您的位置首页  科技生活  行业

三大专业领域知识图谱的最佳实践

  • 来源:互联网
  • |
  • 2022-12-13
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

  是面向特定领域的知识图谱,如电商、金融、医疗等。相比较而言,领域知识图谱的知识来源更多、规模化扩展要求更迅速、知识结构更加复杂、知识质量要求更高、知识的应用形式也更加广泛。从多个方面对通用知识图谱和领域知识图谱进行了比较分析。下面以电商、医疗、金融领域知识图谱为例,介绍领域知识图谱的主要特点及技术难点。

  以阿里巴巴的电子商务知识图谱为例,最新的知识图谱规模已达数百亿。知识图数据主要基于阿里巴巴现有的结构化商品数据,并与行业合作伙伴数据,政府业务管理数据和外部开放数据进行集成和扩展。在知识表示方面,除了简单的三元组外,它还包含更复杂的分层电子商务本体和大量用于业务控制的常规知识。

  在知识的质量方面,对知识的覆盖范围和准确性有更高的要求。在申请形式方面,它支持广泛的应用场景,例如产品搜索,产品购物指南,天猫精灵和其他产品的智能问答,平台治理和管理以及销售趋势预测和分析。电子商务知识还具有很高的动态特性,例如,交易知识和与销售趋势相关的知识具有很强的及时性和及时性。

  在医学领域中有大量的大型领域知识库。例如,Linked LifeData项目包含RDF三元组,其规模为102亿,其中包括许多领域的知识,例如基因,蛋白质,疾病,化学,神经科学和医学。

  另一个例子是在中国建造的中药知识图谱,它通常需要整合来自基础医学,文献和医院诊所等各种来源的数据。医学领域的知识结构更加复杂,如医学语义网络UMLS包含大量复杂的语义关系,GeneOnto则包含复杂的类层次结构。在知识质量方面,特别涉及临床辅助决策的知识库通常要求完全避免错误知识。

  金融领域的典型例子如Kensho采用知识图谱辅助投资顾问和投资研究,国内以恒生电子为代表的金融科技机构以及不少银行、证券机构等也都在开展金融领域的知识图谱构建工作。金融知识图谱构建主要来源于机构已有的结构化数据和公开的公报、研报及新闻的联合抽取等。

  在知识表示方面,财务概念还具有很高的复杂性和层次结构,并且更多地依赖常规知识来进行投资因素的相关分析。就申请形式而言,它主要是基于财务问答和投资,投资,投资和研究决策分析的应用程序。金融知识图谱的一个显著特点是高度动态性,且需要考虑知识的时效性,对金融知识的时间维度进行建模。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186