知识图谱与认知智能:基本原理、关键技术、应用场景与解决方案
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.2 知识抽取系统

知识抽取作为知识图谱构建的核心流程,不仅涉及机器学习、深度学习等自然语言处理、大数据统计与推理方向的算法应用与研究,还涉及企业级数据生产与应用系统的工业化建设。因此,在建设过程中,不可避免地会遇到诸多挑战。如何获得知识抽取的数据来源是知识图谱项目面临的首要挑战,开发人员常常困惑如何获得知识图谱的数据来源。同样,基于不同来源的数据、知识抽取算法模型,应如何在企业高投入产出比的要求下,建设业务可用、功能齐全、模型迭代速度快的技术框架呢?知识抽取包括实体抽取、关系抽取、属性抽取等不同的任务目标,那么应如何围绕任务目标进行算法选型呢?

围绕上述问题,本节首先举例说明知识抽取的数据来源,然后详细介绍知识抽取的流程及技术框架,最后分别介绍实体、关系、属性抽取的定义、目标及技术选型建议。