现代国际关系

计算机软件及计算机应用论文_有监督实体关系联 

来源:现代国际关系 【在线投稿】 栏目:期刊导读 时间:2022-03-24

文章摘要:实体关系联合抽取作为信息抽取领域的核心任务,能够从非结构化或半结构化的文本中自动识别实体、实体类型以及实体之间特定的关系类型,为知识图谱构建、智能问答和语义搜索等下游任务提供基础支持。传统的流水线方法将实体关系联合抽取分解成命名实体识别和关系抽取两个独立的子任务,由于两个子任务之间缺少交互,流水线方法存在误差传播等问题。近年来,实体关系联合抽取成为新的趋势,其可以建立统一的模型使得不同子任务彼此交互,进一步提升模型性能。本文对有监督实体关系联合抽取方法进行综述,根据抽取特征的不同方式,可将实体关系联合抽取分为两种类型:基于特征工程的联合抽取和基于神经网络的联合抽取。首先,介绍基于特征工程的联合抽取,包括四种方法:整数线性规划、卡片金字塔解析、概率图模型和结构化预测;这四种方法都需要采用相对复杂的特征工程方法。然后,介绍基于神经网络的联合抽取,这类方法可以自动抽取特征信息,已逐渐成为联合抽取的主流方法,其主要包括共享参数和联合解码两种类型。接着,介绍有监督实体关系联合抽取常用的7个数据集以及评价指标,并对不同的实体关系联合抽取方法进行了实验对比分析。最后,展望实体关系联合抽取的未来研究方向。

文章关键词:

项目基金: