人工智能与模式识别
张洪程, 李林育, 杨莉, 伞晨峻, 尹春林, 颜冰, 于虹, 张璇
知识图谱是由各种知识或数据单元经过抽取等处理而组成的一种结构化知识库, 用于描述和表示实体、概念、事实和关系等信息。自然语言处理技术的限制和各种知识或信息单元文本本身的噪声都会使信息抽取的准确性受到一定程度的影响。现有的知识图谱补全方法通常只考虑单一结构信息或者文本语义信息, 忽略了整个知识图谱中同时存在的结构信息与文本语义信息。针对此问题, 提出一种基于语言模型增强嵌入与对比学习的知识图谱补全(KGC)模型。将输入的实体和关系通过预训练语言模型获取实体和关系的文本语义信息, 利用翻译模型的距离打分函数捕获知识图谱中的结构信息, 使用2种用于对比学习的负采样方法融合对比学习来训练模型以提高模型对正负样本的表征能力。实验结果表明, 与基于来自Transformer的双向编码器表示的知识图谱补全(KG-BERT)模型相比, 在WN18RR和FB15K-237数据集上该模型链接预测的排名小于等于10的三元组的平均占比(Hits@10)分别提升了31%和23%, 明显优于对比模型。