作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

• 人工智能及识别技术 • 上一篇    下一篇

基于中文知识图谱的人物实体识别

李薇,肖仰华,汪卫   

  1. (复旦大学 计算机科学技术学院,上海 201203)
  • 收稿日期:2016-02-18 出版日期:2017-03-15 发布日期:2017-03-15
  • 作者简介:李薇(1991—),女,硕士研究生,主研方向为数据挖掘;肖仰华,副教授、博士、博士生导师;汪卫,教授、博士、博士生导师。
  • 基金资助:
    国家自然科学基金(61472085);国家“973”计划项目(2015CB358800);上海市科技创新行动计划基础研究项目(15JC1400900);上海市青年科技启明星计划项目(13dz2260200)。

People Entity Recognition Based on Chinese Knowledge Graph

LI Wei,XIAO Yanghua,WANG Wei   

  1. (School of Computer Science,Fudan University,Shanghai 201203,China)
  • Received:2016-02-18 Online:2017-03-15 Published:2017-03-15

摘要: 分类是知识图谱构建中的一个重要问题,但是目前多数中文百科都采用人工编辑的方式为词条添加分类,耗费人力并且存在漏标和标错等问题。为此,提出一种自动识别百度百科人物领域下全部实体并添加分类的方法。对百度百科词条已有的分类、属性和副标题进行实体集拓展,使用马尔科夫逻辑网络方法联合推断词条的分类。实验结果表明,与支持向量机和逻辑回归算法相比,该方法在实体识别的精确度和召回率方面性能均有所提升。

关键词: 实体分类, 实体集拓展, 马尔科夫逻辑网络, 知识图谱, 机器学习, 联合推断

Abstract: Classification is an important issue in constructing knowledge graph.However,the existing categories are edited by human beings for Chinese Baike websites,leading to increasing manpower cost and lost or error of categories.Aiming at this problem,this paper proposes a method to recognize all entities of Baidu Baike.under people domain automatically and add categories for these entities.Entity Set Expansion(ESE) is used for existing raw data of like categories,attributes and subtitles,and Markov Logic Network(MLN) is used to jointly inference the category of entities.Experimental result shows that,compared with Support Vector Machine(SVM) and Logistic Regression(LR) algorithm,the proposed method performs much better both in precision and recall aspects.

Key words: entity classification, Entity Set Expansion(ESE), Markov Logic Network(MLN), knowledge graph, machine learning, joint inference

中图分类号: