作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (7): 210-212,215. doi: 10.3969/j.issn.1000-3428.2011.07.071

• 人工智能及识别技术 • 上一篇    下一篇

CRF与规则相结合的地理空间命名实体识别

鞠久朋1,2,3,张伟伟3,宁建军4,周国栋1,2   

  1. (1. 苏州大学计算机科学与技术学院,江苏 苏州 215006;2. 江苏省计算机信息处理技术重点实验室,江苏 苏州 215006;3. 海量信息技术有限公司,北京 100190;4. 新民网,上海 200041)
  • 出版日期:2011-04-05 发布日期:2011-03-31
  • 作者简介:鞠久朋(1986-),男,硕士研究生,主研方向:自然语言处理,命名实体识别;张伟伟,研究员;宁建军,工程师;周国栋,教授、博士生导师
  • 基金资助:
    国家自然科学基金重大研究计划培育项目(90920004);国家自然科学基金资助项目(60873150, 60970056);高等学校博士学科点专项科研基金资助项目(200802850006);江苏省高校自然科学基础研究基金资助重大项目(08KJA520002);江苏省高校自然科学基础研究基金资助项目(08KJD520010);江苏省自然科学基础研究计划基金资助项目(BK2008160);苏州市软件专项基金资助项目(SGR0807);上海市科学技术委员会科研基金资助项目“新闻网站专题页面富媒体信息搜编技术研究及其系统实现”(09dz1502000)

Geospatial Named Entities Recognition Using Combination of CRF and Rules

JU Jiu-peng  1,2,3, ZHANG Wei-wei  3, NING Jian-jun 4, ZHOU Guo-dong  1,2   

  1. (1. School of Computer Science and Technology, Soochow University, Suzhou 215006, China; 2. Jiangsu Provincial Key Laboratory of Computer Information Processing Technology, Suzhou 215006, China; 3. Hylanda Information Technology Co. Ltd., Beijing 100190, China; 4. Xinmin.cn, Shanghai 200041, China)
  • Online:2011-04-05 Published:2011-03-31

摘要: 提出条件随机场(CRF)与规则相结合的地理空间命名实体识别方法。该方法以丰富的知识作为触发条件,用CRF对满足条件的片段作地名及机构名识别,识别出来的命名实体又被解构,CRF及知识用来进一步判断该命名实体是否表示事件发生地的地理空间信息。实验结果表明,统计与规则方法的结合以及解构算法有效提升了地理空间命名实体识别的性能,准确率、召回率和F1值分别达到92.86%、90.91%、91.87%。

关键词: 条件随机场, 规则, 地理空间属性, 命名实体识别

Abstract: A GeoSpatial Named Entities Recognition(GSNER) method based on combination of Conditional Random Fields(CRF) and rules is proposed. This method takes extensive knowledge as trigger conditions. Triggered text fragments are put into CRF Named Entity Recognition(NER) module, and recognized NEs are deconstructed to several components, CRF and knowledge are also employed for classification of GSNE. Experimental results show that, this combination method and the NE deconstruction strategy effectively promotes the performance of GSNER: the overall Precision, Recall, F1 achieves 92.86%, 90.91%, 91.87%.

Key words: Conditional Random Fields(CRF), rules, geospatial attributes, Named Entity Recognition(NER)

中图分类号: