作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (11): 200-202. doi: 10.3969/j.issn.1000-3428.2011.11.069

• 人工智能及识别技术 • 上一篇    下一篇

基于CRFs和领域规则的业务名称识别

赵延平1,2,曹存根2,谢丽聪1   

  1. (1. 福州大学数学与计算机科学学院,福州 350108;2. 中国科学院计算技术研究所智能信息处理重点实验室,北京 100190)
  • 收稿日期:2010-11-03 出版日期:2011-06-05 发布日期:2011-06-05
  • 作者简介:赵延平(1986-),女,硕士,主研方向:数据挖掘; 曹存根,教授;谢丽聪,副教授
  • 基金资助:
    中国科学院计算技术研究所和NEC中国研究院合作 基金资助项目(LC-2009-044)

Service Name Recognition Based on CRFs and Domain Rules

ZHAO Yan-ping  1,2, CAO Cun-gen  2, XIE Li-cong  1   

  1. (1. College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350108, China; 2. Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China)
  • Received:2010-11-03 Online:2011-06-05 Published:2011-06-05

摘要: 提出一种基于条件随机场(CRFs)和领域规则的业务名称识别方法。通过实验词及词性的不同组合选择特征集合,由该特征训练得到CRFs模型,利用该模型测试得到业务术语,采用2-gram及编辑距离2种度量方式进行相似度计算,利用领域规则和相似度计算方法得到业务名称。实验结果证明了该方法的有效性。

关键词: 业务名称识别, 条件随机场, 文本相似度, 编辑距离

Abstract: This paper presents a method for service name recognition based on Conditional Random Fields(CRFs) and domain rules. It choses a characteristic set by different combinations of experimental words and their part of speech. It obtains a CRFs model, and uses this model to the test corpus. It extracts service terms, which support the acquisition of service name recognition. In similarity measurement, 2-gram and edit distance mothods are adopted. Experimental results prove the validity of the method.

Key words: service name recognition, Conditional Random Fields(CRFs), text similarity, edit distance

中图分类号: