计算机工程 ›› 2011, Vol. 37 ›› Issue (18): 180-182.doi: 10.3969/j.issn.1000-3428.2011.18.059

• 人工智能及识别技术 • 上一篇    下一篇

基于特征分选策略的中文共指消解方法

李渝勤 1,2,甘润生 1,杨永红 3,施水才 1,2   

  1. (1. 北京信息科技大学计算机学院,北京 100101;2. 北京拓尔思信息技术股份有限公司,北京 100101; = 3. 中山大学信息科学与技术学院计算机科学系,广州510275)
  • 收稿日期:2011-03-02 出版日期:2011-09-20 发布日期:2011-09-20
  • 作者简介:李渝勤(1963-),女,副研究员,主研方向:中文信息处理,信息检索;甘润生,硕士研究生;杨永红,讲师;施水才, 教授
  • 基金项目:
    国家“863”计划基金资助重点项目(2006AA010105); 国家自然科学基金资助项目(60772081);北京市自然科学基金资助 项目(4092015);北京市教委科技发展计划基金资助项目(KM201010 772023)

Chinese Coreference Resolution Method Based on Feature Respective Selection Strategy

LI Yu-qin 1,2, GAN Run-sheng 1, YANG Yong-hong 3, SHI Shui-cai 1,2   

  1. (1. Computer School, Beijing Information Science & Technology University, Beijing 100101, China; 2. Beijing TRS Information Technology Co. Ltd., Beijing 100101, China; 3. School of Information Science and Technology, Sun Yat-Sen University, Guangzhou 510275, China)
  • Received:2011-03-02 Online:2011-09-20 Published:2011-09-20

摘要: 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的“噪声”。实验结果表明,该中文共指消解方法能提高共指消解的性能, 值达到80.72%。

关键词: 共指消解, 特征选择, 自然语言处理, 支撑向量机, 数据词典

Abstract: This paper studies different features based up on the type of noun phrase in Chinese coreference resolution based on machine learning, and proposes features selection strategy to be applied to coreference resolution, the approach selects pronouns and other noun phrases features respectively, so this method can reduce some “noise” and utilize features effectively. Experimental results show that the method can improve the performance of coreference resolution system, and F-measure reaches 80.72%.

Key words: coreference resolution, feature selection, nature language processing, Support Vector Machine(SVM), data dictionary

中图分类号: