作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (3): 183-185. doi: 10.3969/j.issn.1000-3428.2011.03.065

• 人工智能及识别技术 • 上一篇    下一篇

基于明确语义分析的自动文摘算法

陈 燕1,龙建勋2   

  1. (1. 重庆医药高等专科学校图书馆,重庆 400030;2. 重庆大学机械工程学院,重庆 400030)
  • 出版日期:2011-02-05 发布日期:2011-01-28
  • 作者简介:陈 燕(1963-),女,副研究馆员,主研方向:文献资源管理;龙建勋,助理研究员、硕士

Automatic Abstraction Algorithm Based on Explicit Semantic Analysis

CHEN Yan 1, LONG Jian-xun 2   

  1. (1. Library of Chongqing Pharmaceutical College, Chongqing 400030, China; 2. College of Mechanical Engineering, Chongqing University, Chongqing 400030, China)
  • Online:2011-02-05 Published:2011-01-28

摘要: 不同于传统采用统计学习方式的自动文摘算法,利用维基百科等知识密集的资源建立概念空间,在该空间中对词语进行语义解释,进而解释词语及文本片段的语义,由此提出一种基于明确语义分析的自动文摘算法。实验结果证明,相比传统算法,该算法精度更高,用更少的句子即可获得更高的信息覆盖率。

关键词: 自动文摘, 明确语义分析, 维基百科, 概念空间

Abstract: Different from the widely used automatic abstraction algorithm based on statistical learning method, this paper proposes an automatic abstraction algorithm based on Explicit Semantic Analysis(ESA) to analyze the meaning of words and document fragments in a concept space built with knowledge-intensive resources such as Wikipedia. Experimental result shows that, compared with traditional algorithm, it reaches better accuracy and higher information coverage rate while with less sentences.

Key words: automatic abstraction, Explicit Semantic Analysis(ESA), Wikipedia, concept space

中图分类号: