基于明确语义分析的自动文摘算法

doi:10.3969/j.issn.1000-3428.2011.03.065

计算机工程 ›› 2011, Vol. 37 ›› Issue (3): 183-185.

基于明确语义分析的自动文摘算法

陈燕¹，龙建勋²

(1. 重庆医药高等专科学校图书馆，重庆 400030；2. 重庆大学机械工程学院，重庆 400030)

出版日期:2011-02-05 发布日期:2011-01-28
作者简介:陈燕(1963－)，女，副研究馆员，主研方向：文献资源管理；龙建勋，助理研究员、硕士

Automatic Abstraction Algorithm Based on Explicit Semantic Analysis

CHEN Yan ¹, LONG Jian-xun ²

(1. Library of Chongqing Pharmaceutical College, Chongqing 400030, China; 2. College of Mechanical Engineering, Chongqing University, Chongqing 400030, China)

Online:2011-02-05 Published:2011-01-28

摘要/Abstract

摘要： 不同于传统采用统计学习方式的自动文摘算法，利用维基百科等知识密集的资源建立概念空间，在该空间中对词语进行语义解释，进而解释词语及文本片段的语义，由此提出一种基于明确语义分析的自动文摘算法。实验结果证明，相比传统算法，该算法精度更高，用更少的句子即可获得更高的信息覆盖率。

关键词: 自动文摘, 明确语义分析, 维基百科, 概念空间

Abstract: Different from the widely used automatic abstraction algorithm based on statistical learning method, this paper proposes an automatic abstraction algorithm based on Explicit Semantic Analysis(ESA) to analyze the meaning of words and document fragments in a concept space built with knowledge-intensive resources such as Wikipedia. Experimental result shows that, compared with traditional algorithm, it reaches better accuracy and higher information coverage rate while with less sentences.

Key words: automatic abstraction, Explicit Semantic Analysis(ESA), Wikipedia, concept space

中图分类号:

TP391

陈燕, 龙建勋. 基于明确语义分析的自动文摘算法[J]. 计算机工程, 2011, 37(3): 183-185.

CHEN Yan, LONG Jian-Xun. Automatic Abstraction Algorithm Based on Explicit Semantic Analysis[J]. Computer Engineering, 2011, 37(3): 183-185.

https://www.ecice06.com/CN/Y2011/V37/I3/183

[1]	江惠珍, 孙艳春, 黄罡. 基于知识图谱的GitHub层次化学习和检索服务[J]. 计算机工程, 2024, 50(5): 16-25.
[2]	荆琪,段利国,李爱萍,赵谦. 基于维基百科的短文本相关度计算[J]. 计算机工程, 2018, 44(2): 197-202.
[3]	李雁群,何云琪,钱龙华,周国栋. 基于维基百科的中文嵌套命名实体识别语料库自动构建[J]. 计算机工程, 2018, 44(11): 76-82.
[4]	廖涛, 刘宗田, 王先传. 基于事件的多主题文本自动文摘方法[J]. 计算机工程, 2013, 39(3): 236-240.
[5]	王东, 牛军钰. 基于多角度关联模型的实体检索方法[J]. 计算机工程, 2013, 39(1): 71-75.
[6]	蒋效宇. 基于关键词抽取的自动文摘算法?[J]. 计算机工程, 2012, 38(3): 183-186.
[7]	盛志超, 陶晓鹏. 基于维基百科的语义相似度计算方法[J]. 计算机工程, 2011, 37(7): 193-195.
[8]	王萌, 徐超, 李春贵, 何婷婷. 基于子主题区域划分的多文档自动文摘方法[J]. 计算机工程, 2011, 37(12): 158-160.
[9]	史天艺;李明禄. 基于维基百科的自动词义消歧方法[J]. 计算机工程, 2009, 35(18): 62-65.
[10]	徐　超;王　萌;何婷婷;张　勇. 基于局部主题关键句抽取的自动文摘方法[J]. 计算机工程, 2008, 34(22): 49-51.
[11]	索红光;梁玉环;刘玉树. 基于时间戳的多文档自动文摘[J]. 计算机工程, 2007, 33(16): 164-165.
[12]	刘德喜;何炎祥;姬东鸿;杨华. 基于基本要素向量空间的英文多文档自动摘要[J]. 计算机工程, 2007, 33(14): 166-167,.
[13]	王萌;李春贵;唐培和;王晓荣. 一种主题句发现的中文自动文摘研究[J]. 计算机工程, 2007, 33(08): 180-181，.
[14]	吴晨;张全. 一种基于语言概念空间聚类的信息检索方法[J]. 计算机工程, 2007, 33(08): 51-53.
[15]	郭庆琳，樊孝忠，柳长安. 基于文本聚类的自动文摘系统的研究与实现[J]. 计算机工程, 2006, 32(4): 30-32，121.

选择文件类型/文献管理软件名称

选择包含的内容

基于明确语义分析的自动文摘算法

Automatic Abstraction Algorithm Based on Explicit Semantic Analysis

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于明确语义分析的自动文摘算法

Automatic Abstraction Algorithm Based on Explicit Semantic Analysis

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价