基于维基百科的自动词义消歧方法

doi:10.3969/j.issn.1000-3428.2009.18.022

计算机工程 ›› 2009, Vol. 35 ›› Issue (18): 62-65.

基于维基百科的自动词义消歧方法

史天艺，李明禄

(上海交通大学计算机科学与工程系，上海 200240)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2009-09-20 发布日期:2009-09-20

Automatic Word Sense Disambiguation Method Based on Wikipedia

SHI Tian-yi, LI Ming-lu

(Department of Computer Science & Engineering, Shanghai Jiaotong University, Shanghai 200240)

Received:1900-01-01 Revised:1900-01-01 Online:2009-09-20 Published:2009-09-20

摘要/Abstract

摘要： 针对传统词义消歧仅基于上下文语境而导致准确率低的问题，提出一种多策略的无监督自动词义消歧方法。利用从维基百科在线中提炼出的丰富语义知识，线性融合上下文语境、背景知识和语义信息3大特征，根据逻辑回归算法学习各特征的权重，选取最大融合值所对应的候选项作为最优词义。在SENSEVAL数据集上取得了85.50%的平均准确率，验证了该方法的有效性。

关键词: 词义消歧, 维基百科, 知识库, 无监督学习

Abstract: Most traditional Word Sense Disambiguation(WSD) method is just based on contextual information, often results in inaccurate output. A multi-level unsupervised automatic WSD method which works efficiently is promoted. This method utilizes the rich semantic information extracted from online Wikipedia, makes a linear fusion of contextual information, background knowledge and semantic information, uses logistic regression algorithm to learn the weight of each feature, and selects the one with the maximum combined value as correct meaning. Experimental result on SENSEVAL dataset shows an average precision of 85.50%, therefore validates the feasibility and effectiveness of this method.

Key words: Word Sense Disambiguation(WSD), Wikipedia, knowledge base, unsupervised learning

中图分类号:

TP18

史天艺;李明禄. 基于维基百科的自动词义消歧方法[J]. 计算机工程, 2009, 35(18): 62-65.

SHI Tian-yi; LI Ming-lu. Automatic Word Sense Disambiguation Method Based on Wikipedia[J]. Computer Engineering, 2009, 35(18): 62-65.

https://www.ecice06.com/CN/Y2009/V35/I18/62

[1]	饶东宁, 许正辉, 梁瑞仕. 基于知识库问答的回答生成研究[J]. 计算机工程, 2025, 51(2): 94-101.
[2]	阳金霖, 李朝锋. 融合快速傅里叶卷积的域变换图像去雨滴方法[J]. 计算机工程, 2024, 50(9): 296-303.
[3]	李永飞, 李铭洋, 常鑫, 曹可欣. 基于可解释性深度学习的物联网水质监测数据异常检测[J]. 计算机工程, 2024, 50(6): 179-187.
[4]	余长宏, 许孔豪, 张泽, 高明. 基于分割点改进孤立森林的网络入侵检测方法[J]. 计算机工程, 2024, 50(6): 148-156.
[5]	江惠珍, 孙艳春, 黄罡. 基于知识图谱的GitHub层次化学习和检索服务[J]. 计算机工程, 2024, 50(5): 16-25.
[6]	何银银, 胡静, 陈志泊, 张荣国. 融合门控变换机制和GAN的低光照图像增强方法[J]. 计算机工程, 2024, 50(2): 247-255.
[7]	周莎, 申国伟, 郭春. 基于安全知识图谱与逆向特征的弱点信息补全[J]. 计算机工程, 2024, 50(1): 145-155.
[8]	王书朋, 何引弟. 融合特征注意力机制的非均匀光照图像增强算法[J]. 计算机工程, 2023, 49(8): 232-239.
[9]	何悦, 陈广胜, 景维鹏, 徐泽堃. 基于深度多相似性哈希方法的遥感图像检索[J]. 计算机工程, 2023, 49(2): 206-212.
[10]	鄢宁, 李岳阳, 罗海驰. 基于块金字塔记忆模块的无监督异常检测[J]. 计算机工程, 2023, 49(12): 304-310.
[11]	王旖旎, 高永彬, 万卫兵, 杨淑群, 郭茹燕. 结合外部知识库与适应性推理的场景图生成模型[J]. 计算机工程, 2022, 48(9): 230-238.
[12]	付林, 刘钊, 邱晨, 高峰. 基于特征联合与多注意力的实体关系链接[J]. 计算机工程, 2022, 48(8): 53-61.
[13]	唐佳敏, 韩华, 黄丽. 行人再识别中基于无监督学习的粗细粒度特征提取[J]. 计算机工程, 2022, 48(4): 269-275,283.
[14]	吴天波, 刘露平, 罗晓东, 卿粼波, 何小海. 基于弱依赖信息的知识库问答方法[J]. 计算机工程, 2021, 47(6): 76-82.
[15]	张显炀, 朱晓宇, 林浩申, 刘刚, 安喜彬. 基于高斯混合-变分自编码器的轨迹预测算法[J]. 计算机工程, 2020, 46(7): 50-57.

选择文件类型/文献管理软件名称

选择包含的内容

基于维基百科的自动词义消歧方法

Automatic Word Sense Disambiguation Method Based on Wikipedia

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于维基百科的自动词义消歧方法

Automatic Word Sense Disambiguation Method Based on Wikipedia

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价