基于动态规划的汉语句子相似度算法

doi:10.3969/j.issn.1000-3428.2013.02.045

计算机工程 ›› 2013, Vol. 39 ›› Issue (2): 220-224. doi: 10.3969/j.issn.1000-3428.2013.02.045

基于动态规划的汉语句子相似度算法

冯凯，王小华，谌志群

(杭州电子科技大学计算机应用技术研究所，杭州 310018)

收稿日期:2012-03-12 修回日期:2012-05-21 出版日期:2013-02-15 发布日期:2013-02-13
作者简介:冯凯(1986－)，男，硕士研究生，主研方向：中文信息处理；王小华，教授；谌志群，副教授
基金资助:
国家自然科学基金资助项目(61103101)；教育部人文社会科学研究基金资助项目(12YJCZH201)

Chinese Sentence Similarity Algorithm Based on Dynamic Programming

FENG Kai, WANG Xiao-hua, CHEN Zhi-qun

(Institute of Computer Application Technology, Hangzhou Dianzi University, Hangzhou 310018, China)

Received:2012-03-12 Revised:2012-05-21 Online:2013-02-15 Published:2013-02-13

摘要/Abstract

摘要： 传统汉语句子相似度计算算法在处理大量专业词汇时准确率较低。为此，提出一种基于动态规划的汉语句子相似度算法。通过获取2个句子的公共子串集合，结合链表消重机制，从集合中获取2个句子的所有最长公共子串，并以此计算相似度。实验结果表明，对于含有大量专有名词的问题集合，该算法的测试正确率达93.6%，计算效率较高。

关键词: 句子相似度, 动态规划, 自动问答, 最长公共子串, 消重链表

Abstract: Traditional Chinese sentence computing algorithm has a lower accuracy in dealing with a large number of professional vocabulary. In order to solve this problem, this paper proposes a Chinese sentence similarity algorithm based on dynamic programming. By getting the common sub-string collection of two sentences, it combines the mechanism for duplicate elimination by linked list, and obtains all of the longest common sub-string of two sentences for computing similarity. Experimental results show that for the problem sets which contain a lot of proper nouns, the test accuracy of this algorithm is 93.6%, and has high computational efficiency.

Key words: sentence similarity, dynamic programming, automatic question-answer, longest common substring, duplicate elimination linked list

中图分类号:

TP301.6

冯凯, 王小华, 谌志群. 基于动态规划的汉语句子相似度算法[J]. 计算机工程, 2013, 39(2): 220-224.

FENG Kai, WANG Xiao-Hua, CHEN Zhi-Qun. Chinese Sentence Similarity Algorithm Based on Dynamic Programming[J]. Computer Engineering, 2013, 39(2): 220-224.

http://www.ecice06.com/CN/Y2013/V39/I2/220

[1]	顾轶寅, 王鸿奎, 殷海兵. 基于上下文自适应阈值剪枝的快速依赖量化算法[J]. 计算机工程, 2023, 49(7): 143-149.
[2]	徐淑琳, 周广瑞, 岳昊. 标注Petri网中的最小初始标识估计[J]. 计算机工程, 2021, 47(4): 285-290,297.
[3]	宋煜, 张帅, 严永辉, 钱柱中. 基于冗余任务消减的边缘应用性能优化[J]. 计算机工程, 2021, 47(3): 209-217,226.
[4]	章俊伟, 卞金来, 丁良辉, 支琤, 杨峰, 钱良. 慢衰落信道下并行HARQ系统的速率自适应算法[J]. 计算机工程, 2021, 47(2): 201-205,211.
[5]	王青松, 张衡, 李菲. 基于文本多维度特征的自动摘要生成方法[J]. 计算机工程, 2020, 46(9): 110-116.
[6]	陈俊月, 郝文宁, 张紫萱, 唐新德, 康睿智, 莫斐. 基于改进句子相似度算法的释义识别研究[J]. 计算机工程, 2020, 46(9): 76-82.
[7]	李嘉伟, 张激, 赵俊才, 丁如艺. 一种SRIO网络负载均衡最短路径路由算法[J]. 计算机工程, 2020, 46(3): 214-221,228.
[8]	李隋凯,励益韬,孙未未,秦涛,黄秀松. 一种自动化集装箱码头出口箱进箱选位算法[J]. 计算机工程, 2019, 45(5): 272-278,284.
[9]	魏冰茹, 张国富, 苏兆品, 岳峰, 牛福强. 成本最小化的最优重叠联盟结构生成算法[J]. 计算机工程, 2019, 45(11): 198-203.
[10]	丛超. 基于动态规划与填充密度的监控视频摘要算法[J]. 计算机工程, 2018, 44(7): 250-258.
[11]	李玉龙,刘任任,赵津锋,臧浪,曹斌. 分簇感知网络中基于压缩感知的数据收集方法[J]. 计算机工程, 2018, 44(10): 129-135.
[12]	裴飞龙,闵华松. 基于修正偏移量的句子相似度算法[J]. 计算机工程, 2017, 43(9): 234-239.
[13]	邓涵,朱新华,李奇,彭琦. 基于句法结构与修饰词的句子相似度计算[J]. 计算机工程, 2017, 43(9): 240-244,249.
[14]	蒲梅,周枫,周晶晶,严馨,周兰江. 基于加权TextRank的新闻关键事件主题句提取[J]. 计算机工程, 2017, 43(8): 219-224.
[15]	吴修国. 云存储系统中基于动态规划的最小开销数据副本布局研究[J]. 计算机工程, 2017, 43(7): 29-37.

选择文件类型/文献管理软件名称

选择包含的内容

基于动态规划的汉语句子相似度算法

Chinese Sentence Similarity Algorithm Based on Dynamic Programming

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于动态规划的汉语句子相似度算法

Chinese Sentence Similarity Algorithm Based on Dynamic Programming

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价