基于概率粗糙集模型的信息检索

doi:10.3969/j.issn.1000-3428.2008.23.069

计算机工程 ›› 2008, Vol. 34 ›› Issue (23): 193-195. doi: 10.3969/j.issn.1000-3428.2008.23.069

基于概率粗糙集模型的信息检索

黄治国1，朱承学2，薛凡1，王加阳3

(1. 黄淮学院国际学院，驻马店 463000；2. 湖南第一师范学院信息技术系，长沙 410002；3. 中南大学信息科学与工程学院，长沙 410083)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2008-12-05 发布日期:2008-12-05

Information Retrieval Based on Probability Rough Set Model

HUANG Zhi-guo1, ZHU Cheng-xue2, XUE Fan1, WANG Jia-yang3

(1. International College, Huanghuai University, Zhumadian 463000; 2. Department of Information and Technology, Hunan First Normal College, Changsha 410002; 3.School of Information Science and Engineering, Central South University, Changsha 410083)

Received:1900-01-01 Revised:1900-01-01 Online:2008-12-05 Published:2008-12-05

摘要/Abstract

摘要： 针对经典粗糙集模型难以分类标引空间以及体现类间关联的缺陷，将条件概率关系结合粗糙集理论引入信息检索，提出一种基于概率粗糙集的信息检索模型。定义标引词空间的条件概率关系，自动挖掘概念相似类形成概念空间。定义文档与查询、文档与文档间语义贴近度的计算方法。根据贴近度实现检索匹配结果的排序输出。仿真实例表明了该方法的可行性和有效性。

关键词: 粗糙集, 信息检索, 条件概率关系, 语义贴近度

Abstract: Aiming at the disadvantage of classical rough set theory on identifying the conceptually similar terms and the relationships between classes, this paper proposes a novel information retrieval model based on conditional probability relation and rough set. Conception space is formed by defining conditional probability relation in index words space to mine conception similar class automatically. A method is designed to calculate semantic distance between a document and a query, as well as documents. And the ordered outputs of retrieval result are acquired. The simulation instance shows that this algorithm is feasible and effective in practice.

Key words: rough set, information retrieval, conditional probability relation, semantic distance

中图分类号:

TP391

黄治国;朱承学;薛凡;王加阳. 基于概率粗糙集模型的信息检索[J]. 计算机工程, 2008, 34(23): 193-195.

HUANG Zhi-guo; ZHU Cheng-xue; XUE Fan; WANG Jia-yang. Information Retrieval Based on Probability Rough Set Model[J]. Computer Engineering, 2008, 34(23): 193-195.

http://www.ecice06.com/CN/Y2008/V34/I23/193

[1]	杨璇, 马建敏, 赵曼君. 基于邻域互信息的高维时序数据特征选择[J]. 计算机工程, 2023, 49(7): 135-142.
[2]	徐怡, 侯迪. 基于矩阵的粗糙集近似集快速计算算法[J]. 计算机工程, 2023, 49(5): 22-28.
[3]	吴正江, 张亚宁, 张真, 梅秋雨, 杨天. 拟单层覆盖粗糙集中近似集的增量更新算法[J]. 计算机工程, 2022, 48(6): 200-206,212.
[4]	李佩, 陈乔松, 陈鹏昌, 邓欣, 王进, 朴昌浩. 基于模态特异及模态共享特征信息的多模态细粒度检索[J]. 计算机工程, 2022, 48(11): 62-68,76.
[5]	孙静勇, 马福民. 基于邻域归属信息混合度量的粗糙K-Means算法[J]. 计算机工程, 2021, 47(3): 109-116.
[6]	李抒音, 刘洋. 权重模糊粗糙集的分类规则挖掘算法[J]. 计算机工程, 2019, 45(9): 211-215.
[7]	高军,黄献策. 基于Hadoop平台的相关性权重算法设计与实现[J]. 计算机工程, 2019, 45(3): 26-31.
[8]	张倩倩,田学东,杨芳,李新福. 基于数学文本和表达式转换的融合检索模型[J]. 计算机工程, 2019, 45(3): 175-181,187.
[9]	王运明, 陈波, 周敏, 张云贺. 基于主客观权重判决的异构无线网络接入选择算法[J]. 计算机工程, 2019, 45(11): 107-111,120.
[10]	塞麦提·麦麦提敏, 司马义·阿不都热依木. 维吾尔语停用词抽取方法研究[J]. 计算机工程, 2019, 45(10): 288-292,300.
[11]	申元,高岭,高妮,王帆. 基于文化算法的层次属性约减入侵检测模型[J]. 计算机工程, 2017, 43(7): 175-181.
[12]	王莹,罗准辰,于洋. 基于排序学习模型的微博多样性检索问题研究[J]. 计算机工程, 2017, 43(11): 152-160.
[13]	丁棉卫,张腾飞,马福民. 基于二进制区分矩阵的增量式属性约简算法[J]. 计算机工程, 2017, 43(1): 201-206.
[14]	覃华峥,胡忠顺,阳德青,肖仰华. 基于类别模板挖掘的百科相关实体构建[J]. 计算机工程, 2016, 42(9): 180-185,191.
[15]	洪国栋,闵卫东. 网络故障管理中基于邻域粗糙集的规则自动生成[J]. 计算机工程, 2016, 42(9): 310-314.

选择文件类型/文献管理软件名称

选择包含的内容

基于概率粗糙集模型的信息检索

Information Retrieval Based on Probability Rough Set Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于概率粗糙集模型的信息检索

Information Retrieval Based on Probability Rough Set Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价