基于XML的检索结果聚类方法

doi:10.3969/j.issn.1000-3428.2010.01.030

计算机工程 ›› 2010, Vol. 36 ›› Issue (1): 85-86,9.

基于XML的检索结果聚类方法

余宏1，万常选2

(1. 南昌师范高等专科学校信息中心，南昌 330029；2. 江西财经大学信息管理学院，南昌 330013)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2010-01-05 发布日期:2010-01-05

Retrieval Result Clustering Method Based on XML

YU Hong1, WAN Chang-xuan2

(1. Center of Information, Nanchang Teachers College, Nanchang 330029; 2. School of Information Management, Jiangxi University of Finance and Economics, Nanchang 330013)

Received:1900-01-01 Revised:1900-01-01 Online:2010-01-05 Published:2010-01-05

摘要/Abstract

摘要： 针对XML文档的半结构化特点，提出一种建模XML检索结果片段的新思路，设计综合内容和结构语义信息度量相应文档相似性的方法，给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明，面向XML的检索结果聚类方法聚类效果优于传统方法。

关键词: XML检索结果聚类, 结构语义相似度, 内容相似度, 聚类算法

Abstract: According to feature of semi-structure of XML documents, a new effective method for modeling documents of XML retrieval result segment is brought forward, and a method for computing relativity of keywords and measuring similarity of structure semantics between documents is designed. A new algorithm named Dynamic k-means Soft Clustering(DKMSC) is brought forward to meet requirement of clustering retrieval results. Experiment indicates that the method of clustering XML retrieval results is obviously better than the traditional way.

Key words: XML retrieval result clustering, structure semantic similarity, content similarity, clustering algorithm

中图分类号:

TP311

余宏;万常选. 基于XML的检索结果聚类方法[J]. 计算机工程, 2010, 36(1): 85-86,9.

YU Hong; WAN Chang-xuan. Retrieval Result Clustering Method Based on XML[J]. Computer Engineering, 2010, 36(1): 85-86,9.

https://www.ecice06.com/CN/Y2010/V36/I1/85

[1]	李启文, 王治和, 杜辉, 鲁德鹏. 基于高斯分布的自适应密度峰值聚类算法[J]. 计算机工程, 2025, 51(4): 137-148.
[2]	张俊娜, 韩超臣, 陈家伟, 赵晓焱, 袁培燕. 一种联合边缘服务器部署与服务放置的方法[J]. 计算机工程, 2024, 50(10): 266-280.
[3]	刘博宇, 梁承姬, 王钰. 特大型城市地下物流多层级网络优化研究[J]. 计算机工程, 2023, 49(12): 311-320.
[4]	王芙银, 张德生, 肖燕婷. 基于加权共享近邻与累加序列的密度峰值算法[J]. 计算机工程, 2022, 48(4): 61-69.
[5]	王治和, 王淑艳, 杜辉. 基于密度敏感距离的改进模糊C均值聚类算法[J]. 计算机工程, 2021, 47(5): 88-96,103.
[6]	周伟枭, 蓝雯飞. 融合文本分类的多任务学习摘要模型[J]. 计算机工程, 2021, 47(4): 48-55.
[7]	刘宇航, 马慧芳, 刘海姣, 余丽. 一种可重叠子空间K-Means聚类算法[J]. 计算机工程, 2020, 46(8): 58-63,71.
[8]	陆慎涛, 葛洪伟. 一种抗噪的移动时间势能聚类算法[J]. 计算机工程, 2020, 46(5): 144-149.
[9]	张强, 张勇, 刘芝国, 周文军, 刘佳慧. 基于改进YOLOv3的手势实时识别方法[J]. 计算机工程, 2020, 46(3): 237-245,253.
[10]	唐鸿成, 文畅, 冯文祥, 谢凯, 方文青. 基于智能聚类模型的海量数据快速显示方法[J]. 计算机工程, 2019, 45(8): 53-59.
[11]	钱雪忠,姚琳燕. 面向稀疏高维大数据的扩展增量模糊聚类算法[J]. 计算机工程, 2019, 45(6): 75-81.
[12]	牛壮,李凤莲,张雪英,樊宇宙,魏鑫. 改进欠抽样方法及其在非平衡数据集分类中的应用[J]. 计算机工程, 2019, 45(6): 218-224.
[13]	王卫华,应时,贾向阳,王冰明,程国力. 一种基于日志聚类的多类型故障预测方法[J]. 计算机工程, 2018, 44(7): 67-73.
[14]	谢永华,朱延刚,赵贤国. 基于Zernike矩与BoF-SURF特征融合的花粉图像分类识别[J]. 计算机工程, 2018, 44(7): 259-263,270.
[15]	陈建,王子磊,奚宏生. 基于情境感知的广播电视群组发现策略[J]. 计算机工程, 2018, 44(5): 140-145.

选择文件类型/文献管理软件名称

选择包含的内容

基于XML的检索结果聚类方法

Retrieval Result Clustering Method Based on XML

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于XML的检索结果聚类方法

Retrieval Result Clustering Method Based on XML

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价