用于 Web 文档聚类的基于相似度的软聚类算法

doi:10.3969/j.issn.1000-3428.2006.02.021

计算机工程 ›› 2006, Vol. 32 ›› Issue (2): 59-61.

用于 Web 文档聚类的基于相似度的软聚类算法

姜亚莉，关泽群

武汉大学遥感信息工程学院，武汉 430079

出版日期:2006-01-20 发布日期:2006-01-20

A Similarity-based Soft Clustering Algorithm for Web Documents

JIANG Yali, GUAN Zequn

School of Remote Sensing Information Engineering, Wuhan University, Wuhan 430079

Online:2006-01-20 Published:2006-01-20

摘要/Abstract

摘要： 提出了一种基于相似度的软聚类算法用于文本聚类，这是一种基于相似性度量的有效的软聚类算法，实验表明通过比较SISC 和诸如K-means 的硬聚类算法，SISC 的聚类速度快、效率高。最后展望了文本挖掘在信息技术中的发展前景。

关键词: Web 文本挖掘；文本聚类；软聚类；相似度

Abstract: This paper proposes similarity-based soft clustering (SISC), an efficient soft clustering algorithm based on a given similarity measure used in document clustering. Comparison with existing hard clustering algorithms like K-means, the experiment indicates SISC is both efficient and effective, and this algorithm is available for document clustering. In the end, it highlights the upcoming challenges of document mining and the opportunities it offers.

Key words: Web document mining; Document clustering; Soft clustering; Similarity

姜亚莉，关泽群. 用于 Web 文档聚类的基于相似度的软聚类算法[J]. 计算机工程, 2006, 32(2): 59-61.

JIANG Yali, GUAN Zequn. A Similarity-based Soft Clustering Algorithm for Web Documents[J]. Computer Engineering, 2006, 32(2): 59-61.

https://www.ecice06.com/CN/Y2006/V32/I2/59

选择文件类型/文献管理软件名称

选择包含的内容

用于 Web 文档聚类的基于相似度的软聚类算法

A Similarity-based Soft Clustering Algorithm for Web Documents

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

用于 Web 文档聚类的基于相似度的软聚类算法

A Similarity-based Soft Clustering Algorithm for Web Documents

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

编辑推荐

Metrics

本文评价