Author Login Editor-in-Chief Peer Review Editor Work Office Work

Computer Engineering ›› 2011, Vol. 37 ›› Issue (11): 86-88. doi: 10.3969/j.issn.1000-3428.2011.11.029

• Networks and Communications • Previous Articles     Next Articles

Text Clustering Method Based on Word Hyperclique

QU Chao 1, PAN Xiao-heng  1, ZHU Jun  1, CAI Shao-zhong  2, HU Tian-ming  1   

  1. (1. College of Computer Science, Dongguan University of Technology, Dongguan 523000, China; 2. Yihao Electronics Technology Co., Ltd., Dongguan 523000, China)
  • Online:2011-06-05 Published:2011-06-09

基于单词超团的文本聚类方法

曲 超1,潘晓衡1,朱 君1,蔡少仲2,胡天明1   

  1. (1. 东莞理工学院计算机学院,广东 东莞 523000;2. 东莞市毅豪电子科技有限公司,广东 东莞 523000)
  • 作者简介:曲 超(1979-),男,讲师、硕士,主研方向:信息网络,信息检索;潘晓衡,硕士研究生;朱 君,副教授、博士;蔡少仲,学士;胡天明,副教授、博士
  • 基金资助:
    国家自然科学基金资助项目(60773050, U0935003)

Abstract: In order to improve text clustering performance, this paper proposes a text clustering method based on word hyperclique. It evaluates document similarity with word relationship between documents, works with word hyperclique as assistance of the document’s vector and uses a corresponding clustering algorithm by graph to partition the document sets. Experimental results validate the effectiveness of the algorithm for improving clustering performance.

Key words: text clustering, word hyperclique, clustering mode, feature selection

摘要: 为优化文本聚类效果,提出一种基于单词超团理论的文本聚类方法。利用文档中单词的关联模式来评估文档间的相似度,将单词超团作为文档向量辅助信息,以图划分的方式进行聚类分析。对不同聚类方法的结果进行比较,证明基于单词超团的文本聚类方法能提高文本聚类的准确性。

关键词: 文本聚类, 单词超团, 聚类模式, 特征选择

CLC Number: