作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (11): 86-88.

• 软件技术与数据库 • 上一篇    下一篇

基于单词超团的文本聚类方法

曲 超1,潘晓衡1,朱 君1,蔡少仲2,胡天明1   

  1. (1. 东莞理工学院计算机学院,广东 东莞 523000;2. 东莞市毅豪电子科技有限公司,广东 东莞 523000)
  • 出版日期:2011-06-05 发布日期:2011-06-09
  • 作者简介:曲 超(1979-),男,讲师、硕士,主研方向:信息网络,信息检索;潘晓衡,硕士研究生;朱 君,副教授、博士;蔡少仲,学士;胡天明,副教授、博士
  • 基金资助:
    国家自然科学基金资助项目(60773050, U0935003)

Text Clustering Method Based on Word Hyperclique

QU Chao 1, PAN Xiao-heng  1, ZHU Jun  1, CAI Shao-zhong  2, HU Tian-ming  1   

  1. (1. College of Computer Science, Dongguan University of Technology, Dongguan 523000, China; 2. Yihao Electronics Technology Co., Ltd., Dongguan 523000, China)
  • Online:2011-06-05 Published:2011-06-09

摘要: 为优化文本聚类效果,提出一种基于单词超团理论的文本聚类方法。利用文档中单词的关联模式来评估文档间的相似度,将单词超团作为文档向量辅助信息,以图划分的方式进行聚类分析。对不同聚类方法的结果进行比较,证明基于单词超团的文本聚类方法能提高文本聚类的准确性。

关键词: 文本聚类, 单词超团, 聚类模式, 特征选择

Abstract: In order to improve text clustering performance, this paper proposes a text clustering method based on word hyperclique. It evaluates document similarity with word relationship between documents, works with word hyperclique as assistance of the document’s vector and uses a corresponding clustering algorithm by graph to partition the document sets. Experimental results validate the effectiveness of the algorithm for improving clustering performance.

Key words: text clustering, word hyperclique, clustering mode, feature selection

中图分类号: