作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (15): 40-42,48. doi: 10.3969/j.issn.1000-3428.2010.15.014

• 软件技术与数据库 • 上一篇    下一篇

用于文档聚类的间隔流形学习算法研究

李 昕,钱 旭,王自强   

  1. (中国矿业大学(北京)机电与信息工程学院,北京 100083)
  • 出版日期:2010-08-05 发布日期:2010-08-25
  • 作者简介:李 昕(1978-),男,博士研究生,主研方向:数据挖掘;钱 旭,教授、博士、博士生导师;王自强,博士研究生
  • 基金资助:
    教育部科学技术研究基金资助重点项目(107021)

Research on Marginal Manifold Learning Algorithm for Document Clustering

LI Xin, QIAN Xu, WANG Zi-qiang   

  1. (College of Mechanical Electronic and Information Engineering, China University of Mining and Technology(Beijing), Beijing 100083)
  • Online:2010-08-05 Published:2010-08-25

摘要: 为有效解决文档聚类问题,提出一种基于间隔流形学习的文档聚类算法。该算法利用间隔Fisher分析将高维文档空间降维到低维特征空间,利用支持向量聚类算法进行聚类。在基准文档测试集上的实验结果表明,该算法的聚类性能优于其他常用的文档聚类算法。

关键词: 文档聚类, 流形学习, 支持向量聚类, 数据挖掘

Abstract: To effectively deal with the document clustering problem, a novel document clustering algorithm based on marginal manifold learning is proposed. The high dimensional document space is reduced into the lower dimensional feature space with marginal fisher analysis. The support vector clustering algorithm is applied to cluster documents herein. Experimental results on the benchmark document sets show the algorithm achieves much better clustering performance than tradition document clustering algorithms.

Key words: document clustering, manifold learning, support vector clustering, data mining

中图分类号: