作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (18): 210-213. doi: 10.3969/j.issn.1000-3428.2010.18.073

• 人工智能及识别技术 • 上一篇    下一篇

高维数据自适应分类研究

吴永亮,万旺根,许雪琼   

  1. (上海大学通信与信息工程学院,上海200072)
  • 出版日期:2010-09-20 发布日期:2010-09-30
  • 作者简介:吴永亮(1985-),男,硕士研究生,主研方向:模式识别,虚拟现实;万旺根,教授;许雪琼,硕士研究生
  • 基金资助:
    国家“863”计划基金资助项目(2007AA01Z319);国家自然科学基金资助项目(60873130);上海市教委电路与系统重点学科建设基金资助项目(J50104);上海大学研究生创新基金资助项目(07720680)

WU Yong-liang, WAN Wang-gen, XU Xue-qiong   

  1. (School of Communication and Information Engineering, Shanghai University, Shanghai 200072, China)
  • Online:2010-09-20 Published:2010-09-30

摘要: 利用高维海量数据点的自身特性和所属类别的唯一性,提出一种改进的无监督分类算法。计算高维点间的互相似度,利用相似性图像处理技术,在每次迭代计算中对数据集进行分割与分类,对数量较少的孤立点进行重分类。实验结果表明,该算法可在没有人工干预的情况下实现高维数据的自适应分类,相比K-means和Isodata算法,所需的计算迭代次数与计算时间较少。

关键词: 高维海量数据, 自适应分类, 相似性, 无监督

Abstract: This paper proposes an improved nonsupervision classification algorithm by using the property of the high-dimensional mass data points and the uniqueness of certain class. The algorithm computes the mutual similarity between points, uses similarity image processing technology to iterate and segment the data set before finding out one class, and accomplishes a re-classification on isolated data points. Experimental results show that the algorithm can realize high-dimensional adaptive classification data with no manual intervention, and it has less computing iterations and time compared with K-means and Isodata algorithm.

Key words: high-dimensional mass data, adaptive classification, similarity, nonsupervision

中图分类号: