基于排序思想的高维稀疏数据聚类

doi:10.3969/j.issn.1000-3428.2010.22.004

计算机工程 ›› 2010, Vol. 36 ›› Issue (22): 13-14. doi: 10.3969/j.issn.1000-3428.2010.22.004

基于排序思想的高维稀疏数据聚类

祝　琴1,2，高学东1，武　森1，陈　敏1，陈　华2

(1. 北京科技大学经济管理学院，北京 100083；2. 南昌大学管理科学与工程系，南昌 330031)

出版日期:2010-11-20 发布日期:2010-11-18
作者简介:祝琴(1978－)，女，讲师、博士研究生，主研方向：数据挖掘，管理优化；高学东，教授、博士生导师；武　森，副教授、博士；陈　敏，博士研究生；陈　华，副教授、博士
基金资助:
国家自然科学基金资助项目(60963008)

High Dimensional Sparse Data Clustering Based on Sorting Idea

ZHU Qin1,2, GAO Xue-dong1, WU Sen1, CHEN Min1, CHEN Hua2

(1. School of Economics and Management, University of Science and Technology Beijing, Beijing 100083, China; 2. Department of Management Science and Engineering, Nanchang University, Nanchang 330031, China)

Online:2010-11-20 Published:2010-11-18

摘要/Abstract

摘要：

针对CABOSFV聚类算法对数据输入顺序的敏感性问题，提出融合排序思想的高属性维稀疏数据聚类算法，通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合，减小了算法复杂度。应用结果表明，该方法能提高CABOSFV聚类的质量。

关键词: 高维稀疏数据, CABOSFV聚类, 排序

Abstract:

In the light of the sensitivity of the order of data input by CABOSFV clustering algorithm, this paper puts forward a high attribute dimensional sparse clustering algorithm of the integration of sorting. The method of how to determine the two sets calculates the difference between two high dimensional sparse data sets in the first clustering, the algorithm complexity is reduced. The method improves the quality and efficiency of clustering. Simulation results of one groups of sample are given to illustrate that it can improve the quality of CABOSFV clustering.

Key words: high dimensional sparse data, CABOSFV clustering, sorting

中图分类号:

TP311

祝琴, 高学东, 武森, 陈敏, 陈华. 基于排序思想的高维稀疏数据聚类[J]. 计算机工程, 2010, 36(22): 13-14.

CHU Qin, GAO Hua-Dong, WU Sen, CHEN Min, CHEN Hua. High Dimensional Sparse Data Clustering Based on Sorting Idea[J]. Computer Engineering, 2010, 36(22): 13-14.

http://www.ecice06.com/CN/Y2010/V36/I22/13

[1]	薛振宇, 余正涛, 高盛祥. 融入事件实体知识的汉越跨语言新闻事件检索[J]. 计算机工程, 2022, 48(8): 274-282,291.
[2]	张晓明, 郑理欣, 王会勇. 基于图排序和最大信息增益的领域实体抽取方法[J]. 计算机工程, 2022, 48(12): 140-149.
[3]	任方, 杨益萍, 薛斐元. 基于像素值排序与块再分的可逆数据隐藏算法[J]. 计算机工程, 2022, 48(10): 130-137.
[4]	李昭, 刘有耀, 焦继业, 潘树朋. 超标量处理器乱序提交机制的研究与设计[J]. 计算机工程, 2021, 47(4): 180-186.
[5]	王智铎, 江波, 苗瑞, 赵慧. 基于有向图的外键冲突解决算法设计与实现[J]. 计算机工程, 2021, 47(2): 254-260.
[6]	祝捷, 王萍, 海涵, 王帅. 一种可扩展的广义空移键控调制系统设计[J]. 计算机工程, 2021, 47(1): 188-195.
[7]	余恒, 王让定, 严迪群, 张雪垣. 基于采样值排序的音频可逆隐写算法[J]. 计算机工程, 2021, 47(1): 123-128,138.
[8]	金亚洲, 张正军, 颜子寒, 王雅萍. 基于间隔准则的优化排序多标记学习算法[J]. 计算机工程, 2020, 46(7): 104-109.
[9]	郭伟, 洪倩. 基于边界和中心关系的显著性检测方法[J]. 计算机工程, 2020, 46(6): 241-247.
[10]	唐素勤, 刘笑梅, 袁磊. 嵌入双曲层的神经排序式图表示学习方法[J]. 计算机工程, 2020, 46(6): 81-87.
[11]	吴昌明, 赵兴涛, 柳可鑫. 基于三元组排序局部性的SOCFS改进算法[J]. 计算机工程, 2020, 46(5): 47-53.
[12]	吴涛, 任淑霞, 张书博. 基于三角形子图的复杂网络过滤压缩算法[J]. 计算机工程, 2020, 46(5): 70-77.
[13]	曹素珍, 杜霞玲, 王友琛, 刘雪艳. 多服务器可验证的属性基多关键字排序检索方案[J]. 计算机工程, 2020, 46(3): 120-128.
[14]	倪鸿, 刘鑫. 基于神威·太湖之光的非结构网格众核优化技术[J]. 计算机工程, 2019, 45(6): 45-51.
[15]	肖锋,李茹娜. 语义信息引导下的显著目标检测算法[J]. 计算机工程, 2019, 45(4): 248-253.

选择文件类型/文献管理软件名称

选择包含的内容

基于排序思想的高维稀疏数据聚类

High Dimensional Sparse Data Clustering Based on Sorting Idea

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于排序思想的高维稀疏数据聚类

High Dimensional Sparse Data Clustering Based on Sorting Idea

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价