基于多示例的K-means聚类学习算法

doi:10.3969/j.issn.1000-3428.2009.22.061

计算机工程 ›› 2009, Vol. 35 ›› Issue (22): 179-181. doi: 10.3969/j.issn.1000-3428.2009.22.061

基于多示例的K-means聚类学习算法

谢红薇，李晓亮

(太原理工大学计算机与软件学院，太原 030024)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2009-11-20 发布日期:2009-11-20

K-means Clustering Learning Algorithm Based on Multi-instance

XIE Hong-wei, LI Xiao-liang

(College of Computer and Software, Taiyuan University of Technology, Taiyuan 030024)

Received:1900-01-01 Revised:1900-01-01 Online:2009-11-20 Published:2009-11-20

摘要/Abstract

摘要： 多示例学习是继监督学习、非监督学习、强化学习后的又一机器学习框架。将多示例学习和非监督学习结合起来，在传统非监督聚类算法K-means的基础上提出MI_K-means算法，该算法利用混合Hausdorff距离作为相似测度来实现数据聚类。实验表明，该方法能够有效揭示多示例数据集的内在结构，与K-means算法相比具有更好的聚类效果。

关键词: 多示例学习, K-means聚类, 包间距, 聚类有效性评价

Abstract: Multi-instance learning is a new machine learning framework following supervised learning, unsupervised learning and reinforcement learning. Multi-instance learning and unsupervised learning are combined. This paper proposes a new multi-instance clustering algorithm MI_K-means based on traditional unsupervised learning algorithm K-means. The algorithm MI_K-means adopts mixed Hausdorff distance as similar measure to carry out clustering. Experimental shows that MI_K-means can effectively reveal inherent structure of a multi-instance data set, and it can get better clustering effect than K-means algorithm.

Key words: multi-instance learning, K-means clustering, distance between bags, validity measure on clustering

中图分类号:

TP311

谢红薇;李晓亮. 基于多示例的K-means聚类学习算法[J]. 计算机工程, 2009, 35(22): 179-181.

XIE Hong-wei; LI Xiao-liang. K-means Clustering Learning Algorithm Based on Multi-instance[J]. Computer Engineering, 2009, 35(22): 179-181.

http://www.ecice06.com/CN/Y2009/V35/I22/179

[1]	刘宇航, 马慧芳, 刘海姣, 余丽. 一种可重叠子空间K-Means聚类算法[J]. 计算机工程, 2020, 46(8): 58-63,71.
[2]	徐慧君, 王忠, 马丽萍, 饶华, 何承恩. 改进Mini Batch K-Means时间权重推荐算法[J]. 计算机工程, 2020, 46(3): 73-78,86.
[3]	刘崇阳, 刘勤让. 基于LZW编码的卷积神经网络压缩方法[J]. 计算机工程, 2019, 45(9): 188-193.
[4]	张旭, 周新志, 赵成萍, 邵伦. 基于犹豫模糊决策树的非均衡数据分类[J]. 计算机工程, 2019, 45(8): 75-79,91.
[5]	陆贝妮,杜育根. 基于社区发现的Web服务QoS预测[J]. 计算机工程, 2019, 45(3): 117-124.
[6]	王大飞, 解武杰, 董文瀚. 基于CSD-ELM的不平衡数据分类算法[J]. 计算机工程, 2019, 45(11): 54-61.
[7]	周福星, 陈秀真, 马进, 李生红. 一种融合标签语义的微博热点话题挖掘方法[J]. 计算机工程, 2019, 45(10): 283-287.
[8]	谢永华,朱延刚,赵贤国. 基于Zernike矩与BoF-SURF特征融合的花粉图像分类识别[J]. 计算机工程, 2018, 44(7): 259-263,270.
[9]	余乐,莫路锋,易晓梅. 一种路径损耗模型融合的WSN森林定位算法[J]. 计算机工程, 2018, 44(3): 87-92,98.
[10]	聂进焱,魏艳涛,瞿少成. 一种面向局部神经反应的模板选取算法[J]. 计算机工程, 2017, 43(3): 277-281.
[11]	汪文靖,冯瑞. 基于二分K-means的测试用例集约简方法[J]. 计算机工程, 2016, 42(12): 73-77,83.
[12]	李想,汪荣贵,杨娟,蒋守欢,梁启香. 基于示例选择的目标跟踪改进算法[J]. 计算机工程, 2015, 41(1): 150-157.
[13]	熊思，李磊民，黄玉清. 基于小波变换和K-means的非结构化道路检测[J]. 计算机工程, 2014, 40(2): 158-161.
[14]	陈舒, 刘秉瀚. 基于角点特征的粘连车辆分割方法[J]. 计算机工程, 2013, 39(4): 210-213,218.
[15]	苏巧平, 刘原, 卜英乔, 黄河. 基于稀疏表达的多示例学习目标追踪算法[J]. 计算机工程, 2013, 39(3): 213-217,222.

选择文件类型/文献管理软件名称

选择包含的内容

基于多示例的K-means聚类学习算法

K-means Clustering Learning Algorithm Based on Multi-instance

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于多示例的K-means聚类学习算法

K-means Clustering Learning Algorithm Based on Multi-instance

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价