近似k-median分类属性数据聚类

doi:10.3969/j.issn.1000-3428.2007.08.022

计算机工程 ›› 2007, Vol. 33 ›› Issue (08): 66-67.

近似k-median分类属性数据聚类

赵恒，张高煜

(西安电子科技大学电子工程学院，西安 710071)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-04-20 发布日期:2007-04-20

Approximate k-median Clustering for Categorical Data

ZHAO Heng, ZHANG Gaoyu

(School of Electronic Eng., Xidian University, Xi’an 710071)

Received:1900-01-01 Revised:1900-01-01 Online:2007-04-20 Published:2007-04-20

摘要/Abstract

摘要： 数据挖掘中解决分类属性数据聚类的算法有很多种，但大多数基于划分的方法得到的聚类中心一般不是数据集中的实际数据对象，缺乏实际的物理意义，有时会导致某一聚类为空。该文研究了近似k-median的求解算法，用数据的近似中值来代替模式进行聚类，提出了分类属性数据的近似k-median聚类算法，克服了一般基于划分的可分类属性数据聚类中所遇到的问题，仿真实验证明该算法有效。

关键词: 数据挖掘, 近似k-median聚类, 分类属性数据

Abstract: Based on the approximate k-median algorithm, an approximate k-median clustering algorithm for categorical data is developed. The algorithm replaces the modes in k-modes algorithm with the approximate medians of data set, and optimizes the center of cluster with the approximate k-median algorithm. The center of cluster is an actual sample of data set, which prevents the empty cluster. The experiments indicate the algorithm is effective.

Key words: Data mining, Approximate k-median clustering, Categorical data

赵恒;张高煜. 近似k-median分类属性数据聚类[J]. 计算机工程, 2007, 33(08): 66-67.

ZHAO Heng; ZHANG Gaoyu. Approximate k-median Clustering for Categorical Data[J]. Computer Engineering, 2007, 33(08): 66-67.

https://www.ecice06.com/CN/Y2007/V33/I08/66

[1]	邵良杉, 赵松泽. 基于多模型融合的不完整数据分数插补算法[J]. 计算机工程, 2023, 49(9): 79-88, 98.
[2]	席荣康, 蔡满春, 芦天亮. 基于数据增强与流数据处理的Tor流量分析模型[J]. 计算机工程, 2023, 49(3): 177-184.
[3]	谷青竹, 董红斌. PPDM中面向k-匿名的MI Loss评估模型[J]. 计算机工程, 2022, 48(4): 143-147.
[4]	王璐, 刘晓清, 何震瀛. 连续时间区间内的频繁词序列挖掘算法[J]. 计算机工程, 2022, 48(2): 79-85,91.
[5]	张攀, 高丰, 周逸, 饶涵宇, 毛冬, 李静. 一种在线实时微服务调用链异常检测方法[J]. 计算机工程, 2022, 48(11): 161-169.
[6]	吴军, 欧阳艾嘉, 张琳. 面向置换检验的冗余对比模式过滤算法[J]. 计算机工程, 2022, 48(1): 75-84.
[7]	吴军, 欧阳艾嘉, 张琳. 面向对比序列模式发现的独立精确置换检验算法[J]. 计算机工程, 2021, 47(8): 45-53,61.
[8]	杜诗晴, 王鹏, 汪卫. 一种基于MDL的日志序列模式挖掘算法[J]. 计算机工程, 2021, 47(2): 118-125.
[9]	魏文浩, 唐泽坤, 刘刚. 基于距离和密度的PBK-means算法[J]. 计算机工程, 2020, 46(9): 68-75.
[10]	史明阳, 王鹏, 汪卫. 有监督时间序列分割与状态识别算法[J]. 计算机工程, 2020, 46(5): 131-138.
[11]	张潘, 卢光跃, 吕少卿, 赵雪莉. 基于矩阵分解的属性网络表示学习[J]. 计算机工程, 2020, 46(10): 67-73.
[12]	王慧健, 刘峥, 李云, 李涛. 基于神经网络语言模型的时间序列趋势预测方法[J]. 计算机工程, 2019, 45(7): 13-19,25.
[13]	张玺君, 袁占亭, 张红, 高玮军, 张恩展. 交通轨迹大数据预处理方法研究[J]. 计算机工程, 2019, 45(6): 26-31.
[14]	李克,王海,徐小龙,杜煜. 基于众包感知的移动网络小区信息侦测方法[J]. 计算机工程, 2019, 45(2): 92-100.
[15]	崔晨,邓赵红,王士同. 基于Lasso稀疏学习的径向基函数神经网络模型[J]. 计算机工程, 2019, 45(2): 173-177.

选择文件类型/文献管理软件名称

选择包含的内容

近似k-median分类属性数据聚类

Approximate k-median Clustering for Categorical Data

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

近似k-median分类属性数据聚类

Approximate k-median Clustering for Categorical Data

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价