具有特征语义权重的数据聚类方法

doi:10.3969/j.issn.1000-3428.2011.04.023

计算机工程 ›› 2011, Vol. 37 ›› Issue (4): 64-66.

具有特征语义权重的数据聚类方法

周川祥，孟凡荣，张磊，王志愿

(中国矿业大学计算机学院，江苏徐州 221116)

出版日期:2011-02-20 发布日期:2011-02-17
作者简介:周川祥(1985－)，男，硕士研究生，主研方向：聚类算法；孟凡荣，教授；张磊，副教授；王志愿，硕士研究生
基金资助:
国家自然科学基金资助项目(50674086)；江苏省社会发展科技计划基金资助项目(BS2006002)；高等学校博士学科点专项科研基金资助项目(20060290508)；中国矿业大学校基金资助项目(0D 090229)

Data Clustering Method with Feature Semantic Weight

ZHOU Chuan-xiang, MENG Fan-rong, ZHANG Lei, WANG Zhi-yuan

(School of Computer, China University of Mining and Technology, Xuzhou 221116, China)

Online:2011-02-20 Published:2011-02-17

摘要/Abstract

摘要： 针对聚类中的特征选择问题，提出一种基于特征语义权重的数据聚类方法。该方法由用户指定必需的特征集，通过计算特征之间的语义相关度，选择和指定特征集相关的特征集作为补充。利用语义相关度确定各个特征的语义权重，在特征语义权重计算的基础上对传统的K-Means聚类算法进行改进，提出具有特征语义权重的FSW-KMeans算法。实验结果表明，FSW-KMeans算法较大地提高了聚类算法准确率和效率。

关键词: 本体, 特征语义权重, 语义相关度, FSW-KMeans算法

Abstract: This paper proposes a data clustering method based on feature semantic weight for feature selection in clustering. The method acquires Must-Link set from user, and chooses the features which are relevant to the Must-Link as a supplement by calculating the semantic relativity and calculates feature semantic weight by the semantic relativity. It improves the traditional K-Means clustering algorithm based on the calculation of semantic relativity and presents FSW-KMeans clustering algorithm with feature semantics weight. Experimental results show that the clustering accuracy and efficiency of FSW-KMeans algorithm are improved.

Key words: ontology, feature semantic weight, semantic relativity, FSW-KMeans algorithm

中图分类号:

TP311

周川祥, 孟凡荣, 张磊, 王志愿. 具有特征语义权重的数据聚类方法[J]. 计算机工程, 2011, 37(4): 64-66.

ZHOU Chuan-Xiang, MENG Fan-Rong, ZHANG Lei, WANG Zhi-Yuan. Data Clustering Method with Feature Semantic Weight[J]. Computer Engineering, 2011, 37(4): 64-66.

https://www.ecice06.com/CN/Y2011/V37/I4/64

[1]	杨艳丽, 宋礼鹏. 融合社交网络威胁的攻击图生成方法[J]. 计算机工程, 2021, 47(5): 104-116.
[2]	东熠, 刘景发, 刘文杰. 基于多目标蚁群算法的主题爬虫策略[J]. 计算机工程, 2020, 46(9): 274-282.
[3]	安敬民, 李冠宇. 基于图熵极值理论的领域概念聚类方法[J]. 计算机工程, 2020, 46(6): 88-93.
[4]	王鑫, 傅强, 王林, 徐大为, 王昊奋. 知识图谱可视化查询技术综述[J]. 计算机工程, 2020, 46(6): 1-11.
[5]	朱文跃,刘炜,刘宗田. 基于事件本体的新闻个性化推荐[J]. 计算机工程, 2019, 45(6): 267-272,279.
[6]	蒋猛,禹明刚,王智学. 多策略自适应大规模本体映射算法[J]. 计算机工程, 2019, 45(3): 14-19.
[7]	王光, 姜丽, 董帅含, 李丰. 融合本体语义与用户属性的协同过滤算法[J]. 计算机工程, 2019, 45(10): 215-220.
[8]	杜胜浩,钱晓捷. 基于刻面与本体标识的语义Web服务发现方法[J]. 计算机工程, 2018, 44(8): 224-229,236.
[9]	李新福,徐筱,田学东. 基于Ontology扩展查询的数学表达式检索模型[J]. 计算机工程, 2018, 44(5): 155-161.
[10]	荆琪,段利国,李爱萍,赵谦. 基于维基百科的短文本相关度计算[J]. 计算机工程, 2018, 44(2): 197-202.
[11]	宫云宝,甘亮,黄九鸣. 基于概率软逻辑模型的实体解析[J]. 计算机工程, 2017, 43(8): 188-192,199.
[12]	郭竹为,刘胜全,刘艳,赵美玲,符贤哲. 基于最大公共子图的本体映射方法研究[J]. 计算机工程, 2017, 43(5): 197-203,209.
[13]	王汉博,孙启霖. 基于路径特征的复杂本体匹配[J]. 计算机工程, 2017, 43(2): 227-233,240.
[14]	韩道军,甘甜,叶曼曼,沈夏炯. 基于形式概念分析的本体构建方法研究[J]. 计算机工程, 2016, 42(2): 300-306.
[15]	叶施仁,孙宁. 基于概念聚类的领域本体图中文文本分类[J]. 计算机工程, 2016, 42(12): 181-187.

选择文件类型/文献管理软件名称

选择包含的内容

具有特征语义权重的数据聚类方法

Data Clustering Method with Feature Semantic Weight

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

具有特征语义权重的数据聚类方法

Data Clustering Method with Feature Semantic Weight

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价