基于语义密度的文本聚类研究

doi:10.3969/j.issn.1000-3428.2010.05.030

计算机工程 ›› 2010, Vol. 36 ›› Issue (5): 81-83. doi: 10.3969/j.issn.1000-3428.2010.05.030

基于语义密度的文本聚类研究

刘金岭

(淮阴工学院计算机系，淮安 223003)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2010-03-05 发布日期:2010-03-05

Study on Text Clustering Based on Semantic Density

LIU Jin-ling

(Department of Computer, Huaiyin Institute of Technology, Huaian 223003)

Received:1900-01-01 Revised:1900-01-01 Online:2010-03-05 Published:2010-03-05

摘要/Abstract

摘要： 结合文本数据的语义相似度，给出一种基于语义密度文本数据聚类的方法。根据文本数据的特点，从一个随机选定的文本对象出发，向文本数据最为密集的区域扩张，组织成一个能反映语料结构的有序序列进行聚类。在处理噪声文本数据的过程中，利用有效结果重组策略来辅助噪声文本数据重新定位。实验结果表明，该方法具有良好的聚类性能。

关键词: 密度, 簇, 邻域, 聚类

Abstract: Combined with semantic similarity of text data, this paper gives a method of text data clustering based on semantic density. According to the characteristics of text data, from a randomly selected text object, it expands towards the most intensive area of the text data, organizes into a structure to reflect the corpus in an orderly sequence, and then clusters. In dealing with noise text data, it uses the results of the reorganization of an effective strategy to support the re-positioning noise text data. Experimental results show that the method has good clustering performance.

Key words: density, cluster, neighborhood, clustering

中图分类号:

TP311

刘金岭. 基于语义密度的文本聚类研究[J]. 计算机工程, 2010, 36(5): 81-83.

LIU Jin-ling. Study on Text Clustering Based on Semantic Density[J]. Computer Engineering, 2010, 36(5): 81-83.

http://www.ecice06.com/CN/Y2010/V36/I5/81

[1]	江雨燕, 陶承凤, 李平. 数据增强和自适应自步学习的深度子空间聚类算法[J]. 计算机工程, 2023, 49(8): 96-103, 110.
[2]	郑美光, 杨泳. 基于互信息软聚类的个性化联邦学习算法[J]. 计算机工程, 2023, 49(8): 20-28.
[3]	李泽水, 冀俊忠, 杨翠翠. 基于边权重信息深度网络嵌入的PPIN功能模块检测[J]. 计算机工程, 2023, 49(8): 69-76.
[4]	邱天晨, 郑小盈, 祝永新, 封松林. 面向非独立同分布数据的联邦学习架构[J]. 计算机工程, 2023, 49(7): 110-117.
[5]	杨璇, 马建敏, 赵曼君. 基于邻域互信息的高维时序数据特征选择[J]. 计算机工程, 2023, 49(7): 135-142.
[6]	潘大志, 蒋妍, 刘雅文. 求解多维背包问题的双决策交互差异算法[J]. 计算机工程, 2023, 49(7): 21-33.
[7]	高小方, 原玉梁, 温静, 白雪飞. 面向相交多流形聚类的标签传播算法[J]. 计算机工程, 2023, 49(6): 90-98.
[8]	位雅, 张正军, 何凯琳, 唐莉. 基于相对密度的密度峰值聚类算法[J]. 计算机工程, 2023, 49(6): 53-61.
[9]	戴浩磊, 黄永慧, 周郭许. 基于超图正则化非负张量链分解的聚类分析[J]. 计算机工程, 2023, 49(6): 81-89.
[10]	李晓腾, 张盼盼, 勾智楠, 高凯. 基于多任务学习的多模态命名实体识别方法[J]. 计算机工程, 2023, 49(4): 114-119.
[11]	邹长龙, 安敬民, 李冠宇. 基于邻域聚合与CNN的知识图谱实体类型补全[J]. 计算机工程, 2023, 49(3): 134-141.
[12]	翟社平, 张宇航, 柏晓夏. 融合实体邻域信息的知识图谱嵌入负采样方法[J]. 计算机工程, 2023, 49(3): 95-104.
[13]	程小辉, 李钰, 康燕萍. 基于中间图特征提取的卷积网络双标准剪枝[J]. 计算机工程, 2023, 49(3): 105-112.
[14]	毕翔, 黄晃, 张本宏, 卫星. 基于分簇与改进Q学习的车联网V2V复合路由算法[J]. 计算机工程, 2023, 49(3): 221-230,247.
[15]	袁立宁, 胡皓, 刘钊. 基于多通道图卷积自编码器的图表示学习[J]. 计算机工程, 2023, 49(2): 150-160,174.

选择文件类型/文献管理软件名称

选择包含的内容

基于语义密度的文本聚类研究

Study on Text Clustering Based on Semantic Density

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于语义密度的文本聚类研究

Study on Text Clustering Based on Semantic Density

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价