基于图的特征选择算法

doi:10.3969/j.issn.1000-3428.2012.09.059

计算机工程 ›› 2012, Vol. 38 ›› Issue (9): 197-198,201. doi: 10.3969/j.issn.1000-3428.2012.09.059

基于图的特征选择算法

潘锋^1,2，王建东¹，顾其威²，牛奔²

(1. 南京航空航天大学计算机科学与技术学院，南京 210016；2. 深圳大学管理学院，广东深圳 518060)

收稿日期:2011-09-19 出版日期:2012-05-05 发布日期:2012-05-05
作者简介:潘锋(1977－)，男，讲师、博士研究生，主研方向：数据挖掘，机器学习；王建东，教授、博士生导师；顾其威，教授；牛奔，副教授、博士
基金资助:
国家自然科学基金资助项目(71001072)；广东省自然科学基金资助项目(9451806001002694)

Feature Selection Algorithm Based on Graph

PAN Feng ^1,2, WANG Jian-dong ¹, GU Qi-wei ², NIU Ben ²

(1. College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China; 2. College of Management, Shenzhen University, Shenzhen 518060, China)

Received:2011-09-19 Online:2012-05-05 Published:2012-05-05

摘要/Abstract

摘要： 针对数据挖掘与模式识别领域中的高维数据处理问题，通过分析样本类间距离与类内距离，给出一种基于图理论的特征排序框架。根据该框架，提出使用类内-类间和K近邻相似度定义的2种快速特征选择算法，能避免复杂度较高的广义特征分解过程。实验结果表明，该算法具有较高的分类精度。

关键词: 数据挖掘, 模式识别, 特征选择, 图模型, 特征分解, K近邻

Abstract: The high dimensionality of the data samples often makes the data mining or pattern recognition tasks intractable, through analyzing both the within-class distance and between-class distance, it presents a fast feature ranking framework, from which the computationally expensive feature decomposition is avoided. Two similarity measures of within-class and between-class similarity and K nearest neighbor similarity are employed to derive efficient feature selection algorithms. Experimental results demonstrate that these algorithms have higher classification precision.

Key words: data mining, pattern recognition, feature selection, graph model, feature decomposition, K nearest neighbor

中图分类号:

TP18
TP301.6

潘锋, 王建东, 顾其威, 牛奔. 基于图的特征选择算法[J]. 计算机工程, 2012, 38(9): 197-198,201.

BO Feng, WANG Jian-Dong, GU Ji-Wei, NIU Ben. Feature Selection Algorithm Based on Graph[J]. Computer Engineering, 2012, 38(9): 197-198,201.

http://www.ecice06.com/CN/Y2012/V38/I9/197

[1]	杨璇, 马建敏, 赵曼君. 基于邻域互信息的高维时序数据特征选择[J]. 计算机工程, 2023, 49(7): 135-142.
[2]	王其涵, 庞建民, 岳峰, 祝迪, 沈莉, 肖谦. 面向申威架构的KNN并行算法实现与优化[J]. 计算机工程, 2023, 49(5): 286-294.
[3]	席荣康, 蔡满春, 芦天亮. 基于数据增强与流数据处理的Tor流量分析模型[J]. 计算机工程, 2023, 49(3): 177-184.
[4]	王雷, 王文发, 宋慧娜, 张帅. 基于相似度评分与二级子系统的设计模式识别[J]. 计算机工程, 2023, 49(1): 210-222.
[5]	艾成豪, 高建华, 黄子杰. 混合特征选择和集成学习驱动的代码异味检测[J]. 计算机工程, 2022, 48(7): 168-176,198.
[6]	刘利, 张德生, 肖燕婷. 基于隶属度的模糊加权k近质心近邻算法[J]. 计算机工程, 2022, 48(7): 122-129.
[7]	范林歌, 武欣嵘, 童玮, 曾维军. 基于概率矩阵分解的不完整数据集特征选择方法[J]. 计算机工程, 2022, 48(6): 57-64.
[8]	钱龙, 赵静, 韩京宇, 毛毅. 基于标签相关性的K近邻多标签学习[J]. 计算机工程, 2022, 48(6): 73-78,88.
[9]	谷青竹, 董红斌. PPDM中面向k-匿名的MI Loss评估模型[J]. 计算机工程, 2022, 48(4): 143-147.
[10]	张要, 马盈仓, 朱恒东, 李恒, 陈程. 结合流形学习与逻辑回归的多标签特征选择[J]. 计算机工程, 2022, 48(3): 90-99,106.
[11]	汪正凯, 沈东升, 王晨曦. 基于文本分类的Fisher Score快速多标记特征选择算法[J]. 计算机工程, 2022, 48(2): 113-124.
[12]	王璐, 刘晓清, 何震瀛. 连续时间区间内的频繁词序列挖掘算法[J]. 计算机工程, 2022, 48(2): 79-85,91.
[13]	黄奕轩, 杜世强, 余瑶, 肖庆江, 宋金梅. 基于特征选择与鲁棒图学习的多视图聚类[J]. 计算机工程, 2022, 48(12): 95-103.
[14]	刘子巍, 骆曦, 李克, 陈富强. 基于k近邻的多尺度超球卷积神经网络学习[J]. 计算机工程, 2022, 48(11): 111-119.
[15]	张攀, 高丰, 周逸, 饶涵宇, 毛冬, 李静. 一种在线实时微服务调用链异常检测方法[J]. 计算机工程, 2022, 48(11): 161-169.

选择文件类型/文献管理软件名称

选择包含的内容

基于图的特征选择算法

Feature Selection Algorithm Based on Graph

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于图的特征选择算法

Feature Selection Algorithm Based on Graph

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价