大样本情况下的一种新的SVM迭代算法

doi:10.3969/j.issn.1000-3428.2007.08.072

计算机工程 ›› 2007, Vol. 33 ›› Issue (08): 205-207. doi: 10.3969/j.issn.1000-3428.2007.08.072

大样本情况下的一种新的SVM迭代算法

田新梅，吴秀清，刘莉

(中国科学技术大学电子工程与信息科学系，合肥 230027)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-04-20 发布日期:2007-04-20

A New SVM Iterative Algorithm in Large Training Set

TIAN Xinmei, WU Xiuqing, LIU Li

(Dept. of Electronic Eng. & Information Science, University of Science and Technology of China, Hefei 230027)

Received:1900-01-01 Revised:1900-01-01 Online:2007-04-20 Published:2007-04-20

摘要/Abstract

摘要： 针对SVM方法在大样本情况下学习和分类速度慢的问题，提出了大样本情况下的一种新的SVM迭代训练算法。该算法利用K均值聚类算法对训练样本集进行压缩，将聚类中心作为初始训练样本集，减少了样本间的冗余，提高了学习速度。同时为了保证学习的精度，采用往初始训练样本集中加入边界样本和错分样本的策略来更新训练样本集，迭代训练直到错分样本数目不变为止。该文提出的基于K均值聚类的SVM迭代算法能在保持学习精度的同时，减小训练样本集及决策函数的支持向量集的规模，从而提高学习和分类的速度。

关键词: 支持向量机, 机器学习, K均值聚类算法, 迭代算法

Abstract: A new SVM iterative algorithm is proposed, aiming at the problem that the speeds of learning and classifying are slow in large training set. K-mean clustering algorithm is used to get the original training set, the clustering center is considered to be the original training set, and so reduces the redundance of samples. The margined samples and error-classifying samples are joined in the original training set to renew it. Iterative training is done till the error-classifying samples’ number is not changed. The experiments show that, by this iterative algorithm, the scales of training data and the support vector set are effectively compressed. So the speeds of learning and classifying are accelerated while keeping the same learning precision.

Key words: Support vector machine(SVM), Machine learning, K-mean clustering algorithm, Iterative algorithm

中图分类号:

TP181

田新梅;吴秀清;刘莉. 大样本情况下的一种新的SVM迭代算法[J]. 计算机工程, 2007, 33(08): 205-207.

TIAN Xinmei; WU Xiuqing; LIU Li. A New SVM Iterative Algorithm in Large Training Set[J]. Computer Engineering, 2007, 33(08): 205-207.

http://www.ecice06.com/CN/Y2007/V33/I08/205

[1]	陈治旭, 靳雁霞, 芦烨, 杨晶, 刘亚变, 史志儒. 基于子图卷积神经网络的多精度服装建模方法[J]. 计算机工程, 2023, 49(4): 174-181.
[2]	刘金硕, 詹岱依, 邓娟, 王丽娜. 基于深度神经网络和联邦学习的网络入侵检测[J]. 计算机工程, 2023, 49(1): 15-21,30.
[3]	葛昕, 邹福泰, 郭万达, 谭越, 李林森. 社交僵尸网络发展综述[J]. 计算机工程, 2022, 48(8): 12-24.
[4]	俞莎莎, 牛保宁. 基于交易不可信度的比特币非法交易检测[J]. 计算机工程, 2022, 48(8): 166-172.
[5]	金海波, 赵欣越. 共形预测框架下的高可靠入侵检测算法[J]. 计算机工程, 2022, 48(7): 130-140.
[6]	钱龙, 赵静, 韩京宇, 毛毅. 基于标签相关性的K近邻多标签学习[J]. 计算机工程, 2022, 48(6): 73-78,88.
[7]	王志江, 秦品乐, 柴锐, 武峰, 程一彤, 史玥. 基于深度学习的牙齿嵌塞自动判别方法[J]. 计算机工程, 2022, 48(4): 307-313.
[8]	李莉, 任振康, 石可欣. 代价敏感的Boosting软件缺陷预测方法[J]. 计算机工程, 2022, 48(3): 175-180.
[9]	刘鹏, 叶润, 闫斌, 谢茜, 刘睿. 一种深度回声状态网络的输入尺度自适应算法[J]. 计算机工程, 2022, 48(2): 92-98,105.
[10]	雷恒林, 古兰拜尔·吐尔洪, 买日旦·吾守尔, 曾琪. 基于Hellinger距离与词向量的终身机器学习主题模型[J]. 计算机工程, 2022, 48(11): 89-95.
[11]	陈良臣, 傅德印. 面向小样本数据的机器学习方法研究综述[J]. 计算机工程, 2022, 48(11): 1-13.
[12]	赵季红, 张文娟, 乔琳琳, 张梦雪. 服务功能链中基于机器学习的QoE评估与预测[J]. 计算机工程, 2022, 48(1): 163-169.
[13]	高平, 广晖, 陈熹, 李光松. 基于侧信道特征的安全代理流量分类方法[J]. 计算机工程, 2021, 47(8): 140-148,156.
[14]	王海, 翁晨傲, 李克, 骆曦. 一种面向基站扇区方向角估计的改进SVM算法[J]. 计算机工程, 2021, 47(4): 120-126.
[15]	张冰玉, 潘晴, 田妮莉, Everett Xiaolin Wang. 一种基于多重特征融合的信源个数估计方法[J]. 计算机工程, 2021, 47(4): 115-119,126.

选择文件类型/文献管理软件名称

选择包含的内容

大样本情况下的一种新的SVM迭代算法

A New SVM Iterative Algorithm in Large Training Set

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

大样本情况下的一种新的SVM迭代算法

A New SVM Iterative Algorithm in Large Training Set

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价