感知器学习算法研究

doi:10.3969/j.issn.1000-3428.2010.07.065

计算机工程 ›› 2010, Vol. 36 ›› Issue (7): 190-192. doi: 10.3969/j.issn.1000-3428.2010.07.065

感知器学习算法研究

刘建伟，申芳林，罗雄麟

(中国石油大学(北京)自动化研究所，北京 102249)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2010-04-05 发布日期:2010-04-05

Reserch on Perceptron Learning Algorithm

LIU Jian-wei, SHEN Fang-lin, LUO Xiong-lin

(Research Institute of Automation, China University of Petroleum, Beijing 102249)

Received:1900-01-01 Revised:1900-01-01 Online:2010-04-05 Published:2010-04-05

摘要/Abstract

摘要： 介绍感知器学习算法及其变种，给出各种感知器算法的伪代码，指出各种算法的优点。给出感知器算法在线性可分和线性不可分情况下的误差界定理，讨论各种感知器学习算法的误差界理论，给出各种算法的误差界。介绍感知器学习算法在在线优化场景、强化学习场景和赌博机算法中的应用，并对未解决的问题进行讨论。

关键词: 感知器, 错误界, 赌博机算法, 强化学习

Abstract: This paper introduces some perceptron algorithms and their variations, gives various pseudo-codes, pionts out advantage among algorithms. It gives mistake bound’s theorems of perceptrons algorithm in linearly separable and unlinearly separable situation. It studies their mistake bounds and works out their bounds. It shows their various applications in the online optimization, reinforcement learning and bandit algorithm, and discusses the open problems.

Key words: perceptron, mistake bound, bandit algorithm, reinforcement learning

中图分类号:

TP18

刘建伟;申芳林;罗雄麟. 感知器学习算法研究[J]. 计算机工程, 2010, 36(7): 190-192.

LIU Jian-wei; SHEN Fang-lin; LUO Xiong-lin. Reserch on Perceptron Learning Algorithm[J]. Computer Engineering, 2010, 36(7): 190-192.

http://www.ecice06.com/CN/Y2010/V36/I7/190

[1]	张冠莹, 伊鹏, 李丹, 朱棣, 毛明. 面向大规模网络的服务功能链部署方法[J]. 计算机工程, 2023, 49(8): 122-129.
[2]	梅晶, 戴龙宝, 童钊, 邓昕, 王嘉珂. 资源约束下基于Lyapunov优化的自适应卸载算法[J]. 计算机工程, 2023, 49(7): 34-46.
[3]	蔡丽娇, 秦进, 陈双. 远离旧区域和避免回路的强化探索方法[J]. 计算机工程, 2023, 49(7): 118-124.
[4]	李强, 仪晋辉, 杜婷婷, 王胜春. 移动边缘计算中基于A3C的依赖任务卸载与资源分配[J]. 计算机工程, 2023, 49(6): 42-52.
[5]	金志军, 王浩, 方宝富. 稀疏场景下基于理性好奇心的多智能体强化学习[J]. 计算机工程, 2023, 49(5): 302-309.
[6]	饶东宁, 罗南岳. 基于多任务强化学习的堆垛机调度与库位推荐[J]. 计算机工程, 2023, 49(2): 279-287,295.
[7]	宋健, 王子磊. 基于值分解的多目标多智能体深度强化学习方法[J]. 计算机工程, 2023, 49(1): 31-40.
[8]	吴仍裕, 周强, 于海龙, 王亚沙. 基于深度强化学习的深圳市急救车调度算法[J]. 计算机工程, 2022, 48(9): 298-304.
[9]	赵寅甫, 冯正勇. 基于深度强化学习的机械臂控制快速训练方法[J]. 计算机工程, 2022, 48(8): 113-120.
[10]	厉子凡, 王浩, 方宝富. 一种基于多步竞争网络的多智能体协作方法[J]. 计算机工程, 2022, 48(5): 74-81.
[11]	周瑞朋, 秦进. 基于最佳子策略记忆的强化探索策略[J]. 计算机工程, 2022, 48(2): 106-112.
[12]	崔景洋, 陈振国, 田立勤, 张光华. 基于机器学习的用户与实体行为分析技术综述[J]. 计算机工程, 2022, 48(2): 10-24.
[13]	于晶, 鲁凌云, 李翔. 车联网中基于DDQN的边云协作任务卸载机制[J]. 计算机工程, 2022, 48(12): 156-164.
[14]	杨思明, 单征, 曹江, 郭佳郁, 高原, 郭洋, 王平, 王景, 王晓楠. 基于模型的强化学习在无人机路径规划中的应用[J]. 计算机工程, 2022, 48(12): 255-260,269.
[15]	黄晓辉, 张雄, 杨凯铭, 熊李艳. 基于联合Q值分解的强化学习网约车订单派送[J]. 计算机工程, 2022, 48(12): 296-303,311.

选择文件类型/文献管理软件名称

选择包含的内容

感知器学习算法研究

Reserch on Perceptron Learning Algorithm

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

感知器学习算法研究

Reserch on Perceptron Learning Algorithm

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价