<p>基于黑板模型的多智能体合作学习</p>

doi:10.3969/j.issn.1000-3428.2007.22.015

计算机工程 ›› 2007, Vol. 33 ›› Issue (22): 42-44,4. doi: 10.3969/j.issn.1000-3428.2007.22.015

基于黑板模型的多智能体合作学习

韩　伟，韩忠愿

(南京财经大学信息工程学院，南京 210046)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2007-11-20 发布日期:2007-11-20

Multiagent Learning Based on Black-board Model

HAN Wei, HAN Zhong-yuan

(College of Information Science, Nanjing University of Financial and Economics, Nanjing 210046)

Received:1900-01-01 Revised:1900-01-01 Online:2007-11-20 Published:2007-11-20

摘要/Abstract

摘要： Q学习算法要求智能体无限遍历每个状态-动作转换，因此在涉及状态-动作空间非常大的应用问题时，导致收敛速度非常慢。借助多智能体的合作学习，智能体之间基于黑板模型的方法通过开关函数相互协调合作，可以更快地定位那些有效的状态-动作转换，避免了无效的更新，从而以较小的学习代价加快了Q表的收敛速度。

关键词: 多智能体系统, 合作学习, 黑板模型

Abstract: Q learning requires each state-action transform be visited infinitely, which limits its application when comes to large state-action space. This paper puts forward a black-board-model based multiagents cooperation learning algorithm. Agents cooperate and coordinate by a bull function which is defined in state-action space. By this bull function, agents can find those effective update more quickly and thus avoid those useless updates. Simulation proves the method can speed up the learning process at lower cost.

Key words: multiagents system, cooperation learning, black-board model

中图分类号:

TP391

韩　伟;韩忠愿.

基于黑板模型的多智能体合作学习

[J]. 计算机工程, 2007, 33(22): 42-44,4.

HAN Wei; HAN Zhong-yuan. Multiagent Learning Based on Black-board Model[J]. Computer Engineering, 2007, 33(22): 42-44,4.

http://www.ecice06.com/CN/Y2007/V33/I22/42

[1]	金志军, 王浩, 方宝富. 稀疏场景下基于理性好奇心的多智能体强化学习[J]. 计算机工程, 2023, 49(5): 302-309.
[2]	隆腾, 杨莎莎, 王茜竹. 可变脉冲控制下的多智能体系统固定时间一致性研究[J]. 计算机工程, 2023, 49(1): 311-320.
[3]	崔艳, 李庆华. 二阶多智能体系统参数自适应的有限时间一致性算法[J]. 计算机工程, 2020, 46(4): 273-278,286.
[4]	赵蕊,朱美玲,徐勇. 基于观测器的多智能体系统自适应跟踪控制[J]. 计算机工程, 2017, 43(4): 317-321.
[5]	张琦琪,刘鹏,张涛. 基于多Agent的板坯出/入库协同调度系统[J]. 计算机工程, 2015, 41(1): 289-295.
[6]	秦锋,田杰,程泽凯. 基于偏最小二乘法的RoboCup 传球研究[J]. 计算机工程, 2014, 40(9): 275-279.
[7]	薛红, 赵川. 基于多智能体的连锁零售多级库存集成与优化[J]. 计算机工程, 2012, 38(14): 167-170.
[8]	周绪川, 钟勇, 蔡利平. 机会发现在多智能体系统中的形式化描述方法[J]. 计算机工程, 2011, 37(11): 187-189.
[9]	骆翔宇;陈艳. Web服务的形式化验证[J]. 计算机工程, 2010, 36(5): 257-259.
[10]	张继军;田宝国;张继平;张金春. 基于遗传算法的多智能体联盟形成机制[J]. 计算机工程, 2009, 35(6): 219-221.
[11]	富宇;唐国维;高雅田. 基于Agent的数据库分布式语义缓存[J]. 计算机工程, 2009, 35(16): 48-50.
[12]	赵辉;谭天晓;赵宗涛. 一种基于MAS的作战指挥智能运作模型研究[J]. 计算机工程, 2007, 33(04): 171-172.
[13]	Architecture for Multi-agent Distributed Intelligent Control Based on Coevolution Mechanism. 基于协进化机制的Multi-agent分布式智能控制体系[J]. 计算机工程, 2006, 32(19): 34-37.

选择文件类型/文献管理软件名称

选择包含的内容

基于黑板模型的多智能体合作学习

Multiagent Learning Based on Black-board Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 13

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于黑板模型的多智能体合作学习

Multiagent Learning Based on Black-board Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 13

编辑推荐

Metrics

本文评价