作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑
基于Q值低估的多智能体强化学习探索优化方法
罗纯颖, 丁世飞, 张健, 李璇, 杜威
Optimizing Exploration via Q-Value Underestimation in Multi-Agent Reinforcement Learning
Chunying Luo, Shifei Ding, Jian Zhang, Xuan Li, Wei Du
计算机工程 . 0, (): 0 -0 .  DOI: 10.19678/j.issn.1000-3428. 0252735