基于联合<i>Q</i>值分解的强化学习网约车订单派送

检索

作者投稿和查稿主编审稿专家审稿编委审稿远程编辑

黄晓辉, 张雄, 杨凯铭, 熊李艳

Reinforcement Learning Online Car-Hailing Order Dispatch Based on Joint Q-value Decomposition

HUANG Xiaohui, ZHANG Xiong, YANG Kaiming, XIONG Liyan

计算机工程 . 2022, (12): 296 -303,311 . DOI: 10.19678/j.issn.1000-3428.0063438