基于深度强化学习的流媒体边缘云会话调度策略

doi:10.19678/j.issn.1000-3428.0050875

计算机工程 ›› 2019, Vol. 45 ›› Issue (5): 237-242,248. doi: 10.19678/j.issn.1000-3428.0050875

基于深度强化学习的流媒体边缘云会话调度策略

徐西建,王子磊,奚宏生

中国科学技术大学自动化系,合肥 230027

收稿日期:2018-03-20 出版日期:2019-05-15 发布日期:2019-05-15
作者简介:徐西建(1992—),男,硕士研究生,主研方向为网络多媒体;王子磊,副教授;奚宏生,教授。
基金资助:
国家自然科学基金(61673362);中央高校基本科研业务费专项资金(WK3500000002)。

Session scheduling strategy for streaming media edge cloud based on deep reinforcement learning

XU Xijian,WANG Zilei,XI Hongsheng

Department of Automation,University of Science and Technology of China,Hefei 230027,China

Received:2018-03-20 Online:2019-05-15 Published:2019-05-15

摘要/Abstract

摘要：

在流媒体边缘云资源调度中,传统启发式方法或规划方法多数存在自适应性不足、时间复杂度高等问题。基于迁移代价、负载均衡等约束,提出一种流媒体边缘云会话调度策略。以流媒体边缘云系统的状态信息作为属性特征,结合深度学习与确定性策略进行梯度强化学习,以解决用户请求接入问题。实验结果表明,该策略具有较好的请求接入效果,且能够降低迁移代价,同时缩短了运行时间。

关键词: 流媒体边缘云, 会话调度, 会话迁移, 深度学习, 强化学习, 确定性策略梯度

Abstract:

In the streaming cloud edge resource scheduling,traditional heuristic methods or planning methods mostly have problems such as insufficient adaptability and high time complexity.Based on the constraints of migration cost and load balancing,a session scheduling strategy for streaming media edge cloud is proposed.The state information of the streaming media edge cloud system is used as the attribute feature,and the deep learning and the deterministic strategy are combined to carry out the gradient reinforcement learning to solve the problem of user request access.Experimental results show that the strategy has better request access effect,and can reduce the migration cost and shorten the running time.

Key words: streaming Media Edge Cloud(MEC), session scheduling, session migration, deep learning, reinforcement learning, deterministic strategy gradient

中图分类号:

TP37

徐西建,王子磊,奚宏生. 基于深度强化学习的流媒体边缘云会话调度策略[J]. 计算机工程, 2019, 45(5): 237-242,248.

XU Xijian,WANG Zilei,XI Hongsheng. Session scheduling strategy for streaming media edge cloud based on deep reinforcement learning[J]. Computer Engineering, 2019, 45(5): 237-242,248.

https://www.ecice06.com/CN/Y2019/V45/I5/237

参考文献

［1］姜同全,王子磊,奚宏生,等.基于动态阈值分配的流媒体边缘云会话迁移策略［J］.计算机工程,2017,43(1):55-60.
［2］WANG Feng,LIU Jiangchuan,CHEN Minghua.CALMS:cloud-assisted live media streaming for globalized demands with time/region diversities［C］//Proceedings of IEEE International Conference on Computer Communications.Washington D.C.,USA:IEEE Press,2012:199-207.
［3］WOLF J L,YU P S,SHACHNAI H.Disk load balancing for video-on-demand systems［J］.Multimedia Systems,1997,5(6):358-370.
［4］SUTTON R S,PRECUP D,SINGH S.Between MDPs and semi-MDPs:a framework for temporal abstraction in reinforcement learning［J］.Artificial Intelligence,1999,112(1/2):181-211.
［5］MIYAZAWA T,KAFLE V P,HARAI H.Reinforcement learning based dynamic resource migration for virtual networks［C］//Proceedings of Symposium on Integrated Network and Service Management.Washington D.C.,USA:IEEE Press,2017:428-434.
［6］WANG Jinzhi,QU Shuhui,WANG Jie,et al.Real-time decision support with reinforcement learning for dynamic flowshop scheduling［C］//Proceedings of European Conference on Smart Objects,Systems and Technologies.Munich,Germany:［s.n.］,2017:1-9.
［7］PENG Zhiping,CUI Delong,MA Yuanjia,et al.A reinforcement learning-based mixed job scheduler scheme for cloud computing under SLA constraint［C］// Proceedings of the 3rd International Conference on Cyber Security and Cloud Computing.Washington D.C.,USA:IEEE Press,2016:142-147.
［8］ZHAO Yang,XIAO Mingqing,GE Yawei.Dynamic resource scheduling of cloud-based automatic test system using reinforcement learning［C］//Proceedings of the 13th IEEE International Conference on Electronic Measurement and Instruments.Washington D.C.,USA:IEEE Press,2017:159-165.
［9］WANG Y C,USHER J M.Application of reinforcement learning for agent-based production scheduling［J］.Engineering Applications of Artificial Intelligence,2005,18(1):73-82.
［10］MNIH V,KAVUKCUOGLU K,SILVER D,et al.Human-level control through deep reinforcement learning［J］.Nature,2015,518(7540):529-533.
［11］SILVER D,HUANG A,MADDISON C J,et al.Mastering the game of go with deep neural networks and tree search［J］.Nature,2016,529(7587):484-489.
［12］LILLICRAP T P,HUNT J J,PRITZEL A,et al.Continuous control with deep reinforcement learning［EB/OL］.［2018-02-08］.https://arxiv.org/pdf/1509.02971.pdf.
［13］李军,倪宏,王玲芳,等.流媒体系统中基于请求迁移的任务调度算法［J］.吉林大学学报(工学版),2015,45(3):938-945.
［14］温暖,刘正华,祝令谱,等.深度强化学习在变体飞行器自主外形优化中的应用［J］.宇航学报,2017,38(11):1153-1159.
［15］CHEN Liang,ZHOU Yipeng,CHIU D M.Smart streaming for online video services［J］.IEEE Transactions on Multimedia,2015,17(4):485-497.

[1]	魏嵬, 丁香香, 郭梦星, 杨钊, 刘辉. 文本相似度计算方法综述[J]. 计算机工程, 2024, 50(9): 18-32.
[2]	朱凯, 李理, 张彤, 江晟, 别一鸣. 基于Transformer的多阶段运动模糊图像修复网络[J]. 计算机工程, 2024, 50(9): 276-285.
[3]	张天鹏, 韩晶, 吕学强. 基于多任务学习的超分辨率辅助小目标检测[J]. 计算机工程, 2024, 50(9): 304-312.
[4]	高煜宝, 文志诚. 基于注意力机制的双路解码器图像去噪方法[J]. 计算机工程, 2024, 50(9): 324-332.
[5]	石琼, 段辉, 师智斌. 基于深度强化学习的可信任务卸载方案[J]. 计算机工程, 2024, 50(8): 142-152.
[6]	钱清, 龙永, 蒋忠远, 段春红, 王宏. 基于深度强化学习的自适应图像隐写算法[J]. 计算机工程, 2024, 50(8): 319-327.
[7]	高伟, 李帅龙, 茆琳, 王磊, 李颖颖, 韩林. 一种基于TVM的算子生成加速策略[J]. 计算机工程, 2024, 50(8): 353-362.
[8]	王宇, 祁琦, 王纯, 许才. 储能变流器信号高精度故障诊断方法[J]. 计算机工程, 2024, 50(8): 389-396.
[9]	张华青, 夏张涛, 陆晓庆, 童基均. 基于字形特征的血管外科命名实体识别[J]. 计算机工程, 2024, 50(8): 13-21.
[10]	张亚洲, 和玉, 戎璐, 王祥凯. 基于上下文知识增强型Transformer网络的抑郁检测[J]. 计算机工程, 2024, 50(8): 75-85.
[11]	肖慈, 徐杨, 张永丹, 冯明文, 黄易仟. 结合注意力和低光增强的夜间语义分割[J]. 计算机工程, 2024, 50(7): 271-281.
[12]	张诗婧, 莫绪涛, 赵行, 董杨林. 基于球面折反射成像和YOLOv7的内螺纹缺陷检测[J]. 计算机工程, 2024, 50(7): 282-292.
[13]	牛瑞婷, 严天峰, 高锐, 王映植. 低信噪比下基于深度学习TCNN-MobileNet的调制识别[J]. 计算机工程, 2024, 50(7): 204-215.
[14]	徐明亮, 李芳媛, 马浩然, 何飞. 大规模神经记录的峰电位聚类算法(特邀)[J]. 计算机工程, 2024, 50(6): 1-34.
[15]	魏琢艺, 罗迈, 李文兵, 曾远松, 余伟江, 杨跃东. 基于多源域适应的单细胞智能分类[J]. 计算机工程, 2024, 50(6): 48-55.

选择文件类型/文献管理软件名称

选择包含的内容

基于深度强化学习的流媒体边缘云会话调度策略

Session scheduling strategy for streaming media edge cloud based on deep reinforcement learning

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于深度强化学习的流媒体边缘云会话调度策略

Session scheduling strategy for streaming media edge cloud based on deep reinforcement learning

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价