作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2018, Vol. 44 ›› Issue (11): 172-177. doi: 10.19678/j.issn.1000-3428.0048631

• 人工智能及识别技术 • 上一篇    下一篇

针对新用户冷启动问题的改进Epsilon-greedy算法

王素琴1,张洋1,蒋浩2,朱登明2   

  1. 1.华北电力大学 控制与计算机工程学院,北京 102206; 2.中国科学院计算技术研究所,北京 100080
  • 收稿日期:2017-09-11 出版日期:2018-11-15 发布日期:2018-11-15
  • 作者简介:王素琴(1970—),女,副教授、硕士,主研方向为数据挖掘、计算机视觉;张洋,硕士;蒋浩,助理研究员、博士;朱登明,副研究员、博士。
  • 基金资助:

    国家自然科学基金“逼真稳定的服装动画方法研究”(61300131);北京市共建项目(2014JG48)

Improved Epsilon-greedy Algorithm for Cold-start Problem of New Users

WANG Suqin 1,ZHANG Yang 1,JIANG Hao 2,ZHU Dengming 2   

  1. 1.School of Control and Computer Engineering,North China Electric Power University,Beijing 102206,China; 2.Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100080,China
  • Received:2017-09-11 Online:2018-11-15 Published:2018-11-15

摘要:

在解决新用户冷启动问题时,固定不变的Epsilon参数会使传统Epsilongreedy算法收敛缓慢。为此,提出一种改进的Epsilon-greedy算法。利用免疫反馈模型动态调整Epsilon参数,从而使算法快速收敛。使用蒙特卡罗模拟方法对算法进行实验验证,结果表明,该算法能够在用户与推荐系统交互较少的情况下为用户进行有效推荐,且推荐效果优于传统的Epsilon-greedy、Softmax和UCB算法。

关键词: 推荐系统, 冷启动, Epsilon-greedy算法, 免疫反馈模型, bandit算法

Abstract: When solving the cold-start problem of new users,fixed and invariant Epsilon parameters will slow the convergence of traditional Epsilon-greedy algorithm.Therefore,an improved Epsilon-greedy algorithm is proposed.Immune feedback model is used to dynamically adjust the Epsilon parameters so that the algorithm converges quickly.Monte Carlo simulation is used to validate the proposed algorithm.Results show that this algorithm can effectively recommend to users when they have little interaction with the recommendation system,and the recommendation effect is better than the traditional Epsilon-greedy algorithm,Softmax algorithm and UCB algorithm.

Key words: recommendation system, cold-start, Epsilon-greedy algorithm, immune feedback model, bandit algorithm

中图分类号: