作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

• 开发研究与工程应用 • 上一篇    下一篇

一种基于数据迁移的冷启动解决算法

马远坤1,梁永全1,刘 彤1,赵建立1,李玉军2   

  1. (1. 山东科技大学信息科学与工程学院,山东 青岛 266590;2. 海信集团有限公司数字多媒体技术国家重点实验室,山东 青岛 266000)
  • 收稿日期:2013-05-14 出版日期:2014-04-15 发布日期:2014-04-14
  • 作者简介:马远坤(1989-),男,硕士研究生,主研方向:机器学习,数据挖掘;梁永全,教授、博士;刘 彤,讲师、博士;赵建立(通讯作者),副教授、博士;李玉军,研究员、博士后。
  • 基金资助:
    国家自然科学基金资助项目(71240003);国家“973”计划前期研究专项基金资助项目“云服务多媒体应用平台的基础架构研究与应用研究”(2012CB724106);山东省自然科学基金资助项目(ZR2012FM003);山东省优秀中青年科学家科研奖励基金资助项目(BS2012DX030);山东省高等学校科技计划基金资助项目(J12LN45);全国统计科学研究计划基金资助项目(2012LY001);青岛开发区重点科技计划基金资助项目(2013-1-25);青岛市科技计划基础研究基金资助项目(KJZD-13-29-JCH)。

A Solution Algorithm for Cold Start Based on Data Transfer

MA Yuan-kun   1, LIANG Yong-quan   1, LIU Tong   1, ZHAO Jian-li   1, LI Yu-jun   2   

  1. (1. College of Information Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China; 2. State Key Laboratory of Digital Multi-media Technology, Hisense Group, Qingdao 266000, China)
  • Received:2013-05-14 Online:2014-04-15 Published:2014-04-14

摘要: 在协同过滤技术的实际应用中,提出一种数据迁移和聚类相结合的方法来解决新系统冷启动问题。采用斯皮尔曼秩相关公式度量用户之间的相似度,使用期望最大化聚类算法对原数据集用户进行聚类。对于不同的簇,选取平均打分最高的N个项目作为推荐内容,针对目标数据集的用户,计算用户所属的簇以及对簇的隶属度,按照隶属度比例给用户推荐其所属簇的推荐列表。与TAM算法和CF算法的实验对比结果表明,该算法在解决新系统冷启动问题方面有较好的效果。

关键词: 推荐系统, 冷启动, 协同过滤, 数据迁移, 迁移学习, 期望最大化

Abstract: In the practical application of collabrative filtering technology, this paper proposes a method which combines the transfer learning technology and clustering technology to solve the cold start problem of new system. This method uses spearman rank correlation to measure the similarity between two users, and takes use of expectation maximization algorithm to cluster the users of source dataset into several clusters. For different cluster, N items who have the higher average score are selected as this cluster’s recommendation list. For users of target dataset, calculate the clusters belong to the users and membership of the clusters. It recommends the recommended list of the cluster according to the membership in proportion. Experimental results show that the algorithm is more available to solve the cold start problem of new system than the TAM algorithm and CR algorithm.

Key words: recommender system, cold start, collaborative filtering, data transfer, transfer learning, expectation maximization

中图分类号: