计算机工程

• 人工智能及识别技术 • 上一篇    下一篇

微博环境下基于用户行为与主题相似度的改进PageRank算法

朱颢东,丁温雪,杨立志,冯嘉美   

  1. (郑州轻工业学院 计算机与通信工程学院,郑州 450002)
  • 收稿日期:2016-08-10 出版日期:2017-05-15 发布日期:2017-05-15
  • 作者简介:朱颢东(1980—),男,副教授、博士,主研方向为智能信息处理、智能计算;丁温雪、杨立志、冯嘉美,硕士研究生。
  • 基金项目:
    河南省科技计划项目(152102210149,152102210357);河南省高等学校青年骨干教师资助计划项目(2014GGJS-084);河南省高等学校重点科研项目(16A520030);郑州轻工业学院校级青年骨干教师培养对象资助计划项目(XGGJS02);郑州轻工业学院博士科研基金(2010BSJJ038)。

Improved PageRank Algorithm Based on User Behavior and Topic Similarity in Microblog Environment

ZHU Haodong,DING Wenxue,YANG Lizhi,FENG Jiamei   

  1. (School of Computer and Communication Engineering,Zhengzhou University of Light Industry,Zhengzhou 450002,China)
  • Received:2016-08-10 Online:2017-05-15 Published:2017-05-15

摘要:

针对传统PageRank算法存在主题漂移、网页权值均分等问题,提出一种改进的PageRank算法。为提高用户查询效率和搜索质量,结合时间反馈因子对用户转发、用户评论和微博提及行为进行综合分析,采用统计分析方法对用户行为在微博用户影响力排序中的贡献进行度量,并利用改进的TF-IDF算法计算主题相似度权值使用户能够选择相关度较高的网页,从而获得相对应的PageRank权值。实验结果表明,与微博常用排序算法相比,改进PageRank算法具有更好的用户影响力排序效果。

关键词: PageRank算法, 相似度权值, 时间反馈因子, 用户行为, 随机游走模型

Abstract:

Aiming at the theme drifting and the page weight splitting of traditional PageRank algorithm,an improved PageRank algorithm is proposed.In order to improve the user query efficiency and search quality,combined with the time feedback factor,it makes a comprehensive analysis on user forwarding,user comments and micro-blog mentions.Statistical analysis is used to measure the contribution of user behavior in the ranking of micro-blog user influence.By using the improved TF-IDF algorithm to calculate the similarity weight of the topic,the user can select the Web page with high relevance to obtain the corresponding PageRank weight.Experimental results show that compared with common microblog ranking algorithms,the improved PageRank algorithm has better user influence ranking effect.

Key words: PageRank algorithm, similarity weight, time feedback factor, user behavior, random walk model

中图分类号: