作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

所属专题: 虚拟现实专题

• 先进计算与数据处理 • 上一篇    下一篇

支持搜索结果多样化的排名算法比较研究

陈婷婷,黄春兰,吴胜利   

  1. (江苏大学 计算机科学与通信工程学院,江苏 镇江 212013)
  • 收稿日期:2015-09-21 出版日期:2016-10-15 发布日期:2016-10-15
  • 作者简介:陈婷婷(1989—),女,硕士研究生,主研方向为数据库技术、信息检索;黄春兰,博士研究生;吴胜利,教授、博士生导师。
  • 基金资助:
    江苏大学特聘教授启动基金资助项目(13JDG002)。

Comparative Study of Ranking Algorithms Supporting Search Result Diversification

CHEN Tingting,HUANG Chunlan,WU Shengli   

  1. (School of Computer Science and Telecommunication Engineering,Jiangsu University,Zhenjiang,Jiangsu 212013,China)
  • Received:2015-09-21 Online:2016-10-15 Published:2016-10-15

摘要: 近年来在信息检索领域研究人员提出了多种支持结果多样化的排名算法,但还没有相关文献对这些算法的性能进行系统的分析和比较。为此,在数据融合排名算法CombSum的基础上,提出一种同时考虑文档相关性和多样性的排名算法CombSumDiv,并将其与xQuAD和PM2这2种显式排名算法进行性能比较。在TREC多样性任务提供的查询数据集和ClueWeb09B数据集上的实验结果表明,CombSumDiv查询性能较优、xQuAD次之、PM2较差,且3种算法均具有较强的稳定性及抗干扰能力。

关键词: 数据融合, 搜索结果多样化, 重排, 稳定性, 检索评价

Abstract: Recently,researchers in the field of information retrieval have proposed many ranking algorithms supporting search result diversification,but there is no literature on the performance analysis and comparison of these algorithms.Based on a traditional data fusion ranking algorithm CombSum,this paper proposes a new ranking algorithm CombSumDiv,which considers relevance and diversity of the documents at the same time.Besides,a comparison among CombSumDiv and two explicit ranking algorithms xQuAD and PM2 is conducted.Experiments are carried out with query datasets and ClueWeb09B datasets from the TREC diversity task.The result shows that the query performance of CombSumDiv algorithm is better than that of xQuAD and PM2 algorithm,and these three algorithms have strong stability and anti-interference ability.

Key words: data fusion, search result diversification, re-ranking, stability, retrieval evaluation

中图分类号: