作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

所属专题: 大数据专题

• 大数据专题 • 上一篇    下一篇

基于SimRank的公共自行车站点聚类算法

朱金山1,刘良旭2,周超兰2,管博2   

  1. (1.浙江大学宁波理工学院 图书信息中心,浙江 宁波 315100; 2.宁波工程学院 电子与信息工程学院,浙江 宁波 315211)
  • 收稿日期:2017-02-27 出版日期:2018-04-15 发布日期:2018-04-15
  • 作者简介:朱金山(1976—),男,工程师、硕士,主研方向为大数据分析;刘良旭(通信作者),副教授、博士;周超兰,本科生;管博,副教授、硕士。
  • 基金资助:
    浙江省自然科学基金(LY14F020007);浙江省公益技术应用研究计划项目(2016C33255);宁波市自然科学基金(2014A610072)。

Public Bike Station Clustering Algorithm Based on SimRank

ZHU Jinshan 1,LIU Liangxu 2,ZHOU Chaolan 2,GUAN Bo 2   

  1. (1.Library and Information Center,Ningbo Institute of Technology,Zhejiang University,Ningbo,Zhejiang 315100,China;2.School of Electronic and Information Engineering,Ningbo University of Technology,Ningbo,Zhejiang 315211,China)
  • Received:2017-02-27 Online:2018-04-15 Published:2018-04-15

摘要: 针对城市公共自行车系统快速发展面临的潮汐问题,提出一种基于SimRank的自行车站点聚类算法。从站点间的关联关系出发,基于站点特性定义站点相似度,引入SimRank算法进行站点相似度计算,并按计算得到的相似度值,根据最大相似优先的思想对站点进行聚类。实验结果表明,该算法得到的聚类结果能准确反映自行车流趋势和区域特征,其中同聚类成员也具有较大的关联性。

关键词: 公共自行车, 聚类分析, 站点联系, 站点特征, 相似度矩阵

Abstract: In view of the tide problem of fast developed city public bike system,this paper proposes a station clustering algorithm based on SimRank,which uses the characteristics of public bike.Firstly,the definition of station similarity is proposed based on the relation between stations.Secondly,the SimRank algorithm is introduced to calculate the similarity between stations.Finally,according to the calculated similarity values,the stations are clustered with the idea of maximum similarity priority.Experimental results show that the clustering results by the proposed algorithm have accurate bike flow characteristic and regional characteristic,meanwhile,the members in same cluster have great relevance.

Key words: public bike, clustering analysis, station relationship, station feature, similarity matrix

中图分类号: