作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

• 先进计算与数据处理 • 上一篇    下一篇

分布式信息网数据库管理系统的动态数据划分研究

马杨,刘梦赤   

  1. (武汉大学 计算机学院,武汉 430072)
  • 收稿日期:2016-07-12 出版日期:2017-09-15 发布日期:2017-09-15
  • 作者简介:马杨(1993—),女,硕士研究生,主研方向为数据库技术、大数据;刘梦赤,教授。
  • 基金资助:
    国家自然科学基金(61202100);软件工程国家重点实验室开放基金(SKLSE2012-09-20)。

Research on Dynamic Data Partition of Database Management System in Distributed Information Network

MA Yang,LIU Mengchi   

  1. (School of Computer,Wuhan University,Wuhan 430072,China)
  • Received:2016-07-12 Online:2017-09-15 Published:2017-09-15

摘要: 在分布式信息网数据库管理系统中,数据是否被合理划分会影响系统的负载均衡以及节点之间的通信开销。为此,提出一种基于查询的动态数据划分算法。根据历史查询信息挖掘数据之间潜在的关联性,将关联性较大的数据动态调整到同一个处理节点上,使查询在较少的节点上处理完成,减少不必要的通信开销。实验结果表明,在保证系统负载均衡的情况下,该算法可减小通信开销,加快查询速度,优化分布式环境的整体性能。

关键词: 动态数据划分, 通信开销, 关联性, 负载均衡, 分布式系统

Abstract: For database management system in distributed information network,whether data is partitioned reasonably affects not only load balancing of the system but also the communication overhead between nodes.Aiming at this problem,this paper proposes a query-based dynamic data partition algorithm.According to the historical query information,it mines the potential relevance between data and dynamically adjusts the data with larger relevance to one processing node,so as to make the query processing completed in fewer nodes and reduce the unnecessary communication overhead.Experimental results show that,in the case of system load balancing,this algorithm can reduce the communication overhead,speed up the query and optimize the overall performance of the distributed environment.

Key words: dynamic data partition, communication overhead, relevance, load balancing, distributed system

中图分类号: