作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

• 先进计算与数据处理 • 上一篇    下一篇

可扩展的分布式元数据管理系统设计

黄秋兰,程耀东,杜 然,陈 刚   

  1. (中国科学院高能物理研究所计算中心,北京100049)
  • 收稿日期:2014-05-29 出版日期:2015-05-15 发布日期:2015-05-15
  • 作者简介:黄秋兰(1982 - ),女,助理研究员、博士,主研方向:海量数据存储;程耀东,副研究员、博士;杜 然,博士研究生;陈 刚, 研究员、博士。
  • 基金资助:
    国家自然科学基金资助项目(11305192,11205179)。

Design of Scalable Distributed Metadata Management System

HUANG Qiulan,CHENG Yaodong,DU Ran,CHEN Gan   

  1. (Computing Center,Institute of High Energy Physics,Chinese Academy of Sciences,Beijing 100049,China)
  • Received:2014-05-29 Online:2015-05-15 Published:2015-05-15

摘要: 为解决高能物理海量存储系统由于存储规模不断扩大所面临的问题,设计一种分布式元数据管理系统,包括 元数据管理、元数据服务、缓存服务以及监控信息采集4 个部分,在此基础上提出自适应目录子树划分算法,以目录为 粒度进行元数据划分,根据集群负载情况调整目录子树,实现元数据信息在元数据集群中的合理存储和分布。实验 结果证明,该算法能提高元数据的访问和检索性能,提供可扩展及动态负载均衡的元数据服务,以保证该元数据管理 系统的可用性、扩展性及I / O 性能不会因存储规模扩大而受到影响,满足高能物理实验日益增长的存储需求。

关键词: 元数据管理, 动态, 可扩展, 元数据分布, Ceph 文件系统, Gluster 文件系统, Lustre 文件系统

Abstract: To solve the problems caused by the storage expanding in high energy physics mass storage system,a scalable distributed metadata management system is designed,which includes metadata management,metadata service, cache service and monitoring information collector. Based on it,a new Adaptive Directory Sub-tree Partition(ADSP) algorithm is proposed. ADSP divides the file system namespace into sub-trees with directory granularity and adjusts subtrees adaptively according to the load of metadata cluster for achieving the storage and distribution of metadata in cluster.Experimental results show that the algorithm can improve the metadata access and retrieval performance,provides a scalable and dynamic load balancing of metadata service to ensure the availability,scalability and I / O performance of metadata management system is not affected by the storage scale,thereby it can meet the growing storage requirements of high energy physics experiments.

Key words: metadata management, dynamic, scalability, metadata distribution, Ceph file system, Gluster file system, Lustre file system

中图分类号: