作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

• 先进计算与数据处理 • 上一篇    下一篇

基于数据库的文件系统管理工具设计与实现

石京燕1,陈德清1,2   

  1. (1. 中国科学院高能物理研究所,北京100049; 2. 中国科学院大学,北京100049)
  • 收稿日期:2014-05-23 出版日期:2015-05-15 发布日期:2015-05-15
  • 作者简介:石京燕(1972 - ),女,副研究员,主研方向:高性能计算;陈德清,硕士研究生。
  • 基金资助:
    国家自然科学基金资助项目(11375223,61161140454)。

Design and Implementation of File System Management Tool Based on Database

SHI Jingyan  1,CHEN Deqing  1,2   

  1. (1. Institute of High Energy Physics,Chinese Academy of Sciences,Beijing 100049,China; 2. University of Chinese Academy of Sciences,Beijing 100049,China)
  • Received:2014-05-23 Online:2015-05-15 Published:2015-05-15

摘要: 传统的文件系统管理工具通过实时遍历文件目录树获取文件元数据信息,以实现管理监视功能。但对于 大型文件系统,元数据信息的获取需要耗费大量时间,传统管理工具无法适应当前大数据背景下的管理需求。为 此,基于数据库技术设计一种新的文件系统管理工具。该工具集成Robinhood 策略引擎与TORQUE 作业管理系 统,通过分布式并行计算获取文件系统元数据信息,并将信息保存到MySQL 数据库,同时基于数据库中的元数据 信息,实现文件系统的监视、管理和备份功能。实验结果表明,采用分布式并行计算能够充分利用集群的计算资 源,提高文件系统的遍历速率,保证文件系统监视、管理和备份的顺利进行。

关键词: 元数据, 大数据, Robinhood 策略引擎, TORQUE 作业管理系统, 分布式处理, MySQL 数据库

Abstract: Traditional file system management tools achieve management and monitoring functions by traversing file directory tree to get metadata information. For large file systems,it is a time consumed task to get metadata which can not meet the demand of the current management of large data background. This paper integrates policy engine Robinhood and TORQUE job management system. A distributed parallel computing is used to get the file system metadata information which is saved into MySQL database. Based on metadata information saved in database,the tool achieves monitoring,file management and system backup. The tests indicate that distributed computing is able to fully use the computing utilities of the cluster,not able to enhance the speed of traversing file system,and makes sure of the progressing on monitoring, management and back up of the file system.

Key words: metadata, big data, Robinhood policy engine, TORQUE job management system, distributed processing, MySQL database

中图分类号: