一种面向大规模数据处理的数据库引擎

doi:10.3969/j.issn.1000-3428.2012.11.015

计算机工程 ›› 2012, Vol. 38 ›› Issue (11): 48-50.

一种面向大规模数据处理的数据库引擎

王毅，刘长城，马建庆

(复旦大学计算机科学技术学院，上海 200433)

收稿日期:2011-12-19 出版日期:2012-06-05 发布日期:2012-06-05
作者简介:王毅(1985－)，男，硕士，主研方向：数据仓库技术，并行计算；刘长城，硕士；马建庆，讲师、博士
基金资助:
国家自然科学基金资助项目(60803117)

Database Engine for Large Scale Data Processing

WANG Yi, LIU Chang-cheng, MA Jian-qing

(School of Computer Science, Fudan University, Shanghai 200433, China)

Received:2011-12-19 Online:2012-06-05 Published:2012-06-05

摘要/Abstract

摘要： 当数据量从GB级上升至TB级甚至PB级时，具有高性能的并行数据库在保证扩展性和容错性的同时计算代价会很高。针对该问题，设计一种面向大规模数据处理的并行数据库引擎FlexDB。利用Map Reduce的并行计算框架作为通信层，调度和协调集群中各节点的计算和通信。实验结果表明，FlexDB的系统性能接近于并行数据库，并且具有较好的扩展性和容错性。

关键词: 海量数据, 扩展性, 容错性, Map Reduce框架, 并行数据库

Abstract: When the amount of data from GB goes up to TB level or even PB level, parallel database with high performance cost too much in order to achieve scalability and fault tolerance. To address the problem, this paper designs a parallel database engine——FlexDB, which is based on Map Reduce. The parallel computing framework of Map Reduce is as a communication layer of FlexDB which is to assign computing tasks and coordinate communications among all nodes in cluster. Experimental results show that the FlexDB system performance is close to parallel database, and has good expansibility and fault tolerance.

Key words: mass data, scalability, fault tolerance, Map Reduce framework, parallel database

中图分类号:

TP311

王毅, 刘长城, 马建庆. 一种面向大规模数据处理的数据库引擎[J]. 计算机工程, 2012, 38(11): 48-50.

WANG Yi, LIU Chang-Cheng, MA Jian-Qiang. Database Engine for Large Scale Data Processing[J]. Computer Engineering, 2012, 38(11): 48-50.

https://www.ecice06.com/CN/Y2012/V38/I11/48

[1]	王华维, 刘若妍, 艾志玮, 曹轶. 基于多绘制管线的大规模并行体绘制性能优化技术[J]. 计算机工程, 2024, 50(8): 207-215.
[2]	苏瑞国, 阳建, 秦继伟, 武晓雄, 贾振红. 基于物联网区块链的轻量级共识算法研究[J]. 计算机工程, 2023, 49(2): 175-180.
[3]	黄华威, 孔伟, 彭肖文, 郑子彬. 区块链分片技术综述[J]. 计算机工程, 2022, 48(6): 1-10.
[4]	刘旭, 张曦煌, 刘钊, 吕小敬, 朱光辉. 基于神威太湖之光的宇宙学多体模拟[J]. 计算机工程, 2020, 46(9): 35-43.
[5]	唐鸿成, 文畅, 冯文祥, 谢凯, 方文青. 基于智能聚类模型的海量数据快速显示方法[J]. 计算机工程, 2019, 45(8): 53-59.
[6]	殷晓超,韩国栋,王孝龙. 基于输出队列的WUDN交换结构仿真及分析[J]. 计算机工程, 2018, 44(7): 80-85.
[7]	宁可,孙同晶,徐洁洁. 面向海量数据的改进最近邻优先吸收聚类算法[J]. 计算机工程, 2018, 44(4): 35-40.
[8]	余立苹,李云飞,朱世行. 基于高维数据流的异常检测算法[J]. 计算机工程, 2018, 44(1): 51-55.
[9]	彭振,吴百锋. 基于数据并行的碰撞检测[J]. 计算机工程, 2017, 43(9): 1-6.
[10]	陈曦,朱建涛,何晓斌. 一种面向高性能计算的分布式对象存储系统[J]. 计算机工程, 2017, 43(8): 69-73.
[11]	周政,刘勇智,宋金龙,马卫民,王真亮. 功率变换器的容错设计及验证[J]. 计算机工程, 2017, 43(2): 120-123,130.
[12]	张剑,刘梦赤. 面向信息网模型的高可扩展性分布式事务处理机制[J]. 计算机工程, 2017, 43(11): 16-21,26.
[13]	马冬冬,衷璐洁,朱敬茹. 基于GPU的LLVM程序分析信息并行提取[J]. 计算机工程, 2017, 43(10): 23-30.
[14]	蒋成. 基于弧形不相交生成树的多链路故障恢复方法[J]. 计算机工程, 2016, 42(7): 65-71.
[15]	周文剑,靳婷. Blogel-SPINAL:分布式PPI网络比对算法[J]. 计算机工程, 2016, 42(4): 209-214,220.

选择文件类型/文献管理软件名称

选择包含的内容

一种面向大规模数据处理的数据库引擎

Database Engine for Large Scale Data Processing

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

一种面向大规模数据处理的数据库引擎

Database Engine for Large Scale Data Processing

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价