作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2012, Vol. 38 ›› Issue (18): 26-29. doi: 10.3969/j.issn.1000-3428.2012.18.007

• 软件技术与数据库 • 上一篇    下一篇

列存储数据库中压缩位图索引技术

王 梅,杨思箫,乐嘉锦   

  1. (东华大学计算机科学与技术学院,上海 201620)
  • 收稿日期:2011-12-07 修回日期:2012-01-15 出版日期:2012-09-20 发布日期:2012-09-18
  • 作者简介:王 梅(1980-),女,副教授、博士后,主研方向:数据库技术,多媒体信息检索;杨思箫,硕士研究生;乐嘉锦,教授
  • 基金资助:

    国家自然科学基金资助项目(61070031, 61070032, 61103046);“核高基”重大专项(2010ZX01042-001-003-004);上海市自然科学基金资助项目(11ZR1401200)

Compressed Bitmap Index Technology in Column-oriented Database

WANG Mei, YANG Si-xiao, LE Jia-jin   

  1. (School of Computer Science and Technology, Donghua University, Shanghai 201620, China)
  • Received:2011-12-07 Revised:2012-01-15 Online:2012-09-20 Published:2012-09-18

摘要: 为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group by子句在查询执行过程中的数据提取。在SSB数据集上的实验结果证明,该技术能提高29.7%~38.9%的压缩位图索引性能。

关键词: 列存储数据库, 位图索引, 活跃度, SSB数据集, 聚集查询

Abstract: In order to improve the compression code utilization, this paper presents a compressed bitmap index technology in column-oriented database. It defines the inversion and merges operations to transform the input and output of all calculation to the bitmap vector. By using a vitality to describe the complexity of each bitmap vector and directly operating on the compressed bitmap vector, the technology optimizes the data extraction in query execution process of where and group by clauses. Experimental research on SSB dataset shows that the technology improves 29.7%~38.9% of the index performance on compressed bitmap.

Key words: column-oriented database, bitmap index, vitality, Star Schema Benchmark(SSB) dataset, aggregation query

中图分类号: