作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程

• 先进计算与数据处理 • 上一篇    下一篇

基于BSP 的SPARQL 基本图模式查询算法

李国鼎a,冯志勇a,b ,饶国政a,b ,王 鑫a,b   

  1. (天津大学a. 计算机科学与技术学院;b. 天津市认知计算与应用重点实验室,天津300072)
  • 收稿日期:2013-08-28 出版日期:2014-09-15 发布日期:2014-09-12
  • 作者简介:李国鼎(1989 - ),男,硕士研究生,主研方向:语义网,软件工程;冯志勇,教授、博士、博士生导师;饶国政(通讯作者),博士; 王 鑫,讲师、博士。
  • 基金资助:
    国家" 863" 计划基金资助项目(2013AA013204);国家自然科学基金资助项目(61373165,61070202)。

SPARQL Basic Graph Pattern Search Algorithm Based on Bulk Synchronous Parallel

LI Guo-ding  a ,FENG Zhi-yong  a,b ,RAO Guo-zheng  a,b ,WANG Xin  a,b   

  1. (a. School of Computer Science and Technology;b. Tianjin Key Laboratory of Cognitive Computing and Application,Tianjin University,Tianjin 300072,China)
  • Received:2013-08-28 Online:2014-09-15 Published:2014-09-12

摘要: 随着语义网的不断发展,发布在互联网上的资源描述框架(RDF)数据达到百亿级三元组规模,并且呈现 几何增长趋势,针对RDF 数据的单机SPARQL 查询方法已经不再适用。为此,提出一种基于整体同步并行(BSP) 模型的SPARQL 基本图模式查询算法。根据RDF 有向图数据特性及基本图模式定义,将整个查询过程分成匹配 和迭代2 个阶段,在匹配出所需查询的三元组模式后,通过迭代使部分解逐步逼近完全解,得到最终查询结果。利 用HAMA 分布式计算框架进行算法实现,实验结果表明,与基于MapReduce 的SPARQL 查询算法相比,该算法具 有较高的查询效率,能为大规模RDF 数据的快速SPARQL 查询提供支持。

关键词: 语义网, 资源描述框架, SPARQL 查询, 基本图模式, 整体同步并行模型, HAMA 框架

Abstract: With the advance of semantic Web,the Resource Description Framework(RDF) data published on the Web reaches the scale of ten billion triples,and it shows a geometric growth trend. Simple Protocol and RDF Query Language (SPARQL) query methods on stand-alone machine are no longer applicable. For this problem,this paper proposes a SPARQL Basic Graph Pattern(BGP) search algorithm based on Bulk Synchronous Parallel(BSP) model. According to the graph nature of RDF data and the definition of BGP,it divides the whole process into “ matching ” stage and “iteration” stage. First match each triple patterns and then iterate to get the query results eventually. It implements the algorithm by HAMA distributed computing framework. Experimental results show that it has higher query efficiency than SPARQL algorithm based on MapReduce,and it can support the SPARQL query of the large scale RDF data.

Key words: semantic Web, Resource Description Framework(RDF), SPARQL search, Basic Graph Pattern(BGP), Bulk Synchronous Parallel(BSP) model, HAMA framework

中图分类号: