计算机工程 ›› 2018, Vol. 44 ›› Issue (11): 7-13.doi: 10.19678/j.issn.1000-3428.0048650

• 先进计算与数据处理 • 上一篇    下一篇

基于最长属性路径过滤的SPARQL查询优化

林晓庆1,2,张富1,程经纬1   

  1. 1.东北大学 计算机科学与工程学院,沈阳 110819; 2.辽东学院 信息工程学院,辽宁 丹东 118003
  • 收稿日期:2017-09-14 出版日期:2018-11-15 发布日期:2018-11-15
  • 作者简介:林晓庆(1979—),女,讲师、博士研究生,主研方向为RDF数据关键字查询;张富,副教授、博士;程经纬,讲师、博士。
  • 基金项目:

    国家自然科学基金(61672139);辽宁省自然科学基金(2015020048)

SPARQL Query Optimization Based on Longest Property Path Filtering

LIN Xiaoqing1,2,ZHANG Fu1,CHENG Jingwei1   

  1. 1.School of Computer Science and Engineering,Northeastern University,Shenyang 110819,China; 2.School of Information Engineering,Eastern Liaoning University,Dandong,Liaoning 118003,China
  • Received:2017-09-14 Online:2018-11-15 Published:2018-11-15

摘要:

SPARQL查询过程中产生的大量中间结果严重影响查询效率。针对该问题,提出一种两阶段的查询优化方法。在第一阶段,将查询内含有相同变量的联结划分为一块,通过计算每块内的选择度重新排列联结。在第二阶段,利用属性路径索引对剩余的联结进行中间结果过滤。实验结果表明,该方法能够有效减少查询的中间结果,提高查询的执行效率。

关键词: 资源描述框架, SPARQL查询, 选择度, 属性路径, 三元组过滤, 中间结果

Abstract:

A large number of intermediate results during executing SPARQL query greatly affect the query efficiency.For this,a query optimization method with two phases is proposed.In the first phase,it divides a query that contains the same variable into a block by calculating the selectivity within each block to rearrange the join.In the second phase,it emploies the longest property path index to filter intermediate results.Experimental results show that the proposed method can effectively reduce the number of intermediate results and improve the query performance.

Key words: Resource Description Framework(RDF), SPARQL query, selectivity, property path, triple filtering, intermediate result

中图分类号: