作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (12): 52-54. doi: 10.3969/j.issn.1000-3428.2010.12.018

• 软件技术与数据库 • 上一篇    下一篇

基于包装器的Deep Web自动语义标注

杨晓琴,鞠时光,曹庆皇,王秀红   

  1. (江苏大学计算机学院,镇江 212013)
  • 出版日期:2010-06-20 发布日期:2010-06-20
  • 作者简介:杨晓琴(1986-),女,硕士研究生,主研方向:Deep Web信息集成;鞠时光,教授、博士、博士生导师;曹庆皇,硕士研究生;王秀红,博士研究生
  • 基金资助:

    国家自然科学基金资助项目(60773049);江苏大学博士生创新基金资助项目(CX08B_18X)

Deep Web Automatic Semantic Annotation Based on Wrapper

YANG Xiao-qin, JU Shi-guang, CAO Qing-huang, WANG Xiu-hong   

  1. (College of Computer, Jiangsu University, Zhenjiang 212013)
  • Online:2010-06-20 Published:2010-06-20

摘要:

为最准最全地对页面抽取的数据进行语义标注,提出一种基于包装器自动语义标注的方法。该方法利用多个标注源进行组合标注,有效解决单标注源标注率不高问题,同时针对标注不完全问题,给出利用多个数据源的互补关系来标注,生成高效率的标注包装器对抽取结果自动标注。实验结果证明,该方法具有较高的准确性和效率。

关键词: 深层网络, 语义标注, 同步标注, 包装器

Abstract:

To annotate extracted data accurately and comprehensively in Deep Web, this paper proposes an automatic semantic annotation method based on wrapper. Several annotators are combined to improve accuracy. To settle annotation incomplete problem, complementary relationship of data sources is used. A wrapper which can annotate extracted data in high efficiency is generated. Experimental result shows that the method achieves higher accuracy and efficiency.

Key words: Deep Web, semantic annotation, synchronous annotation, wrapper

中图分类号: