基于规则集的Deep Web信息检索

doi:10.3969/j.issn.1000-3428.2008.13.019

计算机工程 ›› 2008, Vol. 34 ›› Issue (13): 51-53. doi: 10.3969/j.issn.1000-3428.2008.13.019

基于规则集的Deep Web信息检索

杨巨峰1，史广顺1，赵玉娟1,2，王庆人1

(1. 南开大学机器智能研究所，天津 300071；2. 天津市气象信息中心，天津 300074)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2008-07-05 发布日期:2008-07-05

Rules-based Deep Web Information Retrieval

YANG Ju-feng1, SHI Guang-shun1, ZHAO Yu-juan1,2, WANG Qing-ren1

(1. Institute of Machine Intelligence, Nankai University, Tianjin 300071; 2. Tianjin Meteorological Information Center, Tianjin 300074)

Received:1900-01-01 Revised:1900-01-01 Online:2008-07-05 Published:2008-07-05

摘要/Abstract

摘要： 提出一种基于规则集的新型Deep Web信息检索模型。该模型包含4个层次，主要处理环节如任务分派、信息提取、数据清洗等引入了Deep Web特有的结构规则、逻辑规则和应用规则协助工作。把该模型应用于科技文献检索、电子机票定购和工作简历搜索3个领域，实验结果证明该模型灵活、可信，有效信息查全率达到96%以上。

关键词: 信息检索, 深层网络, 规则集, 数据提取

Abstract: This paper proposes a novel rules-based model to extract data from Deep Web pages. The model comprises four layers, main processing parts as task allocation, information extraction, data cleaning which work based on the rules of structure, logic and application. It applies the new model to three intelligent system, scientific paper retrieval, electronic ticket ordering and resume searching. Experimental results show that the proposed method is robust and feasible.

Key words: information retrieval, Deep Web, rules set, data extraction

中图分类号:

TP311

杨巨峰;史广顺;赵玉娟;王庆人. 基于规则集的Deep Web信息检索[J]. 计算机工程, 2008, 34(13): 51-53.

YANG Ju-feng; SHI Guang-shun; ZHAO Yu-juan; WANG Qing-ren. Rules-based Deep Web Information Retrieval[J]. Computer Engineering, 2008, 34(13): 51-53.

http://www.ecice06.com/CN/Y2008/V34/I13/51

[1]	李佩, 陈乔松, 陈鹏昌, 邓欣, 王进, 朴昌浩. 基于模态特异及模态共享特征信息的多模态细粒度检索[J]. 计算机工程, 2022, 48(11): 62-68,76.
[2]	高军,黄献策. 基于Hadoop平台的相关性权重算法设计与实现[J]. 计算机工程, 2019, 45(3): 26-31.
[3]	张倩倩,田学东,杨芳,李新福. 基于数学文本和表达式转换的融合检索模型[J]. 计算机工程, 2019, 45(3): 175-181,187.
[4]	塞麦提·麦麦提敏, 司马义·阿不都热依木. 维吾尔语停用词抽取方法研究[J]. 计算机工程, 2019, 45(10): 288-292,300.
[5]	王莹,罗准辰,于洋. 基于排序学习模型的微博多样性检索问题研究[J]. 计算机工程, 2017, 43(11): 152-160.
[6]	覃华峥,胡忠顺,阳德青,肖仰华. 基于类别模板挖掘的百科相关实体构建[J]. 计算机工程, 2016, 42(9): 180-185,191.
[7]	毋光先,刘年义,刘博雅. 基于LWE的BGN类CPA安全加密方案设计与应用[J]. 计算机工程, 2016, 42(12): 118-123.
[8]	姬鹏飞,李远刚,卢盛祺,戴开宇. 基于语义Web的旅游路线个性化定制系统[J]. 计算机工程, 2016, 42(10): 308-317.
[9]	邓晓军,满君丰,欧阳旻. 基于K武装决斗土匪问题的排序器在线评估算法[J]. 计算机工程, 2015, 41(9): 271-275.
[10]	李金忠,杨威,夏洁武,曾小荟,孙凌宇. 基于Hooke & Jeeves模式搜索的排序学习方法[J]. 计算机工程, 2015, 41(7): 215-218.
[11]	张杰鑫,张铮. 包分类算法研究综述[J]. 计算机工程, 2015, 41(12): 111-118.
[12]	许家铭，李晓东，金键，马盈. 一种高效的多模式字符串匹配算法[J]. 计算机工程, 2014, 40(3): 315-320.
[13]	张旭东，孙志明，刘亚宁，单栋栋，闫宏飞. 基于64位体系结构的倒排索引压缩算法[J]. 计算机工程, 2014, 40(2): 71-76.
[14]	朱菁华,王晓玲. 基于扩展查询表达式的XML 关键字查询[J]. 计算机工程, 2014, 40(10): 25-31.
[15]	熊忠阳，蔺显强，张玉芳，牙漫. 结合网页结构与文本特征的正文提取方法[J]. 计算机工程, 2013, 39(12): 200-203,210.

选择文件类型/文献管理软件名称

选择包含的内容

基于规则集的Deep Web信息检索

Rules-based Deep Web Information Retrieval

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于规则集的Deep Web信息检索

Rules-based Deep Web Information Retrieval

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价