作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2008, Vol. 34 ›› Issue (9): 278-280. doi: 10.3969/j.issn.1000-3428.2008.09.101

• 开发研究与设计技术 • 上一篇    下一篇

基于WebLech的内容搜索引擎设计

戴明星,杜彦辉   

  1. (中国人民公安大学信息安全工程系,北京 102623)
  • 收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2008-05-05 发布日期:2008-05-05

Design for Content Search Engine Based on WebLech

DAI Ming-xing, DU Yan-hui   

  1. (Information Security Department, Chinese People’s Public Security University, Beijing 102623)
  • Received:1900-01-01 Revised:1900-01-01 Online:2008-05-05 Published:2008-05-05

摘要: 网络蜘蛛WebLech是一种优秀的Web站点下载开源工具。该文分析WebLech的特点和工作流程,完善WebLech的起始地址设置,并丰富其链接和所获取的网页类型。使用改进后的WebLech设计了一款能在用户设置的IP范围内进行搜索的基于内容的搜索引擎。

关键词: WebLech开源软件, 网络蜘蛛, 搜索引擎

Abstract: Web spider——WebLech is an open source tool used to download Website. This paper analyzes the characteristics and the workflow of WebLech, improves the initial address settings, and riches the Web’s types which can be achieved by WebLech. It uses the improved WebLech to design a content based search engine which can search in a range of IP address set by customer.

Key words: WebLech open source software, Web spider, search engine

中图分类号: