作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (21): 57-58,61. doi: 10.3969/j.issn.1000-3428.2010.21.020

• 软件技术与数据库 • 上一篇    下一篇

Web站点核心逻辑结构挖掘

郑皎凌,王 鹏   

  1. (成都信息工程学院软件工程系,成都 610225)
  • 出版日期:2010-11-05 发布日期:2010-11-03
  • 作者简介:郑皎凌(1981-),女,讲师、硕士,主研方向:Web挖掘,信息检索;王 鹏,副教授、博士
  • 基金资助:
    国家自然科学基金资助项目(60702075)

Website Kernel Logical Structure Mining

ZHENG Jiao-ling, WANG Peng   

  1. (Department of Software Engineering, Chengdu University of Information Technology, Chengdu 610225, China)
  • Online:2010-11-05 Published:2010-11-03

摘要: 已有Web结构挖掘研究主要是挖掘出站点的核心节点而非整个结构。为此,设计Web站点逻辑域核及其导入路径的模型,提出Web站点逻辑域核挖掘算法和逻辑域核导入路径挖掘算法。在4个大型Web站点上的实验结果表明,Web站点逻辑域核挖掘算法和导入路径挖掘算法均能够达到较高的精度和召回率。

关键词: Web站点核心逻辑结构, 逻辑域, 逻辑域核, 导入路径

Abstract: Existing researches on Web structure mining focus on finding the authoritative vertexes instead of the whole Web hyperlink structure. This paper designs the Website logical domain core and the model of domain core’s entry path, proposes logical domain core mining algorithm and its entry path mining algorithm. Through experiment on four large Websites, results show that both algorithms can achieve relatively high precision and recall.

Key words: Website kernel logical structure, logical domain, logical domain core, entry path

中图分类号: