作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (4): 70-72. doi: 10.3969/j.issn.1000-3428.2011.04.025

• 软件技术与数据库 • 上一篇    下一篇

基于访问日志的网页内容监控挖掘系统

丘海澜1,文 翰2,肖南峰2   

  1. (1. 北京城市热点资讯有限公司研发部,广州 510630; 2. 华南理工大学计算机科学与工程学院,广州 510006)
  • 出版日期:2011-02-20 发布日期:2011-02-17
  • 作者简介:邱海澜(1978-),男,硕士,主研方向:Web挖掘;文 翰,博士研究生;肖南峰,教授、博士、博士生导师
  • 基金资助:
    null

Webpage Content Monitoring and Mining System Based on Visiting Log

QIU Hai-lan 1, WEN Han 2, XIAO Nan-feng 2   

  1. (1. Research and Development Department, City Hotspot Information Co., Ltd., Guangzhou 510630, China;2. School of Computer Science & Engineering, South China University of Technology, Guangzhou 510006, China)
  • Online:2011-02-20 Published:2011-02-17
  • Supported by:
    null

摘要:

URL是用于完整描述Internet上网页和其他资源地址的一种标识方法,URL访问日志能记录用户的上网痕迹。针对该特点,提出一种基于访问日志的网页内容监控挖掘系统,实现网页内容抓取、监控、分析、报表生成等一系列过程的自动化。系统运行测试结果表明,该系统的准确率较高,能有效解决运营商和互联网监管部门的网络监管问题。

关键词: 用户访问日志, 网页内容挖掘, 网页分类

Abstract: null

中图分类号: