作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (24): 45-47. doi: 10.3969/j.issn.1000-3428.2010.24.016

• 软件技术与数据库 • 上一篇    下一篇

网页驻留时间约束的用户访问序列挖掘

杨长春,孙 婧   

  1. (常州大学信息科学与工程学院,江苏 常州 213164)
  • 出版日期:2010-12-20 发布日期:2010-12-14
  • 作者简介:杨长春(1963-),男,教授,主研方向:数据库系统,数据挖掘;孙 婧,硕士生研究生
  • 基金资助:
    江苏省高校自然科学研究计划基金资助项目(06KJB5200 22)

Mining of User Access Sequence Constrainted on Duration Time of Web Page

YANG Chang-chun, SUN Jing   

  1. (School of Information Science and Engineering, Changzhou University, Changzhou 213164, China)
  • Online:2010-12-20 Published:2010-12-14

摘要: 对Web用户的访问序列进行分析,可以发现用户的爱好、兴趣、习惯等因素,为Web网站的升级修正提供必要的信息支持,提出一种通过对用户访问序列进行分析的数据挖掘方法,该方法采用网页驻留时间为参数来约减会话序列中的网页数,压缩频繁访问序列的规模。实验结果表明,该算法可以降低挖掘成本,为Web用户的商业数据挖掘提供有益的借鉴。

关键词: 网页驻留时间, 数据挖掘, 序列

Abstract: By analysis of Web user access sequence, it can find the factors of user’s hobbies, interests, habits etc.,and provides the necessary support of information for the upgrade and amendment of Web sites. This article proposes a method of data mining by analysis of the user access sequence. It can reduce the number of Web pages of the session sequence and compress the size of frequent traversal sequence by taking the duration time of Web page as a parameter. Experimental results show the algorithm can reduce the cost of mining and provide a useful reference for mining of Web users’ commercial data.

Key words: duration time of Web page, data mining, sequence

中图分类号: