作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2006, Vol. 32 ›› Issue (24): 44-47. doi: 10.3969/j.issn.1000-3428.2006.24.016

• 软件技术与数据库 • 上一篇    下一篇

分布式Web用户兴趣迁移模式挖掘研究

金 玮1,张克君2,曲文龙2,杨炳儒2   

  1. (1. 北华大学教育技术中心,吉林 132000;2. 北京科技大学信息工程学院,北京 100083)
  • 收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2006-12-20 发布日期:2006-12-20

Research on Distributed Web Interest Transfer Pattern Mining

JIN Wei1, ZHANG Kejun2, QU Wenlong2, YANG Bingru2   

  1. (1. Education Technology Center, University of Beihua, Jilin 132000; 2. Information Engineering School, University of Science and Technology Beijing, Beijing 100083)
  • Received:1900-01-01 Revised:1900-01-01 Online:2006-12-20 Published:2006-12-20

摘要: 提出了一个结合Web文本挖掘的分布式Web使用挖掘模型DWLMST,以及基于该模型的局部浏览兴趣迁移模式更新算法LITP和全局浏览兴趣迁移模式更新算法GITP。利用页面聚类来表示用户兴趣。通过将用户事务中的页面替代为相应的聚类号来得到用户浏览兴趣序列。从用户浏览兴趣序列中分析得到用户浏览兴趣迁移模式。算法较好地解决了Web访问信息的异地存储、实时增长等因素给模式分析过程带来的困难,同时也提高了用户浏览兴趣表示的准确性。

关键词: Web使用模式挖掘, 分布式数据挖掘, Web日志挖掘

Abstract: This paper proposes a distributed Web log mining system model based on Web text(DWLMST). It is presented that the more general incremental updating algorithms of local interest transfer patterns (LITP) and global interest transfer patterns (GITP) in a distributed database system based on DWLMST for discovering the user interest transfer patterns. The algorithms better solve troubles which are made by the real time incremental distributed Web access information and the more communication number.

Key words: Web usage pattern mining, Distributed data mining, Web log mining