基于多重评价因素的Web用户聚类方法

doi:10.3969/j.issn.1000-3428.2011.10.014

计算机工程 ›› 2011, Vol. 37 ›› Issue (10): 44-46. doi: 10.3969/j.issn.1000-3428.2011.10.014

基于多重评价因素的Web用户聚类方法

吴金桥 ¹，曹奇英 ¹，何夏燕 ²，庄怡雯 ¹

(1. 东华大学计算机科学与技术学院，上海 201600；2. 上海交通大学电子信息与电气工程学院，上海 200240)

出版日期:2011-05-20 发布日期:2011-05-20
作者简介:吴金桥(1987－)，男，硕士，主研方向：数据挖掘；曹奇英，教授；何夏燕、庄怡雯，硕士
基金资助:
教育部科技基金资助重点项目(104086)

Web User Clustering Method Based on Multiple Evaluating Factors

WU Jin-qiao 1, CAO Qi-ying 1, HE Xia-yan 2, ZHUANG Yi-wen 1

(1. School of Computer Science and Technology, Donghua University, Shanghai 201600, China; 2. School of Electronic, Information and Electrical Engineering, Shanghai Jiaotong University, Shanghai 200240, China)

Online:2011-05-20 Published:2011-05-20

摘要/Abstract

摘要：

介绍Web日志挖掘的预处理过程，其中包括数据清理、站点拓扑识别、用户识别、会话识别、页面过滤和路径补充。针对无引用域记录日志的路径补充问题，提出并实现一种基于网站拓扑图的路径补充算法。讨论一种综合多重评价因素的用户相似度计算方法，并将其应用于Web用户聚类操作。使用Davies-Bouldin指标衡量聚类的效果并给出实验结果。

关键词: 日志预处理, 路径补充, 用户相似度, 模糊聚类

Abstract:

The paper introduces the pre-processing procedure, which includes data cleaning, Website topology identification, user identification, session identification, page filtering and path completion. With respect to logs without reference record, a path completion algorithm based on Website topology is put forward and implemented. A multi-factor user similarity computing method is introduced and applies on Web user clustering. Davies-Bouldin index is used to evaluate to effectiveness of the experiment results.

Key words: log pre-processing, path complementing, user similarity, fuzzy clustering

中图分类号:

N945

吴金桥, 曹奇英, 何夏燕, 庄怡雯. 基于多重评价因素的Web用户聚类方法[J]. 计算机工程, 2011, 37(10): 44-46.

TUN Jin-Qiao, CAO Ai-Yang, HE Jia-Yan, PENG Yi-Wen. Web User Clustering Method Based on Multiple Evaluating Factors[J]. Computer Engineering, 2011, 37(10): 44-46.

http://www.ecice06.com/CN/Y2011/V37/I10/44

[1]	乔彩彩, 吴成茂, 李昌兴, 王佳烨. 结合隶属度与像素交替引导滤波的鲁棒模糊聚类算法[J]. 计算机工程, 2022, 48(8): 224-233.
[2]	桂琼, 吕永军, 程小辉. 基于敏感信息邻近抵抗的匿名方法[J]. 计算机工程, 2020, 46(12): 142-149,184.
[3]	张波, 周从华, 张付全, 张婷, 蒋跃明. 一种面向SNP选择的模糊聚类算法[J]. 计算机工程, 2019, 45(8): 66-74.
[4]	陈扬洋, 钱鹏江, 赵开发, 苏冠豪. 基于mDixon序列下腹部MRI数据的sCT生成方法[J]. 计算机工程, 2019, 45(7): 273-281.
[5]	钱雪忠,姚琳燕. 面向稀疏高维大数据的扩展增量模糊聚类算法[J]. 计算机工程, 2019, 45(6): 75-81.
[6]	王娜,胡超芳,师五喜. 基于客观满意聚类的pH中和过程建模方法[J]. 计算机工程, 2018, 44(2): 298-303,309.
[7]	陈瑞东,赵凌园,张小松. 基于模糊聚类的僵尸网络识别技术[J]. 计算机工程, 2018, 44(10): 46-50.
[8]	姜宇,张大方,刁祖龙. 基于点击流的用户矩阵模型相似度个性化推荐[J]. 计算机工程, 2018, 44(1): 219-225.
[9]	吴礼洋,熊磊,仲柔在. 基于模糊聚类回归的人脸特征点定位研究[J]. 计算机工程, 2017, 43(8): 272-278,283.
[10]	梁元,车明. 基于约束条件的模糊等价关系聚类方法[J]. 计算机工程, 2017, 43(6): 276-280,288.
[11]	罗勇,郭雅默,刘冲. 基于Pareto烟花算法的模糊分类系统设计[J]. 计算机工程, 2017, 43(2): 304-307,316.
[12]	吴文明,刘茜萍. 基于可信相似用户的服务推荐方法[J]. 计算机工程, 2016, 42(11): 57-63,69.
[13]	王兆凯,李亚星,冯旭鹏,刘利军,黄青松,刘晓梅. 基于深度信念网络的个性化信息推荐[J]. 计算机工程, 2016, 42(10): 201-206.
[14]	冯少荣,潘炜炜,林子雨. 基于改进k-medoids算法的XML文档聚类[J]. 计算机工程, 2015, 41(9): 56-62.
[15]	张磊, 高强, 朱珍民, 叶剑. 面向移动阅读平台的资源推荐算法[J]. 计算机工程, 2013, 39(8): 69-73.

选择文件类型/文献管理软件名称

选择包含的内容

基于多重评价因素的Web用户聚类方法

Web User Clustering Method Based on Multiple Evaluating Factors

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于多重评价因素的Web用户聚类方法

Web User Clustering Method Based on Multiple Evaluating Factors

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价