基于客户端的恶意网页收集系统

doi:10.3969/j.issn.1000-3428.2010.23.037

计算机工程 ›› 2010, Vol. 36 ›› Issue (23): 113-115,118. doi: 10.3969/j.issn.1000-3428.2010.23.037

基于客户端的恶意网页收集系统

陆璐，全君林，李玮超

（华南理工大学计算机科学与工程学院，广州 510006）

出版日期:2010-12-05 发布日期:2010-12-14
作者简介:陆璐(1971-)，男，副教授、博士，主研方向：远程监控，软件测试，网络安全；全君林、李玮超，硕士研究生
基金资助:
广州市科技攻关与广东省自然科学基金联合基金资助项目

Clientbased Malicious Webpage Collection System

LU Lu,QUAN Junlin,LI Weichao

(School of Computer Science & Engineering, South China University of Technology, Guangzhou 510006, China)

Online:2010-12-05 Published:2010-12-14

摘要/Abstract

摘要： 设计一个基于客户端的恶意网页收集系统。系统通过设置主题爬虫，有针对性地获取可能包含恶意脚本的网页文件，通过分析恶意代码常见的挂木马方式与恶意代码样本，设计正则表达式来提取网页恶意代码的特征码，利用相应算法扫描并匹配利用爬虫获取的网页文件，如发现网页文件中包含可疑的恶意脚本，则将它的域名URL、恶意网页路径与恶意代码脚本类型存入恶意网页库中，以实现恶意网页的搜集。

关键词: 恶意网页, 主题爬虫, 特征码, 匹配算法, 收集系统

Abstract: This paper designs a clientbased malicious webpage collection system. By setting theme spider, it accesses the webpage file which may contain malicious script. By analyzing the common features of malicious codes, it designs regular expressions to extract character code of malicious codes, and uses algorithm to match and scan the webpage file extracted. If the webpage file contains suspect malicious scripts, domain URL, path of malicious webpage and type of malicious code scripts will be recorded in malicious webpage database to realize collection of malicious webpages.

Key words: malicious webpage, focused crawler, character code, match algorithm, collection system

中图分类号:

TP393.08

陆璐, 全君林, 李玮超. 基于客户端的恶意网页收集系统[J]. 计算机工程, 2010, 36(23): 113-115,118.

LIU Lu, QUAN Jun-Lin, LI Wei-Chao. Clientbased Malicious Webpage Collection System[J]. Computer Engineering, 2010, 36(23): 113-115,118.

http://www.ecice06.com/CN/Y2010/V36/I23/113

[1]	东熠, 刘景发, 刘文杰. 基于多目标蚁群算法的主题爬虫策略[J]. 计算机工程, 2020, 46(9): 274-282.
[2]	刘景发,李新,蒋盛益. 基于网页空间进化算法的暴雨灾害主题爬虫策略[J]. 计算机工程, 2019, 45(2): 184-190.
[3]	周麒,杨永明,王振洲. 基于双目立体视觉的结构光测量技术[J]. 计算机工程, 2018, 44(7): 244-249,258.
[4]	王科,李鹏,金瑜,刘宇. 基于三证据DS理论的双模式地图匹配算法[J]. 计算机工程, 2018, 44(5): 316-321.
[5]	倪林,石磊,韩鹍,李少青. 基于特征匹配的IP软核硬件木马检测[J]. 计算机工程, 2017, 43(3): 176-180.
[6]	魏勇,胡丹露,郝晨光,欧小平. 基于分类关键词词频模型的地缘政治主题爬虫设计[J]. 计算机工程, 2016, 42(2): 45-50.
[7]	马雷雷,李宏伟,连世伟,梁汝鹏,陈虎. 一种基于本体语义的灾害主题爬虫策略[J]. 计算机工程, 2016, 42(11): 50-56.
[8]	汤春明,蒋昂. 基于跨尺度代价聚合的改进立体匹配算法[J]. 计算机工程, 2016, 42(11): 272-276,280.
[9]	邹艳妮,刘小平,李春泉,胡凌燕. 一种基于Splat 图元的形状匹配改进算法[J]. 计算机工程, 2015, 41(6): 231-235.
[10]	吴彦文, 李诗, 田庆恒. Mashup智能答疑系统的研究与实现[J]. 计算机工程, 2013, 39(7): 233-236,241.
[11]	付思源, 刘功申, 李建华. 基于UEFI固件的恶意代码防范技术研究[J]. 计算机工程, 2012, 38(9): 117-120.
[12]	李进伟, 陈更生, 尹文波. 一种改进的位平面匹配运动估计算法[J]. 计算机工程, 2012, 38(2): 259-260.
[13]	王文奇, 吴志刚, 李世晓. Windows注册表隐藏检测完全解决方案[J]. 计算机工程, 2012, 38(14): 106-108.
[14]	赵知劲, 张鹏, 尚俊娜, 王海泉. 基于MUSIC算法的宽带频谱感知[J]. 计算机工程, 2012, 38(13): 83-85,92.
[15]	吴伟民, 范炜锋, 王志月, 李晓峰, 黄健炜118. 基于特征码的PE文件自动免杀策略[J]. 计算机工程, 2012, 38(12): 118-121.

选择文件类型/文献管理软件名称

选择包含的内容

基于客户端的恶意网页收集系统

Clientbased Malicious Webpage Collection System

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于客户端的恶意网页收集系统

Clientbased Malicious Webpage Collection System

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价