摘要: 针对目前影响爬虫程序效率的诸多关键因素,在研究爬虫程序内部运行机理的基础上,进行架构优化,改进爬虫程序中的相关算法。在Linux网络环境下,通过对实现的爬虫程序运行进行检测,反馈出该解决方案和改进之处具有可行性,提高了页面抓取的效率和爬虫程序的整体性能。
中图分类号:
王 锋;王 伟;张 璟;罗作民. 基于Linux的网络爬虫系统[J]. 计算机工程, 2010, 36(1): 280-282.
WANG Feng; WANG Wei; ZHANG Jing; LUO Zuo-min. Web Crawler System Based on Linux[J]. Computer Engineering, 2010, 36(1): 280-282.