[1] 李国栋, 刘忠强, 柳长安. 基于目录树的网络科技资源采集算法[J]. 计算机工程, 2009, 35(1): 277-279, 282.[2] 杨 舟, 卓 林, 赵朋朋, 等. 一种针对商品数据记录的自动抽取方法[J]. 计算机工程, 2010, 36(23): 262-265.[3] 姜 波, 丁岳伟. 基于约束树编辑距离与导航树的信息采集[J].计算机工程, 2009, 35(14): 75-77. [4] 宫继兵, 唐 杰. 基于Ontology的视频描述信息抽取系统[J]. 计算机工程, 2009, 35(18): 34-36. [5] Cao Yujuan, Niu Zhendong, Dai Liuling, et al. Extraction of Informative Blocks from Web Pages[C]//Proc. of International Conference on Advanced Language Processing and Web Information Technology. Washington D. C., USA: IEEE Computer Society, 2008.[6] Weminger T, William H. Text Extraction from the Web via Text-to-tag Ratio[C]//Proc. of the 19th International Conference on Database and Expert Systems Application. Washington D. C., USA: IEEE Computer Society, 2008.[7] 邱 哲, 符滔滔. 开发自己的搜索引擎[M]. 北京: 人民邮电出版社, 2007. [8] Clifford A S. 数据结构与算法分析[M]. 张 铭, 刘晓丹, 译. 北京: 电子工业出版社, 1998.[9] 刘金红, 陆余良. 主题网络爬虫研究综述[J]. 计算机应用研究, 2007, 24(10): 26-29.[10] 宋明秋, 张瑞雪, 吴新涛, 等. 网页正文信息抽取新方法[J]. 大连理工大学学报, 2009, 49(4): 594-597. |