[1] 宁 葵, 龙 珑. 绿色网络不良内容语义分析方法研究[J]. 计算机应用研究, 2010, 27(12): 4643-4645. [2] Lochovsky F H, Wang Jiying. Data-rich Section Extraction from HTML Pages[C]//Proc. of the 3rd International Con- ference on Web System Engineering. [S. l.]: IEEE Computer Society Press, 2002. [3] W3C. Document Object Model[EB/OL]. (2010-06-05). http:// www.w3.org/DOM/. [4] 吴 麒, 陈兴蜀. 基于取值优化的网页正文内容提取算 法[J]. 华南理工大学学报: 自然科学版, 2011, 39(4): 32-36. [5] 欧健文, 董守斌, 蔡 斌. 模块化网页主题信息的提取方 法[J]. 清华大学学报: 自然科学版, 2005, 45(3): 1743-1747. [6] 韩 光, 赵春霞, 胡雪蕾. 一种新的SVM主动学习算法及其在障碍物检测中的应用[J]. 计算机研究与发展, 2009, 46(11): 1934-1941. [7] 龙 军, 祝 恩. 选择最大可能预测错误样例的主动学习算法[J]. 计算机研究与发展, 2008, 45(3): 472-478. [8] 李连霞, 马 军, 陈竹敏. 基于多特征的网页内容提取研 究[C]//第三届和谐人机环境联合学术会议议论会集. 济南: 清华大学出版社, 2007. [9] Sushi G, Gai K, David N, et al. DOM-based Content Ex- traction of HTML Document[C]//Proc. of the 12th Inter- national World Wide Web Conference. [S. l.]: ACM Press, 2003. [10] Cai Deng, He Xiaofei, Wen Jirong, et al. Block-level Link Anagysis[C]//Proc. of SIGIR’04. [S. l.]: ACM Press, 2004. [11] Tim W, William H H. Web Content Extraction Through Histogram Clustering[C]//Proc. of the 18th International Conference on Artificial Neural in Engineering. New York, USA: [s. n.], 2008. [12] Javier A M, Koen D, Maie F M. Language Independent Content Extraction from Web Pages[C]//Proc. of the 9th Dutch-belgian Information Retrieval Workshop. [S. l.]: University of Twente, 2009. [13] 何凤英. 基于语义理解的中文博文倾向性分析[J]. 计算机应用, 2011, 31(8): 2130-2137. [14] Zhu Jingbo, Wang Huizhen, Sou B K, et al. Active Learning with Sampling by Uncertainty and Density for Data Annotations[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2010, 18(6): 1323-1331. [15] 郑皎凌, 唐常杰. 基于伪属性语义匹配的Deep Web信息抽取[J]. 四川大学学报: 工程科学版, 2009, 41(2): 231-234. 编辑 刘 冰
|