[1]付志超.基于Map/Reduce的分布式智能搜索引擎框架研究[D].武汉:武汉理工大学,2008.
[2]邓玉林.基于hadoop大数据框架的个性化推荐系统研究与实现[D].成都:电子科技大学,2016.
[3]慕慧鸽,张军.国内情报学领域信息检索相关性研究进展分析[J].图书馆学研究,2016(6):10-14.
[4]SALTON G,YU C T.On the construction of effective vocabularies for information retrieval[C]//Proceedings of ACM SIGPLAN-SIGIR Interface Meeting.New York,USA:ACM Press,1973,9(3):48-60.
[5]SALTON G,FOX E A,WU H.Extended Boolean information retrieval[D].New York,USA:Cornell University,1982.
[6]李学明,李海瑞,薛亮,等.基于信息增益与信息熵的TFIDF算法[J].计算机工程,2012,38(8):37-40.
[7]张瑜,张德贤.一种改进的特征权重算法[J].计算机工程,2011,37(5):210-212.
[8]张瑾.基于改进TF-IDF算法的情报关键词提取方法[J].情报杂志,2014(4):153-155.
[9]龚静,周经野.一种基于多重因子加权的文本特征项权值计算方法[J].计算技术与自动化,2007,26(1):81-83.
[10]张玉芳,陈小莉,熊忠阳.基于信息增益的特征词权重调整算法研究[J].计算机工程与应用,2007,43(35):159-161.
[11]贺科达,朱铮涛,程昱.基于改进 TF-IDF 算法的文本分类方法研究[J].广东工业大学学报,2016,33(5):49-53.
[12]周源,刘怀兰,杜朋朋,等.基于改进TF-IDF特征提取的文本分类模型研究[J].情报科学,2017(5):111-118.
[13]王锴,施水才,王涛,等.基于MapReduce的术语权重计算方法研究[J].电信科学,2011,27(11):62-65.
[14]李彬.基于Hadoop框架的TF-IDF算法改进[J].微型机与应用,2012,31(7):14-16.
[15]姚卫国,张东波.基于Hadoop分布式平台的Web文本关键词提取方案[J].湘潭大学(自然科学学报),2016,38(2):79-83.
[16]DEAN J,GHEMAWAT S.MapReduce:simplified data processing on large clusters[C]//Proceedings of Conference on Symposium on Opearting Systems Design and Implementation.[S.1.]:USENIX Association,2008:10-10.
[17]GEORGE L.HBase权威指南[M].代志远,刘佳,蒋杰,译.北京:人民邮电出版社,2013. |