基于注意力CNLSTM模型的新闻文本分类

doi:10.19678/j.issn.1000-3428.0051312

计算机工程 ›› 2019, Vol. 45 ›› Issue (7): 303-308,314. doi: 10.19678/j.issn.1000-3428.0051312

基于注意力CNLSTM模型的新闻文本分类

刘月, 翟东海, 任庆宁

西南交通大学信息科学与技术学院, 成都 610097

收稿日期:2018-04-23 修回日期:2018-06-07 出版日期:2019-07-15 发布日期:2019-07-15
作者简介:刘月(1993-),女,硕士研究生,主研方向为数据挖掘、自然语言处理;翟东海,副教授、博士;任庆宁,硕士研究生。
基金资助:
国家自然科学基金（61540060）。

News Text Classification Based on CNLSTM Model with Attention Mechanism

LIU Yue, ZHAI Donghai, REN Qingning

School of Information Science and Technology, Southwest Jiaotong University, Chengdu 610097, China

Received:2018-04-23 Revised:2018-06-07 Online:2019-07-15 Published:2019-07-15

摘要/Abstract

摘要： 结合卷积神经网络（CNN）和嵌套长短期记忆网络（NLSTM）2种模型，基于注意力机制提出一个用于文本表示和分类的CNLSTM模型。采用CNN提取短语序列的特征表示，利用NLSTM学习文本的特征表示，引入注意力机制突出关键短语以优化特征提取的过程。在3个公开新闻数据集中进行性能测试，结果表明，该模型的分类准确率分别为96.87%、95.43%和97.58%，其性能比baseline方法有显著提高。

关键词: 卷积神经网络, 特征表示, 嵌套长短期记忆网络, 注意力机制, 文本分类

Abstract: Combining Convolutional Neural Network (CNN) and Nested Long Short-Term Memory (NLSTM) models,this paper proposes a CNLSTM model for text representation and classification based on the attention mechanism.The model uses CNN to extract feature of phrase sequences,and then uses NLSTM to learn the representation of text features.By introducing attention mechanisms,the key phrases are highlighted to optimize feature extraction.Experiments on three published news data sets demonstrate that the classification accuracy of the model is 96.87%,95.43%,and 97.58%,respectively,and its performance is significantly improved compared with the baseline methods.

Key words: Convolutional Neural Network (CNN), feature representation, Nested Long Short-Term Memory(NLSTM), attention mechanism, text classification

中图分类号:

TP391.1

刘月, 翟东海, 任庆宁. 基于注意力CNLSTM模型的新闻文本分类[J]. 计算机工程, 2019, 45(7): 303-308,314.

LIU Yue, ZHAI Donghai, REN Qingning. News Text Classification Based on CNLSTM Model with Attention Mechanism[J]. Computer Engineering, 2019, 45(7): 303-308,314.

https://www.ecice06.com/CN/Y2019/V45/I7/303

参考文献

[1] 陈钊,徐睿峰,桂林,等.结合卷积神经网络和词语情感序列特征的中文情感分析[J].中文信息学报,2015,29(6):172-178.
[2] 夏从零,钱涛,姬东鸿.基于事件卷积特征的新闻文本分类[J].计算机应用研究,2017,34(4):991-994.
[3] MIKOLOV T,SUTSKEVER I,CHEN Kai,et al.Distributed representations of words and phrases and their compositionality[C]//Proceedings of Advances in Neural Information Processing Systems.[S.l.]:Neural Information Processing Systems Foundation,Inc.,2013:3111-3119.
[4] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[5] MONIZ J R A,KRUEGER D.Nested LSTM[EB/OL].[2018-04-01].https://arxiv.org/pdf/1801.10308.pdf.
[6] AGARWAL B,MITTAL N.Text classification using machine learning methods:a survey[C]//Proceedings of the 2nd International Conference on Soft Computing for Problem Solving. Berlin,Germany:Springer,2014:701-709.
[7] 李荣艳,金鑫,王春辉,等.一种新的中文文本分类算法[J].北京师范大学学报(自然科学版),2006,42(5):510-505.
[8] PENG Fuchun,SCHUURMANS D.Combining naive Bayes and n-gram language models for text classification[C]//Proceedings of European Conference on Information Retrieval.Berlin,Germany:Springer,2003:335-350.
[9] 翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23,45.
[10] KALCHBRENNER N,GREFENSTETTE E,BLUNSOM P.A convolutional neural network for modelling sentences[EB/OL].[2018-04-01].https://arxiv.org/pdf/1404.2188.pdf.
[11] BENGIO Y,DUCHARME R,VINCENT P,et al.A neural probabilistic language model[J].Journal of Machine Learning Research,2003,3:1137-1155.
[12] 谢逸,饶文碧,段鹏飞,等.基于CNN和LSTM混合模型的中文词性标注[J].武汉大学学报(理学版),2017,63(3):246-250.
[13] NAIR V,HINTON G E.Rectified linear units improve restricted Boltzmann machines[C]//Proceedings of the 27th International Conferenceon Machine Learning.Haifa,Israel:[s.n.],2010:807-814.
[14] MNIH V,HEESS N,GRAVES A,et al.Recurrent models of visual attention[C]//Proceedings of the 27th International Conference on Neural Information Processing Systems.Montreal,Canada:MIT Press,2014:2204-2212.
[15] BAHDANAU D,CHO K,BENGIO Y.Neural machine translation by jointly learning to align and translate[EB/OL].[2018-04-01].https://arxiv.org/pdf/1409.0473.pdf.
[16] 周瑛,刘越,蔡俊.基于注意力机制的微博情感分析[J].情报理论与实践,2018,41(3):85-94.
[17] 张冲.基于Attention-Based LSTM模型的文本分类技术的研究[D].南京:南京大学,2016.
[18] 黄磊,杜昌顺.基于递归神经网络的文本分类研究[J].北京化工大学学报(自然科学版),2017,44(1):98-104.
[19] 胡朝举,梁宁.基于深层注意力的LSTM的特定主体情感分析[J].计算机应用研究,2019,36(5):10-15.
[20] LAI Siwei,XU Liheng,LIU Kang.Recurrent convolutional neural networks for text classification[C]//Proceedings of the 29th AAAI Conference on Artificial Intelligence.Palo Alto,USA:AAAI Publications,2015:2267-2273.
[21] 彭玉青,宋初柏,闫倩,等.基于VDCNN与LSTM混合模型的中文文本分类研究[J].计算机工程,2018,44(11):190-196.
[22] 阳馨,蒋伟,刘晓玲.基于多种特征池化的中文文本分类算法[J].四川大学学报(自然科学版),2017,54(2):287-292.

选择文件类型/文献管理软件名称

选择包含的内容

基于注意力CNLSTM模型的新闻文本分类

News Text Classification Based on CNLSTM Model with Attention Mechanism

RichHTML

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

[1]	王志浩, 钱沄涛. 基于Swin Transformer的双流遥感图像时空融合超分辨率重建[J]. 计算机工程, 2024, 50(9): 33-45.
[2]	李俊俊, 董建刚, 李坤. 基于Kubernetes的集群节能策略研究[J]. 计算机工程, 2024, 50(9): 82-91.
[3]	林畅, 郭伟, 任哲聪, 金海波. 基于Transformer的目标跟踪与分割统一算法[J]. 计算机工程, 2024, 50(9): 130-141.
[4]	李泽霖, 吕兆峰, 陈富强, 李克. 基于多跳信息融合的实体对齐模型[J]. 计算机工程, 2024, 50(9): 142-152.
[5]	王汝英, 马嘉骏, 董建强, 刘万龙, 张海涛, 尹凯, 赵博超. 基于MTS-BiGRU-DMHSA的工业负荷预测方法[J]. 计算机工程, 2024, 50(9): 169-178.
[6]	张鲁, 田春伟, 宋焕生, 刘侍刚. 用于低剂量CT图像去噪的多级双树复小波网络[J]. 计算机工程, 2024, 50(9): 266-275.
[7]	朱凯, 李理, 张彤, 江晟, 别一鸣. 基于Transformer的多阶段运动模糊图像修复网络[J]. 计算机工程, 2024, 50(9): 276-285.
[8]	张天鹏, 韩晶, 吕学强. 基于多任务学习的超分辨率辅助小目标检测[J]. 计算机工程, 2024, 50(9): 304-312.
[9]	郭敏, 张熙涵, 李阳. 融合注意力的教师互一致性半监督医学图像分割[J]. 计算机工程, 2024, 50(9): 313-323.
[10]	高煜宝, 文志诚. 基于注意力机制的双路解码器图像去噪方法[J]. 计算机工程, 2024, 50(9): 324-332.
[11]	曾钰琦, 刘博, 钟柏昌, 钟瑾. 智慧教育下基于改进YOLOv8的学生课堂行为检测算法[J]. 计算机工程, 2024, 50(9): 344-355.
[12]	饶日昕, 王怡文, 曾砺志, 童心恬, 赵海涛. 面向废旧电缆检测的轻量化网络模型[J]. 计算机工程, 2024, 50(8): 22-30.
[13]	李华昱, 张智康, 闫阳, 岳阳. 基于知识图谱增强的领域多模态实体识别[J]. 计算机工程, 2024, 50(8): 31-39.
[14]	王蕾, 党时鹏, 潘丰. 基于卷积神经网络的隐匿性旁路预测模型[J]. 计算机工程, 2024, 50(8): 40-49.
[15]	陈瀚, 赵春蕾, 蒋昊达, 王春东. 基于融合模型与语义网络的App用户意图识别研究[J]. 计算机工程, 2024, 50(8): 50-63.

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于注意力CNLSTM模型的新闻文本分类

News Text Classification Based on CNLSTM Model with Attention Mechanism

RichHTML

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价