基于区分性关键词模型的维吾尔文本情感分类

doi:10.3969/j.issn.1000-3428.2014.10.026

计算机工程

基于区分性关键词模型的维吾尔文本情感分类

热依莱木·帕尔哈提^1,2,孟祥涛^2,3,艾斯卡尔·艾木都拉¹

(1. 新疆大学信息科学与工程学院,乌鲁木齐830046; 2. 清华大学信息技术研究院,北京100084;3. 重庆邮电大学计算机科学与技术学院,重庆400065)

收稿日期:2013-09-09 出版日期:2014-10-15 发布日期:2014-10-13
作者简介:热依莱木·帕尔哈提(1987 - ),女,硕士研究生,主研方向:文本分类;孟祥涛,硕士研究生;艾斯卡尔·艾木都拉,教授、博士、博士生导师。
基金资助:
国家自然科学基金资助项目(61065005,61163033);教育部新世纪优秀人才支持计划基金资助项目(NCET-10-0969);新疆维吾尔自治区高新技术研究发展计划基金资助项目(201312103)。

Uyghur Text Sentiment Classification Based on Discriminative Keyword Model

Rayila Parhat ^1,2,MENG Xiang-tao ^2,3,Askar Hamdulla ¹

(1. Institute of Information Science and Engineering,Xinjiang University,Urumqi 830046,China; 2. Institute of Information Technology,Tsinghua University,Beijing 100084,China; 3. College of Computer Science and Technology,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

Received:2013-09-09 Online:2014-10-15 Published:2014-10-13

摘要/Abstract

摘要： 在研究区分性关键词提取方法的基础上,对维吾尔语中的生气和高兴等常见情感类型进行基于文本句子的情感分类研究。结合维吾尔文本句子中的情感表达特点,以词频和文档频率作为基本统计量,通过计算同一词语在不同组合统计量下的类间差异得到区分性关键词,并基于这些关键词进行特征提取和区分性情感模型构建。从维吾尔语电影字幕、小说等文本库中提取生气和高兴2 种情感构造实验数据集,并验证所提出的情感分类方法。实验结果表明,基于区分性关键词的建模方法能有效地对维吾尔文本句子进行情感分类。

关键词: 维吾尔语, 区分性关键词, 文本句子, 情感分类, 差异性统计量

Abstract: This paper presents a classification approach for Uyghur text sentiment,such as angry and happy,based on discriminative key word extraction. Combined with the characteristics of sentiment expression in Uyghur text,the term frequency and document frequency are derived as primary statistics. Various discriminative statistics which reflect the discrepancy of the positive and negative sentiment datasets are derived from the primary statistics for each vocabulary word, and are used to extract discriminative key words. Features are extracted based on these keywords and are used to train discriminative sentiment models. This paper builds a sentiment text database by excerpting two sentiments:angriness and happiness from Uyghur movie transcriptions and novels,and verifies the proposed approach. Experimental results show that the method based on discriminative keyword extraction is effective in Uyghur text sentence sentiment classification.

Key words: Uyghur language, discriminative keyword;text sentence;sentiment classification;difference statistics

中图分类号:

TP391

热依莱木·帕尔哈提,孟祥涛,艾斯卡尔·艾木都拉. 基于区分性关键词模型的维吾尔文本情感分类[J]. 计算机工程, doi: 10.3969/j.issn.1000-3428.2014.10.026.

Rayila Parhat,MENG Xiang-tao,Askar Hamdulla. Uyghur Text Sentiment Classification Based on Discriminative Keyword Model[J]. Computer Engineering, doi: 10.3969/j.issn.1000-3428.2014.10.026.

http://www.ecice06.com/CN/Y2014/V40/I10/132

[1]	张博旭, 蒲智, 程曦. 基于提示学习的维吾尔语文本分类研究[J]. 计算机工程, 2023, 49(6): 292-299,313.
[2]	王松, 买日旦·吾守尔, 古兰拜尔·吐尔洪, 薛源. 基于知识架构的持续学习情感分类方法[J]. 计算机工程, 2023, 49(2): 112-118.
[3]	吴迪, 王梓宇, 赵伟超. ELMo-CNN-BiGRU双通道文本情感分类模型[J]. 计算机工程, 2022, 48(8): 105-112.
[4]	王义, 沈洋, 戴月明. 基于细粒度多通道卷积神经网络的文本情感分析[J]. 计算机工程, 2020, 46(5): 102-108.
[5]	胡均毅, 李金龙. 基于情感评分的分层文本表示情感分类方法[J]. 计算机工程, 2020, 46(3): 46-52,59.
[6]	穆妮热·穆合塔尔, 李晓, 杨雅婷. 维吾尔语复杂形态对汉维机器翻译的影响研究[J]. 计算机工程, 2020, 46(2): 309-314.
[7]	陈景霞,郑茹,张鹏伟,贾小云. 基于数据空间自适应与共空间模式的脑电情感分类[J]. 计算机工程, 2019, 45(4): 296-301.
[8]	周锦峰,叶施仁,王晖. 基于深度卷积神经网络模型的文本情感分类[J]. 计算机工程, 2019, 45(3): 300-308.
[9]	塞麦提·麦麦提敏, 司马义·阿不都热依木. 维吾尔语停用词抽取方法研究[J]. 计算机工程, 2019, 45(10): 288-292,300.
[10]	王淑媛,田生伟,禹龙,冯冠军,艾山·吾买尔,李圃,赵建国. 基于堆栈降噪自编码的维吾尔语事件共指关系识别[J]. 计算机工程, 2018, 44(6): 305-310.
[11]	吕超,杨超,李仁发. 基于CNN与词语邻近特征的情感分类模型[J]. 计算机工程, 2018, 44(5): 182-187.
[12]	罗延根,李晓,蒋同海,杨雅婷,周喜,王磊. 基于词向量的维吾尔语词项归一化方法[J]. 计算机工程, 2018, 44(2): 220-225.
[13]	王俊超,黄浩,徐海华,胡英. 基于迁移学习的低资源度维吾尔语语音识别[J]. 计算机工程, 2018, 44(10): 281-285,291.
[14]	陈炳丰,郝志峰,蔡瑞初,温雯,梁礼欣. 基于AWCRF模型的微博情感倾向分类方法[J]. 计算机工程, 2017, 43(7): 187-192.
[15]	李平,戴月明,王艳. 基于混合卡方统计量与逻辑回归的文本情感分析[J]. 计算机工程, 2017, 43(12): 192-196,202.

选择文件类型/文献管理软件名称

选择包含的内容

基于区分性关键词模型的维吾尔文本情感分类

Uyghur Text Sentiment Classification Based on Discriminative Keyword Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于区分性关键词模型的维吾尔文本情感分类

Uyghur Text Sentiment Classification Based on Discriminative Keyword Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价