作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2012, Vol. 38 ›› Issue (13): 156-158,162. doi: 10.3969/j.issn.1000-3428.2012.13.046

• 人工智能及识别技术 • 上一篇    下一篇

基于情绪知识的中文微博情感分类方法

庞 磊1,2,李寿山1,2,周国栋1,2   

  1. (1. 苏州大学计算机科学与技术学院,江苏 苏州 215006;2. 江苏省计算机信息处理技术重点实验室,江苏 苏州 215006)
  • 收稿日期:2011-08-31 出版日期:2012-07-05 发布日期:2012-07-05
  • 作者简介:庞 磊(1985-),男,硕士研究生,主研方向:自然语言处理;李寿山,副教授;周国栋,教授、博士生导师
  • 基金资助:
    国家自然科学基金资助项目(61003155, 60873150)

Sentiment Classification Method of Chinese Micro-blog Based on Emotional Knowledge

PANG Lei  1,2, LI Shou-shan   1,2, ZHOU Guo-dong   1,2   

  1. (1. School of Computer Science and Technology, Soochow University, Suzhou 215006, China; 2. Provincial Key Lab of Computer Information Processing Technology of Jiangsu, Suzhou 215006, China)
  • Received:2011-08-31 Online:2012-07-05 Published:2012-07-05

摘要: 通过对新浪微博文本进行情感信息方面的分析与研究,提出一种基于情绪知识的非监督情感分类方法。利用情绪词和表情图片 2种情绪知识对大规模微博非标注语料进行筛选并自动标注,用自动标注好的语料作为训练集构建微博情感文本分类器,对微博文本进行情感极性自动分类。实验结果表明,该方法对微博文本的情感极性分类达到较好的效果。

关键词: 中文信息处理, 无监督学习, 情绪知识, 微博, 情感分类

Abstract: This paper proposes an unsupervised method of sentiment classification and applies it to perform sentiment classification on Sina micro-blog. The approach employs emotional images and emotional words as the emotional knowledge to extract pseudo-labeled samples, and uses them to train a classifier for automatically classification on polarities of the miro-blog. Experimental results show that the method achieves a decent performance on sentiment classification for Chinese micro-blog.

Key words: Chinese information processing, unsupervised learning, emotional knowledge, micro-blog, sentiment classification

中图分类号: