作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (6): 30-31. doi: 10.3969/j.issn.1000-3428.2011.06.011

• 软件技术与数据库 • 上一篇    下一篇

Web文档评价对象抽取研究

许细清,林世平   

  1. (福州大学数学与计算机科学学院,福州 350108)
  • 出版日期:2011-03-20 发布日期:2011-03-29
  • 作者简介:许细清(1985-),男,硕士研究生,主研方向:文本倾向性分析,信息抽取;林世平,副教授
  • 基金资助:
    上海市信息安全综合管理技术研究重点实验室开放课题基金资助项目“基于机器学习的文本极性分析研究”(AGK2009003)

Research on Evaluation Object Extraction from Web Document

XU Xi-qing, LIN Shi-ping   

  1. (College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350108, China)
  • Online:2011-03-20 Published:2011-03-29

摘要: 针对用户评论信息,基于句子上下文相关线索和上下文无关线索信息,应用句法分析、点互信息方法,构造领域词典及主张词典,对产品评论中的评价对象进行抽取。实验结果说明,与取距离评价词最近的词作为评价对象的Baseline方法相比,该方法能提高准确率和F度量值。

关键词: 信息抽取, 评价对象, 意见挖掘, 句法分析

Abstract: This paper considers both the contextual clues and context-independent statistical clues, using syntactic analysis and method of point of mutual information, building related dictionaries to extract the evaluation object in products comments. Experimental results show that this method is better than Baseline method which gets the latest word as the evaluation object in precision rate and F-measure.

Key words: information extraction, evaluation object, opinion mining, syntactic analysis

中图分类号: