计算机工程 ›› 2012, Vol. 38 ›› Issue (10): 67-69.doi: 10.3969/j.issn.1000-3428.2012.10.019

• 软件技术与数据库 • 上一篇    下一篇

基于知网的中文短信文本词汇链抽取方法

刘金岭 1,刘 丹 2,周 泓 1   

  1. (1. 淮阴工学院计算机工程学院,江苏 淮安 223003;2. 沧州师范学院计算机系,河北 沧州 061001)
  • 收稿日期:2011-07-20 出版日期:2012-05-20 发布日期:2012-05-20
  • 作者简介:刘金岭(1958-),男,教授,主研方向:数据库技术,数据挖掘;刘 丹、周 泓,讲师、硕士
  • 基金项目:
    河北省科技支撑计划基金资助项目(10213581);淮安科 技计划基金资助项目(HAG09061)

Extraction Method of Chinese Short Message Text Lexical Chain Based on HowNet

LIU Jin-ling 1, LIU Dan 2, ZHOU Hong 1   

  1. (1. Computer Engineering Faculty, Huaiyin Institute of Technology, Huai’an 223003, China; 2. Department of Computer, Cangzhou Teachers College, Cangzhou 061001, China)
  • Received:2011-07-20 Online:2012-05-20 Published:2012-05-20

摘要: 提出一种基于知网的中文短信文本词汇链抽取方法。根据知网的语义关系,利用相同语义类给出上下文词汇项信息,构造多条词汇链,表达短信文本的多条叙事线索,从中抽取富含短信文本信息的词汇链,表达短信文本的语义信息,采用词汇链的关键词集合进行文本分类。实验结果证明,该方法的抽取准确率较高,文本分类速度较快。

关键词: 知网, 短信文本, 词汇链, 分类, 关键词, 统计信息

Abstract: Extraction Method of Chinese Short Message Text Lexical Chain Based on HowNet

Key words: HowNet, short message text, lexical chain, classification, keywords, statistical information

中图分类号: