作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (22): 75-77. doi: 10.3969/j.issn.1000-3428.2010.22.026

• 软件技术与数据库 • 上一篇    下一篇

基于本体的Web文本挖掘与信息检索

艾 伟,孙四明,张 峰   

  1. (中国航天工程咨询中心,北京 100048)
  • 出版日期:2010-11-20 发布日期:2010-11-18
  • 作者简介:艾 伟(1985-),男,硕士研究生,主研方向:信息检索,文本挖掘;孙四明,研究员;张 峰,硕士

Web Text Mining and Information Retrieval Based on Ontology

AI Wei, SUN Si-ming, ZHANG Feng   

  1. (China Aerospace Engineering Consultation Center, Beijing 100048, China)
  • Online:2010-11-20 Published:2010-11-18

摘要: 针对传统Web文本挖掘技术缺少语义理解能力的不足,提出并实现一种基于本体的Web文本挖掘模型,即利用基于本体概念体系的向量空间模型替代传统的向量空间模型来表示文档,在此基础上进行Web文本挖掘,并给出一种集成语义信息检索的设计。实验结果初步验证了本体模型在Web文本挖掘技术上应用的可行性。

关键词: 本体, Web文本挖掘, 向量空间模型, 信息检索

Abstract: According to the disadvantages that traditional Web text mining technologies lack capability of ontology understanding, this paper proposes and implements a Web text mining model based on ontology. It uses a concept vector space model based on ontology instead of traditional vector space model to represent the documents. Besides, an integration information retrieval design is proposed on the foundation of text mining.

Key words: ontology, Web text mining, vector space model, information retrieval

中图分类号: