作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (4): 78-80. doi: 10.3969/j.issn.1000-3428.2011.04.028

• 软件技术与数据库 • 上一篇    下一篇

数据流分类变化的分析和检测

黄树成,朱 霞   

  1. (江苏科技大学计算机科学与工程学院,江苏 镇江 212003)
  • 出版日期:2011-02-20 发布日期:2011-02-17
  • 作者简介:黄树成(1969-),男,副教授、博士,主研方向:数据挖掘,机器学习;朱 霞,工程师、硕士
  • 基金资助:
    国家自然科学基金资助项目(70871057);江苏省高校自然科学研究计划基金资助项目(2008DX065J)

Analysis and Detection of Changes in Data Stream Classification

HUANG Shu-cheng, ZHU Xia   

  1. (School of Computer Science & Engineering, Jiangsu University of Science & Technology, Zhenjiang 212003, China)
  • Online:2011-02-20 Published:2011-02-17

摘要: 针对主动挖掘和被动挖掘2种典型分类方法的特点,分析实际问题中数据流的基本变化类型及衍生的各种变化情况,证明主动挖掘方法在许多情况下无法有效工作,给出一个有效检测数据流变化的思路。采用主动学习方法,利用有限的资源可以组织高质量的类标数据,降低训练数据的需求量。

关键词: 数据流, 概念漂移, 分布变化, 主动挖掘, 被动挖掘

Abstract: Aiming at the characteristics of active mining and passive mining, this paper analyzes two basic types of change and possible combination ones in a real-world data stream, demonstrates that the active mining method does not work in most situations. It offers an effective framework for detecting the changes in data streams. By using active learning method, it employs limited resources to organize high-quality data, and reduces the training data.

Key words: data stream, concept-drift, distribution change, active mining, passive mining

中图分类号: