计算机工程 ›› 2010, Vol. 36 ›› Issue (23): 13-15,18.doi: 10.3969/j.issn.1000-3428.2010.23.005

• 博士论文 • 上一篇    下一篇

大规模复杂数据集的约简方法

张诤1,2,王惠文2   

  1. (1.甘肃省委党校信息中心,兰州 730070; 2.北京航空航天大学复杂数据分析研究中心,北京 100083)
  • 出版日期:2010-12-05 发布日期:2010-12-14
  • 作者简介:张诤(1974-),男,副教授、博士,主研方向:复杂数据分析,数据挖掘;王惠文,博士、博士生导师
  • 基金项目:

    国家自然科学基金资助项目(70810307010)

Reduction Method for Mining Largescale Complex Datasets

ZHANG Zheng1,2,WANG Huiwen2   

  1. (1.Information Center, Gansu Party School, Lanzhou 730070, China; 2.Complex Data Analysis Center, Beihang University, Beijing 100083, China)
  • Online:2010-12-05 Published:2010-12-14

摘要:

对样本点数量巨大、用于刻画对象特征的指标众多、带有时空动态特性、包含大量噪声等特点的大规模复杂数据集进行定义。针对大规模复杂数据集的挖掘要求,结合统计分析、粗糙集、模糊集理论中的数据约简思想和方法,提出一种基于样本模糊聚类和粗糙集属性约简的大规模复杂数据集约简方法。

关键词: 大规模复杂数据, 数据挖掘, 数据约简, 粗糙集, 模糊集

Abstract:

This paper gives the definition of largescale complex dataset with characteristics of large, multiattribute, temporal and spatial, rough. For the problem of largescale complex dataset mining, according to theory of data reduction of statistics, rough set, fuzzy set, an efficient method is proposed to reduce largescale complex data based on fuzzy clustering and attribute reduction of rough set.

Key words: largescale complex data, data mining, data reduction, rough set, fuzzy set

中图分类号: