作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (21): 34-36. doi: 10.3969/j.issn.1000-3428.2010.21.012

• 软件技术与数据库 • 上一篇    下一篇

一种高效的高维异常数据挖掘算法

李 昕,钱 旭,王自强   

  1. (中国矿业大学(北京)机电与信息工程学院,北京 100083)
  • 出版日期:2010-11-05 发布日期:2010-11-03
  • 作者简介:李 昕(1978-),男,博士研究生,主研方向:数据挖掘;钱 旭,教授、博士生导师;王自强,博士研究生
  • 基金资助:
    教育部科学技术研究基金重点资助项目(107021)

Efficient Data Mining Algorithm for High-dimensional Outlier Data

LI Xin, QIAN Xu, WANG Zi-qiang   

  1. (College of Mechanical Electronic and Information Engineering, China University of Mining and Technology(Beijing), Beijing 100083, China)
  • Online:2010-11-05 Published:2010-11-03

摘要: 针对高维异常数据的挖掘问题,提出一种基于最大间隔准则和最小最大概率机的高维异常数据挖掘算法。利用最大间隔准则算法将高维数据投影到低维特征空间,再利用最小最大概率机进行异常数据的挖掘。实验结果表明,该算法检测准确率较高。

关键词: 异常数据, 最大间隔准则, 最小最大概率机, 数据挖掘

Abstract: To effectively cope with data mining problem for high-dimensional outlier data, a novel outlier data mining algorithm based on Maximum Margin Criterion(MMC) and MiniMax Probability(MMP) machine is proposed. The high dimensional data sets are first projected into lower-dimensional feature space by using MMC algorithm, and MMP machine is adopted to mine outlier data. Experimental results show that the proposed algorithm is feasible and has higher detection accuracy.

Key words: outlier data, Maximum Margin Criterion(MMC), MiniMax Probability(MMP) machine, data mining

中图分类号: