作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (9): 93-94,97. doi: 10.3969/j.issn.1000-3428.2011.09.031

• 软件技术与数据库 • 上一篇    下一篇

改进的SOD孤立点检测算法

刘文远,张 亮,孙德杰,陈子军   

  1. (燕山大学信息科学与工程学院,河北 秦皇岛 066004)
  • 出版日期:2011-05-05 发布日期:2011-05-12
  • 作者简介:刘文远(1968-),男,教授、博士生导师,主研方向:无线传感器网络,电子商务,数据挖掘;张 亮,硕士;孙德杰, 讲师;陈子军,副教授
  • 基金资助:
    河北省重大技术创新基金资助项目“河北省港口群生产管理集成信息系统”(09213562Z)

Improved SOD Outlier Detection Algorithm

LIU Wen-yuan, ZHANG Liang, SUN De-jie, CHEN Zi-jun   

  1. (College of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, China)
  • Online:2011-05-05 Published:2011-05-12

摘要: 针对传统SOD孤立点检测算法在处理高维数据时存在的问题,提出一种改进算法。通过对每一维的聚集度进行量化,确定各维的参考价值,从而降低算法结果对参数设定的敏感度,利用相对距离表示各点到中心值的偏离度,使其更利于不同密度子空间的孤立点检测。仿真实验结果表明,改进算法的检测精度优于传统SOD算法。

关键词: 高维数据, 子空间, 孤立点检测, 数据挖掘

Abstract: Aiming at the problems in process of dealing with high dimensional data for traditional SOD outlier detection algorithm, this paper presents an improved one. Through quantifying the aggregation of each dimension, the reference value of each dimension can be fixed, thus reducing the parameter settings impact on algorithm results. Using the relative distance to show the degree of deviation is convenient for detecting outlier in different densities subspace. Simulation results demonstrate the improved algorithm is better than traditional one in detection accuracy.

Key words: high dimensional data, subspace, outlier detection, data mining

中图分类号: