%0 Journal Article %A 韩飞 %A 沈镇林 %T 基于不完备集双聚类的缺失数据填补算法 %D 2016 %R 10.3969/j.issn.1000-3428.2016.04.004 %J 计算机工程 %P 20-26 %V 42 %N 4 %X 缺失数据填补是数据清洗领域的一个重要问题。由于绝大部分局部填补方法基于全部属性进行分类,未考虑对象属性之间的关联性,因此基于不完备集双聚类,提出一种缺失数据填补算法。该算法利用双聚类完美簇的平均平方残基为0及簇内的属性值波动一致的特点,对缺失数据进行填补。通过数学分析,把寻找含有缺失值的最大完美簇问题转化为求解缺失对象与其他对象之间的最大相似属性集问题,在相同的最大相似属性集下,以缺失值的众数作为填补值。采用4组UCI数据集进行实验,结果表明,该算法相比ROUSTIDA算法平均提高了77.13%的填补值精确度。 %U http://www.ecice06.com/CN/10.3969/j.issn.1000-3428.2016.04.004