%0 Journal Article %A 尹绍宏 %A 范桂丹 %T 基于矩阵的数据流Top-k频繁项集挖掘算法 %D 2014 %R 10.3969/j.issn.1000-3428.2014.03.011 %J 计算机工程 %P 55-58,75 %V 40 %N 3 %X 传统的数据挖掘算法在挖掘频繁项集时会产生大量的冗余项集,影响挖掘效率。为此,提出一种基于矩阵的数据流Top-k频繁项集挖掘算法。引入2个0-1矩阵,即事务矩阵和二项集矩阵。采用事务矩阵表示滑动窗口模型中的事务列表,通过计算每行的支持度得到二项集矩阵。利用二项集矩阵得到候选项集,将事务矩阵中对应的行做逻辑与运算,计算出候选项集的支持度,从而得到Top-k频繁项集。把挖掘的结果存入数据字典中,当用户查询时,能够按支持度降序输出Top-k频繁项集。实验结果表明,该算法在挖掘过程中能避免冗余项集的产生,在保证正确率的前提下具有较高的时间效率。 %U http://www.ecice06.com/CN/10.3969/j.issn.1000-3428.2014.03.011