基于格的快速频繁项集挖掘算法
FP-growth算法是目前较高效的频繁项集挖掘算法之一,但用于挖掘大型数据库却不能获得较高的效率。深入分析了造成低效的原因,提出一种基于格的快速频繁项集挖掘算法LFP-grwoth。LFP-grwoth算法利用等价关系将原来的搜索空间(格)划分成若干个更小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子网格的并集进行的约束频繁项集的挖掘。实验结果和理论分析表明,LFP-growth算法在挖掘大型数据库时时间和空间的性能上均优于FP-growth算法。而且,随着数据库规模的增大或支持度阈值的减少,LFP-growth算法具有更明显的优势。
版权所有:中国教育和科研计算机网网络中心 Copyright © 1994-2017 CERNIC,CERNET,京ICP备05078770号,京网文[2014]2106-306号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@cernet.com