基于分布式序列模式的算法
本文首先对分布式环境下序列模式的性质进行了分析。
算法采用前缀投影技术划分模式搜索空间,利用序列模式前缀指定选举站点统计序列的全局支持计数,利用局部约减、选举约减、计数约减等方法减少候选序列数,同时将算法分为3个子过程异步运行,使得算法具有较低的I/O开销、内存开销和通信开销,从而高效地生成全局序列模式。实验结果显示,在具有海量数据的局域网环境中,FDMSP (fast distributed mining of sequential patterns)算法的性能优于将数据集中后采用GSP算法68.5%~99.5%,并且FDMSP算法具有良好的可伸缩性。
版权所有:中国教育和科研计算机网网络中心 Copyright © 1994-2017 CERNIC,CERNET,京ICP备05078770号,京网文[2014]2106-306号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@cernet.com