5299 篇
13868 篇
408774 篇
16079 篇
9269 篇
3869 篇
6464 篇
1238 篇
72401 篇
37108 篇
12060 篇
1619 篇
2821 篇
3387 篇
640 篇
1229 篇
1965 篇
4866 篇
3821 篇
5293 篇
基于并行计算的大数据挖掘在电网中的应用
目前并行计算和云计算平台已成为解决大数据挖掘的重要手段。并行计算是将大数据划分成独立的小数据分别进行计算,阐述了常用的分布式和MapReduce方法等数据挖掘方法。分布式方法将大数据以手动的方式划分为若干个子集,并采用相应的数据挖掘算法进行处理,通过合并子集结果来获得最终的结果。MapReduce方法基于云计算平台对数据进行筛选和排序,再拆分成若干个映射任务,最后汇总成最终的输出结果。结合国家电网四个大数据集对分布式和MapReduce方法在数据挖掘的准确性和效率上进行对比,仿真结果表明,除了类不平衡的数据集,MapReduce明显优于基准和分布式计算模式。