5411 篇
13916 篇
478312 篇
16343 篇
11779 篇
3948 篇
6564 篇
1255 篇
75732 篇
38197 篇
12196 篇
1674 篇
2874 篇
3423 篇
642 篇
1242 篇
1980 篇
4929 篇
3895 篇
5518 篇
基于并行计算的大数据挖掘在电网中的应用
目前并行计算和云计算平台已成为解决大数据挖掘的重要手段。并行计算是将大数据划分成独立的小数据分别进行计算,阐述了常用的分布式和MapReduce方法等数据挖掘方法。分布式方法将大数据以手动的方式划分为若干个子集,并采用相应的数据挖掘算法进行处理,通过合并子集结果来获得最终的结果。MapReduce方法基于云计算平台对数据进行筛选和排序,再拆分成若干个映射任务,最后汇总成最终的输出结果。结合国家电网四个大数据集对分布式和MapReduce方法在数据挖掘的准确性和效率上进行对比,仿真结果表明,除了类不平衡的数据集,MapReduce明显优于基准和分布式计算模式。