5393 篇
13905 篇
477978 篇
16302 篇
11766 篇
3933 篇
6543 篇
1253 篇
75636 篇
37863 篇
12163 篇
1665 篇
2866 篇
3421 篇
641 篇
1241 篇
1974 篇
4917 篇
3875 篇
5483 篇
基于并行计算的大数据挖掘在电网中的应用
目前并行计算和云计算平台已成为解决大数据挖掘的重要手段。并行计算是将大数据划分成独立的小数据分别进行计算,阐述了常用的分布式和MapReduce方法等数据挖掘方法。分布式方法将大数据以手动的方式划分为若干个子集,并采用相应的数据挖掘算法进行处理,通过合并子集结果来获得最终的结果。MapReduce方法基于云计算平台对数据进行筛选和排序,再拆分成若干个映射任务,最后汇总成最终的输出结果。结合国家电网四个大数据集对分布式和MapReduce方法在数据挖掘的准确性和效率上进行对比,仿真结果表明,除了类不平衡的数据集,MapReduce明显优于基准和分布式计算模式。