5378 篇
13902 篇
477779 篇
16275 篇
11758 篇
3925 篇
6529 篇
1251 篇
75585 篇
37723 篇
12151 篇
1656 篇
2859 篇
3417 篇
641 篇
1240 篇
1973 篇
4912 篇
3870 篇
5462 篇
计算机行业:读论文、深入浅出解析AlphaGo_Zero的技术和应用
10 月18 日,DeepMind 在《Nature》上公布了他们最新版AlphaGo论文,介绍了迄今最强最新的版本AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个架构,3 天训练后就以100 比0 击败了上一版
本的AlphaGo。
1、 引子——“左右互搏,天下无双” ..... 3
2、 3 分钟看懂AlphaGo 背后的基础知识点................ 3
2.1、 3 张图看懂监督学习、无监督学习、强化学习 ................... 3
2.2、 2 分钟理围棋类程序的重要算法——蒙特卡洛树搜索MCTS ................... 5
3、 AlphaGo Zero 为何是大突破——知易行难 ........... 6
3.1、 围棋竞技——知易行难,穷举算法不可行 .. 6
3.2、 Zero 的最大突破:使用纯强化学习,不再需要录入人类棋谱 .................. 7
3.3、 算法核心仍是蒙特卡洛树算法,策略、估值网络合二为一 9
3.4、 AlphaGo Zero 算法技术简析 ...................... 9
4、 强化学习更贴切人类学习本质,应用前景广泛 ... 11
4.1、 AlphaGo Zero 带来新思考 . 11
4.2、 (深度)强化学习的应用场景探析 ........... 11
5、 投资建议 ................ 12
6、 风险提示 ................ 12
图表目录 13