5401 篇
13911 篇
478084 篇
16320 篇
11773 篇
3942 篇
6548 篇
1254 篇
75673 篇
37947 篇
12175 篇
1667 篇
2870 篇
3423 篇
641 篇
1241 篇
1980 篇
4924 篇
3888 篇
5493 篇
计算机行业:读论文、深入浅出解析AlphaGo_Zero的技术和应用
10 月18 日,DeepMind 在《Nature》上公布了他们最新版AlphaGo论文,介绍了迄今最强最新的版本AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个架构,3 天训练后就以100 比0 击败了上一版
本的AlphaGo。
1、 引子——“左右互搏,天下无双” ..... 3
2、 3 分钟看懂AlphaGo 背后的基础知识点................ 3
2.1、 3 张图看懂监督学习、无监督学习、强化学习 ................... 3
2.2、 2 分钟理围棋类程序的重要算法——蒙特卡洛树搜索MCTS ................... 5
3、 AlphaGo Zero 为何是大突破——知易行难 ........... 6
3.1、 围棋竞技——知易行难,穷举算法不可行 .. 6
3.2、 Zero 的最大突破:使用纯强化学习,不再需要录入人类棋谱 .................. 7
3.3、 算法核心仍是蒙特卡洛树算法,策略、估值网络合二为一 9
3.4、 AlphaGo Zero 算法技术简析 ...................... 9
4、 强化学习更贴切人类学习本质,应用前景广泛 ... 11
4.1、 AlphaGo Zero 带来新思考 . 11
4.2、 (深度)强化学习的应用场景探析 ........... 11
5、 投资建议 ................ 12
6、 风险提示 ................ 12
图表目录 13