行业报告详情 - 行业报告数据库

找到报告 1 篇当前为第 1 页共 1 页

计算机行业：读论文、深入浅出解析AlphaGo_Zero的技术和应用

加工时间：2017-10-31 信息来源：EMIS

索取原文[13 页]

关键词：计算机；AlphaGo_Zero；人工智能
摘要：

10 月18 日，DeepMind 在《Nature》上公布了他们最新版AlphaGo论文，介绍了迄今最强最新的版本AlphaGo Zero，使用纯强化学习，将价值网络和策略网络整合为一个架构，3 天训练后就以100 比0 击败了上一版

本的AlphaGo。

目录：

1、引子——“左右互搏，天下无双” ..... 3

2、 3 分钟看懂AlphaGo 背后的基础知识点................ 3

2.1、 3 张图看懂监督学习、无监督学习、强化学习 ................... 3

2.2、 2 分钟理围棋类程序的重要算法——蒙特卡洛树搜索MCTS ................... 5

3、 AlphaGo Zero 为何是大突破——知易行难 ........... 6

3.1、围棋竞技——知易行难，穷举算法不可行 .. 6

3.2、 Zero 的最大突破：使用纯强化学习，不再需要录入人类棋谱 .................. 7

3.3、算法核心仍是蒙特卡洛树算法，策略、估值网络合二为一 9

3.4、 AlphaGo Zero 算法技术简析 ...................... 9

4、强化学习更贴切人类学习本质，应用前景广泛 ... 11

4.1、 AlphaGo Zero 带来新思考 . 11

4.2、（深度）强化学习的应用场景探析 ........... 11

5、投资建议 ................ 12

6、风险提示 ................ 12

图表目录 13