关键词:AlphaGo;人工智能;智能算法;发展前景;社会问题
摘 要:
AlphaGo 不同于以往的大型计算型机器人, 具有真正的人工智能,使用了深度学习( Deep Learning)而不是暴力穷举。 其能够在每一步走法和全局之间进行平衡, “ 思考” 方式更接近人类。AlphaGo 采用深度神经网络构架和蒙特卡洛树算法( MCTS)相结合,还包含监督学习和自我训练的多个阶段的训练。 其中深度神经网络构架包含策略网络( policy network)和价值网络( value network)。策略网络作为训练流水线的第一步,主要是用于预测下一步的可能性,价值网络则是通过不同的棋子分布状况带来的结果来巩固和调整策略网络。