揭秘AlphaGo:深度强化学习与蒙特卡洛搜索

2016年3月15日,Google的DeepMind团队开发的人工智能程序AlphaGo以4:1的大比分击败了世界围棋冠军李世石震惊了全世界;2017年1月,AlphaGo的升级版化名为Master的棋手以60比0不败的战绩横扫一众围棋顶尖高手;2017年5月26日,AlphaGo升级版再次以3:0的战绩逼哭围棋少将柯杰。那么AlphaGo为何如此厉害?它背后的技术是什么呢?

讲师:   张江

揭秘AlphaGo:深度强化学习与蒙特卡洛搜索

课程背景:

可以说,AlphaGo标志着现代人工智能最顶尖的技术,它的核心算法就是两块,一块是深度强化学习,另一块就是蒙特卡洛搜索。所谓的深度强化学习是深度学习技术与古老的强化学习技术的混合;而蒙特卡洛搜索则是一种快速的搜索算法,能够通过对战的模拟而完成走棋。AlphaGo巧妙地将深度强化学习、蒙特卡洛搜索等技术融合在了一起,造就了人工智能历史上的深化。


image.png


课程资料:

讲稿下载:购买课程后可见

参考文献: Mastering the game of Go with deep neural networks and tree search.pdf ,

    课程大纲:

    本课程将详细讲解AlphaGo的工作原理,内容包括:

    • 强化学习简介

    • AlphaGo的深度强化学习

    • 蒙特卡洛搜索技术

    • AlphaGo的表现


    相关课程:

    image.png

    AI打游戏背后的深度强化学习技术


    image.png

    深度强化学习算法:价值迭代网络


    讲师介绍
    张江

    北京师范大学系统科学学院教授,博士生导师,集智俱乐部、集智AI学园创始人,集智科学家,阿里研究院、腾讯研究院、网络智库专家,人工智能研究者与布道者。主要讲授课程:人工智能、复杂性思维、计算机建模与模拟、Matlab基础及其应用。主要从事的研究领域包括:复杂系统建模、计算社会科学等。曾发表学术论文数十篇,访问过圣塔菲研究所、密西根复杂系统中心等知名国外大学。曾带领集智俱乐部写作、出版书籍:《科学的极致——漫谈人工智能》,《走近2050——注意力、互联网与人工智能》。