揭秘AlphaGo:深度强化学习与蒙特卡洛搜索

本课程将全面解读AlphaGo背后的深度学习技术,包括深度强化学习技术的实现方法,蒙特卡洛搜索的算法细节等等。(课时:43 分钟)

讲师:   张江

课程背景

可以说,AlphaGo标志着现代人工智能最顶尖的技术,它的核心算法就是两块,一块是深度强化学习,另一块就是蒙特卡洛搜索。所谓的深度强化学习是深度学习技术与古老的强化学习技术的混合;而蒙特卡洛搜索则是一种快速的搜索算法,能够通过对战的模拟而完成走棋。AlphaGo巧妙地将深度强化学习、蒙特卡洛搜索等技术融合在了一起,造就了人工智能历史上的深化。

课程目的

学完本课程,你能做到

  • 了解AlphaGo的核心:强化学习技术

  • 熟悉强化学习的基本概念

  • 熟悉蒙特卡洛搜索技术

  • 了解强化学习赋予了AlphaGo怎样的能力

课程详情

本课程将详细讲解AlphaGo的工作原理,内容包括:

  • 强化学习简介

  • AlphaGo的深度强化学习

  • 蒙特卡洛搜索技术

  • AlphaGo的表现

相关课程

image.png

AI打游戏背后的深度强化学习技术


image.png

深度强化学习算法:价值迭代网络

讲师介绍
张江

北京师范大学系统科学学院教授,博士生导师,集智俱乐部、集智AI学园创始人,集智科学家,阿里研究院、腾讯研究院、网络智库专家,人工智能研究者与布道者。主要讲授课程:人工智能、复杂性思维、计算机建模与模拟、Matlab基础及其应用。主要从事的研究领域包括:复杂系统建模、计算社会科学等。曾发表学术论文数十篇,访问过圣塔菲研究所、密西根复杂系统中心等知名国外大学。曾带领集智俱乐部写作、出版书籍:《科学的极致——漫谈人工智能》,《走近2050——注意力、互联网与人工智能》。