揭秘AlphaGo:深度强化学习与蒙特卡洛搜索

本课程将全面解读AlphaGo背后的深度学习技术,包括深度强化学习技术的实现方法,蒙特卡洛搜索的算法细节等等。(课时:43 分钟)

强化学习 深度学习 AlphaGo 蒙特卡洛搜索 策略网络 价值网络 DeepMind

讲师:   张江

课程背景

可以说,AlphaGo标志着现代人工智能最顶尖的技术,它的核心算法就是两块,一块是深度强化学习,另一块就是蒙特卡洛搜索。所谓的深度强化学习是深度学习技术与古老的强化学习技术的混合;而蒙特卡洛搜索则是一种快速的搜索算法,能够通过对战的模拟而完成走棋。AlphaGo巧妙地将深度强化学习、蒙特卡洛搜索等技术融合在了一起,造就了人工智能历史上的深化。

课程目的

学完本课程,你能做到

  • 了解AlphaGo的核心:强化学习技术

  • 熟悉强化学习的基本概念

  • 熟悉蒙特卡洛搜索技术

  • 了解强化学习赋予了AlphaGo怎样的能力

课程详情

本课程将详细讲解AlphaGo的工作原理,内容包括:

  • 强化学习简介

  • AlphaGo的深度强化学习

  • 蒙特卡洛搜索技术

  • AlphaGo的表现

相关课程

image.png

AI打游戏背后的深度强化学习技术


image.png

深度强化学习算法:价值迭代网络