深度强化学习简介

深度强化学习是深度学习技术与强化学习(也称增强学习,Reinforcement learning)相结合的产物。利用深度强化学习我们可以让智能体在缺乏监督信息的情况下快速收集有效的反馈信息,从而表现的越来越好。DeepMind团队利用深度强化学习完成了计算机学习打游戏,完成了AlphaGo的设计,并应用到了包括星际争霸、德州扑克等各种博弈和游戏之中。本课程将由向您详细讲述这套技术以及在一些场合的应用。

讲师:   史雪松

深度强化学习

课程资料:

深度强化学习是深度学习技术与强化学习(也称增强学习,Reinforcement learning)相结合的产物。强化学习是一种无监督的学习方式,它通过建模Agent主体与环境的交互从而不断地从环境吸取反馈以实现Agent的学习过程。这种学习算法将Agent的做与学耦合到了一起。深度卷积神经网络可以大大提升机器在图像识别方面的能力。将深度卷积网络和强化学习技术结合到一起就可以让两种方法取长补短,深度卷积网络可以让Agent的甄别空间大大缩减,而强化学习则可以让Agent能够有效地吸收来自环境的反馈,从而快速地完成学习。


2015年Google的DeepMind团队利用深度强化学习完成了机器打游戏的学习过程,它不仅在300多款Atari游戏上表现非凡,而且还可以赶超人类选手水平。2016年,Google的DeepMind再次凭借深度强化学习完成了Alphago的设计框架,从而战胜人类围棋世界冠军。近期,这套算法也被人们用来更多的问题上。

课程资料:

课程讲稿:

购买课程后可见

课程大纲:

本课程将全面解读AlphaGo算法的原理和一些简单应用,主要内容包括:

  • 强化学习的基本概念

  • 算法:SARSA与Q-learning

  • 机器学习打游戏的例子

  • 强化学习解决机械臂控制问题的例子

  • DDPG算法(Critic与Actor)

  • GPS(Guided policy search)算法

  • 深度强化学习的挑战


参考读物:


讲师介绍
史雪松

复旦大学博士,英特尔研究院机器人系统实验室研究员