AI打游戏背后的深度强化学习技术

本课程将详解DQN背后的深度强化学习技术。该网络在300多款Atari游戏上取得非凡的成绩,甚至超过了人类顶级玩家。(课时:36 分钟)

讲师:   张江


课程背景

2015年,Google的DeepMind团队实现了突破,它们训练了一种叫做DQN的人工神经网络,完成了深度学习和传统的强化学习的无缝拼接,并在300多款Atari游戏上实现了一定程度上的通用人工智能(Artificial General Intelligence)。他们的做法就是改造强化学习的经典算法Q-learning,将其改造成一种有监督的机器学习问题。之后,他们训练了一个深度卷积神经网络,输入一张游戏中的画面,和游戏手柄的动作,就可以输出对这一状态和动作组合的Q值评估。

在不改变任何网络结构和超参数的情况下,只要我们让DQN网络反复地玩一款游戏,它就可以学会适当的评价函数Q,并指导着AI玩家把游戏玩的越来越好。最终,DQN可以在大量经典Atari游戏上表现突出,超越了很多经典的强化学习算法,和人类玩家的最好水平。

课程目的

学完本课程,你能做到

  • 了解强化学习算法的概念

  • 熟悉一些经典的强化学习算法,如Q-Learning算法等

  • 了解强化学习是如何与深度学习结合的

  • 熟悉Deep Q-Learning算法

课程详情

本课程将详解Q-learning算法以及DQN网络的运行原理,主要内容涵盖:

  • 经典强化学习算法回顾

  • Q-learning算法

  • DQN原理

  • DQN的表现结果

相关课程


image.png

揭秘AlphaGo——深度强化学习与蒙特卡洛搜索

讲师介绍
张江

北京师范大学系统科学学院教授,博士生导师,集智俱乐部、集智AI学园创始人,集智科学家,阿里研究院、腾讯研究院、网络智库专家,人工智能研究者与布道者。主要讲授课程:人工智能、复杂性思维、计算机建模与模拟、Matlab基础及其应用。主要从事的研究领域包括:复杂系统建模、计算社会科学等。曾发表学术论文数十篇,访问过圣塔菲研究所、密西根复杂系统中心等知名国外大学。曾带领集智俱乐部写作、出版书籍:《科学的极致——漫谈人工智能》,《走近2050——注意力、互联网与人工智能》。