AI打游戏背后的深度强化学习技术

DQN(Deep Q-Network)是Google Deep Mind团队在2015年研制出来的一种人工神经网络。该网络可以做到在不改变网络结构和超参数的情况下,仅通过反复地玩一款游戏而自动学习,就能够在300多款Atari游戏上取得非凡的成绩,甚至超过了人类顶级玩家。可以说,DQN部分地实现了通用人工智能(Artificial General Intelligence)。本课程将详解DQN背后的深度强化学习技术。

讲师:   张江

AI打游戏背后的深度强化学习技术

课程背景:

2015年,Google的DeepMind团队实现了突破,它们训练了一种叫做DQN的人工神经网络,完成了深度学习和传统的强化学习的无缝拼接,并在300多款Atari游戏上实现了一定程度上的通用人工智能(Artificial General Intelligence)。他们的做法就是改造强化学习的经典算法Q-learning,将其改造成一种有监督的机器学习问题。之后,他们训练了一个深度卷积神经网络,输入一张游戏中的画面,和游戏手柄的动作,就可以输出对这一状态和动作组合的Q值评估。

image.png


在不改变任何网络结构和超参数的情况下,只要我们让DQN网络反复地玩一款游戏,它就可以学会适当的评价函数Q,并指导着AI玩家把游戏玩的越来越好。最终,DQN可以在大量经典Atari游戏上表现突出,超越了很多经典的强化学习算法,和人类玩家的最好水平。

课程资料:

课件:购买课程后可见

参考文献:

课程大纲:

本课程将详解Q-learning算法以及DQN网络的运行原理,主要内容涵盖:

  • 经典强化学习算法回顾

  • Q-learning算法

  • DQN原理

  • DQN的表现结果


相关课程:

image.png

AI打游戏背后的深度强化学习技术


image.png

揭秘AlphaGo——深度强化学习与蒙特卡洛搜索

讲师介绍
张江

北京师范大学系统科学学院教授,博士生导师,集智俱乐部、集智AI学园创始人,集智科学家,阿里研究院、腾讯研究院、网络智库专家,人工智能研究者与布道者。主要讲授课程:人工智能、复杂性思维、计算机建模与模拟、Matlab基础及其应用。主要从事的研究领域包括:复杂系统建模、计算社会科学等。曾发表学术论文数十篇,访问过圣塔菲研究所、密西根复杂系统中心等知名国外大学。曾带领集智俱乐部写作、出版书籍:《科学的极致——漫谈人工智能》,《走近2050——注意力、互联网与人工智能》。