
本课程将详解DQN背后的深度强化学习技术。该网络在300多款Atari游戏上取得非凡的成绩,甚至超过了人类顶级玩家。(课时:36 分钟)
强化学习
深度学习
Q-learning
游戏
DeepMind
-
课程介绍
课程背景
2015年,Google的DeepMind团队实现了突破,它们训练了一种叫做DQN的人工神经网络,完成了深度学习和传统的强化学习的无缝拼接,并在300多款Atari游戏上实现了一定程度上的通用人工智能(Artificial General Intelligence)。他们的做法就是改造强化学习的经典算法Q-learning,将其改造成一种有监督的机器学习问题。之后,他们训练了一个深度卷积神经网络,输入一张游戏中的画面,和游戏手柄的动作,就可以输出对这一状态和动作组合的Q值评估。
在不改变任何网络结构和超参数的情况下,只要我们让DQN网络反复地玩一款游戏,它就可以学会适当的评价函数Q,并指导着AI玩家把游戏玩的越来越好。最终,DQN可以在大量经典Atari游戏上表现突出,超越了很多经典的强化学习算法,和人类玩家的最好水平。
课程目的
学完本课程,你能做到
了解强化学习算法的概念
熟悉一些经典的强化学习算法,如Q-Learning算法等
了解强化学习是如何与深度学习结合的
熟悉Deep Q-Learning算法
课程详情
本课程将详解Q-learning算法以及DQN网络的运行原理,主要内容涵盖:
经典强化学习算法回顾
Q-learning算法
DQN原理
DQN的表现结果