游戏高手

本课程将介绍什么是通用人工智能,并教会你搭建一个初步通用的AI程序,一个可以玩各种游戏的通用学习器:“游戏高手”。(课时:125 分钟)

深度学习 PyTorch 强化学习

讲师:   张江

课程资料

  • 讲稿下载:报名后可见

  • 课程代码包:报名后可见

课程背景

设想这样一个AI程序,只要给它足够的时间,它就可以完成任何任务,无论是作曲、下棋,打游戏,还是跟你谈情说爱——这就是通用AI,一个让无数科学家们醉生梦死的终极梦想。本课程就教会你搭建这样一个初步通用的AI程序,一个可以玩各种游戏的通用学习器:“游戏高手”。首先,课程介绍了强化学习(Reinforcement)的基本概念以及关键算法;其次,我们介绍了Google在2015年发表的成果DQN网络:一个深度卷积网络与强化学习的结合物;之后,我们介绍了基于Python的游戏平台PyGame,以及如何用PyTorch实现这样一个DQN网络,从而让机器自己学习玩Flappy Bird游戏。


课后作业:

将“游戏高手”应用到其它游戏,如“星球大战”

课程目的

学完本课程,你能做到

  • 了解强化学习的基本原理

  • 了解深度强化学习以及实现深度强化学习的各种方法

  • 了解QLearning以及DQN

  • 掌握编写DQN模型的方法,并让DQN自己玩Flappy Bird游戏

  • 了解关于通用人工智能的一些知识

课程详情

本课程的内容包括:

  • 为什么要让AI玩游戏?

  • 强化学习简介

  • 深度强化学习原理

    • 深度强化学习的多种路径

    • DQN网络工作原理

    • DQN表现结果

  • DQN玩Flappy Bird的PyTorch实现

    • PyGame:用Python模拟游戏的包

    • Flappy Bird的Python实现

    • DQN的PyTorch实现

    • 效果评估

  • 我们离通用AI还有多远?

    • Marcus Hutter的AIXI简介

    • 哥德尔机是否是终极?