
-
课程介绍
课程资料
讲稿下载:报名后可见/public/ueditor/php/upload/file/20171130/1512025905422644.pdf/public/ueditor/php/upload/file/20171031/1509430021888040.pdf
课程代码包:报名后可见/public/ueditor/php/upload/file/20171129/1511921917144076.zip
课程背景
设想这样一个AI程序,只要给它足够的时间,它就可以完成任何任务,无论是作曲、下棋,打游戏,还是跟你谈情说爱——这就是通用AI,一个让无数科学家们醉生梦死的终极梦想。本课程就教会你搭建这样一个初步通用的AI程序,一个可以玩各种游戏的通用学习器:“游戏高手”。首先,课程介绍了强化学习(Reinforcement)的基本概念以及关键算法;其次,我们介绍了Google在2015年发表的成果DQN网络:一个深度卷积网络与强化学习的结合物;之后,我们介绍了基于Python的游戏平台PyGame,以及如何用PyTorch实现这样一个DQN网络,从而让机器自己学习玩Flappy Bird游戏。
课后作业:
将“游戏高手”应用到其它游戏,如“星球大战”
课程目的
学完本课程,你能做到
了解强化学习的基本原理
了解深度强化学习以及实现深度强化学习的各种方法
了解QLearning以及DQN
掌握编写DQN模型的方法,并让DQN自己玩Flappy Bird游戏
了解关于通用人工智能的一些知识
课程详情
本课程的内容包括:
为什么要让AI玩游戏?
强化学习简介
深度强化学习原理
深度强化学习的多种路径
DQN网络工作原理
DQN表现结果
DQN玩Flappy Bird的PyTorch实现
PyGame:用Python模拟游戏的包
Flappy Bird的Python实现
DQN的PyTorch实现
效果评估
我们离通用AI还有多远?
Marcus Hutter的AIXI简介
哥德尔机是否是终极?