了解强化学习的基本概念与各种算法
什么是强化学习
强化学习方法汇总
什么是 Q-Learning
什么是 Sarsa
什么是 DQN
什么是 Policy Gradients
什么是 Actor Critic
什么是 DDPG
什么是 A3C
课程背景
强化学习(Reinforcement Learning)是机器学习大家族中重要的一员。这种算法的学习方式非常像一个婴儿,一开始对环境陌生, 然后通过不断的与环境接触,从环境中学习规律,最终熟悉并适应了环境。实现强化学习的方式有很多,比如 Q-learning,Sarsa 等,我们都会一步步提到。在后期的课程中我们也会基于可视化的模拟,来观看计算机是如何学习的。
课程目的
学完本课程,你能做到
课程详情
本课程的主要内容有: