PATHNET: 大规模迁移学习技术

本课程详细解读了由DeepMind提出的PathNet,它是一种巨型神经网络,可以结合遗传算法技术实现大规模的迁移学习。(课时:43 分钟)

深度学习 通用人工智能 DeepMind 迁移学习 遗传算法

讲师:   文雷

课程背景

通用人工智能(articial general intelligence/AGI)至今看起来仍然是一个遥不可及的技术圣杯。迁移学习则是实现它的重要一环,它可以把在A任务上学习到的本领迁移到B领域中去。但是,如何进行大规模迁移学习仍然是未解决的问题。近日,一直研究成果不断的 DeepMind 又在 arXiv 上发布了一篇也许向这个方向迈进了一步的新论文,该论文提出了一种 PathNet,宣称能够实现某种巨型神经网络(giant neural network),并结合遗传算法技术实现大规模的迁移学习。

这种巨型神经网络允许参数复用,并且不会遗忘太多东西,如果多个用户训练同一个巨型神经网络,那么这对通用人工智能而言将是高效的。PathNet 是在这个方向上迈出的第一步。

那么PathNet巨型神经网络的构架是怎样的?如何对它进行训练?它在监督学习的分类任务中表现如何?它又是怎样应用在增强学习任务中的?你将在本节课程中找到答案。

课程目的

学完本课程,你能做到

  • 了解PathNet是如何试图去逼近通用人工智能的,以及它取得了怎样的成果

  • 熟悉PathNet的模型构架

  • 熟悉它在有监督学习领域的应用

  • 了解PathNet与A3C在强化学习任务下的不同表现

课程详情

在本讲解中,我们从如下方面介绍了PATHNET:

  • 什么是PATHNET?它是如何进行训练的?

  • PATHNET的构架

  • PATHNET在有监督学习领域的应用:

    • 在二分类问题、MINIST、Cifar & SVHN分类应用的效果表现

  • PATHNET与A3C构架结合在增强学习任务下的表现:

    • ATARI & LABYRINTH 游戏效果演示

    • 结果分析对比