自然语言生成

本课程主要介绍自然语言生成技术,并对对话生成系统做了一个比较全面详细的综述。(课时:84 分钟)

自然语言处理 深度学习 语言生成 对话生成 RNN

讲师:   李嫣然


课程背景

自然语言生成是研究使计算机具有人一样的表达和写作的功能。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。科学家们对自然语言生成的研究,也有很长的历史了。最早的语言生成模型还是基于模板匹配的,生成的语言一般比较生硬,让人一眼就能识别出来,所以并没有达到真正意义上的自然语言生成。然而最近几年,在深度学习的催生下,自然语言生成技术有了非常大的进展,甚至有两个来自谷歌的对话系统,竟然可以互相对话。那到底是什么促进了自然语言生成技术的发展?自然语言生成内部的机制是什么?认真学习本节课程,你就能明白了。

课程目的

学完本课程,你能做到

  • 了解语言生成的发展历史与最新动态

  • 熟悉语言生成的主流框架

  • 了解在解决语言生成问题时会遇到的问题

  • 了解谷歌的对话系统Allo

课程详情

在本讲解中,我们从如下方面介绍了目前的语言生成技术:

  • 语言生成发展简史

    • 早期的模版匹配、语言模型

    • 生成春联、天气预报、看图说话

    • 故事生成、机器自动对话

  • 语言生成的主流框架

    • 基于编码-解码(Encoder-decoder)框架的端到端(End2end)架构

    • 可变编码-解码(Variational encoder-decoder)方法

    • 可变自编码(Variational autoencoder)方法

  • 语言生成的常见问题:

    • 语义漂移、高频模式、文不对题等,以及相应的解决方案,如混合生成策略

  • 谷歌对话系统Allo架构