机器也懂感情?

本课程主要为大家讲解如何让机器学会读懂感情,也就是在中文句子中识别出赞美词或者贬义词,从而判断出整个句子的情绪。(课时:120 分钟)

深度学习 PyTorch 情感分析 文本分类 词袋模型 RNN

讲师:   张江

课程资料

  • 讲稿下载:报名后可见

  • 代码及课后练习:报名后可见

附加课程

RNN基本原理:http://campus.swarma.org/gvid=10364 

课程背景

在这节课中,我们将教会机器读懂感情,也就是在中文句子中识别出赞美之词或者贬义之语,从而判断出整个句子的情绪。我们的办法是利用词袋模型(Bag of Words,简称BOW)或者循环神经网络(Recurrent Neural Network,简称RNN),甚至于LSTM(Long Short Term Memory),让机器完成一个文本分类问题。本课程将详述词袋模型和RNN的基本工作原理,以及如何用PyTorch实现它。同时,我们还将展示如何从网站爬取数据,以及如何解剖分析一个神经网络。


课后作业:名称国籍识别器

我们将要求学员完成一个字符级RNN,从而完成一个外文名称分类器,即输入名称的拼写,判断出它的国籍。

课程目的

学完本课程,你能做到

  • 了解文本分类任务的基本内容

  • 掌握RNN、LSTM的基本原理与优缺点

  • 亲手实现一个语言分类器,它可以判断在线商城中商品评价的感情色彩

课程详情

本课程的内容包括:

  • 文本分类任务介绍

  • 词袋模型分类器

    • 京东购物评论页面的抓取

    • 大型语料的生成与预处理

    • 训练、校验与测试数据集的划分

    • 构造词袋向量

    • 利用PyTorch构造神经网络

    • 解剖词袋神经网络

    • 词袋神经网络为何会犯错?

  • RNN

    • 什么是RNN?

    • RNN工作基本原理

    • 手工实现一个RNN

    • RNN的缺点

  • LSTM

    • 什么是LSTM?

    • LSTM的工作原理

    • 如何运用PyTorch实现一个LSTM?