Word2Vec: 词向量技术的基础与模型

本课程介绍自然语言处理中的基本工具:Word2Vec,它的历史渊源、原理、架构以及实现技术。(课时:84 分钟)

自然语言处理 深度学习 word2vec

讲师:   李嫣然

课程背景

Word2Vec是目前基于深度神经网络的自然语言处理方法的基础,它可以为每一个单词计算得到一个向量表示。当进行句法翻译等高级自然语言处理任务的时候,这些向量表示可以作为神经网络的输入信息。

课程目的

学完本课程,你能做到

  • 了解什么是词嵌入,为什么要进行词嵌入,它是为了解决什么问题

  • 熟悉Word2Vec的基本原理

  • 熟悉Skip-Gram算法原理

  • 了解负采样(Negative sampling),以及它出现的目的

课程详情

在本讲解中,我们从如下方面介绍了Word2Vec技术:

  • 词嵌入问题:为什么要研究词嵌入,以及目前词嵌入方法的分类

  • Word2Vec的简单历史与介绍

  • CBOW和Skip-Gram算法简介

  • Skip-Gram的工作原理

  • 什么是负采样(Negative sampling),以及它出现的目的