知识表征学习:原理及模型综述

这一次我们主要介绍知识表征学习的概念与实现模型综述。其中会涉及实现表征学习的三大类模型:基于神经网络的模型、基于张量的模型、基于翻译的模型。最后,我们还会讲到这些模型的应用。

讲师:   文雷

知识表征学习——原理及实现方法


课程背景:

目前有大量的人类知识,都以离散化的形式保存在数据库里。大量离散的信息条目对人类来说并没有太大的作用,但是如果能给这些条目建立知识图谱,那么就可以利用知识图谱进行知识问答,甚至知识推理。

然而在庞大的知识数据库里,要对所有数据建立图结构可不容易。首先知识条目数量极多,需要巨大的计算量;其次知识条目间存在对应关系不对称的问题,使用常规方法建立知识图难上加难。

这时候就需要使用”知识表示学习“来解决以上问题。

本节课程从知识表示方法开始,为你详细的介绍知识表征学习的三大方法,以及各方法主要采用的模型,并对模型的数学原理进行了详细的解释。如果你对“知识表达学习”和“知识嵌入”感兴趣,那么本节课程你不应错过。

相关课程:

如果你还不了解什么是知识图谱,知识表征学习,那么可以先看张江老师的介绍课程:

image.png

知识图谱与表征学习——张江

课程资料:

课程讲稿:

主讲稿.pdf

刘康老师 knowledge embedding.pdf

参考文献:

参考文献打包.zip


课程大纲:

一、知识表示介绍:

1.知识图

2.知识表示方式

    2.1 图表达方式(00:07:00)

    2.2 符号表达方式

3. 什么是知识表征学习(00:08:00)

二、知识表征学习的三大实现方法

1.基于神经网络的方法实现:

1.1 SE模型(00:10:10)

1.2 协调投影与实体间关系的改进模型:

  • 1.2.1 SLM(Single Layer Model)

  • 1.2.2 SME(Semantic Matching Energy)

  • 1.2.3 LFM(Latent Factor Model)

1.3 语意匹配能量网络(Semantic Matching Energy Network)(00:25:00)

  • 1.3.1 使用SMEN实现国家与地区的向量表示

1.4 张量神经网络(NTN, Neural Tensor Network)(00:29:00)

2. 基于张量的方法实现:

    2.1 张量分解(Tensor Factorization)(00:37:20)

3. 基于翻译(Translation-Based)的方法实现:

3.1 TransE(00:40:10)

3.2 TransE的改进模型:

  • 3.2.1 TransH(00:47:20)

  • 3.2.2 TransR(00:49:25)

  • 3.2.3 TransD(00:53:00)

3.3 优化实体不对称问题的新式模型:(01:00:00)

  • 3.3.1 TransA

  • 3.3.2 TransG

  • 3.3.3 KG2E

三、知识表征学习的应用:

1. 三元组分类(01:06:00)

2. 链路预测


更多课程:

在上面的课程中提到了TransE模型的改进版TransG模型。

我们也对TransG模型进行了深入的探讨,分析了TransG的优势及实现方法。

如果你对TransG感兴趣,请看:

image.png

知识表征学习——TransG模型解析


讲师介绍
文雷

北京师范大学系统科学学院研究生 研究方向:复杂网络及深度学习技术在经济系统中的应用