自然语言理解在金融领域中的应用

本课程主要讲述了人工智能技术在自然语言理解领域,尤其是在中文自然语言理解领域遇到的瓶颈,以及尝试使用中文形音义特色来解决这种瓶颈的方法。

讲师:   尹相志


课程资料

课程背景

人工智能时代,机器智能的突飞猛进使得人们以为AI可以解决任何难题。然而,自然语言理解,特别是对中文的理解却使得人工智能无法高歌猛进,似乎中文理解成为了人类仅剩的智力堡垒之一。但从另一方面讲,资本的催化会加速一个科技领域的发展。金融业迫切地需要中文的自然语言处理,甚至是自然语言理解上面的突破。那么,目前的深度学习+自然语言处理究竟能够怎样帮助到金融业呢?请让我们聆听华院数据首席科学家尹相志的解读。

课程目的

学完本课程,你能做到

  • 了解利用深度学习技术处理自然语言的一些方法

  • 了解为什么说中文自然语言理解是一个难题

  • 熟悉在金融业应用的一些自然语言处理方法

  • 了解现在的人工智能大赛是怎样出题“刁难”参会者的

课程详情

在本讲解中,我们从如下方面介绍了Word2Vec技术:

  • 中文的理解为何是一个困难的问题

  • 实体-关系与知识图谱在金融业的应用

  • 意图模型在金融业的应用

  • 词向量技术在金融业的应用

  • Brain of things大赛

相关课程

1、有关知识图谱(实体关系提取与表示)技术,推荐课程:

gdelt-global-knowledge-graph.png

张江:知识图谱与表示学习


2、有关词向量(Word2Vec)技术,推荐课程:

11ecfaaed3014775afd57111615e8475.png

李嫣然:Word2Vec: 词向量技术的基础与模型 - 深度学习与自然语言处理1


g3.png

谷伟伟:浅谈Word2Vec:自然语言处理的基石




“自然语言理解在金融领域的应用”笔记

  • 作者:Jake

一、中文理解与金融业

如今的人工智能已经在各个子领域中取得了突飞猛进的发展。现在的AI可以听、说、读、写,但是在自然语言的理解方面仍然存在着很大的不足。

 blob.png

 

 

特别是,对于中文的处理恐怕是人类智力仅剩的堡垒之一。处理中文尤其困难是因为:(1)中文是世界上少数的几个需要分词的语言;(2)中文的字符(汉子)数量超多(20928);(3)能够依赖上下文产生相反的语义;(4)无需约定俗成就可以创造出新的文字。

 

比如,你们知道用中文表达”快递很快“有多少种表达方式吗?答案是3600多种讲法。

 

 blob.png

 

金融业是比较保守的行业,除非你的技术真的能解决它的痛点问题,否则它将不会采纳新的技术。那么金融的痛点问题都有哪些呢?

 

现在的金融从业人员正在阅读大量的合同、文本、网页等信息,从中提炼出重要的关键信息。而这些文本大多非常冗长难读,令人非常伤脑筋,而且还可能犯错误。下面,就让我们来看看这张图:

 blob.png

 

这样一段长长的冗余文字实际上就想表达这样的实体关系(其中括号中的是关系):

华夏幸福基业股份有限公司-->(父子公司)-->廊坊京御房地产开发有限公司

廊坊京御房地产开发有限公司-->(父子公司)-->廊坊市圣斌房地产开发有限公司

华能贵诚-->(向...增资)-->廊坊圣斌

华夏幸福-->(向...提供担保)-->京御地产

华夏幸福-->(向...提供担保)-->廊坊圣斌

 

实际上,实体-关系识别是金融行业中的最典型应用,如如下问题:法金授信、二级市场分析、个资掩码、授信照会、投资研究。

 

进一步阅读,请观看课程……

讲师介绍
尹相志

微软金牌讲师

中国首届人工智能大赛发起人与题目设计

前华院数据(上海)首席数据科学家,数据决策(台湾)技术长

台湾微软特约讲师与2006~2017年最有价值专家(MVP)

微软Tech ED 2002, 2004~2015讲师

专长:

自然语言理解、人工智能算法开发、数据挖掘、商业智慧、分析型CRM、风险管理、数据仓库