自然语言理解在金融领域中的应用

如今,人工智能已经在各个子领域中取得了突飞猛进的发展。现在的AI可以听、说、读、写,但是在自然语言的理解,特别是中文方面仍然存在着很大的不足。然而金融业的快速发展迫切需要自然中文理解方面的突破。资本正在催化着有关知识图谱、词向量、意图模型等领域的发展。本课程将全面介绍这些技术如何应用在金融领域中。

讲师:   尹相志

人工智能时代,机器智能的突飞猛进使得人们以为AI可以解决任何难题。然而,自然语言理解,特别是对中文的理解却使得人工智能无法高歌猛进,似乎中文理解成为了人类仅剩的智力堡垒之一。但从另一方面讲,资本的催化会加速一个科技领域的发展。金融业迫切地需要中文的自然语言处理,甚至是自然语言理解上面的突破。那么,目前的深度学习+自然语言处理究竟能够怎样帮助到金融业呢?请让我们聆听华院数据首席科学家尹相志的解读。课程内容包括:


  • 人工智能发展大背景

  • 中文的理解为何是一个困难的问题

  • 实体-关系与知识图谱在金融业的应用

  • 意图模型在金融业的应用

  • 词向量技术在金融业的应用

  • Brain of things大赛


进一步学习的相关课程:

1、有关知识图谱(实体关系提取与表示)技术,推荐课程:

gdelt-global-knowledge-graph.png

张江:知识图谱与表示学习


2、有关词向量(Word2Vec)技术,推荐课程:

11ecfaaed3014775afd57111615e8475.png

李嫣然:Word2Vec: 词向量技术的基础与模型 - 深度学习与自然语言处理1


g3.png

谷伟伟:浅谈Word2Vec:自然语言处理的基石




“自然语言理解在金融领域的应用”笔记


  • 作者:Jake


一、中文理解与金融业

如今的人工智能已经在各个子领域中取得了突飞猛进的发展。现在的AI可以听、说、读、写,但是在自然语言的理解方面仍然存在着很大的不足。

 blob.png

 

 

特别是,对于中文的处理恐怕是人类智力仅剩的堡垒之一。处理中文尤其困难是因为:(1)中文是世界上少数的几个需要分词的语言;(2)中文的字符(汉子)数量超多(20928);(3)能够依赖上下文产生相反的语义;(4)无需约定俗成就可以创造出新的文字。

 

比如,你们知道用中文表达”快递很快“有多少种表达方式吗?答案是3600多种讲法。

 

 blob.png

 

金融业是比较保守的行业,除非你的技术真的能解决它的痛点问题,否则它将不会采纳新的技术。那么金融的痛点问题都有哪些呢?

 

现在的金融从业人员正在阅读大量的合同、文本、网页等信息,从中提炼出重要的关键信息。而这些文本大多非常冗长难读,令人非常伤脑筋,而且还可能犯错误。下面,就让我们来看看这张图:

 blob.png

 

这样一段长长的冗余文字实际上就想表达这样的实体关系(其中括号中的是关系):

华夏幸福基业股份有限公司-->(父子公司)-->廊坊京御房地产开发有限公司

廊坊京御房地产开发有限公司-->(父子公司)-->廊坊市圣斌房地产开发有限公司

华能贵诚-->(向...增资)-->廊坊圣斌

华夏幸福-->(向...提供担保)-->京御地产

华夏幸福-->(向...提供担保)-->廊坊圣斌

 

实际上,实体-关系识别是金融行业中的最典型应用,如如下问题:法金授信、二级市场分析、个资掩码、授信照会、投资研究。

 

进一步阅读,请观看课程……

讲师介绍
尹相志

台湾大学新闻研究所硕士

中国首届人工智能大赛发起人与题目设计 (www.botchina.org); 曾任华院数据(上海)首席数据科学家,数据抉策(台湾)技术长; 台湾微软特约讲师与2006~2017年最有价值专家(MVP); 微软Tech ED 2002, 2004~2015讲师

专长:

自然语言理解、人工智能算法开发、数据挖掘、商业智慧、分析型CRM、风险管理、数据仓库