从语言序列中判断语义

本课程主要介绍使用序列到序列模型找出文本篇章中重点信息的方法,利用这种技术提取大篇幅投研报告中的重点信息,可以将金融从业人员从无聊的读报工作中解放出来。(课时:97 分钟)

讲师:   尹相志

课程资料

  • 讲稿下载:(报名后可见)

  • 课程实做及讨论记录:(报名后可见)

课程背景

对于每天早上到公司首要任务就是要开始读报的金融从业人员来说,又是个得用好几杯咖啡因才能撑过的时光,但为何不使用深度学习协助我们快速从中找重点。Seq2Seq(序列到序列)让想象变成可能。

Seq2Seq模型,最早被提出于2014年,该技术突破了传统固定大小的输入问题,开通了将深度神经网络模型运用于序列型任务的先河,并被证实在机器翻译任务以及问答系统的应用中有着不俗的表现。

现如今Seq2Seq技术已经在机器翻译领域有非常广泛的应用了。但我们今天要讲的重点不在机器翻译,而在于利用Seq2Seq序列模型让机器读懂文本中的“重点”,从而得出金融交易策略的结论。

课程目的

学完本课程,你能做到

  • 了解Encoder-Decoder模型的基本概念

  • 了解注意力机制的基本概念

  • 掌握使用序列模型,标注投研报告重点信息的方法

课程详情

本课程的主要内容有:

  • 序列到序列(Seq2Seq)模型观念

  • 不只教建模,当然还要教标注

  • 注意力(Attention)重新发明了序列到序列

课程实做

  • 投研报告打开的正确方式:掐头去尾找重点

讲师介绍
尹相志

微软金牌讲师

中国首届人工智能大赛发起人与题目设计

前华院数据(上海)首席数据科学家,数据决策(台湾)技术长

台湾微软特约讲师与2006~2017年最有价值专家(MVP)

微软Tech ED 2002, 2004~2015讲师

专长:

自然语言理解、人工智能算法开发、数据挖掘、商业智慧、分析型CRM、风险管理、数据仓库