在线系统中的信息挖掘与过滤

本课程主要介绍绍科学家们是如何开发出聪明的算法来进行社交媒体上的信息挖掘与过滤的。(课时:50 分钟)

复杂性科学 信息挖掘 推荐算法

讲师:   曾安

课程资料

课程背景

每一秒钟,整个互联网上就有 60 万条信息在 Facebook 上分享,2 亿个 Email、10 万条 推文被发送,571 个新网站被建立,1.9E(1018)字节数据被交换[1]。我们已经进入大数据时代,但同时,我们也已经被淹没在了信息的汪洋之中。

面对信息的洪流,我们急需一种方法或工具来过滤信息,这就是推荐算法所能完成的任务。在本课程中,曾安老师将给大家介绍科学家们是如何开发出聪明的算法来进行社交媒体上的信息挖掘的。

课程目的

学完本课程,你能做到

  • 了解什么是推荐算法,它是基于什么原理实现的

  • 了解有关质量挖掘算法的相关问题

  • 了解经典的复杂系统模型——国家出口品网络

课程详情

本课程的主要内容有:

  • 推荐算法

    • 推荐算法介绍

    • 协同过滤算法(collaborative filtering)

    • 基于网络扩散的推荐算法

    • 评价指标

    • 物质扩散和热传导算法的耦合

    • 耦合优势

  • 质量挖掘算法

    • 问题背景

    • User reputation and object quality

    • Performance on modeled networks

    • Resource redistribution

    • Penalty factors

  • 国家出口品网络的推广

    • 国家-出口品网络