2017/05/05 15:07

杨强教授漫谈《西部世界》、生成式对抗网络及迁移学习

演讲时间：5 月 28 日，9:40-10:10 AM
演讲主题：迁移学习研究

本篇文章转自第四范式公众号，内容根据杨强教授的演讲编写。杨强教授为第四范式首席科学家，华人界首个国际人工智能协会AAAI Fellow、唯一的AAAI 华人执委。在今年 5 月份机器之心 GMIS 2017 大会上，杨强教授将就迁移学习这一主题分享更多精彩的内容。

以下内容根据杨强教授演讲编写，略微有所删减。

有些人看过电视剧《西部世界》—在《西部世界》里，你可能问的一个关键问题是什么？就是当剧中的人们，其中任何一个人走到你面前，你能否区分出他／她是个真人？你会问：咦，这不是图灵测试要解决的问题吗？是的。问题是，如果《西部世界》里的这些机器人已经通过了图灵测试，你又如何区分他／她们呢？

要解决这个问题，除了用“一枪把对方打死，然后看对方是否真的死了”这个极端的检测方法以外，还有什么更好的方法呢？这里有些剧透，答案是：拍苍蝇。当一个苍蝇飞到一个“人”的脸上，如果这个人没有感觉，不会去拨开或拍打苍蝇，他／她很可能就是机器人。结果因此还引发了一件趣事，去年美国大选的时候，希拉里在讲台上面，一个苍蝇飞到她脸上，她没有搭理，后来有人就说：糟了，我们要选一个机器人当总统了！那时《西部世界》恰好正在热播。

言归正传，从人工智能的角度，“拍苍蝇”这个例子，说明什么呢？它告诉我们有一些关键特征可供识别真人亦或机器人，但要找到这些关键特征并不容易。对《西部世界》而言，你得把整个剧看完才能知道。也就是说，你不但要有大量数据的训练，而且得知道剧里的机器人的制造原理，这样才能找到这个重要特征。那么问题来了：如果作为“游客”，我们对这个机器人的构造知道甚少怎么办？

要回答这一点，我首先要给大家讲一下概率模型的不同类型。概率模型是贯穿整个机器学习的主线。下面PPT上的这两张图是对一个女孩的素描，我们在素描里面可以看到很多的特征，比方说比较飘逸的笔画、或者是适合女性颜色等。我们把上面的问题简化一下：如何能够通过辨别这些体征、从而认出来画上的是男是女？

这里我要介绍一个“生成”模型的概念。在某个关于“人”的样本集里面找到某一个高概率的样本，我们认为这个样本很可能对应我们对“人” 这个概念的认识。然后我们根据这个样本来做完形填空或着彩。在小学中学我们经常做的一种题就是填空。其实，生成样本的过程和填空很相似：当我们看到这张画要给它着色时要选择颜色和图案，是因为这些选择符合“人”的概率分布。

再具体一些：如果数据是（X，Y），这里我们用X这个变量来代表笔画和颜色，Y这个变量来区分男女，那么这个概率数据是遵循一定分布规律的。但问题是，如何才能得到这个数据的分布？在现实中，做到这一点是非常难的，因为这需要我们获得概率的“联合分布”，就是所有显式和隐式的特征和它们所有可能取值的概率。知道了这个概率，生成某个样本就很容易了。在机器学习的历史上，关于要不要首先获得“联合分布”这个问题，有着很多的争论。比方说，有贝叶斯流派，就说：“是的，我们需要这样一个联合分布”。而深度学习流派，或者是SVM等算法对应的这些流派，就说：既然我们的目的是分类，那用简单的算法就可以了，所以”不需要”。得到一个联合概率分布是非常非常难的事情，因为需要因果关系的知识，还需要很多先验概率。

专业用户独享

本文为机器之心深度精选内容，专业认证后即可阅读全文

开启专业认证

登录后开启专业认证去登录

入门深度学习第四范式理论GAN迁移学习杨强生成对抗网络