对抗特征学习一般指的是一种双向生成对抗网络(Generative Adversarial Networks,GANs)。GAN由两个网络组成:用来拟合数据分布的生成网络G,和用来判断输入是否“真实”的判别网络D。 生成器的目标是通过生成尽可能接近实际数据的样本来“欺骗”鉴别器。在对抗特征学习中我们使用一种新颖的无监督特征学习框架,即双向生成对抗网络(Bidirectional Generative Adversarial Networks,BiGAN)。其结构如下图所示:
简而言之,除了来自标准GAN框架的生成器G之外,BiGAN还包括编码器E,其将数据x映射到潜在表示z。 BiGAN鉴别器D不仅在数据空间(x与G(z))中进行区分,而且在数据和潜在空间(元组(x,E(x))与(G(z),z))进行区分。即对于生成器生成的数据而言,其包含生成的数据和用以生成数据的噪声数据;而对于真实数据而言,其包含数据本身和经过生成器逆映射得到的值。
因为BiGAN编码器学习预测给定数据x的特征,并且先前对GAN的工作已经证明这些特征能够捕获数据的语义属性,我们可以训练好的BiGAN编码器可以作为相关语义任务的有用特征表示,和在计算机视觉中完全监督的视觉模型训练好可以准确预测图像标签一样。在这种情况下,潜在表示z可以被认为是x的“标签”,但是不需要监督。
BiGAN是一种强大且高度通用的无监督特征学习方法,不对其应用的数据结构或类型做出任何假设。
[图片及描述来源:Donahue, J.; Krähenbühl, P.; Darrell, T. (2016). Adversarial Feature Learning. arXiv:1605.09782.]
发展历史
2014年,还在蒙特利尔读博士的Ian Goodfellow将GAN引入深度学习领域,因为GAN是一种非监督形式的训练方法,能够避免数据标注的问题,所以很快GAN就在AI领域兴起了浪潮。
2015年,Alireza Makhzani和Brendan Frey等人从一个新的角度对这些进行了研究,提出了对抗自编码器。他们展示了对抗性自动编码器如何用于半监督分类,图像内容,无监督聚类,降维和数据可视化等应用。他们在MNIST,Street View House Numbers和Toronto Face数据集上进行了实验,并显示对抗性自动编码器在生成建模和半监督分类任务中获得了有竞争力地结果。
但许多学者对当无监督学习的目标是包含丰富特征表示的任意数据分布时,GAN能否表现良好提出了质疑——生成器能够将样本映射到其生成的数据,但没办法将数据映射回隐藏空间。BiGAN就是在这种情况下被提出的,Jeff Donahue, Philipp Krähenbühl, Trevor Darrell使用这种双向的对抗生成网络学习将数据映射回隐藏空间,同时能够学习特征表达,可以辅助监督分类任务。
Vincent Dumoulin等人在同一时期也在他们的文章中独立地提出了相同的模型,探索了随机编码器E的情况以及这种模型在半监督环境中学习的能力。
2018年,Alex C. Kot,Haoliang Li等人使用对抗特征学习来解决域泛化的问题:如何通过利用多个看到的源域数据来学习“看不见的”目标域的广义特征表示。具体而言,他们通过强加最大均值差异(MMD)度量来对齐不同域之间的分布,并通过对抗性特征学习将对齐分布与任意先验分布相匹配,从而扩展对抗性自动编码器。以这种方式,由于MMD正则化,学习的特征表示被认为对于所看到的源域是通用的,并且由于引入了先前的分布,因此能够在目标域上很好地推广。
主要事件
年份 | 事件 | 相关论文/Reference |
2014 | Goodfellow, I将GAN引入AI领域 | Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2014). Generative adversarial nets. In Advances in neural information processing systems (pp. 2672-2680). |
2015 | Alireza Makhzani和Brendan Frey等人提出了对抗自编码器 | Makhzani, A. et al. (2015). Adversarial Autoencoders. arXiv:1511.05644. |
2016 | Jeff Donahue, Philipp Krähenbühl, Trevor Darrell使用这种双向的对抗生成网络学习将数据映射回隐藏空间 | Donahue, J.; Krähenbühl, P.; Darrell, T. (2016). Adversarial Feature Learning. arXiv:1605.09782. |
2016 | Vincent Dumoulin等人在同一时期也在他们的文章中独立地提出了相同的模型 | Dumoulin, V.; Belghazi, I.; Poole, B.; Lamb, A.; Arjovsky, M.; Mastropietro, O. and Courville. A. (2016). Adversarially learned inference. arXiv:1606.00704. |
2018 | Alex C. Kot,Haoliang Li等人使用对抗特征学习来解决域泛化的问题 | Li, H. et al. (2018). Domain Generalization with Adversarial Feature Learning. CVPR. |
发展分析
瓶颈
BiGAN所属于的GAN这一大类神经网络普遍较难训练,同时,生成的数据多样性有限。
未来发展方向
根据上文提到的一些问题,目前研究者们主要致力于提高训练的稳定性和保证输出的多样性。另外就是提高这类模型的通用性,使其能够适用于更多种类型的数据。
Contributor: Yuanyuan Li