在本文中,微软亚洲研究院的研究员和实习生们提出了一个简单且高效的无监督预训练方法——参数化实例分类(PIC)。和目前最常用的非参数化对比学习方法不同,PIC 采用了类似于有监督图片分类的框架,将每个实例或图片看作一个独立的类别进行实例分类从而进行无监督学习。与 SimCLR 或 MoCo 这类方法相比,PIC 不需要处理潜在的信息泄漏问题,因此结构简单直观。研究者在实验中证明了 PIC 可以在 ImageNet 数据集中取得与这些非参数化对比学习方法相匹配的性能。
Data Scheduler:用来从数据集中采样需要传入网络中的图片;
Data augmentation module:用来对采样出来的图片进行随机数据增强,使网络学到更具区分度的特征;
Backbone network:用来对每个增强后的图像进行特征提取,同时这一部分网络也会在下游任务中使用;
Small projection head:用来将高维的特征投影到低维空间,并且在投影后的特征上施加实例分类的损失函数;
Instance classification loss:整个网络中唯一的损失函数,用于驱动整个网络训练。