DeepMind 新研究:具有对比性预测编码的数据有效图像识别
来自 DeepMind 的研究团队近日发布了一篇名为「具有对比性预测编码的数据有效图像识别」的研究。以下是该研究的完整摘要分享:人类的观察者可以通过几个示例来学习识别图像的新类别,但是如何通过机器感知来识别仍然是一个开放的挑战。研究人员假设通过表示使数据有效识别成为可能,这些表示使自然信号的可变性更加可预测。因此,该团队重新研究和改进了「对比预测编码」,这是学习此类表示的无监督目标。这种新的实现产生的功能支持 ImageNet 数据集上最新的线性分类精度。这种新的实现产生的功能支持 ImageNet 数据集上最新的线性分类精度。当用作深度神经网络的非线性分类的输入时,与直接在图像像素上训练的分类器相比,这种表示形式使我们可以使用少 2–5 倍的标签。最终,这种无监督的表示方法大大改善了 PASCAL VOC-2007 上从转移到目标检测的学习,超过了完全受监督的预训练 ImageNet 分类器。