谷歌 NeurIPS 2019 新研究:通过胶囊解码器进行无监督的对象发现
近日,谷歌公布了一篇被 NeurIPS 2019 收录的新研究,「通过胶囊解码器进行无监督的对象发现」。以下是该研究的完整摘要:一个对象可以被看作是相互关联的部分的几何组织。由于固有的几何关系是视点不变的,因此明确使用这些几何关系来识别对象的系统自然应该对视点的变化具有鲁棒性。研究人员提出了一种无监督的胶囊网络版本,其中一个用于查看所有部分的神经编码器能够被用于推断物体胶囊的存在和姿势。研究团队通过向后传播通过一种解码器来训练编码器。该解码器使用姿势预测的混合来预测每个已经发现的零件的姿势。这些部件以通过使用能够推断出部分及其仿射变换的神经编码器以类似的方式直接从图像中被发现。相应的解码器将每个图像像素建模为仿射变换部分做出的预测混合。研究人员在未标记的数据上学习对象及其部分胶囊,然后聚集对象胶囊存在的向量。经过实验,研究团队获得了无监督分类在 SVHN 分类的最先进结果(55%)并在 MNIST 也获得了接近最优异的结果(98.5%)。