谷歌大脑新研究论文,「论表征学习的互信息最大化」
近日,谷歌大脑研究团队的一篇名为「论表征学习的互信息最大化」的论文引发社群关注,以下是论文概述:最近,许多用于无监督或自监督表示学习的方法是通过最大化数据的不同视图之间的互信息(MI)的估计来训练特征提取器。这同时也带来了几个直接相关的问题:例如,MI 是众所周知难以估计的,并且将其用作表示学习的目标可能会导致高度纠缠的表示,因为它任意可逆变换下的不变性。不过,这些方法已被反复证明在实践中表现出色。在本文中,我们争论并提供经验证据,这些方法的成功可能只是松散地归因于 MI 的特性,并且它们强烈依赖于归纳在特征提取器体系结构的选择和所采用的 MI 估计器的参数化方面的偏差。最后,我们建立了与深度量度学习的联系,并认为这种解释或许能合理地解释近其推出的方法的成功。