有效稳定对抗模型训练过程,伯克利提出变分判别器瓶颈
近期,加州大学伯克利分校的研究者发表论文《VARIATIONAL DISCRIMINATOR BOTTLENECK: IMPROVING IMITATION LEARNING, INVERSE RL, AND GANS BY CONSTRAINING INFORMATION FLOW 》,提出一种新型简单而通用的方法变分判别器瓶颈(VDB),利用信息瓶颈约束判别器内信息流,通过对观测结果和判别器内部表征之间的互信息进行约束来稳定对抗性模型的训练过程。据悉,该论文已被 ICLR 2019 接收,获得了6、10、8的评分。