Facebook AI:使用「放射性数据」来检测数据集是否曾用于训练
Facebook AI 本周三宣布其开发了一种新技术来标记数据集中的图像,以便研究人员可以确定是否过往研究已使用这些图像训练了特定的机器学习模型。这可以帮助研究人员和工程师跟踪用于训练模型的数据集,以便他们可以更好地了解各种数据集如何影响不同神经网络的性能。他们将这种新的验证方法称为「放射性」数据,因为它类似于在医学中使用放射性标记物。他们引入了无害且对模型的分类准确性没有影响的独特标记,但是这些标记在学习过程中始终存在,并且在神经网络中具有很高的置信度。