ECCV 2018(European Conference on Computer Vision,计算机视觉欧洲大会)与CVPR、ICCV共称为计算机视觉领域三大顶级学术会议,从今天到14日正在德国慕尼黑举办。
腾讯AI Lab 是第二次参加,入选了19篇文章,位居国内企业前列。会议期间,我们选取4篇入选论文做深度解读,主题依次为图像到图像转换方法SCAN、视频再定位、单帧RGB生成三维网络模型和跨年龄人脸识别算法。
在这篇由腾讯 AI Lab 独立完成的论文中,作者提出了一种正交深度特征分解算法OE-CNNs,能显著提高跨年龄人脸识别精度,以下为论文详细解读。
该研究的目的是通过研发新的深度学习模型以提高跨年龄人脸识别的精度。本文提出了一种正交深度特征分解算法OE-CNNs,通过把深度特征正交分解为年龄分量和身份分量,从而将年龄分量和身份分量有效分离开,从而达到减少年龄差异、提高跨年龄人脸识别精度的目标。本文在多个跨年龄人脸识别的国际评测基准(FG-NET, Morph Album 2, CACD-VS)中都取得了国际领先的性能,显著提高了跨年龄人脸识别的精度。此外,研究者还建立了一个新的跨年龄人脸数据库CAF以帮助促进跨年龄人脸识别研究。
跨年龄人脸识别是人脸识别领域中的一个极具挑战性的国际性难题。众所周知,同一个人的不同年龄阶段的图片会有非常大的差异,这些差异会严重影响到跨年龄人脸识别的精度。迄今为止,深度学习已经被广泛运用到人脸识别,并且取得了非常好的性能。但是,对于跨年龄人脸识别,问题,由于同一个人在不同年龄阶段下的多张人脸之间存在着非常显著的差异,这严重影响到现有的深度人脸识别模型的性能。为了克服这个巨大的年龄差异,本文研发了一种新的深度学习算法,该算法把深度特征按照模长方向和角度方向(这两个方向是彼此正交的)分别分解为年龄成分和身份成分,如下图所示。
其中,年龄成分被分解成一维径向分量,而身份成分则分解为高维角度分量。这两种分量最后通过多任务学习的方式同时训练,最终的损失函数是二者损失的算术叠加:
其中身份成分的损失函数
而年龄成分的损失函数
基于这种新的分解模型研究人员可以把人脸的年龄分量和身份分量有效分离开,并基于身份分量来做跨年龄人脸识别从而有效提高跨年龄人脸识别的精度。
为了进一步提高跨年龄人脸识别性能,本文还采集了一个面向跨年龄人脸识别的的新型人脸数据库CAF。研究人员通过在网上搜集名人在不同年龄段拍的照片,以保证这些训练图片有足够大的年龄差异。本文的搜集的人名来源于公共的信息库,比如IMDB, Forbes Celebrity, Wikipedia等。本文使用CAF数据库有4,668个不同的人和这些人的313,000张图片。这个数据库的样例和统计分布如下图所示。
实验结果
在上表的FG-NET跨年龄人脸识别任务中,AI Lab的新算法OE-CNNs取得了高达53.26%的第一识别率,比第二名的38.21%足足高了超过15%的识别率。
在上表的Morph Album 2识别任务中,AI Lab的算法也稳定地高于其它所有的人脸算法。
在上表的对比实验中,能明显看出增加了AI Lab新建立的CAF人脸数据做训练后,对于上表中的所有人脸算法,它们的识别率都能显著获得提升,这证明了CAF对于跨年龄人脸识别研究的帮助和价值。