2018/09/12 16:34

腾讯AI Lab提出正交深度特征分解算法，跨年龄人脸识别任务屡创新记录

ECCV 2018（European Conference on Computer Vision，计算机视觉欧洲大会）与CVPR、ICCV共称为计算机视觉领域三大顶级学术会议，从今天到14日正在德国慕尼黑举办。

腾讯AI Lab 是第二次参加，入选了19篇文章，位居国内企业前列。会议期间，我们选取4篇入选论文做深度解读，主题依次为图像到图像转换方法SCAN、视频再定位、单帧RGB生成三维网络模型和跨年龄人脸识别算法。

在这篇由腾讯 AI Lab 独立完成的论文中，作者提出了一种正交深度特征分解算法OE-CNNs，能显著提高跨年龄人脸识别精度，以下为论文详细解读。

该研究的目的是通过研发新的深度学习模型以提高跨年龄人脸识别的精度。本文提出了一种正交深度特征分解算法OE-CNNs，通过把深度特征正交分解为年龄分量和身份分量，从而将年龄分量和身份分量有效分离开，从而达到减少年龄差异、提高跨年龄人脸识别精度的目标。本文在多个跨年龄人脸识别的国际评测基准（FG-NET, Morph Album 2, CACD-VS）中都取得了国际领先的性能，显著提高了跨年龄人脸识别的精度。此外，研究者还建立了一个新的跨年龄人脸数据库CAF以帮助促进跨年龄人脸识别研究。

跨年龄人脸识别是人脸识别领域中的一个极具挑战性的国际性难题。众所周知，同一个人的不同年龄阶段的图片会有非常大的差异，这些差异会严重影响到跨年龄人脸识别的精度。迄今为止，深度学习已经被广泛运用到人脸识别，并且取得了非常好的性能。但是，对于跨年龄人脸识别，问题，由于同一个人在不同年龄阶段下的多张人脸之间存在着非常显著的差异，这严重影响到现有的深度人脸识别模型的性能。为了克服这个巨大的年龄差异，本文研发了一种新的深度学习算法，该算法把深度特征按照模长方向和角度方向（这两个方向是彼此正交的）分别分解为年龄成分和身份成分，如下图所示。

其中，年龄成分被分解成一维径向分量，而身份成分则分解为高维角度分量。这两种分量最后通过多任务学习的方式同时训练，最终的损失函数是二者损失的算术叠加：

其中身份成分的损失函数

而年龄成分的损失函数

基于这种新的分解模型研究人员可以把人脸的年龄分量和身份分量有效分离开，并基于身份分量来做跨年龄人脸识别从而有效提高跨年龄人脸识别的精度。

为了进一步提高跨年龄人脸识别性能，本文还采集了一个面向跨年龄人脸识别的的新型人脸数据库CAF。研究人员通过在网上搜集名人在不同年龄段拍的照片，以保证这些训练图片有足够大的年龄差异。本文的搜集的人名来源于公共的信息库，比如IMDB, Forbes Celebrity, Wikipedia等。本文使用CAF数据库有4,668个不同的人和这些人的313,000张图片。这个数据库的样例和统计分布如下图所示。

实验结果

在上表的FG-NET跨年龄人脸识别任务中，AI Lab的新算法OE-CNNs取得了高达53.26%的第一识别率，比第二名的38.21%足足高了超过15%的识别率。

在上表的Morph Album 2识别任务中，AI Lab的算法也稳定地高于其它所有的人脸算法。

在上表的对比实验中，能明显看出增加了AI Lab新建立的CAF人脸数据做训练后，对于上表中的所有人脸算法，它们的识别率都能显著获得提升，这证明了CAF对于跨年龄人脸识别研究的帮助和价值。

腾讯AI实验室

理论ECCV 2018人脸识别

相关数据

深度学习技术

深度学习（deep learning）是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习是机器学习中一种基于对数据进行表征学习的算法，至今已有数种深度学习框架，如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

来源：LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.

基准技术

一种简单的模型或启发法，用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

来源：Google ML Glossary

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术，包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等；而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。人脸识别是一项热门的计算机技术研究领域，它属于生物特征识别技术，是对生物体（一般特指人）本身的生物特征来区分生物体个体。

来源：维基百科

损失函数技术

在数学优化，统计学，计量经济学，决策理论，机器学习和计算神经科学等领域，损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

来源：Wikipedia

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

特征分解技术

线性代数中，特征分解（Eigendecomposition），又称谱分解（Spectral decomposition）是将矩阵分解为由其特征值和特征向量表示的矩阵之积的方法。需要注意只有对可对角化矩阵才可以施以特征分解。

来源：维基百科

多任务学习技术