Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Guest Blog作者蒋雨畅校对王雨桐翻译

人脸识别的简要介绍(附实例、Python代码)

介绍

你是否意识到,每当你上传照片到Facebook上,平台都会用人脸识别算法来识别图片中的人物?目前还有一些政府在用人脸识别技术来识别和抓捕罪犯。此外,最常见的应用就是通过自己的脸部解锁手机。

计算机视觉的子领域应用得非常广泛,并且全球很多商业活动都已经从中获益。人脸识别模型的使用在接下来的几年内还会继续增长,所以一起来了解如何从零开始构建人脸识别模型吧!

本文首先会介绍人脸识别模型的内部工作原理。随后结合一个简单的案例,我们将通过Python进行案例实践。在本文的最后部分,你将完成你的第一个人脸识别模型!

目录

  • 理解人脸识别的工作原理

  • 案例学习

  • Python应用

  • 理解Python代码

  • 人脸识别算法的应用

理解人脸识别的工作原理

为了理解人脸识别算法工作原理,我们首先来了解一下特征向量的概念。(译者注:此处的特征向量指机器学习的概念,不同于矩阵理论。)

每个机器学习算法都会将数据集作为输入,并从中学习经验。算法会遍历数据并识别数据中的模式。例如,假定我们希望识别指定图片中人物的脸,很多物体是可以看作模式的:

  • 脸部的长度/宽度。

  • 由于图片比例会被调整,长度和高度可能并不可靠。然而,在放缩图片后,比例是保持不变的——脸部长度和宽度的比例不会改变。

  • 脸部肤色。

  • 脸上局部细节的宽度,如嘴,鼻子等。

显而易见,此时存在一个模式——不同的脸有不同的维度,相似的脸有相似的维度。有挑战性的是需要将特定的脸转为数字,因为机器学习算法只能理解数字。表示一张脸的数字(或训练集中的一个元素)可以称为特征向量。一个特征向量包括特定顺序的各种数字。

举一个简单的例子,我们可以将一张脸映射到一个特征向量上。特征向量由不同的特征组成,如:

  • 脸的长度(cm)

  • 脸的宽度(cm)

  • 脸的平均肤色(R,G,B)

  • 唇部宽度(cm)

  • 鼻子长度(cm)

当给定一个图片时,我们可以标注不同的特征并将其转化为如下的特征向量:

如此一来,我们的图片现在被转化为一个向量,可以表示为(23.1,15.8,255,224,189,5.2,4.4)。当然我们还可以从图片中衍生出无数的其他特征(如,头发颜色,胡须,眼镜等)。然而在这个简单的例子中,我们只考虑这五个简单的特征。

现在,一旦我们将每个图片解码为特征向量,问题就变得更简单。明显地,当我们使用同一个人的两张面部图片时,提取的特征向量会非常相似。换言之,两个特征向量的“距离”就变得非常小。

此时机器学习可以帮我们完成两件事:

  • 提取特征向量。由于特征过多,手动列出所有特征是非常困难的。一个机器学习算法可以自动标注很多特征。例如,一个复杂的特征可能是:鼻子长度和前额宽度的比例。手动列出所有的这些衍生特征是非常困难的。

  • 匹配算法:一旦得到特征向量,机器学习算法需要将新图片和语料库中的特征向量进行匹配。

既然我们对人脸识别如何工作有了基本的理解,让我们运用一些广泛使用的Python库来搭建自己的人脸识别算法。

案例学习

首先给定一些人物脸部的图片——可能是一些名人,如Mark Zuckerberg, Warren Buffett, Bill Gates, Shah Rukh Khan等,并把这些人脸看作我们的语料库。现在,我们给定一些其他名人的新图片(“新人物”),并判断这些“新人物”是否在语料库中。

以下是语料库中的图片:

如图所示,我们所列举的名人有Barack Obama, Bill Gates, Jeff Bezos, Mark Zuckerberg, Ray Dalio 和Shah Rukh Khan。

现在,假定“新人物”如下:

注:以上所有图片均来自Google图片。

显而易见,这是Shah Rukh Khan。然而对电脑来说,这个任务很有挑战性。因为对于我们来说,我们可以轻易地将图片的多种特征结合来判断这是哪个人物。然而对电脑而言,学习如何识别人脸是非常不直观的。

有一个神奇但是简单的python库封装了以上提及的内容——可以根据脸部特征生成特征向量并且知道如何区分不同的脸。这个python库叫做face_recognition。它应用了dlib——一个现代C++工具包,其中包含了一些机器学习算法来帮助完成复杂的基于C++的应用。

Python中的face_recognition库可以完成大量的任务:

  • 发现给定图片中所有的脸。

  • 发现并处理图片中的脸部特征。

  • 识别图片中的脸。

  • 实时的人脸识别

接下来,我们将探讨其中的第三种任务——识别图片中的脸。

你可以在github的如下链接中获取face_recognition库的源代码。

附链接:

https://github.com/ageitgey/face_recognition

事实上,这里有一些如何安装face_recognition库的指导。

附链接:

https://github.com/ageitgey/face_recognition#installation-options

在你安装face_recognition之前,还需要安装dlib包。你可以从如下链接中找到安装dlib的指导。

附链接:

https://gist.github.com/ageitgey/629d75c1baac34dfa5ca2a1928a7aeaf 

Python应用

这部分包括使用face_recognition库搭建简单人脸识别系统的代码。这是一个应用操作的部分,我们将在下一部分解读代码来理解更多细节。

# import the libraries

import os

import face_recognition

# make a list of all the available images

images = os.listdir('images')

# load your image

image_to_be_matched = face_recognition.load_image_file('my_image.jpg')

# encoded the loaded image into a feature vector

image_to_be_matched_encoded = face_recognition.face_encodings(

    image_to_be_matched)[0]

# iterate over each image

for image in images:

    # load the image

    current_image = face_recognition.load_image_file("images/" + image)

    # encode the loaded image into a feature vector

    current_image_encoded = face_recognition.face_encodings(current_image)[0]

    # match your image with the image and check if it matches

    result = face_recognition.compare_faces(

        [image_to_be_matched_encoded], current_image_encoded)

    # check if it was a match

    if result[0] == True:

        print "Matched: " + image

    else:

        print "Not matched: " + image

文件结构如下:

facialrecognition:

  • fr.py

  • my_image.jpg

  • images/

  • barack_obama.jpg

  • bill_gates.jpg

  • jeff_bezos.jpg

  • mark_zuckerberg.jpg

  • ray_dalio.jpg

  • shah_rukh_khan.jpg

  • warren_buffett.jpg

我们的根目录,facialrecognition包括:

  • fr.py的形式的人脸识别代码。

  • my_image.jpg – 即将被识别的图片(“新人物”)。

  • images/ – 语料库

如果你按照前文创建文件结构并执行代码,如下是你能得到的结果:

Matched: shah_rukh_khan.jpg

Not matched: warren_buffett.jpg

Not matched: barack_obama.jpg

Not matched: ray_dalio.jpg

Not matched: bill_gates.jpg

Not matched: jeff_bezos.jpg

Not matched: mark_zuckerberg.jpg

显而易见,新名人是Shah Rukh Khan 并且我们的人脸识别系统可以识别!

理解Python代码

现在让我们解读代码来,并理解其工作原理:

# import the libraries

import os

import face_recognition

以上是引入操作。我们将通过已经建好的os库来读入语料库中的所有图片,并且通过face_recognition来完成算法部分。

# make a list of all the available images

images = os.listdir('images')

这个简单的代码将帮助我们识别语料库中所有图片的路径。一旦执行这些代码,我们可以得到:

images = ['shah_rukh_khan.jpg', 'warren_buffett.jpg', 'barack_obama.jpg', 'ray_dalio.jpg', 'bill_gates.jpg', 'jeff_bezos.jpg', 'mark_zuckerberg.jpg']

现在,以下代码将加载新人物的图片:

# load your image

image_to_be_matched = face_recognition.load_image_file('my_image.jpg')

为了保证算法可以解析图片,我们将人物脸部图片转化为特征向量:

# encoded the loaded image into a feature vector

image_to_be_matched_encoded = face_recognition.face_encodings(

    image_to_be_matched)[0]

剩余的代码相对简单:

# iterate over each image

for image in images:

    # load the image

    current_image = face_recognition.load_image_file("images/" + image)

    # encode the loaded image into a feature vector

    current_image_encoded = face_recognition.face_encodings(current_image)[0]

    # match your image with the image and check if it matches

    result = face_recognition.compare_faces(

        [image_to_be_matched_encoded], current_image_encoded)

    # check if it was a match

    if result[0] == True:

        print "Matched: " + image

    else:

        print "Not matched: " + image

此时,我们:

  • 对每个图像进行循环操作。

  • 将图像解析为特征向量。

  • 比较语料库中已经加载的图片和被识别的新人物图片。

  • 如果两者匹配,我们就显示出来。如果不匹配,我们也要显示结果。

如上所示,结果显示这个简单的人脸识别算法进行得很顺利。让我们尝试将my_image替换为另一个图片:


当你再次运行这个算法,将会看到如下结果:

Not matched: shah_rukh_khan.jpg

Not matched: warren_buffett.jpg

Not matched: barack_obama.jpg

Not matched: ray_dalio.jpg

Not matched: bill_gates.jpg

Not matched: jeff_bezos.jpg

Not matched: mark_zuckerberg.jpg

很明显,系统没有将马云识别为以上的任何一个名人。这意味着我们的算法在以下方面都表现得很好:

  • 正确地识别那些在语料库中存储的人。

  • 语料库中不存在的人物进行标注。

人脸识别算法的应用

人脸识别是一个成熟的研究方向,已被广泛地应用在工业界和学术界。例如,一个罪犯在中国被捕可能就得益于人脸识别系统:系统识别了他的脸并发出警报。由此可见,面部识别可以用来减少犯罪。还有许多其他有趣的人脸识别案例:

  • 面部身份验证:Apple在iPhones中引入了Face ID以用于面部身份验证。一些银行也尝试使用面部身份验证来解锁。

  • 用户服务:马来西亚的一些银行安装了新的人脸识别系统,用于识别有价值的银行客户,以便银行为其提供个人服务。进而银行可以通过维持这类用户并提升用户满意度来获取更多收益。

  • 保险行业:很多保险公司正在通过运用人脸识别系统来匹配人的脸和ID提供的照片,使赔付过程变得更简单。

尾记

综上所述,人脸识别是一个有趣的问题并且有很多强大的案例。这些应用可以有效地从各个方面为社会服务。尽管将这些技术商业化可能会带来伦理风险,但我们会把这个问题留到下次讨论。

希望你能从本文中有所收获。

原文标题:

Simple Introduction to Facial Recognition (with Python codes)

原文链接:

https://www.analyticsvidhya.com/blog/2018/08/a-simple-introduction-to-facial-recognition-with-python-codes/

THU数据派
THU数据派

THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。

工程人脸识别计算机视觉Python算法
241
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

映射技术

映射指的是具有某种特殊结构的函数,或泛指类函数思想的范畴论中的态射。 逻辑和图论中也有一些不太常规的用法。其数学定义为:两个非空集合A与B间存在着对应关系f,而且对于A中的每一个元素x,B中总有有唯一的一个元素y与它对应,就这种对应为从A到B的映射,记作f:A→B。其中,y称为元素x在映射f下的象,记作:y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域,记作f(A)。同样的,在机器学习中,映射就是输入与输出之间的对应关系。

语料库技术

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为"body of text"。

北京航空航天大学・飞行器设计与工程(航天)--结构优化・本科(目前研一)
这篇文章太棒了,很清晰。有一点就是 从图像到特征向量,这个过程称为编码,而从特征向量到图像才被称为解码,encode是编码的意思,decode才是解码的意思,翻译时用词应该更准确一些