人脸识别概念概述

人脸识别是在可视媒体(数字图像或视频)中自动定位人脸的处理过程。识别到的脸部会在具有相关大小和方向的位置上被报告。一旦脸部被检测到,就可以搜索到诸如眼睛和鼻子等特征点(landmark)。

以下是讨论 ML Kit 面部识别功能时使用的一些术语:

  • 脸部追踪将人脸识别从图片扩展为视频中追踪。可以追踪出现在视频中的任何时间长度的任何人脸。也就是说,在连续视频帧中检测到的脸部可以被识别为是同一个人。请注意,这不是人脸识别的一种形式; 这个机制只是根据视频序列中人脸的位置和运动进行推理得来。
  • 特征点是脸上的激励点。左眼,右眼和鼻子底部都是特征点的例子。ML Kit 提供了在检测到的脸部上查找特征点的功能。
  • 分类是确定某个面部特征是否存在。例如,可以根据眼睛是否打开或关闭来对脸部进行分类。另一个例子是脸部是否微笑。

面部方向

以下术语描述了脸部相对于相机的角度:

  • 欧拉 X(Euler X):具有正欧拉X角的面朝上。
  • 欧拉 Y(Euler Y):具有正欧拉Y角的脸转向相对于相机的右侧和左侧。
  • 欧拉 Z(Euler Z):具有正欧拉Z角的脸部相对于相机逆时针旋转。

ML Kit 会始终报告检测到的脸部的欧拉 Z 角度。仅当使用面部识别器的“精确(accurate)”模式设置时(与“快速(fast)”模式设置相反,因为采用某些快捷方式可以使检测速度更快),欧拉 Y 角才可用。欧拉 X 角不支持。

特征点

特征点是一张脸的激励点。左眼,右眼和鼻基都是特征点的例子。

ML Kit 并不是首先检测特征点并使用特征点作为识别整个人脸的基础,而是以独立于详细的特征点信息的方式检测整个人脸。因此,特征点检测是默认情况下未启用的可选步骤。

下表总结了和人脸关联的欧拉Y角可以检测到的所有地标:

欧拉Y角 可探测的特征点
<-36° 左眼,左嘴,左耳,鼻基,左脸
-36°到-12° 左嘴,鼻基,下嘴巴,右眼,左眼,左脸颊,左耳尖
-12°到12° 右眼,左眼,鼻基,左脸,右脸,左嘴,右嘴,下嘴巴
12°到36° 右嘴,鼻基,下嘴巴,左眼,右眼,右脸颊,右耳尖
> 36° 右眼,右嘴,右耳,鼻基,右脸

每个识别到的特征点都会包括其在图像中的相关位置。

分类

分类决定了某个面部特征是否存在。ML Kit 目前仅支持两种分类:眼睛睁开与否微笑

分类表示为确定性值,表示面部特征存在的可信度。例如,微笑分类的值为0.7或更大表示一个人可能正在微笑。

这两种分类都依赖于特征点检测。

还要注意,“睁眼”和“微笑”分类仅适用于正面,即具有小欧拉 Y 角的面(最多约+/-18°)。

下一步

在您的iOS或Android应用程序中使用脸部检测: