人脸比对(1:N)_1:n人脸检索 学术-程序员宅基地

技术标签: 人脸1:N  学习笔记  项目笔记  

1 前言

设计出人脸1:N,随着N的增大准确率降低最小的解决方案具有很强的现实意义。人脸1:N的框架大致分为:人脸检测、人脸对齐、人脸映射与人脸识别LOSS的设计,结构如下图所示:

图1:人脸1:N的主要框架

人脸1:N在学术界有着广泛的研究,对于人脸检测与人脸对齐(MTCNN、TCDCN等)在业界已经有较好的效果,目前的主要性能提升有:DeepFace、DeepID,框架为CNN + Softmax,网络在第一个FC层形成判别力很强的人脸特征,用于人脸识别。对于人脸识别的特征映射来说,并不满足人脸对比的需求;DeepID2, DeepID2+, DeepID3都采用Softmax + Contrastive Loss,使得同类特征的L2距离尽可能小,不同类特征的L2距离大于某个间隔;FaceNet是目前引用量最高的人脸对比方法,提出了Triple Loss,以三元组形式进行优化,获得类内紧凑和类间差异;SphereFace是L-Softmax的改进,归一化了权值W,让训练更加集中在优化深度特征映射和特征向量角度上,降低样本数量不均衡问题。Center Loss为每个类别学习一个中心,并将每个类别的所有特征向量拉向对应类别中心,联合Softmax一起使用;COCO loss,归一化了权值c,归一化了特征f,并乘尺度因子,在LFW上达到99.86%;在损失函数上设计还包括:L2-Softmax、Additive Margin Loss、CosFace、ArcFace等。

本文在FaceNet的框架基础上,对于MTCNN进行改进实现了更精确的人脸对齐结果。同时,对训练样本进行增强,使用人脸随机旋转、随机裁剪、人脸色相、饱和度的变换等扩充样本,进一步降低训练误差。将Triple Loss改为最新的COCO loss,结构风险最小化的正则化因子设为:10^-3,梯度下降采用RMSPROP,mini-batch设置为100,实验环境为:GT1080TI,训练时间:48-55h,在华为训练集上人脸1:N的准确率为:99.92%-99.97%之间。

2章 功能及原理

2.1人脸对齐

对人脸检测与切割并进行对齐与规范化。通过Landmark得到人脸的特征点,通过与正脸比较,学习到单应性矩阵,通过单应性矩阵对人脸图像进行旋转,旋转效果明显优于MTCNN的对齐。

  

 

图2:人脸特征点定位结果

 

图3:(a)原始图像 (b) MTCNN对齐结果 (c) 本文对齐结果

2.1.1 人脸特征点定位

       人脸特征点可以被用来将人脸对齐到平均人脸,这样在对齐之后所有图像中的人脸特征点的位置几乎是相同的。直观上来看,用对齐后的图像训练的人脸识别算法更加有效,这个观点已经被很多论文验证。

本文采用是最新的TCDCN模型,该模型思想:通过一些多样的精细的任务,来优化提升特征点定位精度。就是在人脸特征点检测的时候,同时进行多个任务的学习,这些任务包括:性别,是否带眼镜,是否微笑和脸部的姿势。使用这些辅助的属性帮助更好的定位特征点,根据论文结果,这样的确对人脸特征点检测有一定的帮助。该模型优势:1)优于现有的方法,特别是在处理一些遮挡和大姿态的面部图像时。2)与现有的state-of-the-art的级联深度模型方法相比,其动态的降低了模型的复杂度。

图4:TCDCN的结构

损失函数就是不同任务的损失函数直接相加。而在人脸特征点检测的任务中,不同的任务具有不同的loss,特征点检测是平方和误差,而其它分类任务是交叉熵损失,因此最后的loss就是:

(1)

2.1.2 单应性矩阵

平面的单应性即为一个平面到另一个平面的投影映射。若点Q到成像仪上的点q的映射使用齐次坐标,则单应性(如图13所示)可以表示为:

                                                                                      (2)

其中和s是任意尺度的比例。H是由用于定位观察的物体平面的物理变换和使用摄像机内参数矩阵的投影两部分组成的。

 

图 5: 平面单应性的示意图

物理变换部分是与观测到的图像平面相关的部分旋转R和部分平移t的影响之和,可以表示为:

                                                                                  (3)

M为摄像机内参数矩阵,即:

                                                                    (4)

则单应性可以重写为

                                                                                  (5)

又因为单应性是研究一个平面到另一个平面的映射。因此,我们可以令z=0,即物体平面上的点用x, y表示,则可以简化为平面坐标中的,即可以推导为:

                                                                             (6)

其中,,所以最终的单应性矩阵可以表示为:

                                                                                      (7)

 

所以,可以通过一张规范化之后的人脸并将其特征点存储起来,之后计算人脸特征点与标准人脸的人脸特征点的单应性矩阵,通过变换关系即可将人脸规范到统一的标准。通常只需要4对点即可对矩阵估计,为了更加准确估计图像的变换关系,将所有人脸的特征点加入计算可以列出68组方程,方程组个数大于带求解的系数,用过RANSAC算法来求解这个超正定方程,每次计算4个点,选取内点个数最多的作为最终的结果。

                (8)

实现效果如下所示:

 

图 6:单应性矩阵估计(a) 标准人脸及特征点 (b)-(d):通过变换得到标准人脸

2.2 Embedding

按照FaceNet的思路,选取不同的卷积神经框架作为的前级输入,对特征进行L2规范化后,进行特征映射,将特征映射成128维的向量。

图 7:FaceNet的框架图

ResNet有效的解决了深度卷积神经网络难训练的问题。这是因为在误差反传的过程中,梯度通常变得越来越小,从而权重的更新量也变小。这个导致远离损失函数的层训练缓慢,随着层数的增加这个现象更加明显。通过对比效果,最终选择图8(d)的结构作为深度结构,并在利用在CASIA上的训练结果作为预训练模型。

图8:不同的卷积神经网络框架图

 

2.3相似度计算(LOSS选择)

通过相似度计算函数得到人脸之间的距离,通过交叉验证方法设置最佳阈值将人脸和非人脸分开。“COCO Loss”,其目的同样是:

  • 拉近同类样本的特征(类内方差小)
  • 拉远不同分类样本的特征(类间方差大)
    公式为:
              (9)
    我们会发现该Loss的优化目标是分子越大越好(类内Cos相似度高),分母越小越好(类间Cos相似度低)。通过可视化不同损失函数,对比不同相似度计算之间的聚类性,不难看出,COCO Loss 的聚类性明显更好,最终选择COCO Loss 作为最终的损失。

    图9:不同的Loss之间的对比

 

2.4梯度下降方法

由于调整学习率时分母上的变量s一直在累加按元素平方的小批量随机梯度,目标函数自变量每个元素的学习率在迭代过程中一直在降低(或不变)。所以,当学习率在迭代早期降得较快且当前解依然不佳时,Adagrad在迭代后期由于学习率过小,可能较难找到一个有用的解。为了应对这一问题,RMSProp算法对Adagrad做了一点小小的修改。RMSProp算法使用了小批量随机梯度按元素平方的指数加权移动平均变量s,并将其中每个元素初始化为0。给定超参数γ且0≤γ<1, 在每次迭代中,RMSProp首先计算小批量随机梯度g,然后对该梯度按元素平方项g^2做指数加权移动平均。

3章 特色综述

  1. 对样本增广、对模型参数进行设置,较高的识别稳定性。
  2. 对Loss进行选择,在FaceNet基础上增加识别率。
  3. 较好的人脸对齐和预处理效果,环境适应性强。
     

4章 开发工具及技术

编译环境:Python 3.5 (anaconda3)、Tensorflow 1.2、Scikit-learn、opencv-python、h5py、Matplotlib、Pillow、requests、psutil。

硬件环境:I7-7700K,1080TI,64G内存。

技术:人脸对齐、单应性矩阵估计、Facenet、COCO Loss、梯度下降方法、深度学习(卷积神经网络设计)。

下一篇:人脸识别之数据、网络结构、损失函数

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/intflojx/article/details/81278330

智能推荐

C#连接OPC C#上位机链接PLC程序源码 1.该程序是通讯方式是CSharp通过OPC方式连接PLC_c#opc通信-程序员宅基地

文章浏览阅读565次。本文主要介绍如何使用C#通过OPC方式连接PLC,并提供了相应的程序和学习资料,以便读者学习和使用。OPC服务器是一种软件,可以将PLC的数据转换为标准的OPC格式,允许其他软件通过标准接口读取或控制PLC的数据。此外,本文还提供了一些学习资料,包括OPC和PLC的基础知识,C#编程语言的教程和实例代码。这些资料可以帮助读者更好地理解和应用本文介绍的程序。1.该程序是通讯方式是CSharp通过OPC方式连接PLC,用这种方式连PLC不用考虑什么种类PLC,只要OPC服务器里有的PLC都可以连。_c#opc通信

Hyper-V内的虚拟机复制粘贴_win10 hyper-v ubuntu18.04 文件拷贝-程序员宅基地

文章浏览阅读1.6w次,点赞3次,收藏10次。实践环境物理机:Windows10教育版,操作系统版本 17763.914虚拟机:Ubuntu18.04.3桌面版在Hyper-V中的刚安装好Ubuntu虚拟机之后,会发现鼠标滑动很不顺畅,也不能向虚拟机中拖拽文件或者复制内容。在VMware中,可以通过安装VMware tools来使物理机和虚拟机之间达到更好的交互。在Hyper-V中,也有这样的工具。这款工具可以完成更好的鼠标交互,我的..._win10 hyper-v ubuntu18.04 文件拷贝

java静态变量初始化多线程,持续更新中_类初始化一个静态属性 为线程池-程序员宅基地

文章浏览阅读156次。前言互联网时代,瞬息万变。一个小小的走错,就有可能落后于别人。我们没办法去预测任何行业、任何职业未来十年会怎么样,因为未来谁都不能确定。只能说只要有互联网存在,程序员依然是个高薪热门行业。只要跟随着时代的脚步,学习新的知识。程序员是不可能会消失的,或者说不可能会没钱赚的。我们经常可以听到很多人说,程序员是一个吃青春饭的行当。因为大多数人认为这是一个需要高强度脑力劳动的工种,而30岁、40岁,甚至50岁的程序员身体机能逐渐弱化,家庭琐事缠身,已经不能再进行这样高强度的工作了。那么,这样的说法是对的么?_类初始化一个静态属性 为线程池

idea 配置maven,其实不用单独下载Maven的。以及设置新项目配置,省略每次创建新项目都要配置一次Maven_安装idea后是不是不需要安装maven了?-程序员宅基地

文章浏览阅读1w次,点赞13次,收藏43次。说来也是惭愧,一直以来,在装环境的时候都会从官网下载Maven。然后再在idea里配置Maven。以为从官网下载的Maven是必须的步骤,直到今天才得知,idea有捆绑的 Maven 我们只需要搞一个配置文件就行了无需再官网下载Maven包以后再在新电脑装环境的时候,只需要下载idea ,网上找一个Maven的配置文件 放到 默认的 包下面就可以了!也省得每次创建项目都要重新配一次Maven了。如果不想每次新建项目都要重新配置Maven,一种方法就是使用默认的配置,另一种方法就是配置 .._安装idea后是不是不需要安装maven了?

奶爸奶妈必看给宝宝摄影大全-程序员宅基地

文章浏览阅读45次。家是我们一生中最重要的地方,小时候,我们在这里哭、在这里笑、在这里学习走路,在这里有我们最真实的时光,用相机把它记下吧。  很多家庭在拍摄孩子时有一个看法,认为儿童摄影团购必须是在风景秀丽的户外,即便是室内那也是像大酒店一样...

构建Docker镜像指南,含实战案例_rocker/r-base镜像-程序员宅基地

文章浏览阅读429次。Dockerfile介绍Dockerfile是构建镜像的指令文件,由一组指令组成,文件中每条指令对应linux中一条命令,在执行构建Docker镜像时,将读取Dockerfile中的指令,根据指令来操作生成指定Docker镜像。Dockerfile结构:主要由基础镜像信息、维护者信息、镜像操作指令、容器启动时执行指令。每行支持一条指令,每条指令可以携带多个参数。注释可以使用#开头。指令说明FROM 镜像 : 指定新的镜像所基于的镜像MAINTAINER 名字 : 说明新镜像的维护(制作)人,留下_rocker/r-base镜像

随便推点

毕设基于微信小程序的小区管理系统的设计ssm毕业设计_ssm基于微信小程序的公寓生活管理系统-程序员宅基地

文章浏览阅读223次。该系统将提供便捷的信息发布、物业报修、社区互动等功能,为小区居民提供更加便利、高效的服务。引言: 随着城市化进程的加速,小区管理成为一个日益重要的任务。因此,设计一个基于微信小程序的小区管理系统成为了一项具有挑战性和重要性的毕设课题。本文将介绍该小区管理系统的设计思路和功能,以期为小区提供更便捷、高效的管理手段。四、总结与展望: 通过本次毕设项目,我们实现了一个基于微信小程序的小区管理系统,为小区居民提供了更加便捷、高效的服务。通过该系统的设计与实现,能够提高小区管理水平,提供更好的居住环境和服务。_ssm基于微信小程序的公寓生活管理系统

如何正确的使用Ubuntu以及安装常用的渗透工具集.-程序员宅基地

文章浏览阅读635次。文章来源i春秋入坑Ubuntu半年多了记得一开始学的时候基本一星期重装三四次=-= 尴尬了 觉得自己差不多可以的时候 就吧Windows10干掉了 c盘装Ubuntu 专心学习. 这里主要来说一下使用Ubuntu的正确姿势Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的开源GNU/Linux操作系统,Ubuntu 是基于DebianGNU/Linux,支..._ubuntu安装攻击工具包

JNI参数传递引用_jni引用byte[]-程序员宅基地

文章浏览阅读335次。需求:C++中将BYTE型数组传递给Java中,考虑到内存释放问题,未采用通过返回值进行数据传递。public class demoClass{public native boolean getData(byte[] tempData);}JNIEXPORT jboolean JNICALL Java_com_core_getData(JNIEnv *env, jobject thisObj, jbyteArray tempData){ //resultsize为s..._jni引用byte[]

三维重建工具——pclpy教程之点云分割_pclpy.pcl.pointcloud.pointxyzi转为numpy-程序员宅基地

文章浏览阅读2.1k次,点赞5次,收藏30次。本教程代码开源:GitHub 欢迎star文章目录一、平面模型分割1. 代码2. 说明3. 运行二、圆柱模型分割1. 代码2. 说明3. 运行三、欧几里得聚类提取1. 代码2. 说明3. 运行四、区域生长分割1. 代码2. 说明3. 运行五、基于最小切割的分割1. 代码2. 说明3. 运行六、使用 ProgressiveMorphologicalFilter 分割地面1. 代码2. 说明3. 运行一、平面模型分割在本教程中,我们将学习如何对一组点进行简单的平面分割,即找到支持平面模型的点云中的所有._pclpy.pcl.pointcloud.pointxyzi转为numpy

以NFS启动方式构建arm-linux仿真运行环境-程序员宅基地

文章浏览阅读141次。一 其实在 skyeye 上移植 arm-linux 并非难事,网上也有不少资料, 只是大都遗漏细节, 以致细微之处卡壳,所以本文力求详实清析, 希望能对大家有点用处。本文旨在将 arm-linux 在 skyeye 上搭建起来,并在 arm-linux 上能成功 mount NFS 为目标, 最终我们能在 arm-linux 里运行我们自己的应用程序. 二 安装 Sky..._nfs启动 arm

攻防世界 Pwn 进阶 第二页_pwn snprintf-程序员宅基地

文章浏览阅读598次,点赞2次,收藏5次。00为了形成一个体系,想将前面学过的一些东西都拉来放在一起总结总结,方便学习,方便记忆。攻防世界 Pwn 新手攻防世界 Pwn 进阶 第一页01 4-ReeHY-main-100超详细的wp1超详细的wp203 format2栈迁移的两种作用之一:栈溢出太小,进行栈迁移从而能够写入更多shellcode,进行更多操作。栈迁移一篇搞定有个陌生的函数。C 库函数 void *memcpy(void *str1, const void *str2, size_t n) 从存储区 str2 _pwn snprintf

推荐文章

热门文章

相关标签