人脸检测——CascadeCNN_shuzfan的专栏-CSDN博客-免疫在线蚂蚁淘旗下平台-

当前位置：首页 > 新闻动态 >

热卖商品

Cascade/Magnesium hydroxide/1309-42-8

Cascade/Ferric chloride/7705-08-0

Cascade/Butyl acetate/123-86-4

Cascade/Calcium hypochlorite/7778-54-3

新闻详情

人脸检测——CascadeCNN_shuzfan的专栏-CSDN博客

来自 : CSDN技术社区发布时间：2021-03-24

本文介绍的人脸检测方法来源于2015CVPR《A Convolutional Neural Network Cascade for Face Detection》。本篇文章的方法可以说是对经典的Viola jones方法的深度卷积网络实现并没有让人眼前一亮的地方但依然有以下几点可以学习。

1 网络级联

下图是该方法的整个流程示意图可以明显看出是3阶级联 12-net、24-net、48-net 。
$\"这里写图片描述\"$
级联的工作原理和好处

1、最初阶段的网络可以比较简单判别阈值可以设得宽松一点这样就可以在保持较高召回率的同时排除掉大量的非人脸窗口

2、最后阶段网络为了保证足够的性能因此一般设计的比较复杂但由于只需要处理前面剩下的窗口因此可以保证足够的效率

3、级联的思想可以帮助我们去组合利用性能较差的分类器同时又可以获得一定的效率保证。

下图展示了 3阶段平均剩下的窗口数量及对应的召回率
$\"这里写图片描述\"$

2 多尺度特征

下图是3阶网络的具体网络结构

$\"这里写图片描述\"$

由上图可以看出前2阶的网络都非常简单只有第3阶才比较复杂。这不是重点重点是我们要从上图中学习多尺度特征组合。

以第2阶段的24-net为例首先把上一阶段剩下的窗口resize为24*24大小然后送入网络得到全连接层的特征。同时将之前12-net的全连接层特征取出与之拼接在一起。最后对组合后的特征进行softmax分类。

下图展示了使用和不使用多尺度特征的差异
$\"这里写图片描述\"$
由图可见采用多尺度特征可以相同条件下获得相对较高的召回率即提升了网络的分类能力。

3 校正网络-将回归转化为分类问题

大家应该在整体流程示意图中注意到了每一个分类网络的输出都会经过一个对应的校正网络之后才会被送到下一阶段。

该校正网络是为了解决下面的定位不准的问题的
$\"这里写图片描述\"$
在上图中蓝色框是如12-net 分类网络的输出红色框是经过对应的12-calibration-net校正后的输出。

对于矩形框的校正我们只需要3个参数一个是水平平移量xn 一个是垂直平移量yn 还有一个是宽高缩放比例sn。即我们要将矩形框的控制坐标调整为
$\"这里写图片描述\"$

直觉上来看这是要解决一个回归问题需要回归出3个参数。但是连续的回归问题是很难解决的因此文章将此转化为离散的分类问题。文章首先将3个参数分别列出一些值
$\"这里写图片描述\"$
于是我们的目标就是建立一个45类的分类器毕竟神经网络的强项在于分类。

但是这个分类器的准确性仍然不是很稳定。因此文章选择得分比较高的几类做平均最后进行校正即
$\"这里写图片描述\"$

4 级联的训练方法

对于级联问题文章采用了特殊的训练策略。
$\"这里写图片描述\"$
1、按照一般的方法组织正负样本训练第一阶段的12-net和12-calibration-net网络
2、利用上述的1层网络在AFLW数据集上作人脸检测在保证99%的召回率的基础上确定判别阈值T1。
3、将在AFLW上判为人脸的非人脸窗口作为负样本将所有真实人脸作为正样本训练第二阶段的24-net和24-calibration-net网络
4、重复2和3 完成最后阶段的训练

$\"\"$ $\"\"$ $\"\"$ 点赞 2 $\"\"$ $\"\"$ 评论 2

本文链接： http://cascade.immuno-online.com/view-689650.html

发布于： 2021-03-24 阅读（0）

没有了