opencv人脸检测实验论文

基于几何特征的人脸识别方法

基于特征的方法是一种自下而上的人脸检测方法，由于人眼可以将人脸在不此研究人员认为有一个潜在的假设：人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性，如形状、肤色、纹理、边缘信息等。基于特征的方法的目标就是寻找上述这些不变特征，并利用这些特征来定位入脸。这类方法在特定的环境下非常有效且检测速度较高，对人脸姿态、表情、旋转都不敏感。但是由于人脸部件的提取通常都借助于边缘算子，因此，这类方法对图像质量要求较高，对光照和背景等有较高的要求，因为光照、噪音、阴影都极有可能破坏人脸部件的边缘，从而影响算法的有效性。

模板匹配算法首先需要人TN作标准模板(固定模板)或将模板先行参数化(可变模板)，然后在检测人脸时，计算输入图像与模板之间的相关值，这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述，最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。基于可变模板的人脸检测算法比固定模板算法检测效果要好很多，但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。

基于外观形状的方法并不对输入图像进行复杂的预处理，也不需要人工的对人脸特征进行分析或是抽取模板，而是通过使用特定的方法(如主成分分析方法(PCA)、支持向量机(SVM)、神经网络方法(ANN)等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度，非人脸样本集的容量要为人脸样本集的两倍以上)进行学习，再将学习而成的模板或者说分类器用于人脸检测。因此，这也是j种自下而上的方法。这种方法的优点是利用强大的机器学习算法快速稳定地实现了很好的检测结果，并且该方法在复杂背景下，多姿态的人脸图像中也能得到有效的检测结果。但是这种方法通常需要遍历整个图片才能得到检测结果，并且在训练过程中需要大量的人脸与非人脸样本，以及较长的训练时间。近几年来，针对该方法的人脸检测研究相对比较活跃。

基于代数特征的人脸识别方法

在基于代数特征的人脸识别中，每一幅人脸图像被看成是以像素点灰度为元素的矩阵，用反映某些性质的数据特征来表示人脸的特征。设人脸图像 ) , ( y x I 为二维 N M × 灰度图像，同样可以看成是 N M n × = 维列向量，可视为 N M × 维空间中的一个点。但这样的一个空间中，并不是空间中的每一部分都包含有价值的信息，故一般情况下，需要通过某种变换，将如此巨大的空间中的这些点映射到一个维数较低的空间中去。然后利用对图像投影间的某种度量来确定图像间的相似度，最常见的就是各种距离度量。在基于代数特征的人脸识别方法中，主成分分析法（PCA）和Fisher 线性判别分析（LDA）是研究最多的方法。本章简要介绍介绍了PCA。

完整的PCA(PrincipalComponentAnalysis)人脸识别的应用包括四个步骤：人脸图像预处理；读入人脸库，训练形成特征子空间；把训练图像和测试图像投影的上一步骤中得到的子空间上；选择一定的距离函数进行识别。详细描述如下：

读入人脸库

一归一化人脸库后，将库中的每个人选择一定数量的图像构成训练集，设归一化后的图像是n×n，按列相连就构成n2维矢量，可视为n2维空间中的一个点，可以通过K-L变换用一个低维子空间描述这个图像。

计算K．L变换的生成矩阵

训练样本集的总体散布矩阵为产生矩阵，即

或者写成:

式中xi为第i个训练样本的图像向量，|l为训练样本的均值向量，M为训练样本的总数。为了求n2×n2维矩阵∑的特征值和正交归一化的特征向量，要直接计算的话，计算量太大，由此引入奇异值分解定理来解决维数过高的问题。

利用奇异值分解(AVD)定理计算图像的特征值和特征向量

设A是一个秩为r的行n×r维矩阵，则存在两个正交矩阵和对角阵：

其中凡则这两个正交矩阵和对角矩阵满足下式：

其中为矩阵的非零特征值，

把训练图像和测试图像投影到特征空间每一副人脸图像向特征脸子空间投影，得到一组坐标系数，就对应于子空间中的一个点。同样，子空间中的任一点也对应于～副图像。这组系数便可作为人脸识别的依据，也就是这张人脸图像的特征脸特征。也就是说任何一幅人脸图像都可以表示为这组特征脸的线性组合，各个加权系数就是K．L变换的展开系数，可以作为图像的识别特征，表明了该图像在子空间的位置，也就是向量

可用于人脸检测，如果它大于某个阈值，可以认为f是人脸图像，否则就认为不是。这样原来的人脸图象识别问题就转化为依据子空间的训练样本点进行分类的问题。

基于连接机制的人脸识别方法

基于连接机制的识别方法的代表性有神经网络和弹性匹配法。

神经网络(ANN)在人工智能领域近年来是一个研究热门，基于神经网络技术来进行人脸特征提取和特征识别是一个积极的研究方向。神经网络通过大量简单神经元互联来构成复杂系统，在人脸识别中取得了较好的效果，特别是正面人脸图像。常用的神经网络有：BP网络、卷积网络、径向基函数网络、自组织网络以及模糊神经网络等n¨。BP网络的运算量较小耗时也短，它的自适应功能使系统的鲁棒性增强。神经网络用于人脸识别，相比较其他方法，其可以获得识别规则的隐性表达，缺点是训练时间长、运算量大、收敛速度慢且容易陷入局部极小点等。Gutta等人结合RBF与树型分类器的混合分类器模型来进行人脸识别乜螂1。Lin等人采用虚拟样本进行强化和反强化学习，采用模块化的网络结构网络的学习加快，实现了基于概率决策的神经网络方法获得了较理想结果，。此种方法能较好的应用于人脸检测和识别的各步骤中。弹性匹配法采用属性拓扑图代表人脸，拓扑图的每个顶点包含一个特征向量，以此来记录人脸在该顶点位置周围的特征信息¨引。拓扑图的顶点是采用小波变换特征，对光线、角度和尺寸都具有一定的适应性，且能适应表情和视角的变化，其在理论上改进了特征脸算法的一些缺点。

基于三维数据的人脸识别方法

一个完整的人脸识别系统包括人脸面部数据的获取、数据分析处理和最终结果输出三个部分。图2-1 显示了三维人脸识别的基本步骤：1 、通过三维数据采集设备获得人脸面部的三维形状信息；2 、对获取的三维数据进行平滑去噪和提取面部区域等预处理；3 、从三维数据中提取人脸面部特征，通过与人脸库中的数据进行比对；4 、用分类器做分类判别，输出最后决策结果。

基于三维数据的方法的代表性是基于模型合成的方法和基于曲率的方法。

基于模型合成的方法，它的基本思想为：输入人脸图像的二维的，用某种技术恢复(或部分恢复)人脸的三维信息，再重新合成指定条件下的人脸图像。典型代表是3D可变形模型和基于形状恢复的3D增强人脸识别算法。3D可变形模型首先通过200个高精度的3D人脸模型构建一个可变形的3D人脸模型，用这个模型来对给定的人脸图像拟合，获得一组特定的参数，再合成任何姿态和光照的人脸图像n卜捌。基于形状恢复的3D增强人脸识别算法是利用通用的3D人脸模型合成新的人脸图像，合成过程改变了一定的姿态与光源情况。

曲率是最基本的表达曲面信息的局部特征，因而最早用来处理3D人脸识别问题的是人脸曲面的曲率。Lee禾lJ用平均曲率和高斯曲率值，将人脸深度图中凸的区域分割出来。

如果你是开发者的话，可以去Tel一下colorreco，更好地技术解答。

怎样使用OpenCV进行人脸识别本文大部分来自OpenCV官网上的Face Reconition with OpenCV这节内容()，小弟我尝试翻译一些重要内容。这部分内容是Philipp Wagner写的，他的github：，他的网站，应该是个德国人。下面应该是他的照片。1友情提示，要看懂代码前，你得先知道OpenCV的安装和配置，会用C++，用过一些OpenCV函数。基本的图像处理和矩阵知识也是需要的。[gm:我是箫鸣的注释]由于我仅仅是翻译，对于六级才过的我，肯定有一些翻译错的或者不当的地方，所以请大家纠错。.介绍Introduction从开始，加入了新的类FaceRecognizer，我们可以使用它便捷地进行人脸识别实验。本文既介绍代码使用，又介绍算法原理。(他写的源代码，我们可以在OpenCV的opencv\modules\contrib\doc\facerec\src下找到，当然也可以在他的github中找到，如果你想研究源码，自然可以去看看，不复杂)目前支持的算法有 Eigenfaces特征脸createEigenFaceRecognizer() Fisherfaces createFisherFaceRecognizer() LocalBinary Patterns Histograms局部二值直方图 createLBPHFaceRecognizer()下面所有的例子中的代码在OpenCV安装目录下的samples/cpp下面都能找到，所有的代码商用或者学习都是免费的。.人脸识别Face Recognition对人类来说，人脸识别很容易。文献[Tu06]告诉我们，仅仅是才三天的婴儿已经可以区分周围熟悉的人脸了。那么对于计算机来说，到底有多难？其实，迄今为止，我们对于人类自己为何可以区分不同的人所知甚少。是人脸内部特征(眼睛、鼻子、嘴巴)还是外部特征(头型、发际线)对于人类识别更有效?我们怎么分析一张图像，大脑是如何对它编码的？David Hubel和TorstenWiesel向我们展示，我们的大脑针对不同的场景，如线、边、角或者运动这些局部特征有专门的神经细胞作出反应。显然我们没有把世界看成零散的块块，我们的视觉皮层必须以某种方式把不同的信息来源转化成有用的模式。自动人脸识别就是如何从一幅图像中提取有意义的特征，把它们放入一种有用的表示方式，然后对他们进行一些分类。基于几何特征的人脸的人脸识别可能是最直观的方法来识别人脸。第一个自动人脸识别系统在[Kanade73]中又描述：标记点(眼睛、耳朵、鼻子等的位置)用来构造一个特征向量(点与点之间的距离、角度等)。通过计算测试和训练图像的特征向量的欧氏距离来进行识别。这样的方法对于光照变化很稳健，但也有巨大的缺点：标记点的确定是很复杂的，即使是使用最先进的算法。一些几何特征人脸识别近期工作在文献[Bru92]中有描述。一个22维的特征向量被用在一个大数据库上，单靠几何特征不能提供足够的信息用于人脸识别。特征脸方法在文献[TP91]中有描述，他描述了一个全面的方法来识别人脸：面部图像是一个点，这个点是从高维图像空间找到它在低维空间的表示，这样分类变得很简单。低维子空间低维是使用主元分析(Principal Component Analysis,PCA)找到的，它可以找拥有最大方差的那个轴。虽然这样的转换是从最佳重建角度考虑的，但是他没有把标签问题考虑进去。[gm:读懂这段需要一些机器学习知识]。想象一个情况，如果变化是基于外部来源，比如光照。轴的最大方差不一定包含任何有鉴别性的信息，因此此时的分类是不可能的。因此，一个使用线性鉴别(Linear Discriminant Analysis,LDA)的特定类投影方法被提出来解决人脸识别问题[BHK97]。其中一个基本的想法就是，使类内方差最小的同时，使类外方差最大。近年来，各种局部特征提取方法出现。为了避免输入的图像的高维数据，仅仅使用的局部特征描述图像的方法被提出，提取的特征(很有希望的)对于局部遮挡、光照变化、小样本等情况更强健。有关局部特征提取的方法有盖伯小波(Gabor Waelets)([Wiskott97])，离散傅立叶变换(DiscreteCosinus Transform,DCT)([Messer06])，局部二值模式(LocalBinary Patterns,LBP)([AHP04])。使用什么方法来提取时域空间的局部特征依旧是一个开放性的研究问题，因为空间信息是潜在有用的信息。.人脸库Face Database我们先获取一些数据来进行实验吧。我不想在这里做一个幼稚的例子。我们在研究人脸识别，所以我们需要一个真的人脸图像！你可以自己创建自己的数据集，也可以从这里()下载一个。AT&TFacedatabase又称ORL人脸数据库，40个人，每人10张照片。照片在不同时间、不同光照、不同表情(睁眼闭眼、笑或者不笑)、不同人脸细节(戴眼镜或者不戴眼镜)下采集。所有的图像都在一个黑暗均匀的背景下采集的，正面竖直人脸(有些有有轻微旋转)。YaleFacedatabase A ORL数据库对于初始化测试比较适合，但它是一个简单的数据库，特征脸已经可以达到97%的识别率，所以你使用其他方法很难得到更好的提升。Yale人脸数据库是一个对于初始实验更好的数据库，因为识别问题更复杂。这个数据库包括15个人(14个男人,1个女人)，每一个都有11个灰度图像，大小是320*243像素。数据库中有光照变化(中心光照、左侧光照、右侧光照)、表情变化(开心、正常、悲伤、瞌睡、惊讶、眨眼)、眼镜(戴眼镜或者没戴)。坏消息是它不可以公开下载，可能因为原来的服务器坏了。但我们可以找到一些镜像(比如 theMIT)但我不能保证它的完整性。如果你需要自己剪裁和校准图像，可以阅读我的笔记()。ExtendedYale Facedatabase B 此数据库包含38个人的2414张图片，并且是剪裁好的。这个数据库重点是测试特征提取是否对光照变化强健，因为图像的表情、遮挡等都没变化。我认为这个数据库太大，不适合这篇文章的实验，我建议使用ORL数据库。. 准备数据我们从网上下了数据，下了我们需要在程序中读取它，我决定使用CSV文件读取它。一个CSV文件包含文件名，紧跟一个标签。/path/to/;0 假设/path/to/是图像，就像你在windows下的c:/faces/person0/。最后我们给它一个标签0。这个标签类似代表这个人的名字，所以同一个人的照片的标签都一样。我们对下载的ORL数据库进行标识，可以获取到如下结果：./at/s1/;0./at/s1/;0..../at/s2/;1./at/s2/;1..../at/s40/;39./at/s40/;39想象我已经把图像解压缩在D:/data/at下面，而CSV文件在D:/data/。下面你根据自己的情况修改替换即可。一旦你成功建立CSV文件，就可以像这样运行示例程序： D:/data/ Creating the CSV File你不需要手工来创建一个CSV文件，我已经写了一个Python程序来做这事。[gm:说一个我实现的方法如果你会cmd命令，或者称DOS命令，那么你打开命令控制台。假设我们的图片放在J:下的Faces文件夹下，可以输入如下语句：J:\Faces\ORL>dir /b/s *.bmp > 然后你打开文件可能看到如下内容(后面的0，1..标签是自己加的)：参考

haar特征、lbp特征

基于opencv的人脸检测论文

计算机论文题目

随着大科学时代的到来及科技水平的高速发展，计算机科学与技术已经渗透到我国经济、社会的各个领域，这些都有利于全球经济的发展，还极大地推动了社会的进步，

1、基于物联网的煤矿井下监测网络平台关键技术研究

2、基于抽象状态自动机和π演算的UML动态语义研究

3、基于多种数据源的中文知识图谱构建方法研究

4、基于矩阵化特征表示和Ho-Kashyap算法的分类器设计方法研究

5、基于博弈论的云计算资源调度方法研究

6、基于合约的泛型Web服务组合与选择研究

7、本体支持的Web服务智能协商和监测机制研究

8、基于神经网络的不平衡数据分类方法研究

9、基于内容的图像检索与推荐技术研究

10、物联网技术及其在监管场所中的应用

11、移动图书馆的研发与实现

12、图书馆联机公共目录查询系统的研究与实现

13、基于O2O模式的外卖订餐系统

14、网络时代个人数据与隐私保护的调查分析

15、微信公众平台CMS的设计与实现

16、环保部门语义链网络图形化呈现系统

17、BS结构计量信息管理系统设计与研究

18、基于上下文的天然气改质分析控制系统的设计与实现

19、基于增量学习和特征融合的多摄像机协作监控系统目标匹配方法研究

20、无线自组网络密钥管理及认证技术的研究

21、基于CDMI的云存储框架技术研究

22、磨损均衡在提高SSD使用寿命中的应用与改进

23、基于.NET的物流管理软件的设计与实现

24、车站商铺信息管理系统设计与实现

25、元数据模型驱动的合同管理系统的设计与实现

26、安睡宝供应与销售客户数据管理与分析系统

27、基于OpenCV的人脸检测与跟踪算法研究

28、基于PHP的负载均衡技术的研究与改进

29、协同药物研发平台的构建及其信任机制研究

30、光纤网络资源的智能化管理方法研究

31、基于差异同步的云存储研究和实践

32、基于Swift的云存储产品优化及云计算虚拟机调度算法研究

33、基于Hadoop的重复数据删除技术研究

34、中文微博情绪分析技术研究

35、基于协议代理的内控堡垒主机的设计与实现

36、公交车辆保修信息系统的研究与设计

37、基于移动互联网的光纤网络管理系统设计与开发

38、基于云平台的展馆综合管理系统

39、面向列表型知识库的组织机构实体链接方法研究

40、Real-time Hand Gesture Recognition by Using Geometric Feature

41、基于事件的社交网络核心节点挖掘算法的研究与应用

42、线性判别式的比较与优化方法研究

43、面向日志分类的蚁群聚类算法研究

44、基于决策树的数据挖掘技术在电信欠费管理中的应用与研究

45、基于信任关系与主题分析的微博用户推荐技术

46、微博用户兴趣挖掘技术研究

47、面向多源数据的信息抽取方法研究

48、基于本体约束规则与遗传算法的BIM进度计划自动生成研究

49、面向报关行的通关服务软件研究与优化

50、云应用开发框架及云服务推进策略的研究与实践

51、复杂网络社区发现方法以及在网络扰动中的影响

52、空中交通拥挤的识别与预测方法研究

53、基于RTT的端到端网络拥塞控制研究

54、基于体系结构的无线局域网安全弱点研究

55、物联网中的RFID安全协议与可信保障机制研究

56、机器人认知地图创建关键技术研究

57、Web服务网络分析和社区发现研究

58、基于球模型的三维冠状动脉中心线抽取方法研究

59、认知无线网络中频谱分配策略的建模理论与优化方法研究

60、传感器网络关键安全技术研究

61、任务关键系统的软件行为建模与检测技术研究

62、基于多尺度相似学习的图像超分辨率重建算法研究

63、基于服务的信息物理融合系统可信建模与分析

64、电信机房综合管控系统设计与实现

65、粒子群改进算法及在人工神经网络中的应用研究

66、污染源自动监控数据传输标准的研究与应用

67、一种智能力矩限制器的设计与研究

68、移动IPv6切换技术的研究

69、基于移动Ad hoc网络路由协议的改进研究

70、机会网络中基于社会关系的数据转发机制研究

71、嵌入式系统视频会议控制技术的研究与实现

72、基于PML的物联网异构信息聚合技术研究

73、基于移动P2P网络的广播数据访问优化机制研究

74、基于开放业务接入技术的业务移动性管理研究

75、基于AUV的UWSN定位技术的研究

76、基于隐私保护的无线传感网数据融合技术研究

77、基于DIVA模型语音生成和获取中小脑功能及其模型的研究

78、无线网络环境下流媒体传送技术的研究与实现

79、异构云计算平台中节能的任务调度策略研究

80、PRAM模型应用于同步机制的研究

81、云计算平台中虚拟化资源监测与调度关键技术研究

82、云存储系统中副本管理机制的研究

83、嵌入式系统图形用户界面开发技术研究

84、基于多维管理的呼叫中心运行系统技术研究

85、嵌入式系统的流媒体播放器设计与性能优化

86、基于组合双向拍卖的云资源调度算法的研究

87、融入隐私保护的特征选择算法研究

88、济宁一中数字化校园系统的设计与实现

89、移动合作伙伴管理系统的设计与实现

90、黄山市地税局网络开票系统的设计与应用

91、基于语义的领域信息抽取系统

92、基于MMTD的图像拼接方法研究

93、基于关系的垃圾评论检测方法

94、IPv6的过渡技术在终端综合管理系统中的实现与应用

95、基于超声波测距与控制的运动实验平台研发

96、手臂延伸与抓取运动时间协调小脑控制模型的研究

97、位置可视化方法及其应用研究

98、DIVA模型中定时和预测功能的研究

99、基于蚁群的Ad Hoc路由空洞研究

100、基于定向天线的Ad Hoc MAC协议的研究

101、复杂网络社区发现方法以及在网络扰动中的影响

102、空中交通拥挤的识别与预测方法研究

103、基于RTT的端到端网络拥塞控制研究

104、基于体系结构的无线局域网安全弱点研究

105、物联网中的RFID安全协议与可信保障机制研究

106、机器人认知地图创建关键技术研究

107、Web服务网络分析和社区发现研究

108、基于球模型的`三维冠状动脉中心线抽取方法研究

109、认知无线网络中频谱分配策略的建模理论与优化方法研究

110、传感器网络关键安全技术研究

111、任务关键系统的软件行为建模与检测技术研究

112、基于多尺度相似学习的图像超分辨率重建算法研究

113、基于服务的信息物理融合系统可信建模与分析

114、电信机房综合管控系统设计与实现

115、粒子群改进算法及在人工神经网络中的应用研究

116、污染源自动监控数据传输标准的研究与应用

117、一种智能力矩限制器的设计与研究

118、移动IPv6切换技术的研究

119、基于移动Ad hoc网络路由协议的改进研究

120、机会网络中基于社会关系的数据转发机制研究

121、嵌入式系统视频会议控制技术的研究与实现

122、基于PML的物联网异构信息聚合技术研究

123、基于移动P2P网络的广播数据访问优化机制研究

124、基于开放业务接入技术的业务移动性管理研究

125、基于AUV的UWSN定位技术的研究

126、基于隐私保护的无线传感网数据融合技术研究

127、基于DIVA模型语音生成和获取中小脑功能及其模型的研究

128、无线网络环境下流媒体传送技术的研究与实现

129、异构云计算平台中节能的任务调度策略研究

130、PRAM模型应用于同步机制的研究

131、云计算平台中虚拟化资源监测与调度关键技术研究

132、云存储系统中副本管理机制的研究

133、嵌入式系统图形用户界面开发技术研究

134、基于多维管理的呼叫中心运行系统技术研究

135、嵌入式系统的流媒体播放器设计与性能优化

136、基于组合双向拍卖的云资源调度算法的研究

137、融入隐私保护的特征选择算法研究

138、济宁一中数字化校园系统的设计与实现

139、移动合作伙伴管理系统的设计与实现

140、黄山市地税局网络开票系统的设计与应用

141、基于语义的领域信息抽取系统

142、基于MMTD的图像拼接方法研究

143、基于关系的垃圾评论检测方法

144、IPv6的过渡技术在终端综合管理系统中的实现与应用

145、基于超声波测距与控制的运动实验平台研发

146、手臂延伸与抓取运动时间协调小脑控制模型的研究

147、位置可视化方法及其应用研究

148、DIVA模型中定时和预测功能的研究

149、基于蚁群的Ad Hoc路由空洞研究

150、基于定向天线的Ad Hoc MAC协议的研究

建议你主攻facedetect。Opencv有samples文件夹,其中可以帮助你完成毕设。另外,建议你前往知网看看别人的论文。

人脸检测论文

写一篇基于实时监控人脸检测的论文，可以按照以下步骤进行：1. 研究背景和意义：介绍实时监控人脸检测技术在安防、智能家居等领域的应用，并说明该技术对社会发展的重要性。2. 相关工作综述：对当前主流的人脸检测算法进行梳理和总结，包括传统方法（如Haar特征分类器、HOG+SVM）以及深度学习方法（如卷积神经网络）。并分析其优缺点及适用场景。3. 实验设计与数据集选择：详细描述本次实验所使用的硬件设备、软件环境以及数据集来源。同时还需解释为什么选择这些硬件设备和数据集，并且需要提供相关参数设置。4. 方法介绍：详细介绍采用哪种算法来进行实时监控人脸检测，包括模型架构、训练过程中使用到的技巧等方面。此外，还需说明如何将该算法应用于视频流中，并保证高效率地运行。5. 实验结果与分析：给出本次实验得到的具体结果，在不同条件下测试准确率、召回率等指标，并通过图表形式直观呈现。同时也需要针对结果进行分析，找出其中存在问题或者改进空间之处。6. 结论与展望：总结本次研究成果并归纳出最新发现；同时也需要指出目前存在问题或者未来可开展工作方向。最后强调该项技术在未来可能带来更多广泛而深远影响。 7. 参考文献: 列举文章引用过所有参考资料, 便于读者查阅相关信息.以上是一份简单论文框架, 具体内容根据自身情况灵活调整即可。

URL: 论文pdf Google出品。亚毫秒级的移动端人脸检测算法。移动端可达200~1000+FPS速度。主要以下改进：在深度可分离卷积中，计算量主要为point-wise部分，增加depth-wise部分卷积核大小并不会明显增加成本。因此本文在depth-wise部分采用了5x5的卷积核，已获得更大的感受野，故此可以降低在层数上的需求。此外，启发于mobilenetV2，本文设计了一个先升后降的double BlazeBlock。BlazeBlock适用于浅层，double BlazeBlock适用于深层。 16x16的anchor是一样的，但本文将8x8，4x4和2x2的2个anchor替换到8x8的6个anchor。此外强制限制人脸的长宽为1：1。由于最后一层feature map较大（相对于ssd），导致预测结果会较多，在连续帧预测过程中，nms会变导致人脸框变得更加抖动。本文在原始边界框的回归参数估计变为其与重叠概率的加权平均。这基本没有带来预测时间上的消耗，但在提升了10%的性能。效果好速度快的方法想不想要？

在Cver上看到一篇推文，总结了多篇类似anchor-free论文: : Unifying Landmark Localization with End to End Object Detection Only Look Once: Unified, Real-Time Object Detection : Detecting Objects as Paired Keypoints Object Detection by Grouping Extreme and Center Points Selective Anchor-Free Module for Single-Shot Object Detection : Fully Convolutional One-Stage Object Detection Anchor-Free Region Proposal Network for Faster R-CNN based Text Detection Approaches : Beyond Anchor-based Object Detector DenseBox，这是一篇百度2016年挂出来的论文，距离现在比较早的文章了，现在又被拿出来重提了，因为其中anchor-free的特点，我把它找出来了。发现这是一篇百度的神作，有很多极其超前的思路。出现了特征融合，多任务训练，多尺度，通过添加任务分支进行关键点检测（直到2017年mask-rcnn才公布通过添加掩码在Faster-rcnn进行上进行分割任务）。对于分类{0，1}，这个模型使用L2损失，并没使用hinge loss or cross-entropy loss，按照作者说法这个简单的L2损失也能工作的很好。坐标也是l2损失网络添加Conv5_2_landmark和Conv6_3_det输出，对于检测N个关键点的任务，Conv5_2_landmark有N个热图，热图中的每个像素点表示改点为对应位置关键点的置信度。对于标签集中的第i个关键点(x,y) ，在第i个feature map在(x,y) 处的值是1，其它位置为就是关键点的分数热力图。参考: 目标检测：Anchor-Free时代那些酷炫的深度学习网络图怎么画出来的？ CVPR2019-Code 人脸检测之DenseBox

人脸检测论文s3fd

姓名：张钰学号：21011210154 学院：通信工程学院【嵌牛导读】Frequency-aware Discriminative Feature Learning Supervised by Single-Center Loss for Face Forgery Detection论文阅读笔记【嵌牛鼻子】Deepfake人脸检测方法，基于单中心损失监督的频率感知鉴别特征学习框架FDFL，将度量学习和自适应频率特征学习应用于人脸伪造检测，实现SOTA性能【嵌牛提问】本文对于伪造人脸检测的优势在哪里体现【嵌牛正文】转自：

感受野：特征图上单个像素点在原始图像上映射区域的大小。神经元感受野之外的图像内容并不会对该神经元的值产生影响。在实际工程应用中，一般是通过调节模型深度和kernel size等参数来调节模型的感受野大小感受野被细分为了理论感受野和实际感受野 (这一划时代的概念有这篇论文提出《Understanding the Effective Receptive Field in Deep Convolutional Neural Networks》)。实际的感受野近似高斯分布我们需要关注网络的感受野是否足够，尤其是在对大目标进行检测和识别的时候。感受野并不是越大越好，在某些场景中，感受野过大甚至会降低模型性能。《The Receptive Field as a Regularizer in Deep Convolutional Neural Networks for Acoustic Scene Classification》论文通过1*1 Conv替换3*3Conv缩小ResNet和DenseNet等网络的感受野在ASC场景获取了比原始模型更高的精度；《Gated Recurrent Convolution Neural Network for OCR 》论文提出了GRCL 结构来限制无效感受野，提高了STR的识别精度，下图展示了改进后特征响应图，可以看出RCNN能强化文字上的响应，减弱无效背景的响应。Inception网络提出多路卷积融合的思路，实际是在同一个尺度上多种感受野信息的融合，主要是为了解决图像大小分布差异较大的问题。《MixNet: Mixed Depthwise Convolutional Kernels》Google Brain最近提出Mixed Depthwise Convolution，类似Inception的单元结构，以此来提高网络表达能力。Google Brain在MobilenetV2的基础上用MDConv替换3*3 Depthwise Conv进行了多组实验，在大多数情况下都取得了更好的效果，接着在Imagenet上用Auto ML搜索出MixNet-L，取得了的top-1分类精度，同时FLOPs小于600M，超过Resnet153。感受野的计算方式有两种，下面给出其中一个计算公式和计算示例感受野作为神经网络隐藏的重要特性还有很多需要发掘的地方，在实际的工程项目中我们需要考虑这一块的影响，细节往往决定成败，与其沉迷在研究高大上的算法架构，真不如沉下心把一些基础性的研究工作做透彻。 Xudong Cao写过一篇叫《A practical theory for designing very deep convolutional neural networks》的technical report，里面讲设计基于深度卷积神经网络的图像分类器时，为了保证得到不错的效果，需要满足两个条件： Firstly, for each convolutional layer, its capacity of learning more complex patterns should be guaranteed; Secondly, the receptive field of the top most layer should be no larger than the image region. 其中第二个条件就是对卷积神经网络最高层网络特征感受野大小的限制。现在流行的目标检测网络大部分都是基于anchor的，比如SSD系列，v2以后的yolo，还有faster rcnn系列。基于anchor的目标检测网络会预设一组大小不同的anchor，比如32x32、64x64、128x128、256x256，这么多anchor，我们应该放置在哪几层比较合适呢？这个时候感受野的大小是一个重要的考虑因素。放置anchor层的特征感受野应该跟anchor大小相匹配，感受野比anchor大太多不好，小太多也不好。如果感受野比anchor小很多，就好比只给你一只脚，让你说出这是什么鸟一样。如果感受野比anchor大很多，则好比给你一张世界地图，让你指出故宫在哪儿一样。《S3FD: Single Shot Scale-invariant Face Detector》(该文分析讲解详见SIGAI技术短文《人脸检测算法之S3FD 》)这篇人脸检测器论文就是依据感受野来设计anchor的大小的一个例子，文中的原话是 we design anchor scales based on the effective receptive field 《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》这篇论文在设计多尺度anchor的时候，依据同样是感受野，文章的一个贡献为 We introduce the Multiple Scale Convolutional Layers (MSCL) to handle various scales of face via enriching receptive fields and discretizing anchors over layers 虽然进行了整理，但是我还没有仔细的去阅读（精神不太好，上周熬夜太多了，这周有点儿缓不过来，今晚早点睡，明天继续搞，争取这一周，能好好啃一啃这一块儿，最终提取一个有个有用的指导性的结论）。