论文发表百科

有关深度造假检测的近期论文笔记

发布时间:2024-07-05 06:53:18

有关深度造假检测的近期论文笔记

Automatic Pixel-Level Crack Detection on Dam Surface Using Deep Convolutional Network 论文笔记 论文:Automatic Pixel-Level Crack Detection on Dam Surface Using Deep Convolutional Network Received: 大多数坝面裂缝检测只能实现裂缝分类及粗略的定位。像素级语义分割检测可以提供更加精确直观的检测结果。作者提出一种基于深度卷积网络的坝面裂缝检测算法。首先使用无人机进行数据采集,然后对采集到的图像进行预处理(包括裁剪、手动标注),最后对设计好的CDDS 网络结构进行训练、验证和测试。 与ResNet152-based SegNet U-Net FCN 进行了比较。  大坝是水电站的重要水利建筑物。大坝的安全运行对于水电站有着重要的意义。由于结构变形、地震、水流引起的裂缝对大坝坝体产生严重的影响并威胁到水电站的安全运行。因此,对大坝结构的定期健康评估,特别是对大坝裂缝的检测任务变得尤为重要。 根据大坝裂缝的结构特征以及裂缝强度,人们可以对大坝的结构健康进行评估和监测。传统的大坝裂缝的巡检任务通常基于人工进行检测,但是效率低下、耗时费力,浪费了大量的人工成本,因此对裂缝的自动高效检测是非常必要的。 基于计算机视觉的裂缝检测算法得到了广泛的研究。这些方法大多采用传统的图像处理技术和机器学习方法,以识别出一些简单的结构损伤。这些方法利用手工提取的特征从图像中提取特征,然后评估提取的特征是否表示缺陷。然而,上述方法的结果不可避免地受到主观因素的影响 卷积神经网络(CNN)在图像分类和识别领域取得很大的进步,基于CNN的裂缝检测算法也展示出更优异的表现。大坝裂缝的特点: 修补痕迹、噪声大、背景纹理复杂、非结构化的、分布不均匀、裂缝位置随机、背景模糊等缺点 提出了一种像素级的大坝表面裂缝检测方法,利用深卷积网络进行特征提取。利用浅卷积层的定位特征和深卷积层的抽象特征,进行 多尺度卷积级联融合和多维损失值计算 ,实现裂纹缺陷像素级分割,并以高精度、高效率等优点解决了坝面明显裂缝检测问题,消除了可能存在的安全隐患,确保了坝面安全。实验结果表明,该方法对大坝表面像素级裂缝的检测是最优的。 语义分割 PSPNet [42],ICNet [43], Deeplabv3[44],UNet [45] and SegNet [46] 语义分割网络通常分为编码网络和解码网络。 编码网络: 卷积层:用于提取输入图像的特征 池化层:减小feature map的规模,减轻计算负担。 解码网络: 反卷积层(反褶积层):上采样还原feature map大小与输入图像相同,并输出预测结果。 编解码网络结构高度对称:同时利用稀疏feature map和稠密feature map。 为了融合sparse 和 dense feature ,采用跳跃模块以连接编解码网络。编码网络:     15 卷积层:3*3  步长1     4 池化层: 2*2 步长2 解码网络:     15 反卷积层 1*1     4池化层     采用dropout和BN防止过拟合。     Skip branch     4个,1*1卷积和反卷积     每个branch计算 branch loss,4个branch loss级联为总损失的一部分。     Skip branch 的输入输出图像大小不变。卷积核的通道数必须等于输入张量的通道数。降采样 取矩阵最大值 卷积核大小 2*2 步长为2。反褶积也叫做转置卷积 通过上采样还原feature map与输入图像大小相同。 上采样方法:反褶积法、 插值法 反褶积法:对张量进行zero-padding填充最外层,再用反褶积核进行反褶积,修剪第一行和最后一行。1000副5472*3648图像使用LEAR软件手动标记。 得到504张数据集,404用于训练,50用于验证,50用于测试。 在Linux系统上使用TensorFlow构建的 在配置了8 GB GPU的HP工作站上执行培训、验证和测试 利用Anaconda建立了CDDS网络的虚拟python环境评价指标: Precision精度表示在所有预测破裂的样本中,样本的基本真实性也被破解的概率。 Recall召回表明在所有标记为开裂的样本中,样本被预测为开裂的概率。当正负样本数量存在较大差距时,仅使用精确性或召回率来评估性能是不合理的。TPR表示所有标记为裂纹的样本中被正确预测为裂纹的概率。TNR代表以标签为背景的所有样本中被正确预测为背景的概率.F-measure考虑到查全率和查准率的综合影响,F-测度是一个综合指标。IoU是目标检测领域中常用的评价定位精度的方法。IoU表示预测结果与地面真实值的交集与联合的交集的比率。大坝表面裂缝图像分为背景和裂缝两类。背景像素的数目远大于裂纹像素的数目。通常情况下,我们会同时计算背景arrears和裂缝arrears,然后以两张arrears的平均数作为最终arrears。IoU值是由背景像素决定的,不能准确表达裂纹的定位精度。使用三种学习速率10^4,10^5,10^6 使用softmax函数计算概率 使用Dice loss计算网络损失。 裂缝骨架提取:快速细化算法 调用OpenCV库,进行计算。 计算裂缝面积及长度宽度。使用其他裂缝数据集进行补充验证 ,在测试数据集上,提出的CDDS网络的裂纹IOU和F测度分别达到和 略。

论文地址: 官方源码(pytorch):

主要说了目前表现好的目标检测主要基于较深的网络(例如Resnet,Inception),其缺点就是大量的计算成本,速度慢。而一些轻量级的网络速度较快,但检测的精度相对不高。作者提出了RFB模块,并将它添加到SSD的顶部,构建了RFBnet。

为了构建快速而强大的探测器,合理的替代方案是通过引入某些手工制作的机制来增强轻量级网络的特征表示,而不是一味地加深模型。

RFBnet 结构说明

RFB其实就是多分枝卷积块,其内部结构由两部分组成: 1.前一部分与inception一致,负责模拟多尺寸的pRF 2.后一部分再现了人类视觉中pRF与离心率的关系 下图给出了RFB及其对应的空间池区域图

具体来说,首先,我们在每个分支中采用瓶颈结构,由1×1转换层组成,以减少特征映射中的通道数量加上n×n转换层。其次,我们用两个堆叠的3×3转换层替换5×5转换层,以减少参数和更深的非线性层。出于同样的原因,我们使用1×n加n×1转换层来代替原始的n×n转换层。最后,我们应用ResNet 和Inception-ResNet V2 的快捷方式设计。

也叫做astrous卷积层, 该结构的基本意图是生成更高分辨率的特征图,在具有更多上下文的更大区域捕获信息,同时保持相同数量的参数 。

下图示出了多分支卷积层和扩张合并或卷积层的两种组合

所提出的RFB网络探测器重用了SSD的多尺度和单级框架,其中RFB模块被嵌入以改善从轻量级主干提取的特征,使得探测器更准确且仍然足够快。 由于RFB的特性可以轻松集成到CNN中,我们可以尽可能地保留SSD架构。 主要的修改在于用RFB代替顶部卷积层

使用与SSD中完全相同的骨干网络。 简而言之,它是在ILSVRC CLS-LOC数据集上预先训练的VGG16 ,其中fc6和fc7层被转换为具有子采样参数的卷积层,并且其pool5层从2×2-s2变至3×3-s1。 空洞卷积层用来填充空缺和所有dropout层,并移除fc8层。

保持相同的SSD级联结构,但具有相对较大分辨率的特征映射的卷积层被RFB模块取代。 在RFB的主要版本中,我们使用单一结构设置来模仿离心率的影响。 随着视觉图之间pRF大小和离心率的差异,我们相应地调整RFB的参数以形成RFB-s模块,其模拟浅人类视网膜图中较小的pRF,并将其置于conv4 3特征之后,如 由于其特征映射的分辨率太小而无法应用具有大型内核(如5×5)的滤波器,因此保留了最后几个卷积层。

train主要遵循SSD,包括数据增强,硬负挖掘,默认框的比例和宽高比,以及损失函数(例如,用于定位的平滑L1损失和用于分类的softmax损失),同时我们稍微改变了我们的学习速率调度 更好地适应RFB。 更多细节在以下实验部分中给出。 使用MSRA方法初始化所有新的conv层。

后面主要是描述研究的成果,与其他网络的对比,就不多描述了,以后补充更多关于RFBnet的细节

有深度的期刊

《特别关注》很有深度的,我很喜欢看。(现在貌似还分男士和女士两种版本的了)还有《语文世界》(看这个需要一定的语文深度)

不仅要学习,也要了解国事~【作文素材】【英语广场】【演讲与口才】【中学生博览】【中学生学习报】【中学生阅读】高中版【环球时报】【散文诗】【青年文摘】【格言】【意林】【看天下】读者,青年文摘,作文选集等一些刊物。lens适合高中生阅读,因为每一个阶段都应该接受不同的事物,要试着尝试不同的经历和不一样的事情。作文集其实对于写作也有好处,应该多看。O(∩_∩)O~《时事》专门针对学生定制的政治类小杂志,32开,蛮小的,一个月一期吧,内容挺不错的,我们学校专门为我们订购的,看着感觉帮助挺大的读者和青年文摘这两个我经常是换着看,觉得都还挺好的。我倒是觉得读者与其说深奥,还不如说他谈的内容更学术,更理论点,因为经常会有些关于社会问题的思考之类的,而青年文摘可能相比而言生活化点,比较轻松,这点最明显的例子就是他上面有关情感,特别是爱情的文章会要比读者上的多,呵呵。另外有点要提醒下,最近几次我发现两者在文章上的选取上有重合,同样的文章先后在两本杂志上出现。自己一点感受吧,希望帮得到你青年文摘更适合学生,青春时尚些。读者偏哲理点。师总推荐看读者,而不是青年文摘因为读者的文章更有深度一些青年文摘适合中学生包括小学生看.比较有趣老师看的是深度吧..反正我两本都看其实都挺好的看看读者可以提高写作水平深度:《历史研究》《中华文史论丛》《文史》《中华国学研究》《特别关注》使人受益不浅。

还有《知音》《读者》比较好 欢迎您的采纳

每个杂志的侧重点不同。

1、《青年文摘》

由共青团中央主管、中国青年出版社主办,创刊于1981年1月,自2000年起改为半月刊,是中国发行量最大的青年杂志,单期发行145-150万册。

《青年文摘》是一本面向全国、以青少年为核心读者群的文摘类综合刊物,刊物集萃来自报纸、期刊、图书等大众媒体的名篇佳作,旨在为青少年打造一个丰富生动、健康向上的精神空间。

2、《感悟》

杂志创办于2005年,国内首创古典、淡雅、庄重的牛皮纸封面,旨在开启心灵智慧之光,体会世间的真善美,格调高雅,隽永,对构建青年健全的世界观、广阔的视野、优美的感情世界、深厚的人文情怀,尤为有益。

3、《知音》

是创刊于1985年1月的情感类杂志,杂志售价5元,以悲惨曲折的爱情故事,以及名人轶事等内容与精英文化形成对垒,多年稳居国内期刊发行量第一、世界第五的位置。

4、《今日文摘》

是广东省新闻出版局主管、广东省期刊协会主办的大型综合性文摘期刊。内容鲜活,涵盖人文、社会、文学、艺术、娱乐、生活、经济等领域,浓缩睿知灼见,聚集书报刊精华,专注于打造具有中国南方特色的文摘杂志,将“新锐、实在”的办刊理念传递给百万读者。

5、《海外文摘》

是一本贴近生活、透视海外的综合性中文月刊。它专门介绍国外以及台湾、香港、澳门的社会万象和风土人情,以传播知识、开阔眼界、陶冶情操为宗旨。

6、《小说选刊》

是中国作家协会主管的唯一一家国家级大型文学选刊,以遴选优秀中短篇小说为己任。

7、《萌芽》

杂志创刊于1956年7月,是中国第一本青年原创文学刊物,至今已走过了62年的辉煌历程。目前《萌芽》发行量已达50万份,是对中国青年深具影响力的一本原创文学杂志。1999年,萌芽联合13所著名高校合办中国权威作文大赛—新概念作文大赛。

大赛发掘出韩寒、郭敬明、张悦然等80后文化偶像,《萌芽》因而被誉为“80后偶像摇篮”。

论文造假与论文检测的关系

硕士论文主要的检测是论文抄袭,只要你确保自己写的内容不是从别人那里抄来的就行,至于实际编程的内容,即使提交了也是没有人去看的,答辩也是以论文中的实现方式为准。毕业论文的底线不在于你做的东西怎么样,而是到底是不是你做的,老师问你时只要能和论文上答得一致就行

教育部没有明确的规定,但各个学校有自己的规定,检测超过一定比例,会直接延期。这个只是一个客观的标准,如果检测都超过了,那肯定是学术造假。但并不是说检测没超过,就不属于学术造假了。一般硕士生,没有人去深究你是否造假,关键要学校检测通过。建议先上文天下论文检测网提前测一下,再交学校。

这个一般没有实际编程经验,没法看那么仔细,容易混过去只要通过论文检测就行 毕业论文写作技巧 第一条,先要围绕着论题去占有和选择材料。 也就是说,当你的论题已经确定以后,第一,围绕着立论去占有材料,多多益善的去看。有的论题是来自老师已经拟订好的题目。有相当一部分学生是自己确立论题的,先积累材料,再有论点。一旦立论确立了以后,再回过头来去占有材料。在占有材料方面跟我《基础写作》里讲的有相通的地方。第一要占有材料,占有研究对象的真实的材料。比如你要研究某个作家,某个阶段的几部作品,就将这几部作品拿来进行深入细致的研读,进一步来确定自己的论点。如果你的论文是报告类的,不是纯理论性的,用实验报告、调查报告、总结的形式来写论文的,那么你的调查材料、实验材料也要占有。 第二,要对研究对象的外延材料占有。 比如你要研究的是作家作品的话,那么你就要对作家写作的背景材料,包括政治经济背景、文艺思潮背景等。还有作家谈自己创作的材料,还有他人已经研究过的材料等。有了这些材料,你就可以做到知人论世,可以使自己在研究当中尽量公允,不带偏见。所以,充分占有材料,也就使你的论据更充分。这样你将来的论证就会更加深广。 第三,在有材料的基础上要选择材料。 决不能只要有材料就统统拉进来。这是你们写论文常出现的问题。比如让你写一万字,你可能写到五六万字。象刚才那个学生一样,写出六万字,太丰富了。把握不住自己的时候,可以让老师来帮助你,告诉你哪些能用,哪些不能用。多占有材料总比没有材料写不出来要好,因为删总是好删的。在材料多的情况下,你就选更好的材料。 2 、选择论文的类型。 第二项准备工作就是选择论文的类型。毕业论文的类型一是学术性论文,二是报告性论文。应用性比较少的科目来说比较容易做成学术型论文,比如对作家、作品的研究,对诗派的研究。应用性比较强的学科,比如教学领域、新闻领域、治疗科学和实验等,论文一般写成调查性的或总结性的,我将它概括为报告型论文。 杂志上发表的3000来字的论文,一般就是报告型的论文。报告型的论文主要是总结经验。不管是总结也好,报告也好,总之,最后是要总结出规律性的东西来。比如说,《新教材综合性学习的教学体会》有这样几条规律:综合性学习能够激发学生积极参与和主动学习;综合性学习能够激发学生的创造意识,培养学生的创造能力;综合性学习以课外学习为主,能加强课内外的结合,强化能力的培养;综合性学习能强化学生对语文学习的体验和认识,使学生的情感态度和价值取向朝着健康的方向发展。他的这几个体会是努力地从理论上探讨,说明它的意义。 大多数学生的论文都是学术型的,学术型的论文主要是对某一个专业领域的问题,经过充分的研究以后,用文字符号进行表达。这一类论文的基本要求是论者以自己所学的知识,对本专业的理论问题或实际问题进行探讨和研究。学术型的论文还可以细分为两种,一是论述性的论文,一是综述性的论文。所谓论述性的论文,最大的特点是以议论为主,有极强的理论色彩。它又可以分为立论型和驳论型。立论型就是正面树立自己的观点,驳论型就是批驳别人的观点。综述性的论文,在我们的大型报纸上和一些杂志很多。比如,2003年已经过了半年了,我们就可以对过去的半年时间里的小说进行综述。如果是综述文学创作,就要对各种文体进行综述,如果进行小说综述,就要对半年来杂志报纸上发表的小说进行描述。这是一种综述型的,往往采用一种夹叙夹议的方式。两者比较而言,综述型的论文只要你的资料可以找到而且你有一定的概括能力,这种论文的撰写要比论述型的论文容易些。因为论述型的论文完全是议论型的,要求逻辑思维要好一些。另外,论证的深度还是有一定的讲究的。这还是本科生,那么研究生就更不用说了。论文类型的选择,主要是看论文的对象怎么样。如果是宏观的,我们就用综述性的面上的描述;如果是微观的,涉及到某一个具体的作家作品或某一个问题,我们就选择论述性的。如果我们自己学的专业应用性很强,比如说教学、新闻、农业、林业,建议大家写成报告型的论文,写成调查报告也行,写成总结性的报告也行,都可以。这一类文章,可以看看报刊杂志。如果是应用性比较强的学科,建议大家写成报告性论文,包括调查报告、总结和实验报告。有些实验报告就可以成为论文。这是第二条。 3 、要拟订论文的写作提纲。 准备工作的第三条是一定要拟订论文的写作提纲。如果没有完整的写作提纲的话,逻辑思维就会出现偏差。这不同于散文创作。散文创作只是一个百字文或千字文,打个腹稿差不多就可以了。三千字的学年论文都要求打提纲,更不用说上万字的毕业论文了。把一个个提纲罗列出来,罗列出来以后看一下,总论点是什么,分论点是什么,围绕着总论点有几个分论点,分论点列出来了以后,一定要注意以纲带目,以目服纲这样的一个关系。把这个关系弄清楚了以后,它们之间是并列的关系还是主从关系、递进关系、因果关系,逻辑关系一定要搞清楚。这样你才能从提纲中感受到你的研究能力到底是怎么样。导师在辅导的时候,并不是要求你赶快把一篇稿子拿出来,而首先要求的是你跟老师交谈一下论题。当老师确定你的论题的大小和难易都比较合适的时候,就同意你去写提纲。所以第二次跟老师交换意见的时候,是跟老师交换一下对提纲的意见。当老师发现你的提纲根本不清楚,他就要负责把你的思路理清楚;最后确定下来你可以去写了,你就可以动手去写了。写的过程中,有可能你觉得要推翻原来的提纲重新写,如果出现这样的情况,一定要跟老师沟通一下,让老师给你看是否需要重新写提纲。不要做很多无用功,等到你的论文写完了以后再跟老师沟通,老师把你的论文枪毙,就等于你做了无用功。一定要把提纲拟好跟老师交流。你的论文提纲的总论点和分论点之间的关系一定要清楚。你的每一个分论点需要采用哪些论据,都要在提纲里告诉老师。每一个分论点后要注明你的论证方法,或是比喻的方法,或是摆事实的方法,或是其他的什么方法。在《阅读鉴赏评论》中为了在论文提纲方面给大家以借鉴,我举出了王魁今先生的一篇关于对外汉语教学的论文的提纲。他的写作提纲,不妨你们借鉴一下。我引用了其中的一段,讲提纲的怎么拟制,在书的232 页。你们可以看一下他的提纲是怎么拟制的。通过这个提纲的拟制,你们写论文的时候就可以借鉴……少走一点弯路,你的提纲、材料等出来以后,就可以进行论文写作了。 4 、开始写论文的时候,要注意标题拟制。 第五个大问题的第三个小问题就是开始写论文的时候,要注意标题拟制。论文的标题拟制,一般是两个标题,如果是一个标题不太容易驾驭。一个标题往往是比较宏观一些。当然也可以用正标题来表示论题的观点,副标题表示研究的对象。但有的时候,一个标题就把你的论题就拉出来了。比如说《论司法活动的群众监督》,就把范围限制了。所以说,如果是一个标题一般就比较宏观。再比如说,《经济增长的差异与农业产品优势比较》,这是一个标题。还有一种是完整式标题。完整式标题是一个主标题,配一个副标题。一般来说,正标题是揭示论文的中心论点,副标题是表明你论述的范围和对象。比如说,《经济振兴的宣言书——论改革者》,中心论点和研究对象的范围就交代出来了。又比如,《向往光明,追求真善美——丰子恺哲学散文浅论》,论文的中心论点和研究对象也交代清楚,是完整标题。还有《叙事在模式与效果之间——论《老残游记》的叙事艺术》,观点摆到提纲里去出现。拟制标题要注意这么几点,一要贴切,二要醒目,三要简洁,四要新颖,这是论文题目的几个要求。题目拟制好了以后,论文还要注意要写摘要,把整个论文的主要内容说一下。在论文的扉页上,先是题目,题目下面是摘要(也叫论文提要)。论文提要要写哪些内容呢?主要交代清楚选题的背景、理由,论文的观点和价值,简明扼要的揭示出来,便于读者(主要是导师、评委、编辑等)即使不阅读全文就可以获得最重要的信息。一般字数不超过全文的5%. 在摘要下面要有关键词。关键词把论文的主要观点用3 到5 个词提取出来。比如《经济增长差异与农业产品优势比较》的关键词就是经济增长、农产品比较优势、相关的分析、连动机制。第四个小问题要讲一下引言。引言把论文研究的理由、背景、价值等阐释出来。最后就写正文。写完论文后再修改,修改后请导师看。导师认可了以后论文就可以定稿了。一般的学生写两稿就差不多了,差的学生写上四五稿的也有。 (这是清华论文写作的讲座,看完后有用请赞,收集整理有手打不容易,谢谢!)

目标检测论文笔记

论文地址: 官方源码(pytorch):

主要说了目前表现好的目标检测主要基于较深的网络(例如Resnet,Inception),其缺点就是大量的计算成本,速度慢。而一些轻量级的网络速度较快,但检测的精度相对不高。作者提出了RFB模块,并将它添加到SSD的顶部,构建了RFBnet。

为了构建快速而强大的探测器,合理的替代方案是通过引入某些手工制作的机制来增强轻量级网络的特征表示,而不是一味地加深模型。

RFBnet 结构说明

RFB其实就是多分枝卷积块,其内部结构由两部分组成: 1.前一部分与inception一致,负责模拟多尺寸的pRF 2.后一部分再现了人类视觉中pRF与离心率的关系 下图给出了RFB及其对应的空间池区域图

具体来说,首先,我们在每个分支中采用瓶颈结构,由1×1转换层组成,以减少特征映射中的通道数量加上n×n转换层。其次,我们用两个堆叠的3×3转换层替换5×5转换层,以减少参数和更深的非线性层。出于同样的原因,我们使用1×n加n×1转换层来代替原始的n×n转换层。最后,我们应用ResNet 和Inception-ResNet V2 的快捷方式设计。

也叫做astrous卷积层, 该结构的基本意图是生成更高分辨率的特征图,在具有更多上下文的更大区域捕获信息,同时保持相同数量的参数 。

下图示出了多分支卷积层和扩张合并或卷积层的两种组合

所提出的RFB网络探测器重用了SSD的多尺度和单级框架,其中RFB模块被嵌入以改善从轻量级主干提取的特征,使得探测器更准确且仍然足够快。 由于RFB的特性可以轻松集成到CNN中,我们可以尽可能地保留SSD架构。 主要的修改在于用RFB代替顶部卷积层

使用与SSD中完全相同的骨干网络。 简而言之,它是在ILSVRC CLS-LOC数据集上预先训练的VGG16 ,其中fc6和fc7层被转换为具有子采样参数的卷积层,并且其pool5层从2×2-s2变至3×3-s1。 空洞卷积层用来填充空缺和所有dropout层,并移除fc8层。

保持相同的SSD级联结构,但具有相对较大分辨率的特征映射的卷积层被RFB模块取代。 在RFB的主要版本中,我们使用单一结构设置来模仿离心率的影响。 随着视觉图之间pRF大小和离心率的差异,我们相应地调整RFB的参数以形成RFB-s模块,其模拟浅人类视网膜图中较小的pRF,并将其置于conv4 3特征之后,如 由于其特征映射的分辨率太小而无法应用具有大型内核(如5×5)的滤波器,因此保留了最后几个卷积层。

train主要遵循SSD,包括数据增强,硬负挖掘,默认框的比例和宽高比,以及损失函数(例如,用于定位的平滑L1损失和用于分类的softmax损失),同时我们稍微改变了我们的学习速率调度 更好地适应RFB。 更多细节在以下实验部分中给出。 使用MSRA方法初始化所有新的conv层。

后面主要是描述研究的成果,与其他网络的对比,就不多描述了,以后补充更多关于RFBnet的细节

在上一步,完成了网络的创建和数据的预处理。接下来准备对这个网络进行训练,通过训练得到一个可以用于目标检测的深度学习网络模型。这里首先要确定上一步输出的模型和数据集的存放路径是可用的,否则训练环节会因为缺少输入而报错。 Halcon的参考样例详述了这一过程,这里做一些学习记录。 设置输入路径,主要是两个,一是上一步的预训练的以.hdl结尾的模型,另一个是数据集和样本数据字典的存放路径。 输出路径也是两个,一是存放最佳评估模型的路径,一个是最终训练完成的模型路径。 首先用check_files_availability验证预处理模型和数据集路径是否正确。没有问题的话可以开始读取。 使用read_dl_model读取前一步初始化后的网络模型,得到模型的句柄DLModelHandle。 接着用read_dict读取预处理后的数据集,得到数据字典句柄DLDataset。 设置模型参数主要通过set_dl_model_param算子,以修改属性值的方式改变关键参数的值。该算子原型如下: set_dl_model_param( : : DLModelHandle, GenParamName, GenParamValue : ) 输入三个参数: 注意,如果将'runtime'的值改为了’gpu’,则要确定cuDNN和cuBLAS已经成功安装了。 通过set_dl_model_param算子,可以将本文开头提到的设置的模型的基本参数传递给模型句柄DLModelHandle。如将'batch_size'设为之前的batch_size的值等等。 1)创建训练参数。 这里使用create_dl_train_param算子创建一个训练参数的字典,用于存放训练参数和训练效果可视化的参数。这些参数可以做个说明: 2)训练网络 接下来是最耗时的部分,即使用train_dl_model算子进行深度学习网络模型的训练。算子如下: train_dl_model( : : DLDataset, DLModelHandle, TrainParam, StartEpoch : TrainResults, TrainInfos,EvaluationInfos) 前四个参数是输入参数,后三个是输出参数。 接着到了第三步,即验证模型的部分。

边缘检测论文笔记

HED 论文: Holistically-Nested Edge Detection HED(Holistically-Nested Edge Detection)是一个端到端的边缘检测网络,特点是提取不同尺度的特征,和多输出的多监督及融合。 HED 在产业上应用比较广泛。 Holistic:指该方法的预测和训练都是端到端的;Neted:指通过多层级的输出,渐进地优化最终结果。作者的命名逻辑... 看这篇边缘检测的论文主要是想知道边缘检测的损失函数应该怎么设计。我本来的想法是直接像语义分割一样,用 IoU ,后来想想不对,如果一个边缘检测结果是 GT 平移了几个像素,那它仍可称得上好,但它的 IoU 却会骤降至和随机结果差不了多少。如果对边缘检测问题用 IoU 做优化对象,恐怕在优化时根本找不到可以下降的梯度方向。边缘检测的任务是提取图像内每个对象的边界,而排除对象的纹理。HED 被设计以解决两个问题:(1)对图像整体的训练和预测,End-to-end;(2)多尺度的特征提取。端到端很容易实现,因为边缘检测任务的输入和输出都是一张图片,只是通道数不同,很明显可以应用一个全卷积的网络来实现。HED 的骨干网络采用 VGG,并将 VGG 后面的全连接层结构全部移除,只保留卷积层。一些曾被应用过或正在被应用的多尺度特征提取方法。 (a) 多通路并行网络,通过不同的网络深度得到不同的感受野,输出聚合在一起; (b) 跳线连接,将来自不同卷积层的输出通过跳线连接在一起,作为特征提取结果(实际上跳线连接也可以在各个卷积层之间连接,而不仅限于到输出层,比如 U-Net 结构); (c) 同一个网络,采用不同尺寸的输入; (d) 不同深度的网络完全分立(这个方法感觉最拉跨,各个尺度上的特征没有相关性,也没听说过有人这么搞); (e) HED 提出的结构,在卷积网络的不同深度引出“侧输出”,将这些侧输出聚合成最终输出(和 (b) 的不同在于每个侧输出都能被监督并进行反向传播,这里应用了中继监督的思想,也是一个很泛用的做法)。这篇文章也用了中继监督,之前看的 Stacked Hourglass 也是。不过 Stacked Hourglass 的侧输出是还要被输入到下个特征提取网络里继续 refine 的,旨在迭代地优化输出结果。 HED 的侧输出和 GoogLnet 等一些常见的侧输出比较像,前面也说了,浅层的特征保留了更多的信息,但是相对而言感受野更小,那么 HED 就取多个不同深度的特征,分别在这些位点设置输出层。具体地,HED 在每个 VGG 内尺寸的特征图上引出一个卷积层作为侧输出层。HED 将边缘检测任务归纳为对每个像素点的二分类任务——“边缘”和“非边缘”。对于 HED 的单个输出而言,其损失函数为所有像素点的二分类损失函数的和,另外,由于边缘占的像素总数一般都会少于非边缘,所以实际是边缘的像素提供的二分类损失函数会乘以一个更大的权重,以进行正负样本平衡。HED 整体的损失函数就是它所有输出的损失函数的加权和。 转化成数学语言就是:其中 指特征提取网络(VGG)的权重, 指 HED 第 层输出的输出层权重, 为平衡每层输出为最终损失贡献的系数, 为平衡正负样本的系数, 和 分别指代边缘像素和非边缘像素, 为像素 输出的置信度。 上面的损失函数是针对每个侧输出进行优化,HED 的最终输出是每个侧输出按照一定的权重加总得到的融合输出,这些权重是通过训练学习到的,而非人为设定的。 融合输出的损失函数如下:其中融合输出 , 是每个侧输出在融合时的权重, 计算输出和 GT 之间的距离,这里采用交叉熵函数。 整个模型在训练时的优化目标权重为:可以看到,最终的损失函数中存在一定的冗余,由于融合输出是由侧输出得到的,侧输出似乎被不止一次地惩罚了。不过,先不论这种冗余是不是必要的,据作者言,只对融合输出进行惩罚得到的效果是不够好的,因为模型总会区域学习更大尺度上的特征。 HED 的损失函数是一种很直接的思路,不过任然有这样的问题:当一个被预测为“边缘”的像素点实际上是“非边缘”时,不管它和 GT 离得有多近,体现在损失函数上,都和一个差 GT 十万八千里的像素点没有区别。这种设计——就我个人的理解——会让损失函数的梯度出现大面积的平坦区域,梯度下降难以工作。但目前的工作似乎都是在用交叉熵作为损失函数,虽然今年也提出了 G-IoU、D-IoU 等将 IoU 调整后作为损失函数的方法,但是限于数学表达上的困难,目前只能应用于矩形边界框,而不能应用于像素集分割。

《计算机视觉教程》笔记 编著:章毓晋(清华大学电子工程系) 出版社:人民邮电出版社 出版时间:   图像中的边缘是像素灰度值发生加速变化而不连续的结果。   边缘检测是常见的图像基元检测的基础,也是所有基于边界的图像分割方法的第一步。   像素灰度值的变化可利用计算导数的方法来检测,一般常使用一阶和二阶导数。   下面借助图来介绍不同类型边缘的一些特点以及对它们进行检测的原理。   在图中,第1排是图像中典型边缘的示例;   第2排是沿第1排中水平虚线位置得到的图像水平方向的对应剖面图;   第3和第4排分别为剖面的一阶和二阶导数。   这里考虑了3种常见的边缘剖面:   在图 (a)中,对灰度值剖面的一阶导数在图像由暗变明的位置处有一个向上的阶跃,而在其他位置都为零。这表明可用一阶导数的幅度值来检测边缘的存在,幅度峰值一般对应边缘位置。对灰度值剖面的二阶导数在一阶导数的阶跃上升区间有一个向上的脉冲,而在一阶导数的阶跃下降区间有一个向下的脉冲。在这两个阶跃区间之间会有一个过零点,它的位置正对应原图像中边缘的位置。所以可用二阶导数的过零点检测边缘位置,而用二阶导数在过零点附近的符号确定边缘像素在图像边缘的暗区或明区。   在图(b)中,脉冲状的剖面边缘与图(a)所示的一阶导数形状相同,所以图 (b)所示的一阶导数形状与图 (a)所示的二阶导数形状相同,它的两个二阶导数过零点正好分别对应脉冲的上升沿和下降沿。通过检测脉冲剖面的两个二阶导数过零点就可确定脉冲的范围。对比前一种情况,可以看出直线段和边缘是不同的,需要用不同的检测方法。   在图 (c)中,屋顶状边缘的剖面可看作是将脉冲边缘底部拉开而得到的,所以它的一阶导数是将图 (b)所示的脉冲剖面的一阶导数的上升沿和下降沿分别拉伸开而得到的,而它的二阶导数是将脉冲剖面二阶导数的上升沿和下降沿拉开而得到的。通过检测屋顶状边缘剖面的一阶导数过零点可以确定屋顶的中心位置。   基于以上的讨论和检测原理,可采用许多不同的方式来检测边缘。在空域对边缘的检测常采用局部导数算子进行。下面分别对一阶导数算子和二阶导数算子进行介绍,然后讨论如何将检测出的边缘点连接成曲线或封闭轮廓并细化的技术。

相关百科
热门百科
首页
发表服务