CNN图像分类策略

在这篇文章中，作者展示了为什么最先进的深度神经网络仍能很好地识别乱码图像，探究其中原因有助于揭示DNN使用让人意想不到的简单策略，对自然图像进行分类。
在ICLR 2019一篇论文指出上述发现能够>
解决ImageNet比许多人想象的要简单得多,使我们能够构建更具解释性和透明度的图像分类pipeline,解释了现代CNN中观察到的一些现象，例如对纹理的偏见以及忽略了对象部分的空间排序,复古bag-of-features模型
在深度学习出现之前，自然图像中的对象识别过程相当粗暴简单：定义一组关键视觉特征，识别每个视觉特征在图像中的存在频率，然后根据这些数字对图像进行分类。这些模型被称为“特征包”模型。
举个例子，给定一个人眼和一个羽毛，我们想把图像分类为“人”和“鸟”两类。最简单的BoF模型工作流程是这样的：对于图像中的每只眼睛，它将“人类”的证据增加+1。反之亦然；对于图像中的每个羽毛，它将增加“鸟”的证据+1；无论什么类积累，图像中的大多数证据都是预测的。
这个最简单的BoF模型有一个很好的特性，是它的可解释性和透明的决策制定。我们可以准确地检查哪个图像特征携带了给定的类的证据，证据的空间整合是非常简单的，很容易理解模型如何做出决定。
传统的BoF模型在深度学习开始之前一直非常先进、非常流行。但由于其分类性能过低，而很快失宠。可是，我们怎么确定深度神经网络有没有使用与BoF模型截然不同的决策策略呢？,一个很深却可解释的BoF网络,为了测试这一点，研究人员将BoF模型的可解释性和透明度与DNN的性能结合起来。
将图像分割成小的q x q图像色块,通过DNN传递补丁以获取每个补丁的类证据,对所有补丁的证据求和，以达到图像级决策, CNN图像分类策略 (https://ic.work/) AI 人工智能第1张
BagNets的分类策略：对于每个补丁，我们使用DNN提取类证据并总结所有补丁的总类证据,为了以最简单和最有效的方式实现这一策略，我们采用标准的ResNet-50架构，用1x1卷积替换大多数3x3卷积。
在这种情况下，最后一个卷积层中的隐藏单元每个只“看到”图像的一小部分。
这就避免了对图像的显式分区，并且尽可能接近标准CNN，同时仍然实现概述的策略，我们称之为模型结构BagNet-q：其中q代表最顶层的感受域大小。BagNet-q的运行时间大约是ResNet-50的运行时间的2.5倍。
CNN图像分类策略 (https://ic.work/) AI 人工智能第2张
在ImageNet上具有不同贴片尺寸的BagNets的性能。
即使对于非常小的贴片尺寸，BagNet上的BagNets性能也令人印象深刻：尺寸为17 x 17像素的图像特征足以达到AlexNet级别的性能，而尺寸为33 x 33像素的特征足以达到约87％的前5精度。通过更仔细地放置3 x 3卷积和额外的超参数调整，可以实现更高的性能值。
这是我们得到的第一个重要结果：只需使用一组小图的特性即可解决ImageNet问题。对象形状或对象部分之间的关系等远程空间关系可以完全忽略，并且不需要解决任务。
BagNets的一大特色是他们透明的决策。例如，我们现在可以查看哪个图像特征对于给定的类最具预测性。

图像功能具有最多的类证据。我们展示了正确预测类的功能和预测错误类的分散注意力的功能,上图中，最上面的手指图像被识别成tench，因为这个类别中的大多数图像，都有一个渔民像举奖杯一样举起丁鱥。
同样，我们还得到一个精确定义的热图，显示图像的哪些部分促使神经网络做出某个决定。
CNN图像分类策略 (https://ic.work/) AI 人工智能第3张
来自BagNets的热图显示了确切的图像部分对决策的贡献。热图不是近似的，而是显示每个图像部分的真实贡献。
ResNet-50与BagNets惊人相似,BagNets表明，基于本地图像特征和对象类别之间的弱统计相关性，可以在ImageNet上达到高精度。
如果这就够了，为什么像ResNet-50这样的标准深网会学到任何根本不同的东西？如果丰富的本地图像特征足以解决任务，那为什么ResNet-50还需要了解复杂的大尺度关系？,为了验证现代DNN遵循与简单的特征包网络类似的策略的假设，我们在BagNets的以下“签名”上测试不同的ResNets，DenseNets和VGG>
决策对图像特征的空间改组是不变的,不同图像部分的修改应该是独立的,标准CNN和BagNets产生的错误应该类似,标准CNN和BagNets应对类似功能敏感,在所有四个实验中，我们发现CNN和BagNets之间的行为非常相似。例如，在上一个实验中，我们展示了BagNets最敏感的那些图像部分与CNN最敏感的那些基本相同。
实际上，BagNets的热图比由DeepLift等归因方法生成的热图,更好地预测了DenseNet-169的灵敏度。
当然，DNN并不完全类似于特征包模型，但确实显示出一些偏差。特别是，我们发现网络越深入，功能越来越大，远程依赖性也越来越大。
因此，更深层的神经网络确实改进了更简单的特征包模型，但我认为核心分类策略并没有真正改变。
解释CNN几个奇怪的现象,将CNN的决策视为一种BoF策略，可以解释有关CNN的几个奇怪的观察。首先，它将解释为什么CNN具有如此强烈的纹理偏差；其次，它可以解释为什么CNN对图像部分的混乱如此不敏感；甚至可以解释一般的对抗性贴纸和对抗性扰动的存在，比如人们在图像中的任何地方放置误导信号，并且无论这些信号是否适合图像的其余部分，CNN仍然可以可靠地接收信号。
我们的成果显示，CNN利用自然图像中存在的许多弱统计规律进行分类，并且不会像人类一样跳向图像部分的对象级整合。其他任务和感官方式也是如此。
我们必须认真思考如何构建架构、任务和学习方法，以抵消这种弱统计相关性的趋势。一种方式，是将CNN的归纳偏差从小的局部特征改善为更全局的特征；另一种方式，是删除、或替换网络不应该依赖的那些特征。
然而，最大的问题之一当然是图像分类本身的任务：如果局部图像特征足以解决任务，也就不需要去学习自然界的真实“物理学”，这样我们就必须重构任务，推着模型去学习对象的物理本质。
这样就很可能需要跳出纯粹只通过观察学习，获得输入和输出特征之间相关性的方式，以便允许模型提取因果依赖性。
总结,总之，我们的结果表明CNN可能遵循极其简单的分类策略。科学家认为这个发现可能在2019继续成为关注的焦点，凸显了我们对深度神经网络的内部运作了解甚少。
缺乏理解使我们无法从根本上发展出更好的模型和架构，来缩小人与机器之间的差距。深化我们的理解，将使我们能够找到弥合这一差距的方法。
这将带来异常丰厚的回报：当我们试图将CNN偏向物体的更多物理特性时，我们突然达到了接近人类的噪声稳健性。
我们继续期待在2019年，在这一领域上会出现更多令人兴奋的结果，获得真正了解了真实世界中，物理和因果性质的卷积神经网络。

CNN图像分类策略

相关推荐

伟测集成电路芯片测试基地竣工，晶圆级与成品测试项目全面启动。

俄罗斯光刻机突破，350nm技术成功实现，引领科技新篇章。

中国团队突破，全可编程拓扑光子芯片研制成功，引领科技新潮流。

上海新政力推人工智能、算力芯片，科技新风向，不容错过！

美国拟限AI大模型出口，全球科技格局生变，速览最新动态！

博世2024传感器新品：SCS智能互联与两大创新系列，引领行业变革。

OpenAI发布AI图片检测工具，准确率98%，并研发AI音频水印，引领新潮流。

AI医院小镇登陆清华，AI医生超人类，数天诊治万人，快来体验未来医疗！

谷歌AlphaFold 3预测生命分子，登Nature，免费开放，加速科研亿年！

OpenAI掌门人谈AI：末日说夸张，对技术革命持乐观审慎态度。

推荐

VCSEL芯片和光学解决方案提供商瑞识科技完成近亿元B1轮融资

一文带你搞懂开关电源电路

基于脱硝系统改造的自动化优化分析

阿诗特能源L1000液冷新品震撼上市，卓越性能，引领未来！

博世与芯驰科技全面深化战略合作围绕车用半导体核心技术

PLL锁相环：工作原理简述，高效同步控制的核心技术。

中科曙光助力北京航天总医院打造24小时在线的AI医疗助手

国产替代奋进高端，创新引领，开启替代新篇章。

模拟芯片与数字芯片各有独特优势，各具魅力，吸引你的目光。

本征半导体，基础材料之选，了解它，掌握电子世界的关键！

最近更新

征程6P全球首发！HSD炸裂登场，地平线携手奇瑞发布首款量产车型

你了解AVB传输协议吗？AVB传输协议对数据流的3个定义

一文详解时序约束是如何影响数字系统的

你了解HBM高带宽内存吗？你了解HBM3吗？

盘点数组和指针的主要区别

详解高速电路中的电阻端接作用

TrendForce集邦咨询: 国际形势变化带动拉货潮，预估2Q25存储器合约价涨幅将扩大

你了解CXL技术吗？CXL技术和其它技术有何不同？

实现CXL技术面临哪些挑战？CXL.io/PCIe通信开销分析

怎样选择合适的示波器？

CNN图像分类策略

相关推荐

推荐

VCSEL芯片和光学解决方案提供商瑞识科技完成近亿元B1轮融资

一文带你搞懂开关电源电路

基于脱硝系统改造的自动化优化分析

阿诗特能源L1000液冷新品震撼上市，卓越性能，引领未来！

博世与芯驰科技全面深化战略合作 围绕车用半导体核心技术

PLL锁相环：工作原理简述，高效同步控制的核心技术。

中科曙光助力北京航天总医院打造24小时在线的AI医疗助手

国产替代奋进高端，创新引领，开启替代新篇章。

模拟芯片与数字芯片各有独特优势，各具魅力，吸引你的目光。

本征半导体，基础材料之选，了解它，掌握电子世界的关键！

最近更新

征程6P全球首发！HSD炸裂登场，地平线携手奇瑞发布首款量产车型

你了解AVB传输协议吗？AVB传输协议对数据流的3个定义

一文详解时序约束是如何影响数字系统的

你了解HBM高带宽内存吗？你了解HBM3吗？

盘点数组和指针的主要区别

详解高速电路中的电阻端接作用

TrendForce集邦咨询: 国际形势变化带动拉货潮，预估2Q25存储器合约价涨幅将扩大

你了解CXL技术吗？CXL技术和其它技术有何不同？

实现CXL技术面临哪些挑战？CXL.io/PCIe通信开销分析

怎样选择合适的示波器？

博世与芯驰科技全面深化战略合作围绕车用半导体核心技术