微美全息科学院：一种用于图像分类的抗噪声干扰的卷积神经网络--粉丝服务平台-粉丝头条-fensifuwu.com

微美全息科学院：一种用于图像分类的抗噪声干扰的卷积神经网络

科技 08-24 来源： WiMi微美全息

图像被噪声破坏会影响卷积神经网络（CNN）的性能。在预处理过程中，经常会对噪声图像进行恢复，能提升CNN的分类性能。然而，由于噪声的高密度，噪声图像可能在预处理步骤中不能完全恢复，因此会对CNN的学习和验证产生负面影响。此外，去除噪声的预处理是一个昂贵和耗时的过程。因此，一种用于噪声图像分类的抗噪声鲁棒性卷积神经网络(NR-CNN)被提出，它不需要进行去噪的预处理。这种方法对各种类型的噪声具有鲁棒性，如脉冲噪声、缺失的图像样本、图像传输中的丢包、损坏图像和篡改图像。这种NR-CNN通过添加一个噪声图层和自适应调整大小层来修改基本卷积神经网络的体系结构，实现对噪声的鲁棒性，并考虑了在NR-CNN不同分量中噪声图像的分类。作为纳斯达克上市企业“微美全息US.WIMI”旗下研究机构“微美全息科学院”的科学家们大量的实验证明了该NR-CNN在噪声图像分类中的有效性。

卷积层、池化层和全连接层是卷积神经网络的主要组成部分。卷积层由几个包含特征图的卷积核收集。对于分类问题，softmax函数通常应用于输出层(CNN的最后一层)。用于分类的CNN参数的最优值(如权向量和偏差项)可以通过最小化损失函数来实现。接下来介绍NR-CNN的组成部分。

1.噪声图层

该NR-CNN有一个放置在NR-CNN开始地方的噪声图层，该图层可用于检测脉冲噪声、缺失的图像样本、图像传输丢包、损坏图像、篡改图像。噪声图层检测各种类型的噪声，并为每个图像产生一个的噪声层来表示有噪声和未损坏的图像。噪声图层的结构如图1所示。

图1.噪声图层的架构

从图1可以看出，脉冲噪声是通过局部一致性索引方法检测。图像传输中的丢包基于图像内容进行检测。此外，缺失的图像样本用目标区域进行检测，受损图像使用统计方法检测，篡改的图像使用图像身份验证方法进行检测。

在所提方法中，为了增强CNN对噪声的鲁棒性，在前面的步骤中为每个图像生成一个基于噪声类型的噪声图。如图2所示，每幅图像包含四个通道：噪声图通道，红色通道，蓝色通道和绿色通道。因此，图像是通过四个通道传送给CNN的。在基于噪声图的训练过程中，NR-CNN学习处理噪声像素。

图2.每个图像有四个通道。

2.自适应调整层

卷积神经网络通常从卷积层开始。CNN的输入图像一般有一个固定的大小（即244*244)。因此，图像的维度比CNN的尺度要大时，应该减小其维度。在NR-CNN中，一个新的层（称为自适应调整大小层）被放置在CNN以增加网络对噪声的鲁棒性。自适应调整大小层的任务是提高用于较大图像的降维方法。在利用噪声图从几个像素中选取一个像素来减小图像尺寸时，噪声像素被移除，利用剩下的像素实现降维处理。自适应调整层使噪声像素不参与在CNN输入图像的降维过程中。具有自适应调整大小层的CNN的开始部分如图3所示。

图3.具有自适应调整层的CNN的开始部分

3.对噪声的自适应卷积层

卷积层参数包括一组可学习的滤波器。在NR-CNN中，通过自适应滤波为CNN对噪音的鲁棒性提供了一种有效的方法，从而实现了对CNN卷积层结构的改进。

3.1自适应滤波

该方法通过丢弃卷积的源和核之间的噪声连接，减小噪声对CNN的影响。自适应滤波基于CNN中那些能提高分类精度的像素值，来执行丢弃噪声连接。丢弃噪音连接能阻止输入的噪声像素进入到下一层。这种丢弃噪声连接的方法可用于不同的卷积核尺寸。值得一提的是，噪声图在每一层都会更新。

3.2自适应步幅

这里提出的自适应步幅在算法1中进行了描述，提高了噪声图像的分类精度。

算法1：

1制作一个位矩阵作为步幅图

2在每个步幅中标记所选像素

3匹配噪声图和步幅图，检测噪声像素

4将滤波器的位置从有噪声的区域更改为最接近w*w的未损坏的区域

修正自适应步幅图可以使噪声像素在分类过程中不被考虑。如图4所示，噪声图与步幅图最初是匹配在一起的，然后执行步幅操作。w*w是搜索找到用于改变过滤器位置的最近的未损坏位置的区域。

图4.基于噪声图的CNN自适应步长。有噪声的像素用黑色表示。

此后，再经过针对噪声的自适应池化层和基于噪声图的数据增广等过程。

总结

我们可以将NR-CNN的优点总结为如下:

1.该方法可同时用于CNN对几种类型噪音的鲁棒性分析。具有不同噪声类型的图像只需要该NR-CNN处理一次。

2.该NR-CNN无需噪声图像恢复的预处理，并能在训练阶段加速这些图像的分类。

3.该NR-CNN的性能优于其他噪声图像的分类方法。

微美全息科学院成立于2020年8月，致力于全息AI视觉探索科技未知，以人类愿景为驱动力，开展基础科学和创新性技术研究。全息科学创新中心致力于全息AI视觉探索科技未知, 吸引、集聚、整合全球相关资源和优势力量，推进以科技创新为核心的全面创新，开展基础科学和创新性技术研究。微美全息科学院计划在以下范畴拓展对未来世界的科学研究：

一、全息计算科学：脑机全息计算、量子全息计算、光电全息计算、中微子全息计算、生物全息计算、磁浮全息计算

二、全息通信科学：脑机全息通信、量子全息通信、暗物质全息通信、真空全息通信、光电全息通信、磁浮全息通信

三、微集成科学：脑机微集成、中微子微集成、生物微集成、光电微集成、量子微集成、磁浮微集成

四、全息云科学：脑机全息云、量子全息云、光电全息云

微美全息科学院旨在促进计算机科学和全息、量子计算等相关领域面向实际行业场景和未来世界的前沿研究。建立产研合作平台，促进重大科技创新应用，打造产业、研究中心深度融合的生态圈。微美全息科学院秉承“让有人的地方就有科技”为使命，专注未来世界的全息科学研究，为全球人类科技进步添砖加瓦。

微美全息成立于2015年，纳斯达克股票代码：WiMi。

微美全息专注于全息云服务，主要聚集在车载AR全息HUD、3D全息脉冲LiDAR、头戴光场全息设备、全息半导体、全息云软件、全息汽车导航、元宇宙全息AR/VR设备、元宇宙全息云软件等专业领域,覆盖从全息车载AR技术、3D全息脉冲LiDAR技术、全息视觉半导体技术、全息软件开发、全息AR虚拟广告技术、全息AR虚拟娱乐技术、全息ARSDK支付、互动全息虚拟通讯、元宇宙全息AR技术，元宇宙虚拟云服务等全息AR技术的多个环节，是一家全息云综合技术方案提供商。