一图看完深度学习架构谱系--粉丝服务平台-粉丝头条-fensifuwu.com

一图看完深度学习架构谱系

日期： 2023-03-04 12:58:03 来源：书圈收集编辑：

点击图片，查看会议报名详情

完整图

记忆网络

在记忆网络分支中，hunkim 标注了三篇重要论文：《记忆网络》、《端到端记忆网络》、《DMN：动态记忆网络》。神经编程是记忆网络的下一级分支，包含神经图灵机、混合计算等论文。

卷积神经网络（CNN）

如下所示，CNN 除了包含执行目标识别任务的 AlexNet 等深度卷积网络，还包括很多优秀的模型用于处理目标检测、语义分割和超分辨率等任务。它们以不同的方式应用卷积过程处理不同的任务，并在这些任务上产生了非常好的效果。从基本上来说，卷积相对于最初的全连接网络有很多优秀的属性，例如它只和上一层神经元产生部分的连接，同一个卷积核可以在输入张量上重复使用，也就是说特征检测器可以在输入图像上重复检测是否有该局部特征。这是卷积网络十分优秀的属性，它大大减少了两层间参数的数量。

基于这些基础的卷积特性，我们可以构建不同的卷积模型处理不同的任务。以下是卷积网络的主要模型与领域：

循环神经网络（RNN）

循环神经网络（recurrent neural network）是深度学习的重要组成部分，它可以让神经网络处理诸如文本、音频和视频等序列数据。它们可用来做序列的高层语义理解、序列标记，甚至可以从一个片段生产新的序列。目前有很多人工智能应用都依赖于循环深度神经网络，在谷歌（语音搜索）、百度（DeepSpeech）和亚马逊的产品中都能看到 RNN 的身影。

基本的 RNN 结构难以处理长序列，然而一种特殊的 RNN 变种即「长短时记忆（LSTM）」网络可以很好地处理长序列问题。这种模型能力强大，在翻译、语音识别和图像描述等众多任务中均取得里程碑式的效果。因而，循环神经网络在最近几年得到了广泛使用。

Capsule Net

Capsule 是由深度学习先驱 Geoffrey Hinton 等人提出的新一代神经网络形式，旨在修正反向传播机制。在 Dynamic Routing Between Capsules 论文中，Geoffrey Hinton 这样介绍 Capsule：「Capsule 是一组神经元，其输入输出向量表示特定实体类型的实例化参数（即特定物体、概念实体等出现的概率与某些属性）。我们使用输入输出向量的长度表征实体存在的概率，向量的方向表示实例化参数（即实体的某些图形属性）。同一层级的 capsule 通过变换矩阵对更高级别的 capsule 的实例化参数进行预测。当多个预测一致时（本论文使用动态路由使预测一致），更高级别的 capsule 将变得活跃。」

Capsule 中神经元的激活情况表示了图像中存在的特定实体的各种性质。这些性质可以包含多种不同的参数，例如姿势（位置、大小、方向）、变形、速度、反射率、色彩、纹理等。而输入输出向量的长度表示了某个实体出现的概率，所以它的值必须在 0 到 1 之间。

机器之心也详细解读了上周 Hinton 公开的论文，这篇论文的亮点在于 Capsule 层的输入与输出都是向量，构建向量的过程可以认为是 PrimaryCaps 层利用 8 个标准的 Conv2D 操作产生一个长度为 8 个元素的向量，因此每一个 Capsule 单元就相当于 8 个卷积单元的组合。此外，在 Capsule 层中，Hinton 等人还使用了动态路由机制，这种更新耦合系数（coupling coefﬁcients）的方法并不需要使用反向传播机制。

除了 Hinton 等人公布的 Capsule 论文以外，近日还有一篇 MATRIX CAPSULES WITH EM ROUTING 论文，该论文采用 EM Routing 修正原论文的 dynamic routing 从而实现更好的效果。

生成模型

人工智能研究的最大难题之一是无监督学习（unsupervised learning），而面向无监督学习的深度学习方法以学习表征（learning representation）问题为核心，不同的算法都会定义一个目标函数，该目标函数可以让该学习器获取到其数据表征的关键方面以及一个可以表征数据的新空间。深度生成模型可以通过生成全新的样本来演示其对于数据的理解，尽管这些生成的样本非常类似于那些训练样本。许多这样的模型和之前的自编码器的思想有关，其有一个编码器函数将数据映射到表征，还有一个解码器函数（或生成器）将该抽象的表征映射到原始数据空间。此外，生成模型很多也应用到了 GAN 的思想，即通过判别器与生成器之间的对抗促使生成器生成非常真实的图像。

在变分自编码器中，我们需要通过样本训练一个编码器和解码器，在这过程中我们能得到中间的隐藏变量。若我们需要生成新的图像，那么只需要在隐藏变量采样并投入解码器就能完成生成。而在生成对抗网络中，我们会定义一个判别模型与生成模型。首先我们会将生成的样本混合真实样本投递给判别模型以训练其鉴别真假的能力，随后再固定判别模型并训练生成模型，以生成更真实的图像。

|Github 项目地址：https://github.com//hunkim/deep_architecture_genealogy

文章源自：网络，版权归原作者所有，如有侵权，请联系删除

服务粉丝

一图看完深度学习架构谱系

完整图

记忆网络

卷积神经网络（CNN）

循环神经网络（RNN）

Capsule Net

生成模型

文章推荐

相关阅读

ChatGPT是怎么变得这么强的？拆解追溯ChatGPT各项能力的起源

NeurIPS 2022 | DIST: 少学点反而更好！商汤开源松弛知识蒸馏方法

视觉RLHF要来了？谷歌复用30年前经典算法，CV引入强化学习

对话式AI搜索的技术路线猜想

ICLR 2023 | Batch Norm层等暴露TTA短板，开放环境下解决方案来了

为什么ChatGPT仿如十万个为什么回答机？

AIGC行业深度报告：ChatGPT-百度文心一言畅想

重磅！ChatGPT官方API发布：输出100万词只要2.7美金，成本砍掉90%

比 ChatGPT 更早发布的微信大语言模型，现在什么水平？

【芯品动态】SmartFactory AI新品首发，助力晶圆厂建立独特的竞争优势

聚合标签

热门文章

百元茅台没人买，千元茅台有人追。十年前，有人花百元买了一万股茅台，后出手追中石油，如今，茅台一飞冲天，中石油深套十年。炒股，不要见异思迁，价值投资是首选。#股票#

谁说定期存款提前支取不划算？存中原银行“惠农宝”放心随便取

张小龙:交了8千万税无北京户籍孩子连私立也不让上

万字详解：ROE连续十年超过20的明星公司全面分析（附：详细名单）

“复活”半年后　京东拍拍二手杀入公益事业

离职时没有做满一个月，公司还需要帮纳当月社保吗？

最新文章

新书推荐 │ Python漫游数学王国——高等数学、线性代数、数理统计及运筹学

涉及17个行业！锐普给顶尖公司做的介绍PPT都在这儿了！

一图看完深度学习架构谱系

重要突破：我国成功研制光晶体管

写给初学Java的同学们

报名 | 高校计算机网络课程研修班（3月25日-26日，南京）