服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

一图看完深度学习架构谱系

日期: 来源:书圈收集编辑:


 点击图片,查看会议报名详情


 

完整图

 

记忆网络

在记忆网络分支中,hunkim 标注了三篇重要论文:《记忆网络》、《端到端记忆网络》、《DMN:动态记忆网络》。神经编程是记忆网络的下一级分支,包含神经图灵机、混合计算等论文。 


卷积神经网络(CNN)

如下所示,CNN 除了包含执行目标识别任务的 AlexNet 等深度卷积网络,还包括很多优秀的模型用于处理目标检测、语义分割和超分辨率等任务。它们以不同的方式应用卷积过程处理不同的任务,并在这些任务上产生了非常好的效果。从基本上来说,卷积相对于最初的全连接网络有很多优秀的属性,例如它只和上一层神经元产生部分的连接,同一个卷积核可以在输入张量上重复使用,也就是说特征检测器可以在输入图像上重复检测是否有该局部特征。这是卷积网络十分优秀的属性,它大大减少了两层间参数的数量。
 
基于这些基础的卷积特性,我们可以构建不同的卷积模型处理不同的任务。以下是卷积网络的主要模型与领域:


循环神经网络(RNN)

循环神经网络(recurrent neural network)是深度学习的重要组成部分,它可以让神经网络处理诸如文本、音频和视频等序列数据。它们可用来做序列的高层语义理解、序列标记,甚至可以从一个片段生产新的序列。目前有很多人工智能应用都依赖于循环深度神经网络,在谷歌(语音搜索)、百度(DeepSpeech)和亚马逊的产品中都能看到 RNN 的身影。
 
基本的 RNN 结构难以处理长序列,然而一种特殊的 RNN 变种即「长短时记忆(LSTM)」网络可以很好地处理长序列问题。这种模型能力强大,在翻译、语音识别和图像描述等众多任务中均取得里程碑式的效果。因而,循环神经网络在最近几年得到了广泛使用。

Capsule Net

Capsule 是由深度学习先驱 Geoffrey Hinton 等人提出的新一代神经网络形式,旨在修正反向传播机制。在 Dynamic Routing Between Capsules 论文中,Geoffrey Hinton 这样介绍 Capsule:「Capsule 是一组神经元,其输入输出向量表示特定实体类型的实例化参数(即特定物体、概念实体等出现的概率与某些属性)。我们使用输入输出向量的长度表征实体存在的概率,向量的方向表示实例化参数(即实体的某些图形属性)。同一层级的 capsule 通过变换矩阵对更高级别的 capsule 的实例化参数进行预测。当多个预测一致时(本论文使用动态路由使预测一致),更高级别的 capsule 将变得活跃。」
Capsule 中神经元的激活情况表示了图像中存在的特定实体的各种性质。这些性质可以包含多种不同的参数,例如姿势(位置、大小、方向)、变形、速度、反射率、色彩、纹理等。而输入输出向量的长度表示了某个实体出现的概率,所以它的值必须在 0 到 1 之间。
 
机器之心也详细解读了上周 Hinton 公开的论文,这篇论文的亮点在于 Capsule 层的输入与输出都是向量,构建向量的过程可以认为是 PrimaryCaps 层利用 8 个标准的 Conv2D 操作产生一个长度为 8 个元素的向量,因此每一个 Capsule 单元就相当于 8 个卷积单元的组合。此外,在 Capsule 层中,Hinton 等人还使用了动态路由机制,这种更新耦合系数(coupling coefficients)的方法并不需要使用反向传播机制。
 
除了 Hinton 等人公布的 Capsule 论文以外,近日还有一篇 MATRIX CAPSULES WITH EM ROUTING 论文,该论文采用 EM Routing 修正原论文的 dynamic routing 从而实现更好的效果。

生成模型 

人工智能研究的最大难题之一是无监督学习(unsupervised learning),而面向无监督学习的深度学习方法以学习表征(learning representation)问题为核心,不同的算法都会定义一个目标函数,该目标函数可以让该学习器获取到其数据表征的关键方面以及一个可以表征数据的新空间。深度生成模型可以通过生成全新的样本来演示其对于数据的理解,尽管这些生成的样本非常类似于那些训练样本。许多这样的模型和之前的自编码器的思想有关,其有一个编码器函数将数据映射到表征,还有一个解码器函数(或生成器)将该抽象的表征映射到原始数据空间。此外,生成模型很多也应用到了 GAN 的思想,即通过判别器与生成器之间的对抗促使生成器生成非常真实的图像。
 

在变分自编码器中,我们需要通过样本训练一个编码器和解码器,在这过程中我们能得到中间的隐藏变量。若我们需要生成新的图像,那么只需要在隐藏变量采样并投入解码器就能完成生成。而在生成对抗网络中,我们会定义一个判别模型与生成模型。首先我们会将生成的样本混合真实样本投递给判别模型以训练其鉴别真假的能力,随后再固定判别模型并训练生成模型,以生成更真实的图像。


|Github 项目地址:https://github.com//hunkim/deep_architecture_genealogy
文章源自:网络,版权归原作者所有,如有侵权,请联系删除



相关阅读

  • 对话式AI搜索的技术路线猜想

  • ©作者 | 李忠利单位 | 腾讯研究方向 | 语义理解、文本纠错等ChatGPT 真是火爆全网了,铺天盖地的文章一个接一个。最近我老爹都来问我:“你的工作是不是跟那一串英文字母有关
  • 为什么ChatGPT仿如十万个为什么回答机?

  • 加星标,才能不错过每日推送!方法见文末动图近日人工智能ChatGPT火爆全球,各路吃瓜人士纷纷晒出与它的对话,有些回答令人拍案叫绝,也有一本正经的胡说八道;还有人用其辅佐文案写作
  • AIGC行业深度报告:ChatGPT-百度文心一言畅想

  • 《侠说》:新电商,商业智能,房产/金融需要下载报告的朋友,可扫下方二维码付费成为会员,侠说智库已含2.5万+份报告,5000+会员,下载不限制,基本保存日更新。文末加微可免费入群交流~➤~

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 一图看完深度学习架构谱系

  • 点击图片,查看会议报名详情 完整图 记忆网络在记忆网络分支中,hunkim 标注了三篇重要论文:《记忆网络》、《端到端记忆网络》、《DMN:动态记忆网络》。神经编程是记忆网络的下
  • 写给初学Java的同学们

  • 耿老师教授Java程序20多年,多少有些教学经验和从学生那里学懂的什么叫不懂。这里写点文字,算是给初学者的一点参考建议吧。主要内容 五大模块学习介绍 后续主要课程