服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

AutoML并非全能神器!新综述爆火,网友:了解深度学习现状必读

日期: 来源:量子位收集编辑:量子位

羿阁 萧箫 发自 凹非寺量子位 | 公众号 QbitAI

如今深度学习模型开发已经非常成熟,进入大规模应用阶段。

然而,在设计模型时,不可避免地会经历迭代这一过程,它也正是造成模型设计复杂、成本巨高的核心原因,此前通常由经验丰富的工程师来完成。

之所以迭代过程如此“烧金”,是因为在这一过程中,面临大量的开放性问题(open problems)。

这些开放性问题究竟会出现在哪些地方?又要如何解决、能否并行化解决?

现在一篇论文综述终于对此做出介绍,发出后立刻在网上爆火。

作者严谨地参考了接近300篇文献,对大量应用深度学习中的开放问题进行分析,力求让读者一文了解该领域最新趋势。

网友们纷纷在评论区留言“码住”、“了解深度学习领域现状必读”。

一起来看看内容。

这篇论文要研究什么?

众所周知,当我们拿到一个机器学习问题时,通常处理的流程分为以下几步:收集数据、编写模型、训练模型、评估模型、迭代、测试、产品化。

在这篇论文中,作者把上述这些流程比作一个双层次的最佳化问题。

内层优化回路需要最小化衡量模型效果评估的损失函数,背后是为了寻求最佳模型参数而进行的深入研究的训练过程。

而外层优化回路的研究较少,包括最大化一个适当选择的性能指标来评估验证数据,这正是我们所说的“迭代过程”,也就是追求最优模型超参数的过程。

论文中用数学符号表示如下:

其中,Mval表示一个性能指标,如精度,平均精度等。Ltrain表示损失函数,w表示模型参数。

这样一来,仅用一个清晰统一的数学公式就能解释迭代的步骤。

不过,值得注意的是,面对不同的问题,它的解也需要特定分析,有时候情况甚至会非常复杂。

例如,评估度量Mval是一个离散且不可微的函数。它并未被很好地定义,有时候甚至在某些自我监督式和非监督式学习以及生成模型问题中不存在。

同时,你也可能设计了一个非常好的损失函数Ltrain,结果发现它是离散或不可微的,这种情况下它会变得非常棘手,需要用特定方法加以解决。

因此,本篇论文的研究重点就是迭代过程中遇到的各种开放性问题,以及这些问题中可以并行解决优化的部分案例。

开放性问题,不能那么轻易地只用一个简单的“是”、“不是”或者其他一个简单的词或数字来回答的问题。

机器学习中开放问题有哪些?

论文将开放性问题类型分为监督学习和其他方法两大类。

值得一提的是,无论是监督学习还是其他方法,作者都贴心地附上了对应的教程地址:

如果对概念本身还不了解的话,点击就能直接学到他教授的视频课程,不用担心有困惑的地方。

首先来看看监督学习。

这里我们不得不提到AutoML。作为一种用来降低开发过程中迭代复杂度的“偷懒”方法,它目前在机器学习中已经应用广泛了。

通常来说,AutoML更侧重于在监督学习方法中的应用,尤其是图像分类问题。

毕竟图像分类可以明确采用精度作为评估指标,使用AutoML非常方便。

但如果同时考虑多个因素,尤其是包括计算效率在内,这些方法是否还能进一步被优化?

在这种情况下,如何提升性能就成为了一类开放性问题,具体又分为以下几类:

大模型、小模型、模型鲁棒性、可解释AI、迁移学习、语义分割、超分辨率&降噪&着色、姿态估计、光流&深度估计、目标检测、人脸识别&检测、视频&3D模型等。

这些不同的领域也面临不同的开放性问题。

例如大模型中的学习率并非常数、而是函数,会成为开放问题之一,相比之下小模型却更考虑性能和内存(或计算效率)的权衡这种开放性问题。

其中,小模型通常会应用到物联网、智能手机这种小型设备中,相比大模型需求算力更低。

又例如对于目标检测这样的模型而言,如何优化不同目标之间检测的准确度,同样是一种复杂的开放性问题。

在这些开放性问题中,有不少可以通过并行方式解决。如在迁移学习中,迭代时学习到的特征会对下游任务可泛化性和可迁移性同时产生什么影响,就是一个可以并行研究的过程。

同时,并行处理开放性问题面临的难度也不一样。

例如基于3D点云数据同时施行目标识别、检测和语义分割,比基于2D图像的目标识别、检测和分割任务更具挑战性。

再来看看监督学习以外的其他方法,具体又分为这几类:

自然语言处理(NLP)、多模态学习、生成网络、域适应、少样本学习、半监督&自监督学习、语音模型、强化学习、物理知识学习等。

以自然语言处理为例,其中的多任务学习会给模型带来新的开放性问题。

像经典的BERT模型,本身不具备翻译能力,因此为了同时提升多种下游任务性能指标,研究者们需要权衡各种目标函数之间的结果。

又如生成模型中的CGAN(条件GAN),其中像图像到图像翻译问题,即将一张图片转换为另一张图片的过程。

这一过程要求将多个独立损失函数进行加权组合,并让总损失函数最小化,就又是一个开放性问题。

其他不同的问题和模型,也分别都会在特定应用上遇到不同类型的开放性问题,因此具体问题依旧得具体分析。

经过对各类机器学习领域进行分析后,作者得出了自己的一些看法。

一方面,AI表面上是一种“自动化”的过程,从大量数据中产生自己的理解,然而这其中其实涉及大量的人为操作,有不少甚至是重复行为,这被称之为“迭代过程”。

另一方面,这些工作虽然能部分通过AutoML精简,然而AutoML目前只在图像分类中有较好的表现,并不意味着它在其他领域任务中会取得成功。

总而言之,应用深度学习中的开放性问题,依旧比许多人想象得要更为复杂。

作者介绍

本篇论文的作者为Maziar Raissi,目前在科罗拉多大学博德分校应用数学系担任助理教授。

Raissi在马里兰大学帕克分校获得了应用数学和统计学博士学位,并在布朗大学应用数学系完成了博士后研究,有过在英伟达做高级软件工程师的工作经历。

研究方向是概率机器学习、深度学习和数据驱动的科学计算的交叉点,以及大数据分析、经济学和金融学等等。

论文地址如下,感兴趣的小伙伴们可以自取~

论文地址:https://arxiv.org/abs/2301.11316

相关阅读

  • 20人!被云南省纪委监委通报曝光

  • 2月7日以来,云南省纪委省监委连续五批对20起粮食购销领域腐败问题典型案例进行通报曝光,涉及省内怒江、玉溪、大理、德宏、红河、昆明、文山、临沧、昭通、曲靖、普洱等11个市
  • ChatGPT会是大模型商业化的火炬吗?

  • ChatGPT走红的速度,显然超过了许多人的预期。即使是在中文互联网上,和ChatGPT有关的报道、讨论,早已超过了其他科技概念,甚至萌生出了“ChatGPT概念股”的说法,不少与AI、大模型
  • 瑞源名嘉康城新房窗户漏风 开发商承认工艺有问题

  • 信网2月12日讯(记者 李鑫邦)新房没过多久,房间的窗户就发生漏风的情况,家在西海岸新区瑞源名嘉康城的卢先生最近有点烦,只能暂时沿着窗户缝隙用胶带粘起来,可这种“治标不治本”的
  • 青海省200项省级重点项目完成投资1173亿元

  •   2月8日,记者从青海省发展和改革委员会获悉,2022年,省发展改革委把抓项目促投资作为稳经济大盘的重中之重,聚力推动稳住经济一揽子政策措施落实,全力以赴抓重点、稳大局、补短
  • 被玩坏的ChatGPT,商业巨幕拉开仍有隐忧

  • 能写论文、编写代码,还能写诗,近日,ChatGPT火爆全球,也刷屏了许多人的朋友圈。根据UBS发布的研究报告显示,ChatGPT在1月份的月活跃用户数已达1亿,成为史上用户数增长最快的消费者
  • ChatGPT走红,中国人工智能还差多远

  • 在众多科幻作品里,人工智能无一例外都是走上解放人类、取代人类、消灭人类的三步曲。但现实生活中,人工智能的发展几乎以5到10年为一个单位,见证着人类创造同伴的艰辛。在科技

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 新疆雪地赛马争霸赛在昭苏县激情开赛

  •  2月11日上午,自治区首届冬季运动会新疆雪地赛马争霸赛在昭苏县天马旅游文化园激情开赛,来自全疆各地的56名运动员参加比赛。  记者 加木布拉提·马那尔别克 阿尔曼·热扎
  • 预防HRSV病毒感染!中疾控提醒

  • 近期全国新冠感染疫情日趋平稳总体向好态势持续巩固专家提醒冬春季节是各类呼吸道传染病的高发季除了新冠病毒一些其他病原体也会攻击人体的呼吸道和肺部如流感病毒及人呼吸
  • 严重违法!黄权被开除公职

  • 广东省茂名市原副市长黄权严重违法被开除公职据广东省纪委监委消息:日前,经广东省委批准,广东省监委对广东省茂名市原副市长黄权严重违法问题进行了立案调查。经查,黄权无视中央
  • 小学生拿菜刀砍父亲?场面惊心!

  • 2月11日 “男孩手机被收拎菜刀威胁父亲”登上某平台热搜 小学生拎菜刀威胁父亲目击者:不让玩手机引发矛盾 据媒体报道 广西一名男孩因父亲不让自己玩手机情绪激动对父亲“拔