服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

ICLR 2023 | 微软提出自动化模型训练剪枝框架OTO,一站式获得轻量级架构

日期: 来源:PaperWeekly收集编辑:陈天翼

©PaperWeekly 原创 · 作者 | 陈天翼
单位 | 微软
研究方向 | 模型压缩


大型神经网络 DNN 对资源的巨大需求限制了其在现实世界的部署,如何在尽可能小地损失性能的前提下,压缩神经网络是 DNN 产品化的关键。


剪枝是最常见的 DNN 压缩方法之一,旨在减少冗余结构,给 DNN 模型瘦身的同时保持模型性能。然而,现有的剪枝方法通常指针对特定模型,特定任务,并需要 AI 工程师投入大量的工程和时间精力来应用这些方法到自己的任务上。

为了解决这些问题,微软团队提出了 OTOv2 框架,并发表于 ICLR 2023。OTOv2 是业内首个自动化一站式用户友好,且通用的神经网络训练与结构压缩框架。通过使用 OTOv2,AI 工程师可以非常方便地训练目标神经网络,一站式地取得高性能且轻量化的模型。OTOv2 最小化了开发者额外的工程时间精力的投入,且全程无需现有方法通常需要的非常耗时的预训练和额外的模型微调。

论文链接:
https://openreview.net/pdf?id=7ynoX1ojPMt

代码链接:

https://github.com/tianyic/only_train_once




该研究的主要贡献概括如下:


1. 一站式自动化神经网络结构剪枝架构。研究者提出了一个名为 OTOv2(Only-Train-Once)的 one-shot 训练和剪枝框架。它可以将一个完整的神经网络压缩为轻量级网络,同时保持较高的性能。OTO 大大简化了现有剪枝方法复杂的多阶段流程,适合各种架构和应用,且最小化了用户的额外工程投入,因具有通用性,有效性和易用性。

2. 自动化 Zero-Invariant Groups(零不变组)分组。由于网络结构的复杂性和关联性,删去任意网络结构可能会导致剩余的网络结构无效。因此自动化网络结构压缩的一个最大的问题之一是如何找到必须要被一起剪枝的模型参数,使得余下的网络依然有效。


为了解决该问题,研究者提出神经网络的可移除单元和零不变组 Zero-Invariant Groups(ZIGs)。零不变组可以理解为一类最小的可移除单元,使得该组对应的网络结构移除后剩余网络依然有效。研究者进一步提出并实现了一套自动化算法来解决通用网络的 ZIGs 分组问题。

3. 双半平面投影梯度优化算法(DHSPG)。接下来的模型训练和剪枝需要找出冗余的和重要的零不变组。这个问题可以归纳为一个结构稀疏化问题,研究者提出 Dual Half-Space Projected Gradient(DHSPG)优化算法来解决该问题。DHSPG 可以非常有效地找出冗余的零不变组并将其投影成零,并持续训练重要的零不变组来取得跟原始模型相媲美的性能。

4. 自动化构建轻量压缩模型。研究者自动化地删除冗余的零不变组所对应的网络单元来构建轻量化网络。该轻量化由于零不变组的特性会返回跟完整模型一样的输出,因此无需进一步模型微调。




实验效果


▲ 表1:CIFAR10 中的 VGG16 及 VGG16-BN 模型表现


在 CIFAR10 的 VGG16 实验中,OTOv2 将浮点数减少了 86.6%,将参数量减少了 97.5%,性能表现令人印象深刻。


▲ 表2:CIFAR10 的 ResNet50 实验


在 CIFAR10 的 ResNet50 实验中,OTOv2 在没有量化的情况下优于 SOTA 神经网络压缩框架 AMC 和 ANNC,仅使用了7.8% 的 FLOPs 和 4.1% 的参数。


▲ ResNet50 on ImageNet.


在 ImageNet 的 ResNet50 实验中,OTOv2 在不同结构稀疏化目标下,展现出跟现存 SOTA 方法相媲美甚至更优的表现。


▲ 表3:更多结构和数据集


OTOv2 也在更多的数据集和模型结构上取得了不错的表现。


总体而言,OTOv2 在所有的压缩基准实验中获得了 SOTA 或相媲美结果,并且实现了端到端的自动化,对通用网络进行一站式训练压缩,且最小化了用户额外的工程时间投入,为 AI 开发者提供了一款易用的网络压缩工具,加速各类人工智能产品的部署与落地。


更多阅读



#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


相关阅读

  • 铁打的英伟达,流水的ChatGPT

  • 作者∠恩豪‍‍发布∠数智锐角导读当我们在谈论AI将大幅提升社会生产力的时候,背后是英伟达的AI芯片在为ChatGPT们提供生产力。在ChatGPT惊艳全球,类ChatGPT层出不穷之际,其背
  • 邹晓冬等团队,2023合作发表首篇成果重登顶刊!

  • 点击关注,化学科讯!X射线衍射(XRD)技术在晶体材料物相分析和结构解析方面的应用极大地促进了化学、材料科学、生物医学等领域的发展。然而目前很多重要晶体材料的尺寸是在亚微米
  • 英伟达AI布局加速,人工智能的iPhone时代来了

  • 每年春季的GTC,英伟达都会为人工智能产业带来惊喜,2023年也不例外。在北京时间3月21日23点举行的GTC 2023的首日主题演讲上,英伟达的创始人黄仁勋接连放出大招。当上周人们还在
  • ​李彦宏:增长来自创新,创新靠“反馈”推动

  • 李彦宏|百度创始人、董事长兼首席执行官3月17日,亚布力中国企业家论坛第二十三届年会在黑龙江亚布力开幕。本届年会以“弘扬企业家精神,聚力高质量发展——中国式现代化的机遇
  • AI的决定性时刻!

  • 声明:本文仅梳理公司和行业的最新基本面,并非在当前时间点推荐买卖公司,本公众号不具备个股操作指导功能,投资有风险,入市需谨慎英伟达GTC 2023主题演讲速递及观点更新英伟达 CEO
  • 再见,三上老师

  • 上个星期的互联网有两件大事,一件是 GPT-4、文心一言相继发布,另一件则是三上老师突然宣布了引退。虽然在这一天,国内重定向访问 New Bing 聊天机器人的功能失效,有小伙伴问我两

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 停工停产停职!知名品牌道歉!

  • 3月14日晚,南方日报、南方+客户端曝光了汕头市玉蕾食品实业有限公司橄榄菜制作环境脏乱差。对此,汕头市高度重视,连夜组织专项整治行动,职能部门和属地加强联动、协同作战,对涉事
  • “酸”了!这一高校连放7天假!

  • 近日#四川一高校放假7天鼓励恋爱#登上热搜还有这种事?这7天的假期是怎么来的呢?一起来看看3月21日四川西南航空职业学院发布放假通知对全校师生4月1日至7日放7天春假(含清明放