视觉Prompt来了,效果超越微调!

2022-03-30 13:24:46   来源:商业新知网

Prompt tuning ,作为NLP领域中的一个“新宠”,甚至曾被学者誉为NLP预训练新范式。

那么,它能否借鉴到 CV领域 并产生同样的成绩呢?

现在,来自康奈尔大学和Meta AI等机构,通过Prompt来调整基于Transformer的视觉模型,结果发现:

完全可以!

比起全面微调,Prompt性能提升显著。无论模型的规模和训练数据怎么变,24种情况中有20种都完全胜出。

与此同时,它还能大幅降低每项任务所需的存储成本。

论文地址:

https://arxiv.org/abs/2203.12119

只使用不到1%的模型参数

大家一贯使用的 全面微调 (full fine-tuning),需要为每个下游任务存储和部署单独的主干参数副本,成本太高,尤其是现在基于Transformer的模型越来越大,已经超过CNN架构。

所谓Prompt,最初指的是在输入文本中预编语言指令,以便预培训的语言模型后续可以直接理解各种下游任务。

它曾让GPT-3即使在少样本或零样本的情况下表现出很强的泛化能力。

最近一些成果则表明,Prompt与完全微调的性能相当,参数存储量还减少了1000倍。

NLP中的高超性能让不少人开始在CV领域中探索Prompt的魔力,不过都只局限于跨模态任务中文本编码器的输入。

在本文中,作者将他们所提出的Visual Prompt Tuning方法, 简称为VPT 。这是 首次 有人将Prompt应用到视觉模型主干(backbone),并做出成果。

具体来说,比起全面微调,VPT受最新大型NLP模型调整方法的启发,只在输入空间中 引入少量可特定某任务训练的参数 (不到模型参数的1%),同时在训练下游任务期间 冻结 (freeze) 预训练模型的主干 。

在实操中,这些附加参数只用预先加入到每个Transformer层的输入序列中,并在微调期间与线性head一起学习。

他们一共探索出两种变体:

VPT-Deep 变体为Transformer编码器每层的输入预先设置一组可学习的参数;

VPT-Shallow 变体则仅将提示参数插入第一层的输入。

两者在下游任务的训练过程中,只有特定于任务的提示和线性头的参数会更新,而整个Transformer编码器被冻结。

接下来,是骡子是马?拉出来溜溜~

20/24的优胜率

实验涉及两种在ImageNet-21k上预训练好的主干, 一个来自Vision Transformer,一个来自Swin Transformer 。

进行对比的 微调方法有三大种,7小种 ,包括:

(1)完全微调:更新所有主干和分类头(classification head)参数

(2)以分类头为重点的微调,包括Linear、Partial-k和Mlp-k三种;

(3)以及在微调过程中更新一个主干子集参数或向主干添加新的可训练参数的方法,分为Sidetune、Bias和Adapter三种。

实验的数据集有两组,一共涉及 24个跨不同领域的下游识别任务 ,包括:

(1)由5个基准细粒度视觉分类任务组成的FGVC;

(2)由19个不同视觉分类集合组成的VTAB-1k,细分为使用标准相机拍摄的自然图像任务(Natural)、用专用设备(如卫星图像)捕获的图像任务(Specialized)以及需要几何理解的任务(Structured),比如物体计数。

测得每项任务上的 平均准确度 后,得出的主要结果如下:

VPT-Deep在24个任务中有20个的表现都优于全面微调,同时使用的总模型参数显著减少(1.18× vs. 24.02×);

要知道,在NLP领域中Prompt再厉害,性能也不会超过全面微调。这说明 Prompt很适用于视觉Transformer模型 。

和其他微调方法相比(b、c组),VPT-Deep的性能则全部胜出。

此外,选择 不同主干参数规模和模型规模 的ViT(ViT-B、ViT-L和ViT-H)进行测试还发现,VPT方法不会受影响,依然基本保持性能领先。

而在Swin Transformer中,全面微调法的平均准确度虽然更高,但也付出了巨大的参数代价。

其他微调方法则全部不敌VPT。

关键词: 视觉模型 同时使用

上一篇:
下一篇:
精彩阅读

视觉Prompt来了,效果超越微调!

热点

Prompttuning,作为NLP领域中的一个“新宠”,甚至曾被学者誉为NLP预训练新范式。

下载超十亿人次的试妆APP,要在纳斯达克上市了

热点

在玩美移动APP下载量达到4 5亿的2017年,玩美移动得到由创世伙伴资本领投的2500万美元的A轮融资。

洞见2022商业新趋势,热门赛道大神们都在这场直播里说了啥?

热点

张春艳介绍,AR在数字化转型中已投入应用实践。

红杉中国布局零信任安全领域,「亿格云」完成近亿元Pre-A轮融资

热点

亿格云科技旨在构建下一代企业安全架构,解决办公安全隐患,助力企业数字化转型。

上市公司观察|Marpai Health:人工智能驱动的新型TPA

热点

医疗保健行业正在经历以人工智能为基础的历史性变革,通过人工智能积极改变医疗保健的护理和支付方式。

下载超十亿人次的试妆APP,要在纳斯达克上市了

热点

2017年AI作为十大流行词时,我们大多数人都认为,距离AI在各大生活场景落地还很遥远。

对话林凡:脉脉只选择垒塔,拒绝搬砖

热点

如今的快手,即便股价相比最高点跌去80%,但其市值依然接近400亿美元。

诸葛IO用户行为分析SaaS怎么样?诸葛IO软件如何收费?

热点

本篇为在线用户行为数据分析工具诸葛IO的介绍。

微盟“第二曲线”能否开启下一段增长?

热点

财报显示,2021年微盟集团数字商业收入19 67亿元,较2020年的12 46亿元增长70 9%。

透过微盟财报,看数字商业操作系统“深迭代”

热点

在当下的整体市场环境下,微盟业绩仍然逆势增长36 4%。盈利能力上,报告期内公司经调整毛利同比增长51 3%。

财富

最新测速报告:Starlink下行速率波动记录曝光

资讯

自去年 2 月开放预订以来,太空探索技术公司(SpaceX)的星链(Starlink)卫星互联网服务的用户数,已从当时的 10000、猛增到 2022 年 3

支付“破壁”再现新进展淘宝内测微信支付

资讯

机构支付破壁再现新进展,继此前阿里旗下饿了么、优酷等应用接入微信支付后,近两日,关于淘宝App部分用户支持微信支付的消息再次传开,有

施罗德交银理财:首只理财产品即将发售

资讯

正式揭牌近一个月,施罗德交银理财首只理财产品即将发售。3月27日,北京商报记者从施罗德交银理财处获悉,该公司首发理财产品得源多资产稳

映客发布2021年财报:营收91.8亿元,净利润4.7亿元

资讯

3月27日,映客发布了2021年财报,营收91 8亿元,较上年增长85 4%,净调整后净利润4 7亿元,较上年同期增长111 4%。根据财报,2021年映客增

多个乐园临时歇业,主题公园市场“一波三折”

资讯

疫情的变化让今年年初的主题公园市场经历了一场倒春寒。3月27日,北京商报记者了解到,继上海迪士尼度假区暂停营业后,广州、珠海长隆度假

海昌海洋公园发布2021年全年业绩报告

资讯

3月27日晚,海昌海洋公园控股有限公司(以下简称海昌海洋公园)发布2021年度全年业绩报告。公告显示,2021年海昌海洋公园收入为24 6亿元,同

苹果将为iPhone和其他硬件开发订阅服务或用于按月付款

资讯

据国外媒体报道,知情人士透露,苹果正在为iPhone和其他硬件产品开发一种订阅服务。此举或将使客户能够像订阅软件服务那样,以按月付款的形

宁德时代成为新能源产业首家“零碳工厂”

资讯

近日消息,宁德时代官方宣布,全球知名认证机构SGS为宁德时代全资子公司四川时代颁发PAS2060碳中和认证证书,宁德时代宜宾工厂成为新能源产

微软Xbox平台预计2026年可获得7%市场份额

资讯

周五的时候,游戏市场分析公司 DFCIntelligence 发布了对主机市场的最新预测。其认为,微软 Xbox 平台有望在未来四年内,与索尼 PlayS

苹果高管:MacStudio设计源于公司几十年来的工作

资讯

苹果公司很少推出全新的Mac,但两位负责Mac Studio的高管说,Mac Studio设计源于苹果公司几十年来的工作。在接受《GQ》杂志的最新采访中

下载超十亿人次的试妆APP,要在纳斯达克上市了

在玩美移动APP下载量达到4 5亿的2017年,玩美移动得到由创世伙伴资本领投的2500万美元的A轮融资。

洞见2022商业新趋势,热门赛道大神们都在这场直播里说了啥?

张春艳介绍,AR在数字化转型中已投入应用实践。

红杉中国布局零信任安全领域,「亿格云」完成近亿元Pre-A轮融资

亿格云科技旨在构建下一代企业安全架构,解决办公安全隐患,助力企业数字化转型。

上市公司观察|Marpai Health:人工智能驱动的新型TPA

医疗保健行业正在经历以人工智能为基础的历史性变革,通过人工智能积极改变医疗保健的护理和支付方式。

下载超十亿人次的试妆APP,要在纳斯达克上市了

2017年AI作为十大流行词时,我们大多数人都认为,距离AI在各大生活场景落地还很遥远。

为户外劳动者提供便利 重庆已建成665座“劳动者港湾”

  中新网重庆4月22日电 (韩璐 王雪宇)记者22日从重庆市城市管理局获悉,2020年重庆市已建成“劳动者港湾”665座。今年,重庆还将继续建

沈阳警方侦破特大贩卖毒品案 抓获88名涉毒违法犯罪嫌疑人

  中新社沈阳4月22日电 (王景巍)沈阳市公安局22日发布消息,近日,在中国公安部和辽宁省公安厅的指导协调下,历经9个多月,沈阳市公安局

上海警方侦破特大制售假普洱茶案 市场价值高达18亿元

  中新网上海4月22日电 (记者 李姝徵)记者22日从上海警方获悉,2021年3月,上海警方全链条侦破一起销售假冒知名品牌普洱茶案,捣毁制售

西安强化知识产权司法保护 商标权案件占比高

  中新网西安4月22日电 (记者 张一辰)在世界知识产权日即将到来之际,西安市中级人民法院(以下简称:西安中院)22日召开新闻发布会,发

今年5月至明年2月底 江西4A级及以上景区对全国学子免门票

  中新网南昌4月22日电 (记者 李韵涵)记者22日从“红五月·嘉游赣”江西五一假日旅游工作媒体吹风会上获悉,2021年5月1日至2022年2月28

福州乡村公益图书馆:图书“接地气” 门口即是农田

  中新网福州4月22日电 (叶秋云 曾路淇)世界读书日即将来临之际,驾车五十余分钟,记者来到距离福建省福州市30多公里的闽侯县白沙镇马