谁发表了最具影响力的AI研究?谷歌遥遥领先,OpenAI成果转化率完胜DeepMind

2023-03-08 11:18:46   来源:商业新知网

来源:机器之心


(资料图片)

统计了近三年引用量最高的 100 篇论文,我们发现……

谁在发表最具影响力的 AI 研究?在如今「百花齐放」的时代,这个问题极具挖掘空间。

你可能会猜到一些结论:比如谷歌、微软、OpenAI、DeepMind 这些顶级机构,类似这样的结论只猜对了一半,还有另外一些信息,向我们揭露了原本不为人知的结论。

随着 AI 创新的飞速发展,尽快获取一些「情报」是至关重要的。毕竟几乎没人有时间去阅读所有的东西,但可以肯定的是,本文整理的这些论文具备改变人工智能技术发展方向的潜力。

对研发团队影响力的真正考验当然是技术如何落地在产品中,OpenAI 在 2022 年 11 月底发布了 ChatGPT,震撼了整个领域,这是继他们 2022 年 3 月的论文「利用人类反馈训练遵循指令的语言模型」(Training language models to follow instructions with human feedback)之后的又一次突破。

如此迅速的产品落地是罕见的。所以,为了洞察到更多信息,近日,Zeta Alpha 的统计采用了一个经典的学术指标: 引用次数 。

对 2022 年、2021 年和 2020 年每年被引用次数最多的 100 篇论文的详细分析,可以深入了解目前发表最具影响力的 AI 研究的机构和国家 / 地区。一些初步结论是:美国和谷歌仍然占主导地位,DeepMind 在这一年也取得了辉煌的成就,但考虑到产出量,OpenAI 在产品影响和研究方面确实处于前列,并能快速和广泛地被引用。

资料来源:Zeta Alpha。

如上图所示,另外一个重要结论是:中国在研究引用量上的影响力排行第二,但与美国相比仍存在差距,并不像很多报道中描述的那样「追平甚至超越」。

利用来自 Zeta Alpha 平台的数据,然后结合人工策划,本文收集了 2022 年、2021 年和 2020 年人工智能领域被引用次数最多的论文,并分析了作者的所属机构和国家 / 地区。这使得能够按照研发影响而不是纯粹的出版数据对这些论文进行排名。

为了创建分析结果,本文首先在 Zeta Alpha 平台上收集了每年被引用次数最多的论文,然后手动检查首次发表日期(通常是 arXiv 预印本),以便将论文放在正确的年份中。然后通过在 Semantic Scholar 上挖掘高引用率的人工智能论文来补充这个名单,因为 Semantic Scholar 的覆盖面更广,而且能够按引用次数排序。这主要是发现了来自高影响力的出版商(如 Nature、Elsevier、Springer 和其他期刊)之外的论文。然后,将每篇论文在谷歌学术上的引用次数作为代表指标,并按这个数字对论文进行排序,得出一年中的前 100 名。对于这些论文,本文使用了 GPT-3 来提取作者、隶属机构和国家 / 地区,并手动检查这些结果(如果国家 / 地区在出版物中不明显,就采用该组织总部所在的国家 / 地区)。如果一篇论文有来自多个机构的作者,每个机构算一次。

看了这份排行榜之后,大佬 Yann LeCun 表示很欣慰:「在 Meta AI,我们倾向于出版质量而不是数量。这就是为什么在 2022 年被引用最多的 100 篇人工智能论文中,Meta AI 撰写(或共同撰写)了 16 篇,仅次于谷歌的 22 篇,排名第二。我们的研究正在对社会产生巨大的影响。(此外,纽约大学的排名也很赞)。」

所以,刚才谈论的这些 Top 论文有哪些?

在深入了解这些数字之前,让我们先了解一下过去三年的热门论文。相信你会认出其中的几篇。

2022 年热门论文

1、AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models

论文链接:https://academic.oup.com/nar/article/50/D1/D439/6430488

机构:DeepMind

引用次数:1372

主题:Using AlphaFold to augment protein structure database coverage.

2、ColabFold: making protein folding accessible to all

论文链接:https://www.nature.com/articles/s41592-022-01488-1

引用次数:1162

主题:An open-source and efficient protein folding model.

3、Hierarchical Text-Conditional Image Generation with CLIP Latents

论文链接:https://arxiv.org/abs/2204.06125

机构:OpenAI

引用次数:718

主题:DALL・E 2, complex prompted image generation that left most in awe

4、A ConvNet for the 2020s

论文链接:https://arxiv.org/abs/2201.03545

机构:Meta,UC 伯克利

引用次数:690

主题:A successful modernization of CNNs at a time of boom for Transformers in Computer Vision

5、PaLM: Scaling Language Modeling with Pathways

论文链接:https://arxiv.org/abs/2204.02311

机构:谷歌

引用次数:452

主题:Google"s mammoth 540B Large Language Model, a new MLOps infrastructure, and how it performs

2021 年热门论文

1、《Highly accurate protein structure prediction with AlphaFold》

论文链接:https://www.nature.com/articles/s41586-021-03819-2

机构:DeepMind

引用次数:8965

主题:AlphaFold, a breakthrough in protein structure prediction using Deep Learning

2、《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》

论文链接:https://arxiv.org/abs/2103.14030

机构:微软

引用次数:4810

主题:A robust variant of Transformers for Vision

3、《Learning Transferable Visual Models From Natural Language Supervision》

论文链接:https://arxiv.org/abs/2103.00020

机构:OpenAI

引用次数:3204

主题:CLIP, image-text pairs at scale to learn joint image-text representations in a self supervised fashion

4、《On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?》

论文链接:https://dl.acm.org/doi/10.1145/3442188.3445922

机构:U. Washington, Black in AI, The Aether

引用次数:1266

主题:Famous position paper very critical of the trend of ever-growing language models, highlighting their limitations and dangers

5、《Emerging Properties in Self-Supervised Vision Transformers》

论文链接:https://arxiv.org/pdf/2104.14294.pdf

机构:Meta

引用次数:1219

主题:DINO, showing how self-supervision on images led to the emergence of some sort of proto-object segmentation in Transformers

2020 年热门论文

1、《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

论文链接:https://arxiv.org/abs/2010.11929

机构:谷歌

引用次数:11914

主题:The first work showing how a plain Transformer could do great in Computer Vision

2、《Language Models are Few-Shot Learners》

论文链接:https://arxiv.org/abs/2005.14165

机构:OpenAI

引用次数:8070

主题:This paper does not need further explanation at this stage

3、《YOLOv4: Optimal Speed and Accuracy of Object Detection》

论文链接:https://arxiv.org/abs/2004.10934

机构:Academia Sinica, Taiwan

引用次数:8014

主题:Robust and fast object detection sells like hotcakes

4、《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》

论文链接:https://arxiv.org/abs/1910.10683

机构:谷歌

引用次数:5906

主题:A rigorous study of transfer learning with Transformers, resulting in the famous T5

5、《Bootstrap your own latent: A new approach to self-supervised Learning》

论文链接:https://arxiv.org/abs/2006.07733

机构:DeepMind,Imperial College

引用次数:2873

主题:Showing that negatives are not even necessary for representation learning

领先机构排行

让我们来看看一些领先的机构在前 100 名的论文数量上是如何排行的:

谷歌一直是最强大的参与者,其次是 Meta、微软、加州大学伯克利分校、DeepMind 和斯坦福 。虽然如今的工业界在人工智能研究中「呼风唤雨」,单一的学术机构不会产生那么大的影响,但这些机构的尾巴要长得多,所以当我们按组织类型进行汇总时,就会达到平衡。

在研究总量方面,过去三年谷歌居首位,清华大学、卡耐基梅隆大学、麻省理工学院、斯坦福大学等高校排名靠前,而微软位居第三位。整体来看,学术机构的研究数量是要多于业界科技企业的,而谷歌、微软这两大科技巨头近三年发表的研究数也是居于高位。

实际上,谷歌的科研实力一直很强。2017 年,谷歌发表论文《Attention Is All You Need》,标志着 transformer 的问世。直到今天,transformer 依然是包括 ChatGPT 在内的大部分 NLP 和 CV 模型的架构基础。

上个月,在 Bard 发布之际,谷歌 CEO Sundar Pichai 也在一份公开信中表示:「Google AI 和 DeepMind 推动了最先进技术的发展。我们的 Transformer 研究项目和我们 2017 年的领域论文,以及我们在扩散模型方面的重要进展,是当前许多生成式 AI 应用程序的基础。」

当然,作为新晋顶流 ChatGPT 背后的公司,OpenAI 近三年的研究成果转化率(Conversion Rate)是具有绝对优势的。最近几年,OpenAI 的大多数研究成果都引起了极大的关注,特别是在大规模语言模型方面。

2020 年,OpenAI 发布了 GPT-3,这个 1750 亿参数的大规模语言模型在一定程度上颠覆了语言模型领域的游戏规则,因为它解决了许多大规模语言模型中的难题。GPT-3 掀起了一场大规模语言模型的狂潮。几年来,语言模型的参数规模不断被打破,人们一直在探索大规模语言模型的更多潜力。

2022 年底,ChatGPT 横空出世,它引起了人们对文本生成和 AI 对话系统的高度关注。特别地,ChatGPT 在生成知识型内容和生成代码方面已经表现出非常高的能力。在谷歌、微软陆续宣布将类似 ChatGPT 的功能集成到下一代搜索引擎后,ChatGPT 被认为将引领一场 AIGC 和智能工具的新变革。

最后,我们来看一下 2022 年被引用次数最多的 100 篇论文具体有哪些:

此处还 增加了推特提及次数,这有时被视为早期影响指标。但到目前为止,相关性似乎很弱。还需要进一步的工作。

声明

来源 :机器之心 , RAD极客会推荐阅读,不代表RAD极客会立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理!

关键词:

上一篇:
下一篇:
精彩阅读

谁发表了最具影响力的AI研究?谷歌遥遥领先,OpenAI成果转化率完胜DeepMind

热点

谁在发表最具影响力的AI研究?在如今「百花齐放」的时代,这个问题极具挖掘空间。

天天热消息:5G语音,现在什么样了?

热点

5G时代,实时通信仍然是不可或缺的基本业务能力。

每日速读!亮剑“威胁情报”,锐捷、腾讯联手打造“狙击手”

热点

面对无孔不入的攻击和日渐严重的安全威胁,如果仍采用传统防火墙的防御方式,相当于拿着盾牌被动防守,常常是捉襟见肘。

世界速读:中国广电内容数据库项目招标!

热点

近日,中国广电内容数据库相关项目招标再次启动。

环球新资讯:【解析】广电5G将推信用购业务,优势在哪?

热点

据了解,电信运营商信用购业务以“信用购机”最为常见,而省网广电公司大概率也将优先推进这种模式。

【天天聚看点】视频|ChatGPT点燃AI新战事:谷歌“向下”、百度“向上”?

热点

微软投资的AI聊天机器人ChatGPT火遍全球,谷歌和百度显露出不同的应战状态。

当前最新:微软将ChatGPT整合到更多工具中:不用写代码就能开发应用

热点

微软将ChatGPT整合到更多工具中不用写代码就能开发应用。

【天天聚看点】ChatGPT 和 Whisper API 已开放接口,单价骤减 90% ,有哪些值得关注的信息?

热点

工具的缺点就是同质性强,容易被替代,商业化壁垒很低,竞争者繁多。

数字生命

热点

数字⽣命是指把⼀个⼈的记忆上传,然后通过算法模拟出这个⼈的思维⽅式所形成的电⼦意识。

今日热文:参加ChatGPT论坛,这样回答可能会优于邀请微软专家

热点

ChatGPT的深层神经网络的层数不是固定的,它可以通过控制模型参数来调整深度。

财富

天天热门:融资 | 「极麋生物」再获千万级天使+轮融资,十维资本独家投资

资讯

融资|「极麋生物」再获千万级天使+轮融资,十维资本独家投资,极麋生物4个月内再获千万级天使加轮融资

浪潮退去:泡沫破碎后,日本消费产业如何走出低潮期?

资讯

浪潮退去:泡沫破碎后,日本消费产业如何走出低潮期?,在消费界谈起日本时,从他们一百多年的消费发展简史中,总能提炼出值得借鉴的地方。

当前热文:京东 需要再赢一次

资讯

京东需要再赢一次,找回“低价心智”,对京东来说很重要。

【聚看点】微短剧等一个「迷雾剧场」

资讯

微短剧等一个「迷雾剧场」,“悬疑”类型正在扩散。

全球看热讯:拒绝野蛮生长,电竞酒店存监管“盲区”或迎行业大洗牌

资讯

拒绝野蛮生长,电竞酒店存监管“盲区”或迎行业大洗牌,电竞酒店成年轻人新宠,强化未成年人保护意识迫在眉睫。

【播资讯】关于“第一批出海东南亚的VC已被套牢了”的一些看法

资讯

关于“第一批出海东南亚的VC已被套牢了”的一些看法,这里统一说说我们的几点看法。

刘强东时隔12年再掀价格战,但百亿补贴难解百般愁

资讯

刘强东时隔12年再掀价格战,但百亿补贴难解百般愁,价格战,早已不是电商行业的主旋律。

焦点热讯:ARK元宇宙商业世界上线:中国版元宇宙正在深耕客户真实需求

资讯

ARK元宇宙商业世界上线:中国版元宇宙正在深耕客户真实需求,没有解决刚需的,没有应用落地的元宇宙不会被认可

大神李沐被曝离职!投身大模型创业,GitHub项目已开

资讯

大神李沐被曝离职!投身大模型创业,GitHub项目已开,师徒再次携手创业。

环球通讯!水果刺客,收割了谁?

资讯

水果刺客,收割了谁?,水果高价低利的背后是什么?

天天热消息:5G语音,现在什么样了?

5G时代,实时通信仍然是不可或缺的基本业务能力。

每日速读!亮剑“威胁情报”,锐捷、腾讯联手打造“狙击手”

面对无孔不入的攻击和日渐严重的安全威胁,如果仍采用传统防火墙的防御方式,相当于拿着盾牌被动防守,常常是捉襟见肘。

世界速读:中国广电内容数据库项目招标!

近日,中国广电内容数据库相关项目招标再次启动。

环球新资讯:【解析】广电5G将推信用购业务,优势在哪?

据了解,电信运营商信用购业务以“信用购机”最为常见,而省网广电公司大概率也将优先推进这种模式。

【天天聚看点】视频|ChatGPT点燃AI新战事:谷歌“向下”、百度“向上”?

微软投资的AI聊天机器人ChatGPT火遍全球,谷歌和百度显露出不同的应战状态。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个