首页> 热点 >

高达3.6万亿token！PaLM 2训练数据翻5倍，全新Bard对比ChatGPT有8个优势

2023-05-31 12:23:14 来源：商业新知网

转自 |新智元

编辑 |Aeneas 润

【导读】 PaLM2模型训练数据是上一代的5倍，达到3.6万亿。基于PaLM2的Bard对比ChatGPT有8项优势。

决定大模型能力的关键因素，到底是模型的参数，还是训练文本的大小？

【资料图】

谷歌发布的PalM2，似乎选择了后者作为提升的主要路径。

据悉，谷歌用于训练的PaLM2的文本数量几乎是训练其前身模型的5倍。

而且上周宣布PaLM 2时，谷歌明确表示，该模型比早期的PaLM更小。

谷歌内部文件显示，PaLM经过了5400亿的参数训练，而新推出的PaLM2，训练参数接近腰斩，只有3400亿个。

技术文档中训练数据的描述

但是在另一个模型训练的关键数据——训练语料大小上，谷歌开始疯狂堆料，把PaLM的7800亿的训练token量直接推到了3.6万亿！

而且除了Token数量的激增，PaLM2在数据质量上也有很大的提升。

训练数据中各个语言的比例

所以相比PaLM，第二代在英语语料数据量没有显著增长的情况下，英语性能明显提高，部分原因是因为英语数据的质量提升了。

大模型路线选择

OpenAI没有公开GPT-4的训练参数数量，但是谷歌没有藏着掖着，主动公开了PaLM2训练参数。

而且在谷歌I/O大会上，还同时发布了4个参数更少的模型。

其中最小的一款模型 Gecko（壁虎），甚至可以在智能手机上运行。

这一举动侧面反应了谷歌未来的野心，希望在更多的平台上部署自己的大模型。

在这个大背景之下，从长远的角度来看，谷歌几乎不可能选择堆训练参数量来提升模型性能，增加训练语料的数量和质量几乎成了必然的选择。

PaLM 2：史上最强大模型？

在I/O大会上宣布PaLM 2时，谷歌证实：该模型经过100种语言的训练，可以执行广泛的任务。它已经被用来为25个功能和产品提供支持，包括谷歌的实验性聊天机器人Bard。

PaLM 2有四种尺寸，从小到大依次是：Gecko（壁虎）、Otter（水獭）、Bison（野牛）和Unicorn（独角兽）。

基于现在公开披露的数据，PaLM 2比现有的任何模型都更强大。

Meta的LLaMA在今年二月推出，它在1.4万亿个token上进行了训练。

而上一次OpenAI分享训练规模，还是在推出GPT-3时，当时OpenAI说，它接受了3000亿个token的训练。

另外，谷歌两年前曾提出LaMDA模型，当时它接受了1.5万亿个token的训练。

AI军备竞赛升温，公众要求更高透明度

对于大模型训练数据的细节，大厂们都很默契地选择了「Close」。

发布GPT-4时，OpenAI没有公布架构（包括模型大小）、硬件、训练计算、数据集构建、训练方法等细节，理由是「像GPT-4这样的大规模模型的竞争格局和安全影响」。

被OpenAI逼到墙角的谷歌，也一直渴望展示自己AI技术的力量，包括如何将其嵌入到搜索、电子邮件、文字处理和电子表格中，但是此前，谷歌一直不愿意公布训练数据的大小或其他细节。

保密的原因，当然就是业务的竞争性质。

无论是谷歌还是OpenAI，都在争抢着希望使用聊天机器人而不是传统搜索引擎的用户。

但随着AI军备竞赛的升温，研究社区正在要求更高的透明度。

而现在，随着AI应用迅速成为主流，围绕底层技术的争议也愈发激烈。

随着新的人工智能应用迅速成为主流，围绕底层技术的争议也越来越激烈。

今年2月，谷歌研究高级科学家El Mahdi因公司缺乏透明度，选择辞职。

周二，OpenAI首席执行官Sam Altman在参议院司法小组委员会关于隐私和技术的听证会上作证，同意立法者的观点——需要监管AI的新系统。

「对于一项非常新的技术，我们需要一个新的框架，」Altman说。「当然，像我们这样的公司，对于在全球推出的工具负有很大责任。」

Bard可以干但ChatGPT干不了的事

1. 访问网络

相对于ChatGPT，Bard的一个显著优势就是——可以访问互联网。

问问今天（5月17日）的体坛大事，Bard快速总结出来了。

而ChatGPT无法直接访问互联网，只能通过其付费版本Plus上的插件访问网络。

2. 图像生成

在生成图像上，Bard也超越了ChatGPT的付费和非付费版本。

谷歌宣布将通过集成Adobe Firefly，提供AI图像生成功能。这个功能增强了对话的视觉效果，让用户获得了上下文更丰富的信息。

3. 语音输入

在语音输入方面，Bard也优于ChatGPT，用户只要通过语音，就可以和模型交互了。

这样在多任务处理和打字不方便时，用户就多了一种快速获取响应的边界方式。

小编把今日体坛新闻的问题读了一遍，Bard就自动显示了。唯一要注意的是，英文发音要足够标准。?

4. 编码能力

在编码能力上，Bard也超越了ChatGPT，它能够协助20多种编程语言，包括 C++、Python、Java、TypeScript、JavaScript等。它可以辅助开发者进行代码生成、解释和调试。

相比之下，虽然ChatGPT也具有编码功能，但它在处理额外任务时存在不足，相比之下OpenAI的Codex可能更适合执行这些任务。

让Bard用python生成一个斐波那契数列，并打出前10个数字。

Bard成功完成了。

5. 高度整合Gmail

与Gmail集成，是Bard是另一个重要优势。

Gmail拥有超过20亿用户，是全球最大的电子邮件服务商。如果在邮件中能用Bard，无疑为电子邮件交互开辟了新的可能性。

但是，微软也正把ChatGPT添加到Microsoft 365 中，并将嵌入到 Word、Excel、PowerPoint以及Gmail的竞争者中。

6. 分享输出内容

另外，Bard还可以将结果立即导出到Gmail和Docs。

用户可以将生成的内容直接导出到这些平台，轻松与他人分享。这个功能大大简化了共享信息的过程，使撰写电子邮件变得非常轻松。

另一方面，OpenAI在设置中有一个类似的导出选项。用户可以导出帐户详细信息和对话，以可下载文件的形式发送到电子邮箱中。

7. 支持图像提示

Bar还有一大功能是，能够使用图像作为提示。

用户只需点击图片或使用Google Lens扫描图像，就可以向Bard寻求帮助了。

比如，用户可以查找与某张图片类似的度假胜地，还可以询问其这个地点的历史意义。

同样，GPT-4 也是一个多模态大模型，可以接受图像和文本输入，不过截至本文发布之日，在付费版本中也没有引入这个功能。

8. 网页摘要

因为Bard可以联网，因而它可以通过简单地共享链接来总结某个网页。

相比之下，ChatGPT不能联网，用户只能手动复制和粘贴想要总结的内容。

不过，Bard也有其局限性，特别是在毒性方面。

在测试过程中，当给出明确的有毒提示时，Bard在超过30%的时间内，会产生有毒反应。

此外，在英语、德语和葡萄牙语等语言中，PaLM 2总体上会表现出更明显的毒性行为。

总的来说，由于不同的架构和测试方法，直接比较这PaLM2和GPT-4有一定的挑战性。

在推理任务中，PaLM 2的表现与GPT-4类似，甚至更好。

不过，在编码任务中，PaLM 2需要多次尝试，以及额外的编码token，才能获得良好的性能。

关键词：

上一篇： 天天快资讯丨“AI孙燕姿”爆火之后，音乐何去何从？
下一篇： 最后一页

精彩阅读

高达3.6万亿token！PaLM 2训练数据翻5倍，全新Bard对比ChatGPT有8个优势
热点
PaLM2模型训练数据是上一代的5倍，达到3 6万亿。

天天快资讯丨“AI孙燕姿”爆火之后，音乐何去何从？
热点
“AI孙燕姿”强势出圈，成为新晋顶流。在这背后的是发展了半个多世纪的、不可阻挡的AI音乐潮流。

为Apple MR而生，xrOS有何期待？天天滚动
热点
该操作系统将被命名为xrOS，并且Apple已使用空壳公司在各个国家注册该商标。

探索人工智能的革命性技术天天讯息
热点
AI时代已经开始，你准备好了吗？如何在这个充满机遇和挑战的人工智能时代中抓住商业机会？

AIGC风头正盛，英伟达宣布为游戏提供AI定制服务丨游戏干线
热点
“我们已经迎来了生成式AI的引爆点。从此，全世界的每个角落，都会有算力需求。”

环球消息！华东数交与贵数所战略签约，携手共建全国数据要素统一大市场
热点
5月27日，华东数交与贵数所战略签约。

商贸零售罗晓婷|AI+教育：优质教育资源的规模化、公平化、个性化|当前动态
热点
AIGC进一步深化教育的本质在于数字化教育内容的智能生成+推送。

AI诈骗效率高、成本低，“三个魔法”有效防范潜在威胁
热点
随着AI技术的发展，它不仅改变了许多领域的工作方式，还深刻地改变了诈骗的形态，使得电信诈骗更加难以防范

清华商汤最新AI，征服了《我的世界》
热点
继GPT-4惊艳《我的世界》后，国产AI智能体也来了——像人一样生存、探索和创作，并且通关了整个游戏。

云从科技解禁前拟再募36亿元，大模型或成救命稻草？
热点
随着商业化落地遭遇瓶颈，“AI四小龙”光环渐渐散去。

财富

618“首战”：淘宝直播“内容化”，小红书力扶章小蕙加入战局？最资讯
资讯
618“首战”：淘宝直播“内容化”，小红书力扶章小蕙加入战局？,平台间的攻城略地继续上演。

0成本做增长，匿名社交的风又吹到了韩国_天天看热讯
资讯
0成本做增长，匿名社交的风又吹到了韩国,近期火热的匿名社交App们给了这些思路。

天涯死在“乌托邦”里
资讯
天涯死在“乌托邦”里,最后的挣扎还是葬歌？

环球播报:融资丨凌科药业完成2亿人民币C1轮融资
资讯
融资丨凌科药业完成2亿人民币C1轮融资,本轮融资将主要用于加速推进凌科药业核心产品的临床开发。

每日时讯!永辉超市症结之解
资讯
永辉超市症结之解,线上线下都做得好的企业，未来才能生存。

快播：谁会是新能源车险市场的“鲶鱼”？
资讯
谁会是新能源车险市场的“鲶鱼”？,沿着旧地图，找不到新大陆

ofo出走的创始人，散落在天涯-天天聚看点
资讯
ofo出走的创始人，散落在天涯,ofo故人难寻

「问题少年」逆袭成万亿美元掌门人！60岁黄仁勋或成LLM爆发背后最大赢家-天天快资讯
资讯
「问题少年」逆袭成万亿美元掌门人！60岁黄仁勋或成LLM爆发背后最大赢家,英伟达总市值正式突破万亿美元，成

陆正耀“绑上”加盟商去“复仇” 世界要闻
资讯
陆正耀“绑上”加盟商去“复仇”,最了解陆正耀的目标的人，除了钱治亚，可能就是郭谨一。

全球观点：AI诈骗效率高、成本低，“三个魔法”有效防范潜在威胁
资讯
AI诈骗效率高、成本低，“三个魔法”有效防范潜在威胁,魔法打败魔法：社交平台的关键角色

MORE+ 资讯

618“首战”：淘宝直播“内容化”，小红书力扶章小蕙加入战局？最资讯

0成本做增长，匿名社交的风又吹到了韩国_天天看热讯

天涯死在“乌托邦”里

环球播报:融资丨凌科药业完成2亿人民币C1轮融资

每日时讯!永辉超市症结之解

快播：谁会是新能源车险市场的“鲶鱼”？

ofo出走的创始人，散落在天涯-天天聚看点

「问题少年」逆袭成万亿美元掌门人！60岁黄仁勋或成LLM爆发背后最大赢家-天天快资讯

陆正耀“绑上”加盟商去“复仇” 世界要闻

全球观点：AI诈骗效率高、成本低，“三个魔法”有效防范潜在威胁

MORE+ 热点

高达3.6万亿token！PaLM 2训练数据翻5倍，全新Bard对比ChatGPT有8个优势

天天快资讯丨“AI孙燕姿”爆火之后，音乐何去何从？

“AI孙燕姿”强势出圈，成为新晋顶流。在这背后的是发展了半个多世纪的、不可阻挡的AI音乐潮流。

为Apple MR而生，xrOS有何期待？天天滚动

该操作系统将被命名为xrOS，并且Apple已使用空壳公司在各个国家注册该商标。

探索人工智能的革命性技术天天讯息

AI时代已经开始，你准备好了吗？如何在这个充满机遇和挑战的人工智能时代中抓住商业机会？

AIGC风头正盛，英伟达宣布为游戏提供AI定制服务丨游戏干线

“我们已经迎来了生成式AI的引爆点。从此，全世界的每个角落，都会有算力需求。”

环球消息！华东数交与贵数所战略签约，携手共建全国数据要素统一大市场

5月27日，华东数交与贵数所战略签约。

MORE+ 焦点

6000建设者奋战宜来高速宜昌段且看“天路”越武陵_天天快资讯

跨“V”形河谷，挑战170米高墩；夜以继日，掘进8公里超长隧道……这是5月27日湖北日报全媒记者在宜（都）来

每日热门：奥维通信：公司目前暂未开展海外业务

每经AI快讯，有投资者在投资者互动平台提问：1奥维的产品有出口到世界动乱的小国家吗？比如缅甸、苏丹、塞

世界快消息！cf图标如何点亮文章带来详细讲解

1、首先进入穿越火线官网，往下拉，发现点亮图标后，点击进入。2、我们进入荣誉系统就是枪王排位的页面了

天天快看点丨南海西北陆坡沉船遗址第一阶段调查：最新海底画面来了！

南海西北陆坡沉船遗址第一阶段调查：最新海底画面来了！

daphne是什么牌子的鞋_daphne

大家好,小榜来为大家解答以上的问题。daphne是什么牌子的鞋，daphne这个很多人还不知道,现在让我们一起来看

震撼！我军多型实弹射击演练点燃夏季练兵场

铁流滚滚，沙尘弥漫。近日，中部战区陆军第83集团军某合成旅在豫南某训练场，组织全要素多弹种实弹射击演练

MORE+ 智能

盘点乌鲁木齐那些亲子游好去处-世界最新

数百辆收割机，在高速拥堵5天？官方通报来了

官换、官翻、原封机的区别及优劣

每日快报!短债长投什么意思通俗解释如下

江苏2023高考地理试题及答案真题完整解析

美专家呼吁大学防止非裔学生被恶意打低分："种族主义教授"会压迫无辜年轻人-当前关注

国内商品期市早盘多数下跌液化石油气、纯碱跌超5%

世界速递！强制退市！昔日千亿房企告别A股！4天翻倍大牛股紧急提示：远离极端行情！

每日观察!深圳人才安居集团10亿元公司债将付息利率2.88%

环球看热讯：工人日报：立法治理“斑马线低头族”，唤醒更多人的安全意识

精彩推送

高达3.6万亿token！PaLM 2训练数据翻5倍，全新Bard对比ChatGPT有8个优势

探索人工智能的革命性技术天天讯息

AIGC风头正盛，英伟达宣布为游戏提供AI定制服务丨游戏干线

天天快资讯丨“AI孙燕姿”爆火之后，音乐何去何从？

为Apple MR而生，xrOS有何期待？天天滚动

6000建设者奋战宜来高速宜昌段且看“天路”越武陵_天天快资讯

数百辆收割机，在高速拥堵5天？官方通报来了

天天观天下！抢收、晾晒、烘干——豫南夏收一线见闻

盘点乌鲁木齐那些亲子游好去处-世界最新

618“首战”：淘宝直播“内容化”，小红书力扶章小蕙加入战局？最资讯

世界快消息！cf图标如何点亮文章带来详细讲解

0成本做增长，匿名社交的风又吹到了韩国_天天看热讯

天涯死在“乌托邦”里

焦点热门:only up游戏怎么设置中文只有up游戏中文设置教程[多图]

每日热门：奥维通信：公司目前暂未开展海外业务

汽车玻璃油墨怎么去除？汽车玻璃油墨是干什么用的？

商贸零售罗晓婷|AI+教育：优质教育资源的规模化、公平化、个性化|当前动态

AI诈骗效率高、成本低，“三个魔法”有效防范潜在威胁

环球消息！华东数交与贵数所战略签约，携手共建全国数据要素统一大市场

云从科技解禁前拟再募36亿元，大模型或成救命稻草？

清华商汤最新AI，征服了《我的世界》

官换、官翻、原封机的区别及优劣

每日快报!短债长投什么意思通俗解释如下

天天快看点丨南海西北陆坡沉船遗址第一阶段调查：最新海底画面来了！

江苏2023高考地理试题及答案真题完整解析

合肥，2023新一线城市！

daphne是什么牌子的鞋_daphne

到底什么是“5G新通话”？热议

AI接棒酸奶开发，效率提升之外还有哪些潜在意义？每日播报

环球热资讯！全省新开通5G基站2.1万个以上，《2023年江西省5G发展工作要点》已对外公示

上海网红楼盘暂停开盘 “买到躺赚2000万”泡汤？500万、2000万认购金开始退款

前沿热点：“AI换脸”诈骗，怎么防？

天天动态:出门问问冲刺港交所：2020年就已开发出通用大模型，2022年营收超5亿元

震撼！我军多型实弹射击演练点燃夏季练兵场

美专家呼吁大学防止非裔学生被恶意打低分："种族主义教授"会压迫无辜年轻人-当前关注

天天速读：异动快报：英飞拓（002528）5月31日9点55分触及涨停板

国内商品期市早盘多数下跌液化石油气、纯碱跌超5%

北京高考在即，官方提醒考生勿将手机等通讯设备带入考点每日短讯

世界速递！强制退市！昔日千亿房企告别A股！4天翻倍大牛股紧急提示：远离极端行情！

资讯推荐:6名航天员太空“会师”名场面再现

安徽省7人荣获全国创新争先奖

推进5G规模化应用！中国广电（湛河区）5G产业创新中心正式揭牌

世界今日讯！儿童伞图片_儿童伞

每日观察!深圳人才安居集团10亿元公司债将付息利率2.88%

今日讯！中国数字经济规模居世界第二

世界热消息：19岁女生疑遭孤立从宿舍坠亡，室友事后被保送？学校通报

环球播报:融资丨凌科药业完成2亿人民币C1轮融资

ofo出走的创始人，散落在天涯-天天聚看点

快播：谁会是新能源车险市场的“鲶鱼”？

每日时讯!永辉超市症结之解

环球微头条丨涉嫌信息披露违法违规新亚制程收到证监会立案告知书

「问题少年」逆袭成万亿美元掌门人！60岁黄仁勋或成LLM爆发背后最大赢家-天天快资讯

热头条丨探日卫星“夸父一号”观测到200多个太阳耀斑

奋斗圆梦中国人永远是坚定的行动派_热点

【时快讯】肯德基、西贝们，狂卷儿童餐

环球看热讯：工人日报：立法治理“斑马线低头族”，唤醒更多人的安全意识

世界微速讯：堃博医疗-B(02216)授出约225.6万份奖励股份

陆正耀“绑上”加盟商去“复仇” 世界要闻

全球观点：AI诈骗效率高、成本低，“三个魔法”有效防范潜在威胁

北京市场樱桃、荔枝价格走低，小型西瓜受热捧全球热头条

每日动态!包钢股份（600010）：5月30日北向资金减持623.19万股

周口理工职业学院正式揭牌

股债市场“跷跷板”效应显现|每日视点

tmccsf.exe是什么进程_mmc exe是什么进程

商机 | 2.76亿元！21个空调采购项目招标_天天观天下

能辉科技（301046）：5月30日北向资金增持6.97万股

环球热讯:张小勇：勇担重任，做气田效益的守护人

坤宝丸能治疗失眠多梦吗坤宝丸能治失眠吗-天天快看点

爱意女鞋价格（爱意女鞋）天天即时

库伦效率英文（库伦效率）_动态焦点

埃尔多安一胜选就找美国买F-16战机，拜登：你先同意瑞典加入北约|天天快看点

今日辟谣（2023年5月30日）

全球热消息：固态硬盘直降500、switch二手价，亚马逊的618到底图个啥？

每日观察!8mm膨胀螺丝用10还是12钻头（8mm钻头打孔用多大膨胀螺丝）

环球看热讯：华硕主板刷bios步骤华硕主板刷bios教程

世界快看点丨姜山个人资料_姜山年龄

北京哈士奇拉车_北京哈士奇全球微速讯

世界快看点丨终止合同经济补偿金怎么算_终止合同

环球观焦点：新版课程标准解析与教学指导：初中化学_关于新版课程标准解析与教学指导：初中化学简介

焦点速读：黑雷ios模拟器官网_模拟器有没有ios系统的蓝光手游大师是安卓模拟器吗

徐睿知PUA男友_徐睿智_热议

octct-stream文件_octet stream文件怎么打开|热门

2023中国计量大学拟聘用人员公示（浙江）

当前速讯：信用卡欠钱不还会坐牢吗？信用卡利息怎么减免能成功？

高盛准备进行另一轮裁员

只需10.50美元即可获得这款非接触式泡沫皂液器这是有史以来的最低价格

一些最昂贵的苹果WatchSeries6型号比以往任何时候都更实惠天天热头条

【全球播资讯】nm500耐磨钢板_NM500是什么材料

【天天播资讯】中国星辰 | 170秒多视角回顾“神十六”升空瞬间

国漫脑残粉有多无知？“你行你上”已成病态，付钱了还没资格评论

天天资讯：日元重新跌穿140背后的逻辑是啥？这次与去年有何不同

天天报道:马斯克与宁德时代董事长曾毓群会面双方会商谈什么？

吉安县气象台发布大风蓝色预警信号【IV级/一般】【2023-05-30】

LCD党有福了！12GB+512GB仅1999元，LCD屏+天玑8200-Ultra

粤秀中学在昆明排名第几_粤秀中学

四川雅江县麻郎措镇森林火灾周边受威胁群众已全部转移前沿资讯

梅西签2年12亿合同，是C罗2倍？巴萨闺蜜：肯定没有！我向你保证

挂账停息影响其他银行信用卡使用吗？逾期被起诉立案后怎么解决？

【全球聚看点】参商歌曲（参商）2023年05月25日更新

山西“西电东送”特高压通道完善工程取得阶段性成果-观热点