环球观点:百度平地起“雷”,突然爆出的QPS数据意味着什么?

2023-04-24 12:21:16   来源:商业新知网

鲁迅先生1923年在北师大发表了著名的演讲《娜拉走后怎样》,其中的提问与思考方式振聋发聩,直到今天也依旧有效。面对很多产业现象、技术趋势,我们也不妨多问几个“之后怎样”。


(资料图)

比如说,自ChatGPT爆火之后,中国各个互联网、科技公司竞相推出了自己的大语言模型及相关应用。其实,关于中国能否有ChatGPT我们从未担心过,而问题的关键在于“之后怎样”。

层出不穷的大语言模型,让人眼花缭乱。但如此多的大模型,差异化和竞争力从何而来?能否顺利、低成本实现产业落地?能否有效支持模型的快速迭代?

发布大模型并不是终点,而是一场新长跑的起点。如果不能有效回答这些问题,那么大模型也最终会像其他技术风口一样,倏忽而来,倏忽而去。

慢慢地,“大模型之后怎样”这个问题,也开始有了答案。4月23日,我们看到一份百度文心一言内部流出的会议纪要。其中显示, 从3月开始,文心一言启动邀测后的一个多月内,其模型已经迭代了4次,最近一次带来的推理效果提升了达到123%。

到底是什么支持文心一言完成了这种超越常规的迭代速度?

这个“秘密”或许正是中国大模型走向未来所需要的动力,也是“大模型之后怎样”的某种答案。

内部会议纪要

透露出文心一言的奔跑速度

根据内部纪要内容显示,文心一言在开启邀测后用户数与同时在线人数都极速增长,面临这种情况,文心一言需要及时获得更快的响应速度。我们知道,机器学习类模型的应用逻辑包含数据准备—模型训练—模型推理几个步骤。文心一言面临的响应挑战,就是需要及时强化模型的推理能力。

为了实现这个目标,百度对文心一言进行了模型层与框架层的联合优化,从而在一个月内迭代了4次,实现了模型推理能力的极大提升。

是什么让文心一言获得了这样的奔跑速度?这就要提到百度飞桨“提前”做好的准备。作为深度学习开发平台,飞桨可以支持AI模型从训练到推理的全流程落地。其中,飞桨模型推理服务就可以有效支持大模型升级,这一服务在4月19日刚刚再次迭代,已迭代至3.5版本,它的特点是在业内首创了支持动态插入的分布式推理引擎,从而可以更有效完成庞大数据规模的AI模型进行推理部署。

至此我们可以从这份内部纪要中知道,文心一言能够快速持续迭代,并且低成本落地应用的关键,就藏在这里——飞桨与文心一言联合优化。

从结果上看,联合优化带来的价值非常显著。 飞桨帮助文心一言实现了模型推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。 其中,模型推理效率提升10倍,意味着推理成本降低为原来1/10,或者可以为10倍数量的用户提供服务;模型推理性能提升50%,意味着飞桨可以帮助文心一言工艺更精密,模型的学习效果与鲁棒性更强;模型算力利用率提升1倍,是由于飞桨向下兼容到芯片,实现全栈联合优化,从而可以极大降低文心一言的算力开销。

从这几个方向可以看出,飞桨为文心一言带来的价值,是持续性且多方面的,其中最重要的是,飞桨让文心一言可以持续性、低成本向前奔跑,不断进化。

这也恰好解释了这个问题:大模型,路在何方?

飞桨

让大模型节奏飞起的AI引擎

在ChatGPT全球化爆火,各家厂商、投资人,都在不遗余力地挤上大模型赛道。这种情况当然可以理解,但也必须看到,这条赛道不仅门槛高、入局难,在入局之后构建持续竞争力同样很难。

大模型意味着庞大的算力开支、数据开支,以及更为恐怖的模型迭代成本。入局大模型之后,必须根据用户反馈快速迭代,高效率升级,否则一不小心就会掉队,在第一轮风口过去后陷入行业洗牌,紧跟行业趋势,不断推动模型升级,又会面临巨大的工作量与模型推理成本。

这个两难选择并不遥远,很快就会成为困扰大量新玩家的头疼问题。

而多年部署AI基础设施与基础技术的百度,其优势就在这时显示了出来。飞桨与文心一言的联合优化,让文心一言在训练和推理过程中效率大幅提升,实现了真正的人家起跑,我已经几轮加速,节奏快到飞起。

大模型与AI开发平台,是相辅相成、互为表里的关系。比如有分析人士解读认为,“大模型就仿佛汽车的发动机,光账面上的动力强,参数大是没有用的,要压榨出发动机瞬时最大爆发力(QPS)以及最优的性能表现。深度学习框架就像是生产发动机和变速箱的,可以让发动机整体部件组合更精密、动力更强。自研产品彼此适配度更高,协同会更高效,这可能是效率提升的最根本原因。”依托风口入局大模型,终归会有一种空中楼阁的隐忧,至少难以将全面的技术栈掌握在自己手中,实现更高效、可控的模型升级。

由此可见, 大模型走向成功,除了算力、数据的基础之外,深度学习框架同样扮演着关键角色。 面对纷繁而出的大模型,百度文心系列大模型的差异化优势,也就在百度十年搭建的飞桨平台中展露了出来。

而当我们把大模型与飞桨的联动关系,放到科技自立自强的战略高度来审视。又会发现一些别样的答案:飞桨既是百度的AI护城河,也是中国大模型的动力引擎。

中国AI

胜负系于工程化

最近,我们能看到很多大语言模型的发布会,差不多每一家都会说,我们目前确实不如ChatGPT,以后继续努力。

那么问题来了,怎么努力?

事实上,努力不是说说就行了,而是要找到方式和方法。ChatGPT代表的算法优势、人才优势、算力优势都是短期很难抹平的,至少看不到可以快速超车的战略空间。 中国AI想要走通大模型这条路,就只能扬长避短,而中国AI的优势在哪呢?从百度流出的内部会议纪要中其实已经告诉了我们答案:工程化。

通过飞桨长期坚持的AI工程化路径的掌握与打磨,我们可以看到百度发展大模型的独特优势,同时也可以看到中国AI整体性的战略机遇。

首先,对于百度内部来说,通过飞桨牢牢把控工程化能力,可以提升文心一言的迭代速度,降低算力、人工、数据等开销,从而让文心一言能够在同等成本下服务的用户更多,适配产品的效率更高。这就像同样从一处名叫“大模型”的深海油井取得原油,飞桨就像一艘轮船,船速更快,运量还大,而其他人在用帆船运输。效率意味着成本,成本意味着商业化可能性,这就是飞桨的价值,也是AI工程化能力的魅力。

从百度向外看,飞桨带来的工程化能力,意味着文心系列大模型的推理成本更低,继而导致其在各行业、各场景中的落地成本更低。这对于文心大模型融入行业,通过产业智能化产生价值是个重大利好。大模型走向千行百业,是今天每家公司都在喊的口号,但这个过程中,一定不能把模型落地成本全部转嫁给行业用户。消解这一成本的关键,也在于飞桨代表的工程化路径。

最后,当大模型已经上升为国家战略,我们必须看到AI框架在科技自立自强进程中扮演的角色。如果事关国计民生,每天与无数国人进行问答的大模型,建立在其他国家的框架上,那么其危险系数可想而知。当大模型愈发重要,关注并持续解决深度学习框架卡脖子的隐忧就更加重要。

而从另一个角度看,AI框架与AI开发平台代表的AI工程化能力,是中国AI技术最亮眼、最特殊的部分。这一部分下接芯片,上达应用,通向千行百业的AI开发需求,恰好是AI技术中的战略要冲所在。 中国AI能否扬长避短,实现超车,极大概率就系于工程化能力的建设与发挥,系于AI框架与产业智能化的连接中。

中国大模型,就是行业大模型,就是强工程化、强落地性的大模型,只有走通这条路,中国AI才有未来。

关键词:

精彩阅读

环球观点:百度平地起“雷”,突然爆出的QPS数据意味着什么?

热点

发布大模型并不是终点,而是一场新长跑的起点。

独家 | 出门问问最快第二季度赴港上市:核心业务包括但不仅限于生成式AI 天天观速讯

热点

李志飞和他的出门问问可以说是当下这个AIGC热潮中相对比较脚踏实地的一个国内团队。

数字科创丨六棱镜数字化赋能北京市知识产权信息公共服务效率与质量提升-焦点关注

热点

六棱镜数字化赋能北京市知识产权信息公共服务效率与质量提升。

每日报道:人工智能发展太快了吗?听听谷歌AI大咖们怎么说

热点

万豪克:如果我们能给机器人提供多样化的体验,在不同的环境中有更多不同的物体,机器人在每一个方面都会变

观速讯丨人们为什么越来越不爱扫码?

热点

大多数消费品没有基因去做这样的衍生内容。实际上,不同的消费品在面对不同消费者时,不用一味地执着于做内

世界新资讯:紫辉创投郑刚炮轰罗永浩里面一套外面一套 罗永浩回应:郑先生记错了

热点

紫辉创投郑刚今天早些时候发文炮轰罗永浩,称将联合几十位投资人坚决对其发起回购的消息引发热议。

FinTech荣誉 | 神州信息腾讯云携手 开放生态促成果转化_焦点

热点

神州信息腾讯云携手,开放生态促成果转化。

聚焦大数据场景,神州控股如何深挖数字经济?_天天热门

热点

据工信部统计,软件业利润增速较上年同期回落1 9个百分点,主营业务利润率回落0 1个百分点至9 1%。

【核芯观察】卫星通信产业链分析(二)

热点

卫星通信产业链冗长,从卫星制造到发射,从地面设施和终端再到卫星通信运营和服务,每个部分都是一个完整的

财富

环球聚焦:美团、朴朴偷袭叮咚,预制菜能撑几时?

资讯

美团、朴朴偷袭叮咚,预制菜能撑几时?,叮咚买菜旗下预制菜品牌“朝气鲜食”正式发布

融资丨「司库立方」获数亿元C轮融资,持续聚焦司库赛道 全球看点

资讯

融资丨「司库立方」获数亿元C轮融资,持续聚焦司库赛道,持续聚焦司库赛道

融资丨「深浅优视」完成数千万融资,提供3D工业相机及软件方案 全球今热点

资讯

融资丨「深浅优视」完成数千万融资,提供3D工业相机及软件方案,提供3D工业相机及软件方案

被裁员?原画师们正忙着用AI作画-环球信息

资讯

被裁员?原画师们正忙着用AI作画,拥抱时代,或被时代抛弃。

储能投资井喷,融资事件暴增64%,10年融资超1900亿丨创业邦《2023中国储能产业研究报告》发布

资讯

储能投资井喷,融资事件暴增64%,10年融资超1900亿丨创业邦《2023中国储能产业研究报告》发布,创业邦研究中

华为电池休眠时始终保持网络连接?手机永不休眠怎么开启?

资讯

华为电池休眠时始终保持网络连接?解决办法就行。你可以在华为手机设置里面设置30分钟休眠,这样会时间长一点。因为手机本来就没有永不休眠

远近在线是干嘛的?远近在线定位器为什么离线?

资讯

远近在线是干嘛的?1 首先打开手机桌面上的摄像机进入;2 然后在首页点击右上方的加号添加;3 最后在弹出的多功能中选择添加设备或者扫码即可

itools识别不了苹果手机?itools怎么导出照片?

资讯

itools识别不了苹果手机?1、打开iTools,点击工具箱——数据管理——手机搬家2、连接两部设备,注意新旧设备摆放位置,左为旧设备3、查找我

oppoa55是超级闪充吗?oppoa55手机在哪设置闪充?

资讯

oppoa55是超级闪充吗?想要闪充就需要特定功率的充电头和线,但是仅有这些还不够,充电头还需要拥有oppo专门用的vooc闪充协议,才可实现闪充

华为来电屏幕不显示怎么办?华为来电不会自动亮屏?

资讯

华为来电屏幕不显示怎么办?1 手机未开通来电显示功能,建议联系运营商咨询开通和相关收费事宜。2 对方使用的是网络电话软件拨打的电话。3

独家 | 出门问问最快第二季度赴港上市:核心业务包括但不仅限于生成式AI 天天观速讯

李志飞和他的出门问问可以说是当下这个AIGC热潮中相对比较脚踏实地的一个国内团队。

CG大佬暴击AI现场!(字太苍白,进文看图)|环球资讯

AI和人类顶级画师,正式打起来了。

数字科创丨六棱镜数字化赋能北京市知识产权信息公共服务效率与质量提升-焦点关注

六棱镜数字化赋能北京市知识产权信息公共服务效率与质量提升。

每日报道:人工智能发展太快了吗?听听谷歌AI大咖们怎么说

万豪克:如果我们能给机器人提供多样化的体验,在不同的环境中有更多不同的物体,机器人在每一个方面都会变

观速讯丨人们为什么越来越不爱扫码?

大多数消费品没有基因去做这样的衍生内容。实际上,不同的消费品在面对不同消费者时,不用一味地执着于做内

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个