2023-07-06 13:17:14 来源:商业新知网
火山引擎以一种新的姿态加入了大模型赛道的竞争,那就是基于开放的大模型服务平台模式。
可以想见的是,目前已经有如此多的企业聚焦大模型,可以说在供给侧,未来的大模型能力会和水、电、煤一样俯拾皆是。
(相关资料图)
所以,对于用户来说,不用担心没有大模型可用,反而要担心如何解决选择困难症;而对于大模型企业来说,要担心的则是推广难、获客难。
而火山引擎推出的“火山方舟”大模型服务平台,不仅为诸多大模型提供了渠道、服务链路和平台,也非常适合企业采用轻量级、多尝试、易解耦的策略,广泛的尝试多家大模型提供商不同的大模型服务,让时间和实践成为最后选择的指导,让大模型生态更加自然而健康的生长。
时间进入炎热的7月,大模型赛道的热度仿佛叠加了气温,更加的炙手可热。
既有王兴接盘自己老队友的初创大模型企业这样的业内轶事,也有6月28日V-Tech体验创新科技峰会上,火山引擎推出名为“火山方舟”的大模型服务平台的重磅行业新闻。
不过笔者发现,很多读者在激动之下,很容易犯一个错误——把大模型和大模型服务平台弄混。
大模型和大模型服务平台,完全是两码事。
前者好比是一块CPU或GPU,解决的是一个核心部件的功能、性能问题;后者好比是一个商城,在这里你可以选择不同的模型以及相关的精调、评测、推理等一整套服务。
一个强大的零部件和一套完整的服务,商业价值上有巨大的差距。
比如在数字时代里,虽然我们每个人理论上都拥有一块或几块CPU,乃至我们的每一次触碰和点击,都要用到CPU。但是实际生活中,我们都是通过使用iPhone这样的整机来间接的使用CPU的。
所以某种程度上,一个解决方案的完全体,比核心零部件提供商的商业想象空间更高——全球CPU霸主英特尔的市值是1300亿美金,炙手可热的GPU霸主英伟达的市值是1万亿美金。
但苹果公司的市值却是3万亿美金。
说回这次火山方舟的发布——其实,火山引擎在今年的春季Force原动力大会上就明确表示不会做大模型了,解答了“不做什么”的问题。
而这次火山方舟的发布,解答了“做什么”的问题。
简而言之,就是火山引擎发布的大模型服务平台“火山方舟”,它面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。
它最大的特点,就是把各家的百花齐放、各具特色的大模型,集合到自家的平台上,基于独特的多模型架构,让应用企业可同步体验、尝试、应用多个大模型,进而选用更适合自身业务需要的模型组合。
仅仅在邀请测试阶段,火山方舟就集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型。
某种程度上,这等于把这七家企业的大模型,一下子提速到了马上可以落地应用的阶段,大模型服务平台的产业价值,也骤然彰显。
虽然在6月28日这天,火山引擎并没有推出自研的大模型,但就凭火山方舟的创新服务模式,火山引擎成为了目前国内大模型赛道的最大变量之一,把自己拉到了中国“模型即服务”的第一阵营。
作为全球AI唯二的创新源地,国内目前的大模型赛道可谓“群模乱舞”,但能够进入第一阵营的只有区区几家而已。
例如阿里巴巴,它在中国云计算市场上仍然处于头部优势地位,而“模型即服务”也属于广义云服务的范畴。
由于长达十几年的云计算研发、运营经验,和AI、BigData、cloud三者融合的必然趋势,阿里巴巴在云计算相关的软硬件上都做了广泛深入的投资,技术底蕴雄厚,例如其大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力大幅度压缩。
另外,阿里全自研的底层技术优势,也非常有利于构建AI服务的统一底层,这些都属于战略级而非战术级的优势;阿里的通义千问,也是国内第二家发布的生成式大模型。所以可以说,阿里目前已经可以基于自身大模型,向市场提供实际落地的大模型服务。
百度也不可不提。作为国内AI研发的正规军之一,百度应该是国内最早投入AI研发的互联网企业,多年累积投入千亿以上,生态建设全面。包括有深度学习框架—飞桨,有非常适合产生AI的业务——搜索……以及国内首发的生成式大模型——文心一言及其云服务模型“文心千帆”等。
火山引擎总裁谭待并不否认这些头部企业的优势,他指出,目前国内大模型市场的最顶层,还将是几家超级平台支撑的超级大模型并存的格局,这种存在是不可否认的。
图:火山引擎总裁谭待
那么,火山引擎作为相对的后来人,它的战略设计有何独特之处?
在笔者看来,火山引擎的打法,就是坚定走自己“多云多模型”的路,而不是跟着别人的节奏起舞。
所以我们看到,虽然火山引擎不直接做大模型,但通过为大模型企业提供AI基础设施,国内几十家做大模型的企业,多数已经在火山引擎的云上。
又比如,由于大量的服务于大模型企业,也使得火山引擎针对大模型的服务支撑不断强化,并打造了深层次的软硬件一体化能力,如火山引擎的自研DPU,将通信优化的算法直接写到网卡硬件中,以降低延迟、削减拥塞等。
如是的类似技术细节还有很多,但笔者认为,真正关键的不仅仅在于火山引擎的技术,还有它为大模型赛道设计的独特模式和竞争策略。
从AI到大模型,从大模型到大模型商业化落地,其中最大的堵点,主要不是技术问题,而是商业模式问题。
Chatgpt出现之前,各家企业的AI商业化落地,都磕磕绊绊。其实最大的问题,是没有让用户看到价值,同时也不容易让用户感受到价值。
Chatgpt出现后,大家都对AI的价值看的很清楚了,但问题是,什么样的商业模式才能迅速让大模型的优势得以发挥。
这就涉及到对大模型应用模式的底层逻辑判断。
而谭待告诉笔者,他认为未来大模型应用最核心的两个特征,是“多云多模型”和“1+N”。
所谓的多云多模型,指的是——未来的企业会同时选择不同层次的多个模型和多家企业的云服务,来解决不同层次的问题。
“未来大模型赛道的格局,会是少数几家超级模型+一部分通用大模型+很多垂直领域的细分模型”,谭待说:“这就和企业用工一样,不是所有的问题都要博士毕业的员工才能解决,博士干博士的活儿、硕士、本专科生也都根据自己的能力干力所能及的工作,才是一个相对的最优解。所以未来的大模型赛道也会是,一个企业会同时用到多种模型和多种功能。”
但模型又并不是越多越好,过多的模型增加了试错的成本,增加了技术的复杂性,所以火山引擎的判断是,未来较大的可能是,一个企业选择一个主要的大模型作为主干,同时选择多个专用模型解决不同的问题,也就是“1+N”。
无论是哪一种模式,都面临一个底层逻辑——火山方舟这样的大模型服务平台,要能提供尽可能多的选择、组合,同时提供高水平的服务。
我们可以从用户和大模型提供商的角度,来看这种服务逻辑的优点。
先从对大模型用户的突出优点来看。
第一个优点,是可以快速的“试穿试用”。
火山方舟目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等,未来可想而知的还会集成更多的大模型提供商。在火山方舟的统一支撑下,企业可以灵活选择、低成本试错,不用跨平台就能寻找更适合自己企业的模型服务。
第二个优点,是获得与模型提供商一致的服务。
火山方舟的“模型精调”模式,就是一个实用价值很高的服务。
火山引擎智能算法负责人吴迪指出,从短期看,训练大模型很昂贵,但是从长期看,模型的推理开销会超过训练开销。
图:火山引擎智能算法负责人吴迪
这意味着,模型并不是越大越好。例如,微软以医学文章为主要数据集,精调了生物领域的BioGPT-Large模型,仅有15亿参数,但在 PubMedQA 基准测试中的准确率,却优于有着上千亿乃至数千亿参数的大型通用语言模型。
而“火山方舟”提供了丰富的模型精调和评测支持。甚至可以让一家企业用统一的工作流对接多家大模型,再通过自动化和人工评估直观对比模型精调效果。
而精调其实也是需要很高的技术门槛的,所以火山方舟还将通过提供运营干预工具,让用户可以快速设置相关规则,这样在模型已经投入使用后,无需精调模型即可干预模型输出结果。
总之,是怎么便宜、实用、方便,就怎么来。
第三个优点,是超强的安全性。
聚合多模型、服务多用户,这样的架构决定了一个问题会被凸显出来,那就是安全问题。
既有模型服务商的安全问题,也有用户的安全问题。前者在意大模型的源代码安全,后者在意自己独家且精调过的数据的安全。
而火山方舟对用户的需求把握精准,通过互信计算框架,满足基于不同客户的安全和隐私保护诉求,设计了包括安全沙箱、可信硬件以及联邦学习方案,来保证合作的多方在互信的基础上推理、精调等,让模型提供商和用户都更加放心的使用。
这将是火山方舟的一个重要竞争力。
接下来,我们再分析一下火山方舟模式对于大模型服务商的优势。
首先,火山引擎作为一个成熟的云计算服务商,将很好的提升大模型企业和市场对接的效率,让大模型企业跳过“冷启动期”。
其实,无论是大模型开发企业单独提供服务,还是通过火山方舟平台,服务用户的路径在原理上基本是类似的。
但对于大模型开发企业来说,特别是在早期,单独修建这样一条服务路径的成本不仅很高,而且只能由企业自身承担,这样效率不仅低下,成本也很难被摊薄。
而加入火山方舟就相当于把商品放进了成熟的渠道,不但可以共用路径、共享服务,还可以得到火山引擎的能力加持,等于说跳过了冷启动阶段,直接进入了服务落地阶段。这对于初创大模型企业的吸引力十分巨大。
其次,火山引擎提供了应用企业所需的、完整的技术支持。
火山方舟一切从实际需求出发来提供服务——模型厂商担心算力和工程稳定性,火山引擎就提供技术支持;大模型要真正应用,安全信任和推理成本问题必须解决,火山方舟就实现了安全互信计算;更不要说,还有前叙的模型精调支持、训推一体等服务,并且可以通过公有云的弹性,帮助厂商降低成本。
最后,随着越来越多的模型被集成,有可能酝酿新的模式和能力。
我们反复的讨论过,无论是“多云多模型”还是“1+N”,本质都是不同层次、不同功能的模型能力的组合。而火山方舟的开放性,决定了这种组合是跨平台的,其组合形态和数量级会指数级的提升,因而,也为酝酿出基于全盘的最优组合乃至跨越式创新提供了机会,它不仅将成为模型服务的集合者,也会成为模型服务的创新平台。
客观的说,虽然大模型之战非常火热,但其实总体上来说,还是很初级的阶段,而其原因是多方面的:
一个是大模型技术远远没有固化,未来发展可期;
一个是现在对大模型发展路径已经开始发生争议,未来发展充满挑战;
一个是大模型的商业化落地还在探索,这才是最终决定大模型的价值体现的关键一步;
但是,很显然,大模型的开发,并不是任何企业都可以胜任的。未来这个赛道会有非常细的生态分层,例如最具实力的去开发超级大模型,有一定实力的可能专攻产业级大模型,甚至精调、预训练、数据等领域都会产生新的独角兽。
而火山方舟的价值在于,在赛道的极早期就卡位在聚合多模型的大模型服务平台的定位上,为未来发展繁衍出超级生态进行了周到的布局。
当然,不得不说的是,多模型聚合是未来模型即服务的方向,现在也有越来越多的企业宣布自己集成更多的大模型,这既是这个赛道发展的必然,也是火山方舟未来也要面对更激烈的挑战的前奏。
关键词:
MIT微软证实GPT-4涌现自我纠错能力,智能体循环根据反馈让代码迭代。
任何一个没有设计基础、没有代码基础的人都可以用1分钟生成一个自带动
MIT微软证实GPT-4涌现自我纠错能力,智能体循环根据反馈让代码迭代。
脑科学研究又进一大步。
只听说过社交媒体想方设法让用户多停留的,没听说过主动给人加个上限的
中国的VR市场上,各大互联网科技公司都不甘落后。字节跳动收购的PICO属