每日速看!大模型「涌现」的四个关键

2023-04-12 14:19:53   来源:商业新知网

作者 | 吴鸿键

“最近大模型的涌现,比大模型能力的「涌现」都要快。”


【资料图】

「涌现」是一个专业概念,放在大模型的语境里,指的是模型在突破某个规模时,出现了意想不到的能力。这话虽然是调侃,但也高度概括了行业现状。

ChatGPT在全球掀起热潮以来,国内已有多家公司发布或将发布自己的大模型,这些公司中既有阿里巴巴、百度、京东、华为等互联网或科技大厂,也有以商汤为代表的AI公司,以及备受瞩目的初创企业(例如王慧文的光年之外,王小川的百川智能)。

如果再把科研院所算上,据民生证券的统计,国内目前已有超30个大模型亮相。行业俨然有大模型“军备竞赛”的意思。

“混战”本身说明了不少事情,比如各家都已认识到大模型的价值,试图通过大模型升级已有业务和打开新增长空间。即使人们普遍认为大模型门槛高,但“百花齐放”也折射出业界认为大模型的发展尚处早期,且并不是只有极少数大玩家才能参与的游戏。

机会看上去很多,但拨开冗杂的信息,我们需要判断,大模型的“涌现”是不是昙花一现?以下四点值得关注。

产业融合成共识

相比ChatGPT在用户端的热潮,国内厂商更愿意谈大模型和产业的结合。“客户”是高频词,“接入我们的大模型”是共同目标。

以阿里巴巴的通义大模型为例,近期,阿里云官宣自研大模型“通义千问”并面向企业开始邀请测试,在阿里云峰会上,包括张勇在内的阿里云高管频频强调大模型能为各行业企业带来的价值。据阿里云智能CTO周靖人介绍,未来企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。

早些时候发布“文心一言”的百度,也是将B端“生态圈”作为宣传和业务重点。华为云盘古大模型提出了“AI for Industries”理念。推出大模型“日日新”体系的商汤,更是只面向政企客户开放API。

大环境对于生成式人工智能服务相对谨慎的态度、企业各自的资源和能力禀赋、以及在C端体验上和ChatGPT的差距,都可能是造成差异的原因。上述案例的共性是,大模型对于各家企业并非一个“另起炉灶”式的新业务,而是对已有业务方向的延伸和突破,对大模型的理解依然要放在公司已有的业务发展框架里来看。

依然以阿里云为例,云计算公司容易陷入“低毛利集成商”困境,难以在标准化和定制化之间找到平衡。预训练大模型带来了新的可能——在阿里云方面的设想中,企业只需将数据放在专属数据空间,用于大模型自动学习,然后就能生成企业专属的大模型。相比原本“什么都要从头做”的业务模式,大模型提供了效率更高的选择。

扬长避短,各秀肌肉

目前,国内的大模型厂商并不讳言和OpenAI、ChatGPT的差距,只是各家对于“差距有多大”有一些不同的判断。

相比OpenAI,国内互联网大厂有成熟的业务矩阵,多元的能力架构,以及在多年实战中锻炼出来的差异化能力,因此大公司们愿意强调的能力和方向也有所不同。

例如张勇在云峰会上表示,阿里巴巴所有产品未来都将接入“通义千问”大模型。此举意在利用大模型升级甚至改造现有业务体系,阿里云方面将这种融合视为未来发展的关键,称“阿里巴巴和所有企业都在同一起跑线上”。

除了拿自家业务当试炼场,阿里云还在峰会上提及其他优势,比如指出大模型的研发不是简单的“堆叠算力”问题,强调阿里云在低碳低能耗方面的能力积累。这也是阿里云提出为企业打造专属大模型的重要原因。

百度的优势来自其在中文搜索引擎的领导地位,因此公司在发布文心一言时,着重强调了其“更懂中文”的特性。商汤则更多强调其在参数和算力上的优势。“日日新”体系包含自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar),其中“商量”参数约1800亿。商汤方面还强调,SenseCore大装置已完成2.7万块GPU的部署,并实现了5.0 exaFLOPS的算力输出能力,最高可支持万亿参数超大模型的训练。

除了应用,在和大模型相关的芯片和框架方面,国内大公司也有现成的积累。百度有昆仑芯、深度学习框架飞桨,华为有昇腾310和910芯片,ModelArts平台。这些同样是大厂在发展大模型时着重利用的对象。

大模型不稀缺,

高质量数据才稀缺

大模型“混战”还反映了一个信息:至少从表面上看,大模型不再稀缺。

民生证券在研报中指出,因为有开源基础以及大公司自本身的算力储备和资金实力,“单纯发布一个大模型的门槛没有市场想象中的那么高”。

“有大模型”不难,难的是“有一个能持续迭代,性能不断提升的优质大模型”。一些观点也提到,决定大模型发展的关键要素是高质量数据,尤其是在大模型“百花齐放”的背景下,数据是“胜负手”。

数据、算法、算力是AI能力三要素。

高质量的数据是助力AI训练与调优的关键,在和数据相关的流程中,数据采集、数据标注和数据质检又是较为重要的三个环节。但相比大模型的热闹,目前国内的数据相关产业链还有不小的提升空间。

据“自象限”的观察,目前数据质量在国内尚未受到足够重视,缺乏专门做数据质量的企业,这类企业更多是以大公司附庸品的形态出现。

而在海外,数据质量形成了垂直赛道,其中的公司会帮助AI企业最大限度地减少劣质数据带来的影响,这类公司产品通常包括数据可观察性平台、数据整理和偏见检测工具,以及数据标签错误的识别工具等等。

到底需不需要这么多大模型

最后是一个灵魂之问:行业需不需要这么多大模型?或者说,在大厂相继发布大模型的背景下,新玩家还有没有加入混战的必要?

大佬们对此有不同的看法。早些时候李彦宏在接受采访时表示,现在国内大厂都看好AI大模型,创业公司重新做没有多大意义。相较而言,“基于大语言模型开发应用机会很大,没有必要再重新发明一遍轮子”。

并不是所有人都认同这一观点。根据“品玩”的采访,王小川认为“大模型就是需要时间长一点,认真一点,而钱也不是唯一重要的”,“有些公司虽然有大模型这个底子,但没碰好就练歪了,上战场更难受。”

由于大模型的门槛和不确定性,留给中小厂商以及创业公司的难题还有很多——规模跟不上大公司的节奏,中模型或小模型难以找到竞争点,也难以获得“涌现”机会。如果选择垂直场景切入,又有可能遭遇来自通用大模型的“碾压”,一如ChatGPT对Jasper.AI的冲击。

大部分关于这类问题的讨论,比如要不要做大模型,要做什么样的大模型,要选择什么样的场景来落地等等,目前都还处于“混沌”状态。不少人在表达观点时还会特意强调“就目前的情况看”,并表示自己未来可能会在观点上有摇摆。但行业普遍认为,大模型代表着大机会,最后只有少数玩家能留下。

关键词:

上一篇:
下一篇:
精彩阅读

每日速看!大模型「涌现」的四个关键

热点

是诸神之战还是又一场大跃进?

天天百事通!风语筑参股企业星图比特成为阿里云“通义千问”首批企业级生态合作伙伴

热点

风语筑参股企业星图比特成为阿里云“通义千问”首批企业级生态合作伙伴。

世界通讯!对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

热点

相较百度而言,虽然后者还没有推出可商用的大模型产品,但也纷纷转投了大部分精力到大模型的研发工作上。

世界快报:国家知识产权局办公室印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》

热点

近日,国家知识产权局办公室发布了关于印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》的通知。

天天速读:老虎证券首测带ChatGPT的炒股软件 券商+AI能撞出多大火花?

热点

由于ChatGPT爆火全球,近期不少券商都对人工智能生成内容(AIGC)技术赋能数智化转型跃跃欲试。

天天视点!2023年第一季度XR趋势分享会将于4月20日线上举行

热点

尽管元宇宙产品生态尚未成熟,但XR赛道依旧火热,开年以来,大批AR玩家入局。

【世界快播报】欧洲迎来百亿亿次级计算机

热点

JUPITER将落地德国,推动欧洲进入百亿亿次级超级计算领域。

eSIM尚未崛起 半路杀出个程咬金

热点

无论是市场接受度的提升,还是产业链格局的调整,以及政府监管政策的改变,件件皆非小事。

环球最新:本周AI最重要的事SAM

热点

近日,MetaAI在官网发布了基础模型SegmentAnythingModel(SAM)并开源。

财富

环球热文:融资丨「德适生物」完成超亿元融资,远翼投资领投

资讯

融资丨「德适生物」完成超亿元融资,远翼投资领投,继续加大染色体AI诊断技术

环球视讯!Keep卖货,生意难做

资讯

Keep卖货,生意难做,Keep何时能实现盈利自由

融资丨「路凯智行」完成数千万元A轮融资,金善基金领投

资讯

融资丨「路凯智行」完成数千万元A轮融资,金善基金领投,继续深耕矿山无人驾驶赛道,加速实现商业化落地

环球微资讯!融资丨「蓝极医疗」完成数千万元A+轮融资,合肥中合欧普医疗健康产业基金领投

资讯

融资丨「蓝极医疗」完成数千万元A+轮融资,合肥中合欧普医疗健康产业基金领投,募集资金将用于蓝激光微创、光动力诊疗一体化设备

融资丨「莲雾智能」完成数百万元天使轮融资,华盛人和投资

资讯

融资丨「莲雾智能」完成数百万元天使轮融资,华盛人和投资,本轮融资资金将用于内容团队组建及市场开发

电视突然闪退怎么办?电视机屏闪是什么故障?

资讯

电视突然闪退怎么办?1 软件不兼容:由于软件经常需要更新,这就造成最新版本的软件与电视或盒子的系统发生不兼容问题,当出现这种问题时,可以

空调泵坏了如何维修?空调提升泵工作原理?

资讯

空调泵坏了如何维修?1、系统内混入有空气,压缩机运行时候空气中有支持燃烧的氧气,加上压缩机的机油以及制冷剂,压缩机运行时一段时间产生

如何拆冰箱冷藏柜门板盖?冰箱冷藏框架怎么拆?

资讯

如何拆冰箱冷藏柜门板盖?首先,确保冰箱中的所有食物和饮料都被移出。然后根据您的帝度冰箱型号查找说明书,了解拆卸过程的具体步骤。一般

电磁炉万能控制板怎么接线?电磁炉万能板的安装?

资讯

电磁炉万能控制板怎么接线?1、18V接LM339第3脚。2、12V 18V接风扇接入端,(有的风扇是用12V电压的)。3、5V接CPU(一般接20或者1脚,具体因不

空调室内滴水是什么原因?空调滴水自己怎么修理?

资讯

空调室内滴水是什么原因?1、如果空调过滤网灰尘过多,只要对空调过滤网进行一个彻底的清洁,恢复亲水铝箔的亲水性,使得冷凝水能够顺利进入

天天百事通!风语筑参股企业星图比特成为阿里云“通义千问”首批企业级生态合作伙伴

风语筑参股企业星图比特成为阿里云“通义千问”首批企业级生态合作伙伴。

世界通讯!对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

相较百度而言,虽然后者还没有推出可商用的大模型产品,但也纷纷转投了大部分精力到大模型的研发工作上。

世界快报:国家知识产权局办公室印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》

近日,国家知识产权局办公室发布了关于印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》的通知。

天天速读:老虎证券首测带ChatGPT的炒股软件 券商+AI能撞出多大火花?

由于ChatGPT爆火全球,近期不少券商都对人工智能生成内容(AIGC)技术赋能数智化转型跃跃欲试。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个