AI助互联网复苏,大模型创业“逛超市”

2023-07-09 10:39:50   来源:刘兴亮

丨划重点

1. 大型模型的每次训练成本通常在数百万美元以上,是一个非常消耗财力和计算资源的过程。

2. 参数是构成模型本身的要素,类似大脑神经元数量等指标,参数量大小决定了模型的复杂程度,但不意味着参数越大越好。


【资料图】

3. 大模型应用普遍存在计算能力的不足、数据的问题、大模型训练所需的工具链以及缺乏专业团队和经验四个问题。

4. 模型即服务意味着用户只用关注模型本身,而无需关心模型本身底层的各类复杂算法和工程化的过程。

丨概述

ChatGPT爆火7个月,尽管关注度略有下降,但“现象级产品”已经不足以形容这款来自人工智能时代的产品。

在很多人看来,以GPT为代表的大模型,是人类到达通用人工智能(AGI)时代的桥梁,无论是谷歌、微软这样的巨头,还是刚刚成立的初创团队,都希望押宝大模型赛道,拿到通往未来时代的门票,“万模大战”的局面就此诞生。

尽管人们对大模型、人工智能巨大的变革能力存在共识,但是在具体的模型、算法、数据和算力等领域存在不同的观点和看法。

7月5日20:00,《亮见》独家邀请到了腾讯云TI平台产品负责人 侯方,直播解读大模型数据、算力价值、应用场景探索以及平台对大模型创业的赋能理念。

在侯方看来,大模型的训练是一个成本非常高业务,模型的参数量需要跟应用场景匹配,越合适越好,算力则是越大越好,“大型模型的参数量越大,就需要更多的训练过程来填充这些参数,这也意味着成本更高”。

与此同时,侯方也分享了与客户共同推动大模型应用方面的难题,包括 “计算能力的不足、数据的问题、大模型训练所需的工具链以及缺乏专业团队和经验。”,与此同时他也提出了自己对大模型应用的建议,他说,“从目前实际的经验来看,第一个需要解决的问题是确定适用的场景。”

侯方认为会有越来越多的平台加入到赋能的行列当中,推出以模型即服务为代表的行业大模型精选商店,帮助解决客户在模型和算力方面的难题,他也呼吁更多的团队选择这样的形式踏入大模型时代的门槛,以解决企业大模型落地的成本和效率方面的问题。

以下为直播文字精华:

01

参数量越适合越好,算力越大越好

刘兴亮:先科普一下大模型的参数量越大是否意味着越好?

侯方: 大型模型看起来非常智能、复杂,实际上我们可以简单地理解它只是一系列矩阵。这些矩阵在数学中表示各种值,通过大量的矩阵运算,完成整个智能的实现。

关于参数规模,自从ChatGPT问世以来,人们迅速开始进行比较。大家惊叹于巨大的参数量,也意识到它产生了大量的智能涌现。

就模型本身而言,并不是说参数越大越好,也不是说参数越小越好,最重要的是要看你要解决什么问题。在不同问题场景下,你可能需要一个更大、更专业、更聚焦的模型,也可能只需要一个很小的模型。

所以,就参数量而言,从我的观点来看,适合的才是最好的。

刘兴亮:大模型参数是过去理解的数据吗?如果用一句话来解释可能是什么?

侯方: 简单来说,大型模型通过学习数据并将其转化为其内部的参数,这是相对直观的解释。

数据是指我们用于大型模型学习的语料,也就是我们提供给它的知识,而参数则是构成模型本身的要素,类似于我们大脑中的神经元数量等指标,参数量的大小一定程度上体现的是模型的复杂程度。

需要注意的是,训练大型模型的成本与数据、参数息息相关。模型训练涉及的数据量会影响训练成本,学习100条知识与学习1000万条知识的成本完全不同,因此数据规模对成本产生影响;而模型的参数量越大,就需要更多的训练数据和训练时间,这也意味着成本会更高。

从ChatGPT中可以看出,大型模型的每次训练成本通常在数百万美元以上,所以这是一个非常消耗财力和计算资源的过程。

大模型发展进程图,来源:新智元

刘兴亮:说到大模型,算力是躲不开的话题,到底什么是算力,对于模型来说,它的价值在哪?

侯方: 一般来说算力越大越好。

算力多意味着模型训练本身的耗时就会变短,训练模型,大模型的智能涌现过程有一些大力出奇迹的过程,所以如果你拥有更多的算力资源,那就在模型训练本身就有更多尝试的可能性。

算力是指在AI大模型训练中的计算能力,通常指的是GPU卡,也就是用于图形处理的显卡。这些显卡在并行计算方面非常擅长,并且内置了芯片和处理单元。当然,CPU也可能提供一定的算力,因为它是计算单元的一种形式,这就是算力的意义。

02

大模型应用的四个难题

刘兴亮:现如今企业对于大模型的需求体现在哪些方面?

侯方: 自从大模型问世以来,我们与客户交流和合作的频次显著增多。大家的想法和创意变得无限多样化,我们也在不断满足各种各样的需求。

在我之前接触的客户中,有几个典型的例子,最常见的一个例子是客服领域应用,以提升智能客服的体验和效率。许多企业都会面临类似的问题,无论是销售部门还是其他后勤支持部门,客服的升级是我们目前接触最多的一类客户需求。

客服领域涉及许多方面,不仅仅是直接生成答案,它还包括准确性的要求,以及完成各种具体的任务,比如预订酒店、预订机票等等。

除了客服领域,我们还接触到了许多生成类的需求,比如写小说、撰写公文、报告、视频脚本和营销文案等等,这个领域的需求非常广泛多样,因为要写的东西种类繁多,这是第二类需求。

第三类需求逐渐偏向专业领域,包括编程、研报撰写、会议纪要等等。

刘兴亮:企业现在在应用大模型方面,遇到的核心难题会是什么?

侯方: 由于ChatGPT 的出现,大家一开始都会有比较高的预期,认为大模型能够解决所有的问题。单我们与客户合作时常常遇到以下四个难点:计算能力的不足、数据的问题、大模型训练所需的工具链以及缺乏专业团队和经验。

首先是资源问题,特别是计算能力。许多企业想要进行大规模的模型训练,但他们自身的计算能力有限。例如,我们遇到过一些客户只有两张显卡的机器,但他们想要处理更多复杂的任务。这不是因为他们没有足够的资金,而是在这个领域的积累或储备相对不足,而当前市场环境下比较难找到可用的计算资源,算力供不应求已经成为一个普遍的现象。

第二个问题是数据。许多企业希望训练自己的模型,但却面临数据量不足,或者数据质量不够好的问题,而模型训练非常依赖于数据的质量和数量。此外,数据的清洗、配比和预处理等一系列工程任务也需要大量的工作,数据工程本身也具有一定难度。

第三个问题是大模型训练所需的工具链。大模型训练需要一套完整的工具链,因为这个涉及到对于高性能算力、高性能存储、多机多卡调度能力、加速框架等等。

最后一个问题是缺乏专业团队和经验。大模型的虽然越来越多,但很多企业缺乏将其落地的专业团队和经验,在实际落地的时候,会面临模型选型、数据处理、训练方法选择等问题。

刘兴亮:你会给企业管理者在应用大模型方面提什么建议?

侯方: 从目前的经验来看,首要解决的是确定适用的场景。我们在与各个客户的交流中发现,这是我们共同面临的第一个关键问题。

由于大模型技术还比较新颖,没有人能够断言自己的大模型在某个特定场景下就是绝对最佳选择,这需要我们不断摸索和实践。

其次是算力、数据、平台工具的建设,这些都是需要考虑的关键因素。

最后是一个比较普遍的建议,即拥抱大模型。由于大模型对于许多软件和业务设计,包括解决特定场景下问题的方法,都提出了全新的思路和交互方式。

03

人工智能让互联网“又行了”

刘兴亮:有哪些原因和客观条件促成了现在的大模型的创业潮?

侯方: 大模型技术的出现是整个技术领域中的一次根本性变革。

过去,我们更加注重算法,而随后逐渐发展到深度学习阶段,这个阶段数据的作用开始凸显,但算法在其中仍然占有相对较高的比重。

随着大模型的出现,会发现只要提供数据和算力,模型就能自主学习很多东西。在这种情况下,算法本身的重要性在逐步降低,从技术的发展路径来看,这是一个非常大的变革和进化。

而从应用的角度来看,过去几年,AI在企业中的落地场景越来越多,应用也越来越广泛,并且融入到人们的生活中,接触度也越来越高。

在以上几个因素的推动下,人们开始坚定地拥抱AI和大模型技术。

刘兴亮:AIGC的价值到底是什么,它给互联网行业带来什么样的变化?

侯方: 大模型最大的特点是生成式,通过将大量的数据和知识映射到数学空间中,通过多个维度对这些知识进行解构。一旦知识被解构,它们就可以通过重新组合产生现实中的各种作品,如艺术绘画、文字或其他创作。

大模型的运行依赖于大量的计算过程,这意味着它能够以一种非常结构化的方式学习和创造,利用上千亿个维度进行随机组合,从而产生令人难以置信的作品,这就是为什么有时候它创作的画作或文案让人感到惊讶,而人类自己往往无法想到或写出这样的作品。

因此,AI和大模型技术在内容创作领域,尤其是内容生成方面,将带来许多新的技术,辅助或替代人类的创作过程,使我们能够更加聪明地生成内容,这确实是一种非常有效的状态。

AIGC的上中下游,来源:《AIGC+AI生成内容产业展望报告》量子位智库

刘兴亮: 在算力和数据上,小团队其实不占优势,选择成熟的开源大模型进行训练难道不香吗?

侯方: 实际上,现在很多企业都会尝试开源模型,大模型的发展离不开开源社区的贡献。

不过,使用开源模型进行训练存在一些门槛,需要一定的算法知识和行业经验。

从落地的可行性的角度来看,更建议的做法是选择云厂商提供的行业大模型,这些模型通常会针对特定行业进行优化,会更适合解决企业的实际问题。

04

让大模型创业变成“逛超市”?

刘兴亮:我知道腾讯行业大模型不久前也刚刚发布,腾讯云也推出了大模型精选商店,并且提出了模型及服务(MaaS)的概念,应该是在行业较早的提出这种行业大模型的模式,那什么是大模型精选商店,什么是模型即服务?

腾讯云Maas,打造一站式行业大模型精选商店

侯方: 先从MAAS开始说起,这个概念其实很有趣,也是一个不断演变的过程。

从最开始的基础设施及服务(Infrastructure and Services,简称IaaS),到后面的 PaaS,再到现在的 MaaS,都是在让云服务本身变成越来越简单,以前使用的服务需要客户业务系统自己开发实现,随着 MaaS 服务的普及,会越来越降低大家使用 AI 服务的门槛。

MaaS在AI和大模型领域里有很多重要的意义,它意味着我们可以将底层的内部工作完全包装起来,用户只需关注一个问题:向模型请求某些东西,模型直接提供对应的服务。

目前行业内有模型领域有大量的可供选择,不完全统计已经超过800个模型。面对如此多的选择,我们需要思考如何选择和应用模型,类似的问题在算法模型方面也存在。因此,腾讯的思路是在TI平台上精选了各个行业的大模型,类似“模型超市”的概念,根据客户场景和行业特性进行精选,以提供最适合的模型。

刘兴亮:模型商店给客户提供的核心价值是什么?

侯方: 多个行业的高质量大模型,相应的配套工具,更低成本,更高效地帮助企业应用大模型,这是大模型精选商店的三个核心价值。

刘兴亮:从实际的观察来看,行业大模型是目前AI大模型技术落地的有效路径吗?

侯方: 行业大模型是目前来看比较有效的路径之一,在面对一些普遍性的挑战,包括算力、数据时,行业大模型提供了一个较好的解决方案。然而我们很难确定未来五年或十年的发展方向,因为大模型的产业革命才刚刚开始,它将演化成何种状态还不得而知。

刘兴亮:AI大模型商业化落地有哪些方式?

侯方: 行业大模型是一个有效的方式,因为在商业化落地中,我们除了解决问题外,还要考虑到ROI,这是商业化中大家都关注的核心问题。

我认为,在商业化落地中,一个关键因素是创造出能够解决客户问题的价值,无论是商业提供方还是商业需求方。只有这样,商业化落地才能持久发展。商业化落地不仅涉及解决客户问题,还涉及人们情感和交流需求等方面。虽然这种场景可能不一定是行业大模型所涉及的,但它确实也是一个非常好的商业化落地场景。

关键词:

精彩阅读

AI助互联网复苏,大模型创业“逛超市”

智能

丨划重点1 大型模型的每次训练成本通常在数百万美元以上,是一个非常消

新股风向标:本周6只新股上市2家破发,“大肉签”豪恩汽电一签赚30000元

智能

本周A股迎来6只新股上市,目前A股上市公司数量5223家。本周上市的新股

亳州“超速王” 飙到165km/h!

智能

亳州“超速王”飙到165km h!

今年上半年全国铁路完成固定资产投资3049亿元

智能

今年上半年,全国铁路固定资产投资呈持续增长态势。重点项目建设取得新

西班牙欧洲杯4强,葡萄牙狂胜晋级

智能

北京时间7月8日凌晨,U19欧洲杯第二轮B组2场比赛,西班牙5-0狂胜希腊,

6版关羽形象对比,根据3个特点推断,你觉得有几位最接近真人?

智能

历史上真实的关羽形象:特点1、身高2 07米;特点2、魁梧健美;特点3、

红米k40pro屏幕录制

智能

要在红米K40Pro手机上进行屏幕录制,可以按照以下步骤操作:1、打开手

独守空房打一个成语(独守空房打一生肖)

智能

独守空房打一个成语,独守空房打一生肖这个很多人还不知道,现在让我们

12名硕博生走进泰州姜堰

智能

为推动高层次、急需紧缺型人才向产业链集聚,7月8日,南京工业大学—姜

迪亚多纳中国官方网站(迪亚多纳官方旗舰店)

智能

来为大家解答以下的问题,亚多纳中国官方网站,迪亚多纳官方旗舰店这个

财富

Meta的Twitter竞品Threads用户数突破7000万

资讯

Meta的Twitter竞品Threads用户数突破7000万,据报道,Meta的Twitter竞品

机器人首次在联合国答记者问:我们不会抢走工作、反抗人类

资讯

机器人首次在联合国答记者问:我们不会抢走工作、反抗人类,当地时间周

上海浦东新区无驾驶人智能网联汽车正式上路:百度智行等三家企业获首批道路测试牌

资讯

上海浦东新区无驾驶人智能网联汽车正式上路:百度智行等三家企业获首批

不要跟自己过不去

资讯

不要跟自己过不去,接纳,是客观看待评价。

韩媒:苹果与显示面板供应商洽谈推出可折叠MacBook机型

资讯

韩媒:苹果与显示面板供应商洽谈推出可折叠MacBook机型,7月8日,据韩媒

中汽协:删除《汽车行业维护公平市场秩序承诺书》中表意不当条款

资讯

中汽协:删除《汽车行业维护公平市场秩序承诺书》中表意不当条款,7月6

TYMO完成数千万人民币A轮融资

资讯

TYMO完成数千万人民币A轮融资,个护小家电出海品牌TYMO完成数千万人民币

比亚迪:预计本月内泰国门店数量将达到60家

资讯

比亚迪:预计本月内泰国门店数量将达到60家,比亚迪汽车官微消息,7月6

腾讯张立军:游戏已成为推动芯片、AI等技术发展的强大驱动力

资讯

腾讯张立军:游戏已成为推动芯片、AI等技术发展的强大驱动力,7月8日,

一根雪糕卖1800元热传,知名品牌回应

资讯

一根雪糕卖1800元热传,知名品牌回应,近日,网传博柏利(Burberry)推

全球热门:成功入选!用友推动产业互联网和专精特新中小企业高质量发展

7月5日下午,2023全球数字经济大会专题论坛-2023产业互联网创新发展论

推特用户浏览量被限制,马斯克再出奇招,Meta如何应对? 环球热点评

据报道,Threads是meta基于Instagram推出一款与推特竞争的独立应用,该

263集团李玉杰:专注AIGC应用落地,实现数字连接创新_头条

李玉杰表示,新一轮科技革命成为拉动我国的数字经济发展的新引擎。

持续深化“3+3战略”,亚马逊云科技构建生态的“长期主义” 今头条

在数字经济与实体经济深度融合的今天,企业上云步伐不断加快,云生态所

上半年全国铁路发送旅客17.7亿人次,接近2019年同期

澎湃新闻记者从中国国家铁路集团有限公司(下称国铁集团)获悉,今年上

1050笔记本推荐(1050笔记本哪个性价比高)

1050笔记本tesbotThinkpro款式性价比最高。这一款1050笔记本性能释放依

“不缺游客缺门票”如何解

炎炎暑热挡不住人们出游的脚步。多家在线旅游平台预测,今年有望迎来近

键盘上下划线怎么输入(下划线怎么在键盘上打出来)

盘上下划线怎么输入,下划线怎么在键盘上打出来这个问题很多朋友还不知

中核青海“绿电”赋能杭州亚运

本报讯(记者王菲菲通讯员孙璐)“按照测算,一块位于青海省海南藏族自

田鸡粥(田鸡粥怎么煮)

一、“田鸡粥”的来历田鸡粥是一种经典的家常菜系,源自明清时期,是广