数字人也有“灵魂”?大模型被三六零玩明白了

2023-06-15 09:01:46   来源:商业新知网

作者 | 贝隆行业研究

数据支持|勾股大数据(www.gogudata.com)


(相关资料图)

昨天下午,还是那袭红衣,360集团创始人周鸿祎又带着惊喜来了----智脑大模型4.0版发布会如期召开。

这距离3.0版的发布也就13天,离2.0版也就26天,也就是说不到一个月就连发两版,先不说其他,光这“成长”速度就不得不令人咂舌。 当然,国内大模型这种“你追我赶”的势头,有利于我国大模型能力的快速提升乃至相关产业链,形成更浓烈的创新环境和氛围,对用户和中小企业们等参与者未尝不是一件好事。 可能是有了前几次的经验,再加上权威评测数据的铺垫,市场对于此次发布会的期待亦可见一斑---三六零于昨日早盘迅速拉涨,直逼涨停,并带动一众大模型概念股集体飘红。 事实上,360的这场发布会全场看下来,也算是不负众望---干货满满、金句不断,甚至不乏一些惊艳之举。 大体而言,本场发布会的核心或者说重头戏可以归结为三件事: 展示4.0版的多模态能力、360全系产品接入、重新定义数字人。

1

展现多模态交互能力

在周鸿祎看来,国内大模型的基础能力基本处于同一起跑线上,但迭代速度已经接近国际平均水平,要想“弯道超车”关键还需在多模态领域发力。 “未来大模型的能力是多模态能力的竞争,只有多模态的全面能力,才能标志着大模型真正地迈上一个新的台阶。”他认为。 360于2015年成立AI研究院,2018年开始发力多模态。如今的360智脑4.0已具备跨模态生成能力,包括文字处理能力、图像处理能力、语音处理能力、视频处理能力。具体可实现图生图、文生文、图生文、文生图、视频生文、文生视频等,并在现场得到了逐一演示。

1)文生图:生成“熊猫爬长城”

2)图生图:例如身份证生成证件照、证件照换背景;

3)图生文:根据图片描述、判断图片不合理的地方

4)视频理解:检测视频中的车辆、广告牌、检测高层建筑等物体,可增加不同的前缀

5)文生视频:例如熊猫划船等

其中,此次360智脑“文生视频”多模态功能乃是国内首发,任何文字脚本都可生成视频,不受素材限制,国外现在也只能生成10s的视频。 未来的通用智能一定是多模态智能,这点在业内基本已成共识。相比大语言模型,多模态AI在技术上远未收敛,无论在科研、工程还是应用层面,都是一片广阔天地,大有可为。 如果说GPT等大语言模型开启了应用创新的新时代,那么多模态AI将会把这一轮应用创新推到最高潮。 但是多模态AI的难度也是可想而知的。例如,文生图这样最基础的跨模态任务,或许今天许多人认为已经完美解决。Stable Diffusion + ControlNet + LoRA的组合看上去无懈可击,Midjourney工具用起来也似乎得心应手。 但真实情况是,基于扩散模型的文生图算法在娱乐和大众传播领域非常受欢迎,但想融入专业制作流程或取代职业美术师,还是有相当的难度。 文生图尚且如此,那文生视频、文生3D、文生动画,图文混合逻辑推理等更难的任务,今天确实还处在非常早期的阶段。 事实上,大模型本身已具备多模态能力。通过大模型学习多模态知识,来加速多模态AI的开发与应用被业内视为一条值得探索的路径。至少,目前360又让我们又看到了这样的希望。

2

重新定义数字人

在周鸿祎看来,仅靠大模型基础功能的发展,并不能带来工业和产业革命,关键还需要实现与更多场景结合、走向应用。 其中,360基于大模型“激活”的AI数字人,并提出 “有灵魂的数字人” 的概念,不论是其构想还是现场演示情况,绝对都称得上是惊艳了。 为什么选择数字人领域? 他认为,数字人是未来人工智能大模型最重要的应用入口。而没有大模型支撑的传统数字人只能按既定脚本输出内容,不能交流,且没有性格和记忆。

所以,按其计划,360将依托360智脑大模型能力,打造有记忆、有人设和性格,能够复刻思维方经历的AI数字人,重新定义“数字人”。

另外,由于数字人多多应用于虚拟偶像,使得数字人应用场景受限,多应用于泛娱乐场景。对此,360AI数字人给出了一个更优解,将打开当前数字人应用的想象空间。 360推出了一个“数字人广场”的平台,目前拥有200多个角色,分为数字名人和数字员工两类。 其中,数字名人包括历史人物、偶像明星、文学形象等,让用户在与数字人的开放对话中实现与偶像的近距离接触,与先贤的思想交流;数字员工能够参与创作、策划、分析、总结日常工作,成为企业员工的知识助手和办公助手,从而提升企业运营效能。

与此同时,周鸿祎现场演示了“法务专员”数字人角色,对中小企业常见的公章管理和合同审核问题给与了专业回答。

特别是数字员工的出现,打开了市场对于数字人应用场景的想象空间,拓展了数字人应用的可触及边界。 此外,360AI数字人还支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人,如数字分身、数字助理、数字偶像等。 事实上,数字人产业自2010年发展至今,已经有很长一段时间了。但AI数字人发展尚处早期水平,未来成长潜力可想而知。

根据IDC的预测,中国AI数字人行业即将在2023-2026年进入规模增长最快的时期,并且2023年作为大模型爆发的“元年”,在AI大模型的加持下,数字人市场步入高速发展期基本是可以预见的。

当然,目前数字人企业入局者甚多,不仅有互联网巨头,也有初创公司。而随着而随着上游技术和中游服务日益成熟,数字人的创造和应用门槛随之变低,导致了虚拟数字人“放量”,竞争加剧,即使是高端超写实虚拟数字人也出现了激烈的竞争。 针对数字人产品普遍同质化的困境,创造更优质的产品应为破局的可行之道,这与360AI数字人的思路可谓是不谋而合。 据市场人士分析认为,360AI数字人打破了传统数字人的定义和生产方式,打造的是完全具有自主交互能力的数字人,完全不需要人工进行干预,将重新定义“数字人”的概念。

从发展阶段来看,IDC指出目前数字人多处在L1-L3阶段,未来将逐步过渡到L4-L5阶段的纯AI驱动阶段。其中,L1-L3阶段的数字人生产包括简单的人物形象,依赖外部设备采集人体特征信息,再到依靠算法驱动肢体动作等等,之后更多在交互上实现突破,而L3阶段也只限于文本和图片的简单交互方式。

但以360AI数字人的底层逻辑和所展现的能力来看,其已开始跃进到L4-L5阶段,即纯AI驱动,并且表现出不需要人工控制的高智能化水平,完全由数字人自主进行决策以及执行任务,同时在交互方式上也有新的突破,实现流畅的语音化实时交互,这是目前数字人行业中极少有公司能够做到的。

鉴于上述,360依托大模型创新的极具特色的AI数字人,将在“百舸争流”的数字人市场占得先机,并有望凭借显著的稀缺性,快速抢占市场,同时也可在该细分领域掌握一定的AI话语权。

当然,目前360AI数字人应用也并不能说是尽善尽美的。周鸿祎也坦言,目前唯一的问题是回答不稳定,所以还需要提高,未来数字人也还会继续迭代。 归根结底, 360AI数字人得益于背后“360智脑4.0”强大的多模态能力支撑。 不可否认,多模态AI的技术挑战真实存在,但有挑战就意味着有机会。通过技术突破、技术创新在多模态AI领域大步前进,目前正是最好的时机。

3

360大模型战略:两翼齐飞,四路并发

周鸿祎将360的大模型战略概括为“两翼齐飞+四路并发”。 其中,“两翼齐飞”指一手抓核心技术研发,另一手抓优势场景落地。 而“四路并发”则指在用户端,将360GPT的产品矩阵“360智脑”与搜索场景结合,推出新一代智能搜索引擎,现已定向邀约企业客户测试,未来还将推出AI浏览器、AI个人助理等产品;在中小企业端,将推出结合“360智脑”能力的SaaS化垂直应用;在政府及企业端,将开拓私有化大模型蓝海市场,为城市及企业打造定制化的GPT;在安全领域,将核心的安全能力与GPT结合,推出360GPT安全应用框架。

来源: 公开信息

目前来看,随着360智脑快速迭代及AI数字人的推出,说明360已完成从战略规划到大模型基础能力扩展再到应用实践的打通,360大模型的“羽翼”也迅速丰满起来。当然,这一过程其实正应合了周鸿祎所指出的“大模型的价值在于将其能力通用化、垂直化,与具体的业务需求深度融合。” 据了解,在经过多轮迭代之后,360智脑目前已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景,并在多个第三方评测中位居国产大模型第一梯队。 他认为,中国进入“百模大战”,基础能力外,更重要的是应用场景的比拼。所以,也有了会上他宣布“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品,实现全面智能化重塑,也标志着360进入全AI驱动的智能化新时代。 由于搜索引擎的大数据源是构建类ChatGPT产品的核心抓手,不仅有丰富的网页数据和优质的语料库,而且有基于每日用户行为的迭代模型,决定了在大模型国产化背景下的像360这样的国内头部搜索引擎厂商的天然优势,从而获多家券商看好。 会上周鸿祎也表示,360大模型研发落地拥有“八大天然优势”,包括技术、算力、场景、大模型安全、搜索增强、内容安全、数据、工程化,完整覆盖大模型训练全程。

另外,他也预告,下个月会发布5.0插件版本,使得大模型“有手有脚”。届时360又会带来什么样的惊喜?是不是已有些迫不及待了。

格隆汇声明: 文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为任何实际操作建议,交易风险自担。

关键词:

上一篇:
下一篇:
精彩阅读

数字人也有“灵魂”?大模型被三六零玩明白了

热点

昨天下午,还是那袭红衣,360集团创始人周鸿祎又带着惊喜来了----智脑

周鸿祎,落子

热点

周鸿祎再造「周鸿祎」。

每日观点:OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%

热点

如今,其成本降低了75%,低至每1Ktoken0 0001美元。

重磅推荐丨项飙:我在临界中的思考,主要有三个概念

热点

我们不仅仅要在科技变化的临界上思考,而且必须在社会转型意义上的临界

新资讯:深圳市鑫立凯科技有限公司宣布新战略布局,开拓新业务

热点

近日,AI数字人直播间解决方案研发商「鑫立凯AI」获数千万元Pre-A轮融

【环球新视野】FinTech产品 | 神州信息新一代智能线上贷款系统介绍

热点

信贷业务作为金融机构重要的资产业务,在互联网时代背景下,面临着数字

音乐也逃不过AIGC:国风摇滚都来得

热点

只需要输入一段文字,点击生成按钮就能得到一段最长30秒的音乐,而且支

继续挑干的唠:百融云有没有AI大模型数据优势? 观察

热点

存量资金构成的市场当中,个股的深蹲跳与蹦极由小作文发动,风格和赛道

苹果MR现世,VR回光返照?|今日热讯

热点

对于库克的回应,有人表示不看好,也有人大喊新的科技革命来了,人类将

环球热推荐:我被骗了,到底哪个App干的?

热点

大家生活中要长个心眼,多点敏感性,不要贪便宜,要不吃亏的可能就是自

财富

当前头条:联合利华收购北美冷冻酸奶品牌Yasso

资讯

联合利华收购北美冷冻酸奶品牌Yasso,联合利华宣布,将收购北美冷冻酸奶

618前夕,视频号悄悄杀入本地生活|天天百事通

资讯

618前夕,视频号悄悄杀入本地生活,视频号,想要更多

世界热头条丨网易云、QQ音乐、酷狗、汽水……你的音乐软件懂你吗?

资讯

网易云、QQ音乐、酷狗、汽水……你的音乐软件懂你吗?,音乐APP歌曲推荐

每日关注!卸下“BBA”包袱,李斌用了72小时否定自己

资讯

卸下“BBA”包袱,李斌用了72小时否定自己,不只是新势力,所有车企都无

谷歌“弃三星用高通”,智能手表“芯战”风雨欲来

资讯

谷歌“弃三星用高通”,智能手表“芯战”风雨欲来,谷歌此举,或意味着

供应商的招股书里,藏着消费品牌的沉浮史_环球即时看

资讯

供应商的招股书里,藏着消费品牌的沉浮史,供应链是消费的晴雨表。

ChatGPT是劫杀谷歌的“灭霸响指”?

资讯

ChatGPT是劫杀谷歌的“灭霸响指”?,在牌面打散后新战局下,谷歌是否还

天天即时看!欧洲议会投票决定对生成式人工智能增加更多安全控制措施

资讯

欧洲议会投票决定对生成式人工智能增加更多安全控制措施,6月14日消息,

今日热文:商汤发布元萝卜AI下棋机器人围棋版

资讯

商汤发布元萝卜AI下棋机器人围棋版,6月14日,商汤科技正式推出专为学习

阿里集团公关团队将独立运作?知情人士:误传!

资讯

阿里集团公关团队将独立运作?知情人士:误传!,今日有消息称在阿里巴

周鸿祎,落子

周鸿祎再造「周鸿祎」。

每日观点:OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%

如今,其成本降低了75%,低至每1Ktoken0 0001美元。

重磅推荐丨项飙:我在临界中的思考,主要有三个概念

我们不仅仅要在科技变化的临界上思考,而且必须在社会转型意义上的临界

新资讯:深圳市鑫立凯科技有限公司宣布新战略布局,开拓新业务

近日,AI数字人直播间解决方案研发商「鑫立凯AI」获数千万元Pre-A轮融

【环球新视野】FinTech产品 | 神州信息新一代智能线上贷款系统介绍

信贷业务作为金融机构重要的资产业务,在互联网时代背景下,面临着数字

枕藉_枕

1、情况是这样的,我本人是骨外科博士,刚好我的一个室友是神经外科博

什么是缘分什么是天意 什么是缘分

1、茫茫人海中两人从相遇,相识,相知,或是相亲相爱,这就是缘分,缘

今日热门!欧国联-莫德里奇独造3球 克罗地亚加时4-2荷兰进决赛

第34分钟,阿克传球,魏费尔随后横传,马伦禁区右路直接抽射,皮球直挂

做好乡村振兴这篇大文章!青岛:畅通要素流动,推进城乡融合发展-观热点

青岛打造城乡产业协同发展平台、推动城乡资源合理配置,做好乡村振兴这

跟相见恨晚意思一样的词(类似相见恨晚的成语)

想必现在有很多小伙伴对于类似相见恨晚的成语方面的知识都比较想要了解