世界通讯!对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

2023-04-12 13:14:31   来源:商业新知网

作者丨何思思


【资料图】

编辑丨林觉民

走进融新科技中心A座23层,映入眼帘的是绿植、野营桌椅帐篷,在如此轻松的环境下,雷峰网见到了APUS创始人李涛,他着一身休闲装,显得尤为放松。

对谈前,他用八个字总结了创办APUS的心路历程——“享受过程、追求快乐”,对谈过程中,也始终强调着“快乐”的重要性。一场对谈下来,他口中有关“创业压力、至暗时刻”的抱怨很少,更多的是应对变局时的从容淡定。

雷峰网从侧面了解到,APUS在选择办公地址时通常首选高层,原因是窄小的格子间只会给程序员带来压迫感,毫无快乐可言,高楼层视野开阔,可以让程序员们员工心胸更宽广。站在APUS办公室的窗前能看到北京最高的建筑“中国尊”。

李涛是国内最早一批接触到大模型的人之一,早在2019年,他就和字节跳动创始人张一鸣、红杉中国创始人沈南鹏在硅谷见了OpenAI创始人Sam Altman,这也为APUS全面转型人 工智能埋下了伏笔。

2022年11月底,OpenAI上线ChatGPT引发了全球性的关注,随后谷歌母公司Alphabet宣布将推出名为“Bard”的AI(人工智能)聊天机器人服务以及多个人工智能项目,紧接着Azure OpenAI重磅推出了 GPT-4,相继微软宣布将大型语言模型(LLM)和Microsoft 365应用相结合,正推出全新的AI功能。

至今国际市场上有关大模型的角逐仍在持续上演。

反观国内市场,其激烈程度不亚于国外,自今年2月份ChatGPT在国内火爆出圈后,互联网厂商们坐不住了,迅速加入AI赛道。首先是百度官宣文心一言,并在之后的邀约测试环节中吸引了12万人,随后阿里、腾讯、360等互联网企业相继官宣加入该赛道。

相较百度而言,虽然后者还没有推出可商用的大模型产品,但也纷纷转投了大部分精力到大模型的研发工作上。

全球化智能手机操作系统企业APUS,以工具类产品为基础逐渐衍生出内容等相关产品和服务,从2014年成立至今已经在全球拥有了超24亿用户,覆盖200多个国家和地区,支持超25种语言。面对此次AI大模型风口,APUS早在2019年就开始了相关布局,并于去年底启动大AI战略,比国内的AI热潮提早了一到两个月的时间。

从移动互联网企业转型人工智能,李涛坦言,“和公司的定位有很大的关系,2020年以前我们对自己的定位是‘中国出海企业’,之后转成‘全球化公司’。这决定了我们会更早的感知到国外的技术、思维等方面的变化,去年年底则真正感受到了AI 带来的竞争压力,也看到了其巨大的发展潜力,我们随之启动了全面拥抱AI的战略转型。”

以下为雷峰网和李涛的对话:

1

“不要抱着补偿心理创业,创业者要享受过程”

雷峰网:您怎么看待创业这件事?

李涛: 创业是一个动态的过程,不是开始,更不是结果。创业者必然会经历高光也会经历低谷,不能单纯的追求三年或者五年后的特定高光时刻,高光后还会回归到落寞的状态是自然规律,所以创业者没必要为了高光而辛苦,而是要享受过程,从中让自己更快乐。

雷峰网:所以您属于很享受过程的人?

李涛:对,我觉得人做事第一要顺势而为,第二要学会造势,第三要享受过程,这三件事你都做到了,就会很快乐,你的心态也会非常平衡,成功之后也不会有很强的补偿心态。

雷峰网:要想创业成功,什么特质是最重要的?

李涛:积极稳定的心态。有些上市公司并不赚钱,因为这些创业过程艰难,企业家认为太苦了,上市后补偿心理就会太重,一旦有了这种心态就很难成功。现在很多成功企业的领头人恰恰是在享受过程,并不是为了追求走到哪一个高光时刻,但是这些企业一旦进入高光区往往就会持续很长时间,这是积极的心态带来的正向效应。

我创办APUS以后,企业的业务增长很快,因为创造了社会价值,我在其中也感受到快乐,没有补偿心理,这种心态让我更容易做出正确的判断,帮助企业维持了比较好的发展态势。

2

全球化视野提前感知AI变革

决定全面转型

雷峰网:怎么定位APUS?

李涛: APUS是一家以产品技术为核心竞争力的全球化移动互联网公司,2014-2019年一直做出海业务,我们那时的定位是中国出海企业,2019年APUS战略升级为“全球化”,把自己定位为全球化公司,无论中国、美国或其他地方,都是我们选择的一个市场区域。

雷峰网:决定让你全面转型做人工智能,是有什么契机吗?

李涛: ChatGPT出来后再次证明了国内互联网的全球化发展很不充分,去年10月ChatGPT就在美国火了,当时很多美国学生都用它来做作业,但这个概念到今年2月才在国内出圈,这意味着中国在技术意识方面要比美国晚3到4个月以上的时间。而APUS是全球化企业,在这个定位下,感知和思维模型就会有全球化视野,我们大概去年就已经接触到了ChatGPT并开始了相关研究和自我筹备。

雷峰网:APUS最早是怎么做的?

李涛: 从AIGC开始入手,当时不是按照ChatGPT 这个方法,但我们很快就发现了ChatGPT 模型的训练能力是极强的。因为语言模型训练是非常困难的一件事,比AIGC的挑战大的多,今天大部分AIGC都不能算是大模型而是自建的中等模型。

雷峰网:所以如谷歌这类公司在大模型方面是最有优势的?

李涛:我不这么认为。因为他们很难颠覆自己的“商业模式”去实现自我革命。搜索引擎是归纳法,在归纳法的基础上创建自己的商业模式,他们不太可能去做演绎法的事情。像谷歌做大模型就是很被动的在做,因为它在大模型方面是落后的,就必须按照别人制定的规则来做,而OpenAI已经把规则定下来了。假如谷歌能做出一个超越 OpenAI的大模型,他会试图重新把这套东西拉回到自己原来的那套规则上,去发挥它原有的优势向下做,这必然会导致落后。这是谷歌这类公司的痛点,它很难改变。

雷峰网:如果中国出现下一个GPT企业,您认为小公司比大公司的可能性大?

李涛: 对,目前能做GPT的大多是互联网企业,但这些企业本质上都有既得利益,他们不愿意舍弃这些既得利益。王慧文投5000万美金这个事就值得我们期待。

雷峰网:为什么值得期待,能做成吗?

李涛: 中国试图做AI大模型的企业都值得期待,只是王慧文在所有人没表态的时候就站出来了,但这仅仅是表态,最终能输出什么样的产品我们还要再观察。

雷峰网:有人愿意投入大量资金,是不是意味着我们离大模型更近了?

李涛: 大模型靠的是什么?第一场景,第二数据,第三算法,第四算力,不仅仅是砸钱就能搞定的事情。

客观来看,我们有场景,也有不小的数据体量,但这个数据放在全球市场来看也没有绝对优势。我们有算法,但都是割裂状态,没有一个开放平台让大家把拥有的算法都贡献出来。算力方面,我们正面临高性能算力的限制,芯片方面较美国,中国还是有很大差距的。

总的来讲就是,场景丰富;但数据只能算中等规模;算法是极度分散,没有形成合力;算力则是严重不足。

雷峰网:怎么解决这些问题?

李涛: 一方面,中国的算力大部分掌握在政府手里和运营商手里,所以需要政府推动进行算力整合。另一方面,也需要行业推动,公开算法。

雷峰网:为什么倡导大家把算法公开出来?

李涛: 大模型不公开是正常的,因为大模型和商业模式挂钩,会直接决定企业营收。算法是可以公开的,只有算法公开,才可以把大家的智慧集中起来。所有代码都开放出来意味着有更多人能够维护和优化代码,代码一旦升级到很高的水平,数据和模型能力就会迅速提升,这本质上是一个利己的行为。OpenAI就很聪明,它做完这件事就把接口全部开放出来了。而且也更利于训练自己的模型,模型训练需要更多的数据和场景,这不是千百个程序员坐在办公室能想出来的。

从另一个角度来看,公开算法会促使更多开发者进行创新,能够推动行业进步,也是在创造更好的创新环境和发展氛围。这样看来,开源利人利己,何乐而不为?

雷峰网:真正解决了这个问题,中国企业有没有机会?

李涛 :有机会,但不会一下起来,这场AI潮比拼的本质是你能不能先抓住场景;第二是数据,第三是国际化的问题,只有足够国际化才能解决算法不断更新迭代的问题,才能解决算力不足的问题。

3

用蒸馏法训练AI大模型

沉淀中小模型

雷峰网:今年APUS在AI大模型方面的目标是什么?

李涛:2019年APUS开始从中国出海企业转为全球化公司,今年就是要全面拥抱AI,成为一家人工智能公司,这是非常明确的目标,我们预估转型后企业业绩有望实现200%的增长。

雷峰网:成为人工智能公司的标志是什么?

李涛:第一,企业内部生产工具的改进和生产效率的提升;第二,用人工智能改造现在所有的产品;第三:在人工智能的环境下去探索新的物种和新的产品;第四:把人工智能推到全产业链中,让AI成为新引擎。

雷峰网:会和大模型公司(诸如文心一言)合作吗?

李涛: 或许会合作,但存在一个关键问题,双方合作沉淀下来的模型在他那还是在你这儿,这个关系很难平衡。所以国内企业都要考虑沉淀出属于自己的中小模型,这是未来一切发展的基础。

雷峰网:具体应该怎么做?

李涛: 要用别人的大模型方法实现自我训练,也要反向的通过领先的大模型用蒸馏法训练自己的模型,另外在关键节点还要加一部分人工干预。

雷峰网:APUS在自己训练大模型吗?

李涛:我们自研了一个参数在1000亿以内的“天燕”大模型,并形成了无数个精炼模型(中小模型),另外还反向用像GPT这样的大模型通过蒸馏法来训练自己的大模型。

从商业化角度,针对不同场景有不同的小模型,每个场景可能有1到10款不同的产品和软件,这样也能保障有足够大的用户量来训练我的小模型。

雷峰网:中小模型和大模型有什么区别?

李涛: 区别在于参数、算力和场景。大模型和中小模型有非常明显的界限,中小模型之间则没有很大的界限。大模型的使用面非常广,它可以分装成中模型和小模型,中模型是最复杂的,一般是独立建的模型,像商汤和旷视。未来可能很少会存在单独的小模型,一般在大模型的训练场景中加上参数,就会形成一个小模型。

雷峰网:您觉得大中小模型哪个会率先迎来爆发,或者商业机会更多?

李涛: 毋庸置疑肯定是中小模型,下半年各种中小模型会迅速产出商业价值,但从长远来看更具潜力的一定还是大模型。如果说第一个时代的操作引擎是 windows 和Linux,第二个时代的操作引擎就是安卓和iOS,那么下一个时代的操作引擎就是人工智能,OpenAI其实就是想把GPT做成一个操作系统,大家都想争这个操作系统的掌控权和话语权。

4

ChatGPT不是很热

是还不够热

雷峰网:你怎么看待ChatGPT?

李涛: ChatGPT帮我们利用人类的智慧生成了一个全新的结果,且这个结果在历史上从来没有出现过的,它把这个结果作为唯一性的选择给到我们,这是过去机器无法完成的。

它相当于一个7岁小孩的智慧,会模仿会创新,就像他看了无数幅画后,他自己会画一幅画,进行全新创作。

雷峰网:目前行业对ChatGPT的接受度如何?

李涛 :业界对ChatGPT的认知还比较落后,前段时间我的MBA 课程留了一份课堂作业,基于纪录片《寿司之神》描述日本工匠精神,我用ChatGPT完成了这份PPT,第二天讲的时候,很多人都还惊讶,不知道ChatGPT是什么。

雷峰网:APUS内部对人工智能的使用到什么程度了?

李涛: 我们内部所有系统都已经接入人工智能,图片图标制作完全用AI替代,一半以上的程序员代码都是用人工智能来review的。

雷峰网:怎么提升内部员工对人工智能的使用度?

李涛: 去年春节以后APUS制定了一个奖励机制,要求所有程序员、设计师以及生产一线的同事都必须用人工智能来提升自己的生产效率,提升30%效率的加薪10%,如果提升 50% 以上加薪20%-30%,激励大家使用人工智能。

雷峰网:如果全行业都用上人工智能,那企业的核心竞争力在哪里体现?

李涛: 谁优先想到用人工智能,谁把人工智能用得更彻底,谁的生产效率最高,谁在行业内的潜力就越大。

关键词:

上一篇:
下一篇:
精彩阅读

世界通讯!对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

热点

相较百度而言,虽然后者还没有推出可商用的大模型产品,但也纷纷转投了大部分精力到大模型的研发工作上。

世界快报:国家知识产权局办公室印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》

热点

近日,国家知识产权局办公室发布了关于印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》的通知。

天天速读:老虎证券首测带ChatGPT的炒股软件 券商+AI能撞出多大火花?

热点

由于ChatGPT爆火全球,近期不少券商都对人工智能生成内容(AIGC)技术赋能数智化转型跃跃欲试。

天天视点!2023年第一季度XR趋势分享会将于4月20日线上举行

热点

尽管元宇宙产品生态尚未成熟,但XR赛道依旧火热,开年以来,大批AR玩家入局。

【世界快播报】欧洲迎来百亿亿次级计算机

热点

JUPITER将落地德国,推动欧洲进入百亿亿次级超级计算领域。

eSIM尚未崛起 半路杀出个程咬金

热点

无论是市场接受度的提升,还是产业链格局的调整,以及政府监管政策的改变,件件皆非小事。

环球最新:本周AI最重要的事SAM

热点

近日,MetaAI在官网发布了基础模型SegmentAnythingModel(SAM)并开源。

全球观焦点:Coinbase高级总监Gupta将离职 投身新的加密项目

热点

Coinbase高级总监Gupta将离职投身新的加密项目。

重点聚焦!特朗普、马斯克和比尔·盖茨贫民窟AI画“让人尖叫”

热点

一组名为“贫民窟的亿万富豪”的人工智能(AI)画作在网上发布后,引起了全球关注。

财富

环球热文:融资丨「德适生物」完成超亿元融资,远翼投资领投

资讯

融资丨「德适生物」完成超亿元融资,远翼投资领投,继续加大染色体AI诊断技术

环球视讯!Keep卖货,生意难做

资讯

Keep卖货,生意难做,Keep何时能实现盈利自由

融资丨「路凯智行」完成数千万元A轮融资,金善基金领投

资讯

融资丨「路凯智行」完成数千万元A轮融资,金善基金领投,继续深耕矿山无人驾驶赛道,加速实现商业化落地

环球微资讯!融资丨「蓝极医疗」完成数千万元A+轮融资,合肥中合欧普医疗健康产业基金领投

资讯

融资丨「蓝极医疗」完成数千万元A+轮融资,合肥中合欧普医疗健康产业基金领投,募集资金将用于蓝激光微创、光动力诊疗一体化设备

融资丨「莲雾智能」完成数百万元天使轮融资,华盛人和投资

资讯

融资丨「莲雾智能」完成数百万元天使轮融资,华盛人和投资,本轮融资资金将用于内容团队组建及市场开发

电视突然闪退怎么办?电视机屏闪是什么故障?

资讯

电视突然闪退怎么办?1 软件不兼容:由于软件经常需要更新,这就造成最新版本的软件与电视或盒子的系统发生不兼容问题,当出现这种问题时,可以

空调泵坏了如何维修?空调提升泵工作原理?

资讯

空调泵坏了如何维修?1、系统内混入有空气,压缩机运行时候空气中有支持燃烧的氧气,加上压缩机的机油以及制冷剂,压缩机运行时一段时间产生

如何拆冰箱冷藏柜门板盖?冰箱冷藏框架怎么拆?

资讯

如何拆冰箱冷藏柜门板盖?首先,确保冰箱中的所有食物和饮料都被移出。然后根据您的帝度冰箱型号查找说明书,了解拆卸过程的具体步骤。一般

电磁炉万能控制板怎么接线?电磁炉万能板的安装?

资讯

电磁炉万能控制板怎么接线?1、18V接LM339第3脚。2、12V 18V接风扇接入端,(有的风扇是用12V电压的)。3、5V接CPU(一般接20或者1脚,具体因不

空调室内滴水是什么原因?空调滴水自己怎么修理?

资讯

空调室内滴水是什么原因?1、如果空调过滤网灰尘过多,只要对空调过滤网进行一个彻底的清洁,恢复亲水铝箔的亲水性,使得冷凝水能够顺利进入

世界通讯!对话 APUS 李涛:全面转型做 AI,蒸馏法训练大模型,沉淀中小模型

相较百度而言,虽然后者还没有推出可商用的大模型产品,但也纷纷转投了大部分精力到大模型的研发工作上。

世界快报:国家知识产权局办公室印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》

近日,国家知识产权局办公室发布了关于印发《数字经济核心产业分类与国际专利分类参照关系表(2023)》的通知。

天天速读:老虎证券首测带ChatGPT的炒股软件 券商+AI能撞出多大火花?

由于ChatGPT爆火全球,近期不少券商都对人工智能生成内容(AIGC)技术赋能数智化转型跃跃欲试。

天天视点!2023年第一季度XR趋势分享会将于4月20日线上举行

尽管元宇宙产品生态尚未成熟,但XR赛道依旧火热,开年以来,大批AR玩家入局。

【世界快播报】欧洲迎来百亿亿次级计算机

JUPITER将落地德国,推动欧洲进入百亿亿次级超级计算领域。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个