2023-03-17 14:11:46 来源:商业新知网
文/蓝鲸财经 郝圆
(资料图片)
在全世界人民都仍处于GPT-4的震惊中时,百度终于发布了自己的同类产品——文心一言。
蓝鲸财经记者在第一时间拿到了内测名额,为大家实测这款新一代大语言模型、生成式AI产品文心一言。
由于是精通中文语境,所以我们首先拿前不久一道给chat GPT做过的题给它做:
显然,文心一言准确地识别了问题中的人物,并且精准回答了其中暗藏的“玄机”。
但这种喜悦似乎并没有持续多久,当我希望文心一言为我推荐一些礼物备选时,它的回答真的是靠谱中夹杂着各种不靠谱。
请问哪里可以用500块买到iPhone 13 Pro Max手机,我出双倍买!
文心一言像一个听话的工具,让干啥干啥,但似乎缺乏一些判断力, 比如我让它帮我撰写一段诺贝尔数学奖的领奖词,这也是写得头头是道,完全没考虑到这奖项根本不存在……
可见文心一言虽然有基础的文案撰写能力,但是对于问题并没有基础的纠错能力,同时文案本身也缺乏创意,基本是一些片儿汤话。
在见识过水平能上哈佛的GPT-4后,大家对文心一言不太满意在所难免。因此也有博主将其比作AI界的马保国。
但是如果你把这个结论告诉文心一言,它可能会很开心,因为它对马保国的评价很高!
或许文心一言和你对于马保国武术水平的评价并不一致,但是 并不能因此否定它作为一款大语言模型、生成式AI产品的能力。
比如我们体验了它的AI绘画功能,虽然某些细节有出入,但是基本要素是具备的:
在chat GPT横空出世之后,不少人都产生了“AI焦虑”担心自己的工作被AI取代,那文心一言会取代我们的工作吗?
身先士卒,我请文心一言帮助处理了一些工作中的常见数据收集与整理问题:
但仔细校对会发现根据国家电影局数据,2021年春节档电影票房达78.22亿元,这个数据并不准确,除此之外,“近五年”的指令似乎也没有很好的执行,中间有不少遗漏。看来如果把这类工作都交给文心一言,还是很有风险的。
听说编剧也是有可能被AI取代的高危职业,于是我邀请文心一言续写了今年大热的电影《流浪地球2》,希望能为李彦宏的阳泉老乡刘慈欣省点心:
结果发现,大刘还是得接着写……文心一言这水平连投资都骗不到。
文心一言对于信息的覆盖面和掌握程度无需多言,并且在分析的时候很有逻辑:
比如最近爆红的《乌梅子酱》它也能点评一二,并且像模像样:
但从整个回答也能看得出,文心一言呈现的内容比较片面,缺乏更全面的观点,与此同时缺乏更加深刻的点评,换句话说,如果把回答中的李荣浩换成周杰伦应该也是完全可以的,虽然周杰伦的粉丝可能不同意……
虽然截至目前,文心一言的表现都显得比较AI,没有人情味,但是我发现它有些时候还是会展示一些“人性特质”的,比如面对感情问题,它也会表现得像个“情感导师”
面对深刻的爱与死亡话题也能给出这样的回答:
比如下面这种情况:
截至目前,我们对于文心一言的体验暂告一段落。
虽然这场万众瞩目的发布会被各界唱衰,甚至百度的股价都应声下跌,但 真正体验过之后发现,作为近期国内首款大模型,文心一言从回答速度到对话效果整体不错,虽然这其中有很多令人啼笑皆非的bug。但敢于发布文心一言,敢于发布大模型放在公众舆论之下,本身就需要勇气。
就像李彦宏自己也在会上说的:“这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异”,openAI也是在不断自我迭代过程中成长为“大魔王”的,文心一言刚刚迈出自己的第一步。
关键词:
近年来,数字经济政策定调级别高,已上升为国家战略,产业数字化、产业互联网等赛道也收到前所未有的关注。
分镜头怎么拍?打开相机点击多选点击画面比例1:14:316:9手机拍摄户外分镜头小技巧?1 设置拍摄时长,10S,15S,30S,我们选择15秒,分成5段2 设置
尼康z5与z50应该怎么选?两者比较,肯定应该选Z5。Z5是全画幅,而Z50是半画幅,虽说两者都是入门级别,但Z5在画幅上占有先天优势,毕竟全画
近年来,数字经济政策定调级别高,已上升为国家战略,产业数字化、产业互联网等赛道也收到前所未有的关注。
世界上只有1%的人明白真相,剩下99%的人三观是被塑造的,他们只负责站队。
数据权限控制当前账号可以看到的数据范围,比如客服A只能看到分配到她名下的出借人的投资数据。
中国电信已在上海等五省市完成VoWiFi业务现网试点部署。
美团整体公司高层组织架构的发展过程,也更多体现了“博弈论”的思想。