清华商汤最新AI,征服了《我的世界》

2023-05-31 11:02:28   来源:商业新知网

继GPT-4惊艳《我的世界》后,国产AI智能体也来了——


【资料图】

像人一样生存、探索和创作,并且通关了整个游戏!

从生存模式白手起家,不仅可以拿到主世界的所有物品、挖钻石,还能制作附魔书!

面对各类地形、环境、白天黑夜场景都能hold住,甚至遇到怪物也能自如应对。

不卖关子,全都是这个小东西干的,它的名字叫Ghost in the Minecraft(GITM)。

由商汤科技联合清华大学、上海人工智能实验室等机构研究者们共同开发。

和以往的智能体相比,GITM的特点可以用两个字来形容: 更强。

能完成更多的任务:

在主世界的所有技术挑战上实现了100%的任务覆盖率。

更高的任务成功率:

在“获取钻石”任务上,也可以达到67.5%的高成功率。

看到这,你肯定会问:这么强,训练要花很长时间吧?

漏!单一CPU节点只需要训练两天!

打破AI发展限制

在AI发展进程中有一个非常有趣却有违常识的现象:

一些对人类而言相对困难的任务,例如下棋,对AI来说却相对容易实现;而在开放世界中与环境交互、进行规划和决策等对人类来说较简单的事,AI却面临巨大挑战。

这就是莫拉维克悖论。

不过,这个通才AI智能体GITM,据说已经成功打破了这一悖论限制:

它可以在复杂且类似于现实世界的环境中取得突破,能够像人类一样生存,探索和创造。

先来看一下它的具体表现怎么样:

在《我的世界》中,GITM在主世界的所有技术挑战上实现了100%的任务覆盖率,也就是成功解锁了完整的科技树的262个物品。

而此前所有智能体的总和只能覆盖30%。(以往所有智能体方法包括OpenAI和DeepMind在内总共只解锁了78个)

△ 红色代表其它代理也解锁了的物品,绿色代表只有GITM解锁的物品

在最受关注的“获取钻石”任务上,GITM取得了67.5%的成功率,相比于目前最佳成绩(OpenAI VPT)提高了47.5%。

然鹅,重点来了。

在训练效率上,GITM也达到了新高度。环境交互步数只需已有方法的万分之一,单一CPU节点训练 两天 即可完成。

远远低于之前OpenAI VPT所需的6480个GPU天或DeepMind DreamerV3所需的17个GPU天。

不仅如此,GITM还可以进一步应用在《我的世界》更加复杂的任务中,比如生存所需的避难所、农田、铁傀儡,创造自动化设备所需的红石电路、进入下界所需的下界传送门等。

GITM强大的能力和可扩展性的背后是大语言模型(LLM)的加持。

GITM的心脏:大语言模型

之前基于强化学习的代理程序所面临的最大困境在于:

如何将一个极长时域和复杂目标映射成一系列键盘、鼠标操作。

为了解决这个问题,GITM的开发者采用了基于大语言模型(LLM)的代理程序。

与强化学习代理程序直接映射不同,他们基于LLM的代理程序采用了一种分层的方法:

首先将分解目标拆分为子目标,然后进一步拆分为结构化的操作,最后再拆分为键盘、鼠标操作。

具体来说,基于LLM的代理程序包括LLM分解器、LLM规划器和LLM界面,它们分别负责对子目标、结构化操作和键盘/鼠标操作进行分解:

1)LLM分解器首先根据从互联网收集到的基于文本的知识,将目标分解为一系列明确定义的子目标。

2)然后,LLM规划器为每个子目标规划一系列结构化操作。LLM规划器还会将成功的动作列表,记录并总结到基于文本的记忆中,来增强规划能力。

3)LLM界面通过处理原始的键盘/鼠标输入和接收原始的观察结果,执行结构化操作与环境进行交互。

此前,商汤基于监督学习和强化学习就炼成了可以在《星际争霸2》中,对挑顶级水平玩家的DI-star。

而训练一个DI-star,就用了 “16万场录像” 和 “1亿局对战” 。

而这次,有了大语言模型的加持,事情又变得有意思了捏。

关键词:

精彩阅读

清华商汤最新AI,征服了《我的世界》

热点

继GPT-4惊艳《我的世界》后,国产AI智能体也来了——像人一样生存、探索和创作,并且通关了整个游戏。

云从科技解禁前拟再募36亿元,大模型或成救命稻草?

热点

随着商业化落地遭遇瓶颈,“AI四小龙”光环渐渐散去。

到底什么是“5G新通话”? 热议

热点

今天这篇文章,我们来聊聊今年很热门的一个概念——“5G新通话”。

环球热资讯!全省新开通5G基站2.1万个以上,《2023年江西省5G发展工作要点》已对外公示

热点

为促进5G产业发展和创新应用,推进5G高质量发展,现制定2023年江西省5G发展工作要点。

前沿热点:“AI换脸”诈骗,怎么防?

热点

AI换脸术滥用,也促使大家思考一个深层次问题。

AI接棒酸奶开发,效率提升之外还有哪些潜在意义? 每日播报

热点

随着食品行业加大对于人工智能研发系统的投入力度,未来将会有更多的食品类型可以借助AI系统实现本质上的优

天天动态:出门问问冲刺港交所:2020年就已开发出通用大模型,2022年营收超5亿元

热点

随着前述TicWatchPro5手表的上市,出门问问的AIoT解决方案的收入或将重回增长。

推进5G规模化应用!中国广电(湛河区)5G产业创新中心正式揭牌

热点

中国广电(湛河区)5G产业创新中心(以下简称5G中心)揭牌,湛河区政府、5G中心分别与合作对象签约。

热点资讯:比亚迪再回应争议;天涯社区直播首播遭滑铁卢……

热点

今年4月天涯社区因为无法支付电信机房费用而暂停访问。

热门看点:​永洪科技出席科博会:领先源于洞察

热点

企业是创新的主体,是推动创新创造的生力军。

财富

环球播报:融资丨凌科药业完成2亿人民币C1轮融资

资讯

融资丨凌科药业完成2亿人民币C1轮融资,本轮融资将主要用于加速推进凌科药业核心产品的临床开发。

每日时讯!永辉超市症结之解

资讯

永辉超市症结之解,线上线下都做得好的企业,未来才能生存。

快播:谁会是新能源车险市场的“鲶鱼”?

资讯

谁会是新能源车险市场的“鲶鱼”?,沿着旧地图,找不到新大陆

ofo出走的创始人,散落在天涯-天天聚看点

资讯

ofo出走的创始人,散落在天涯,ofo故人难寻

「问题少年」逆袭成万亿美元掌门人!60岁黄仁勋或成LLM爆发背后最大赢家-天天快资讯

资讯

「问题少年」逆袭成万亿美元掌门人!60岁黄仁勋或成LLM爆发背后最大赢家,英伟达总市值正式突破万亿美元,成

陆正耀“绑上”加盟商去“复仇” 世界要闻

资讯

陆正耀“绑上”加盟商去“复仇”,最了解陆正耀的目标的人,除了钱治亚,可能就是郭谨一。

全球观点:AI诈骗效率高、成本低,“三个魔法”有效防范潜在威胁

资讯

AI诈骗效率高、成本低,“三个魔法”有效防范潜在威胁,魔法打败魔法:社交平台的关键角色

【时快讯】肯德基、西贝们,狂卷儿童餐

资讯

肯德基、西贝们,狂卷儿童餐,餐饮盯上新一代“带娃人”。

大厂砍业务,为“未来故事”烧钱的时代结束了

资讯

大厂砍业务,为“未来故事”烧钱的时代结束了,大厂告别规模扩张,开始务实,追求成熟业务和产品带来的“确

全球播报:穷人想薅羊毛,而有人想薅穷人的羊毛

资讯

穷人想薅羊毛,而有人想薅穷人的羊毛,临期店到底香不香?

云从科技解禁前拟再募36亿元,大模型或成救命稻草?

随着商业化落地遭遇瓶颈,“AI四小龙”光环渐渐散去。

到底什么是“5G新通话”? 热议

今天这篇文章,我们来聊聊今年很热门的一个概念——“5G新通话”。

环球热资讯!全省新开通5G基站2.1万个以上,《2023年江西省5G发展工作要点》已对外公示

为促进5G产业发展和创新应用,推进5G高质量发展,现制定2023年江西省5G发展工作要点。

前沿热点:“AI换脸”诈骗,怎么防?

AI换脸术滥用,也促使大家思考一个深层次问题。

AI接棒酸奶开发,效率提升之外还有哪些潜在意义? 每日播报

随着食品行业加大对于人工智能研发系统的投入力度,未来将会有更多的食品类型可以借助AI系统实现本质上的优

天天快看点丨南海西北陆坡沉船遗址第一阶段调查:最新海底画面来了!

南海西北陆坡沉船遗址第一阶段调查:最新海底画面来了!

daphne是什么牌子的鞋_daphne

大家好,小榜来为大家解答以上的问题。daphne是什么牌子的鞋,daphne这个很多人还不知道,现在让我们一起来看

震撼!我军多型实弹射击演练点燃夏季练兵场

铁流滚滚,沙尘弥漫。近日,中部战区陆军第83集团军某合成旅在豫南某训练场,组织全要素多弹种实弹射击演练

北京高考在即,官方提醒考生勿将手机等通讯设备带入考点 每日短讯

北京高考在即,官方提醒考生勿将手机等通讯设备带入考点

资讯推荐:6名航天员太空“会师”名场面再现

“我是零号,倒计时30分钟准备!”“神舟十六号收到!”今天9时许,酒泉卫星发射中心,随着任务零号指挥员

今日讯!中国数字经济规模居世界第二

中国数字经济规模居世界第二