首页> 热点 >

复旦邱锡鹏：深度剖析 ChatGPT 类大语言模型的关键技术

2023-03-17 09:20:17 来源：商业新知网

ChapGPT 自问世以来，便展现出了令世人惊艳的对话能力。仅用两个月时间，ChatGPT 月活跃用户就达一亿，是史上用户增速最快的消费应用。对于学术界、工业界、或是其他相关应用来说都是一个非常大的机会和挑战。

事实上，ChatGPT 的成功并不是偶然结果，其背后多有哪些创新之处，本文整理于「ChatGPT 及大模型专题研讨会」上复旦大学邱锡鹏教授带来的《对话式大型语言模型》的分享，他从大规模预训练语言模型带来的变化、ChatGPT 的关键技术及其局限性等角度深入地介绍了大规模语言模型的相关知识。

邱锡鹏，复旦大学计算机学院教授，MOSS 系统负责人

【资料图】

为什么是大语言模型？

随着算力的不断提升，语言模型已经从最初基于概率预测的模型发展到基于 Transformer 架构的预训练语言模型，并逐步走向大模型的时代。为什么要突出大语言模型或是在前面加个“Large”？更重要的是它的涌现能力。

当模型规模较小时，模型的性能和参数大致符合比例定律，即模型的性能提升和参数增长基本呈线性关系。然而，当 GPT-3/ChatGPT 这种千亿级别的大规模模型被提出后，人们发现其可以打破比例定律，实现模型能力质的飞跃。这些能力也被称为大模型的“涌现能力”（如理解人类指令等）。

上图是多个 NLP 任务随着模型规模扩大的性能变化曲线，可以看到，前期性能和模型规模大致呈线性关系，当模型规模大到一定程度时，任务性能有了明显的突变。

因此，通常以百亿/千亿级参数量作为 LLM 研究的分水岭。除此之外，大规模语言模型基座的可扩展性很强，其能够很容易和外部世界打通，源源不断地接受外部世界的知识更新，进而实现反复自我迭代。因此，大规模语言模型也被看作是实现通用人工智能的希望。

ChatGPT的三个关键技术
目前，很多公司和组织都在跟风 ChatGPT，推出类似的聊天机器人产品。这主要是因为 ChatGPT 的成功，给人们带来了信心，证明了聊天机器人技术的可行性和潜力，让人们看到了聊天机器人在未来的巨大市场和应用前景。
ChatGPT 的三个关键技术为：情景学习、思维链、自然指令学习，接下来将详细介绍一下这三个技术。
情景学习（In-context learning）
改变了之前需要把大模型用到下游任务的范式。对于一些 LLM 没有见过的新任务，只需要设计一些任务的语言描述，并给出几个任务实例，作为模型的输入，即可让模型从给定的情景中学习新任务并给出满意的回答结果。这种训练方式能够有效提升模型小样本学习的能力。
情景学习的示例图
可以看到，只需要以自然语言的形式描述两个情感分类任务输入输出的例子，LLM 就能够对新输入数据的情感极性进行判断。例如，做一个电影的评论，给出相应的任务模型，即可输出正面的回答。
思维链（Chain-of-Thought，CoT）
对于一些逻辑较为复杂的问题，直接向大规模语言模型提问可能会得到不准确的回答，但是如果以提示的方式在输入中给出有逻辑的解题步骤的示例后再提出问题，大模型就能给出正确题解。也就是说将复杂问题拆解为多个子问题解决再从中抽取答案，就可以得到正确的答案。
思维链示意图
如思维链示意图所示，左边是直接让模型进行数学题的计算会得到错误的结果，而右侧在解题过程加入了一个示例，引入解题过程则可以激发模型的推理能力，从而得到的正确的结果。
这就是一个简单的可以通过计算能力从思维链中分离，有助于大模型完成任务，从而减轻神经网络的负担。
由于 CoT 技术能够激发大规模语言模型对复杂问题的求解能力，该技术也被认为是打破比例定律的关键。
自然指令学习（Learning from Natural Instructions）
早期研究人员希望把所有的自然语言处理任务都能够指令化，对每个任务标注数据。这种训练方式就是会在前面添加一个“指令”，该指令能够以自然语言的形式描述任务内容，从而使得大模型根据输入来输出任务期望的答案。该方式将下游任务进一步和自然语言形式对齐，能显著提升模型对未知任务的泛化能力。
自然指令学习示意图
如自然指令学习示意图所示，左边是自然指令的测试场景，人们把 NLP 任务做到 1000 多种，目前最新模型可以做到 2000 多种 NLP 任务，接下来再对 NLP 任务进行分类，比如能力 A、能力 B，大模型指令能力、泛化能力非常强，学到四五十个任务时就可以泛化到上百种任务。但距离真正的 ChatGPT 还有一步，那就是和真实的人类意图对齐，这就是 OpenAI 做的 GPT。
核心逻辑非常简单，一开始时让人写答案，但是成本太高，改成让人来选答案，这样对标注员的能力要求稍微低一点，可以迅速提升迭代和规模。基于打分再训练一个打分器，通过打分器自动评价模型的好坏，然后用强化学习开始迭代，这种方法可以大规模地把数据模型迭代给转起来，这是 OpenAI 做的 Instruct GPT 逻辑，强化学习的人类反馈。
Instruct GPT 逻辑示意图
基于 Instruct GPT 技术路线，ChatGPT 从技术上并没有特别好的创新，但它最伟大之处是赋予了大型语言模型对话的能力，这是个产品化创新，这个创新非常棒！
如何构建一个大语言模型？
目前，主要可以从下面四个维度来衡量大语言模型的能力。
Know Knowns：LLM 知道它知道的东西。
Know Unknowns：LLM 知道它不知道哪些东西。
Unknow Knowns：LLM 不知道它知道的东西。
Unknow Unknowns：LLM 不知道它不知道的东西。
构建对话式大型语言模型
ChatGPT 通过更大规模的预训练，得到了更多的知识，即 Knowns 范围扩大。
另外，ChatGPT 还关注了伦理问题，通过类似解决 Know Unknowns 的方式，利用人工标注和反馈，拒绝回答一些包含伦理问题的请求。
这里，我们也不得不提国内首个对话式大型语言模型 MOSS，从 2 月 21 日发布至公开平台，便引起高度关注。“对话式大型语言模型 MOSS 大概有 200 亿参数。和传统的语言模型不一样，它也是通过与人类的交互能力进行迭代。” 邱锡鹏教授在分享中谈到，MOSS 为何会选择 200 亿参数，原因非常简单，它恰好具备涌现能力，与人对话的成本低。
MOSS 是基于公开的中英文数据训练，通过与人类交互能力进行迭代优化。目前 MOSS 收集了几百万真实人类对话数据，也在进一步迭代优化，也具有多轮交互的能力，所以对于指令的理解能力上，通用的语义理解能力上，和ChatGPT 非常类似，任何话它都能接得住，但它的质量没有 ChatGPT 那么好，原因在于模型比较小，知识量不够。
ChatGPT 的局限性
为什么说 ChatGPT 对于学术上来说有一定的重要性，因为它不仅展示了通用人工智能的大框架，更是因为它可以接入多模态信息，增强思考能力、增加输出能力，从而变成更好的通用人工智能底座，可以在学术上带来更多的应用。
相较于 ChatGPT 本身的能力而言，它的局限性相对较少且都比较容易解决。图灵奖得主、人工智能三巨头之一 Yann LeCun 认为 ChatGPT 的缺点有以下几点：
目前形式有限。当前的 ChatGPT 仅局限于文本方向，但如前面所说，可以在上游使用一些多模态模型初步解决这个问题。
并不可控。目前已有不少报道通过各种方式解锁了模型的 Ethic 和部分 Know Unknowns 限制，但这部分可以通过更多的人工标注和对齐解决。
推理能力较差。通过思维链的方式，一定程度上可以增强模型推理能力。
无法与现实世界相接触。这也是目前 ChatGPT 最大的问题之一，作为大型语言模型，它无法实时与外部世界互动，也无法利用如计算器，数据库，搜索引擎等外部工具，导致它的知识也相对落后。
而未来它更应该做到提高适时性、即时性、无害等等。
总的来说，如果将 LLM 作为智能体本身，能够与外部交互之后，这些模型的能力一定会有更大的提升。
但我们要始终保证这些 AI 模型的模型可信：有助、无害、诚实。

关键词：

上一篇：
下一篇：

精彩阅读

复旦邱锡鹏：深度剖析 ChatGPT 类大语言模型的关键技术
热点
ChapGPT自问世以来，便展现出了令世人惊艳的对话能力。

2023年，AIGC颠覆游戏产业？
热点
需要抵制的也许并不是AI应用于生产，而是随着AI深度参与生产，原有的版权体系、商业模式需要一场革新。

GPT4重磅发布，AI产业变革继续加速！
热点
3月15日，GPT-4作为一个大型多模态模型发布，能接受图像和文本输入，再输出正确的文本回复。

精选！互联网时代的竞争战略：拼多多的大决战
热点
占据优势位置、把握战略节奏、调动最大资源发起大决战，这是拼多多在互联网时代的竞争战略。

全球观点：茅台数字藏品被指是氪金游戏，数字化转型成割韭菜？
热点
茅台数字藏品已成“元宇宙”中繁杂无聊、充满黄牛的氪金游戏？

天天速讯：「光谷企业家日」圆满落幕，社交生态营销成就线上千万级传播
热点
本活动旨在响应国家“科技自立”的号召，让更多人了解到光谷企业家精神，认识到科技创新的重要性。

全球要闻：【商界头条】民生证券股权竞拍91.05亿元落槌；香港大学辟谣委托中介机构招生；2月上海二手房成交近两万套
热点
民生证券股权竞拍91 05亿元落槌。

世界报道:深度剖析：ChatGPT 及其继任者会成为通用人工智能吗？
热点
尽管本文针对的是ChatGPT，但结论适用于其他大语言模型。

搭载骁龙XR2+，Rokid 高性能AR主机将在3月发布
热点
不可否认，算力和佩戴舒适性如何两全，是AR行业乃至整个XR行业必须直面的问题。

裁员1.1万人后，时隔3个月，巨头宣布再裁10000人！CEO：幸存员工“会更有效率”
热点
据央视财经3月14日晚间消息，脸书母公司Meta首席执行官马克·扎克伯格周二表示，该公司计划裁员10000人。

财富

天天短讯！我在欧洲做共享充电宝，一小时就收费25元
资讯
我在欧洲做共享充电宝，一小时就收费25元,享充电宝在国内已然“卷”成一片红海

首发丨「碳佳科技」完成数千万元Pre-A轮融资，IDG资本独家投资
资讯
首发丨「碳佳科技」完成数千万元Pre-A轮融资，IDG资本独家投资,助力碳佳迈向量产与商用化新里程

世界信息:睡不好的年轻人，熬出千亿睡眠经济
资讯
睡不好的年轻人，熬出千亿睡眠经济,不会有人一直失眠，但一直会有人失眠。

新动态：卷到澳洲之后，蜜雪冰城的「价格战」失效了？
资讯
卷到澳洲之后，蜜雪冰城的「价格战」失效了？,新茶饮出海掘金难

今年3.15晚会，车企们逃过一劫
资讯
今年3 15晚会，车企们逃过一劫,各大汽车厂商的公关部门都长舒了一口气。

当前信息：大火猛火炒不好预制菜
资讯
大火猛火炒不好预制菜,产业的发展需要更多的精耕细作。

二手电商闲鱼，踉跄迎来行业“乱纪元“
资讯
二手电商闲鱼，踉跄迎来行业“乱纪元“,闲鱼们迎来“含泪甩卖”的一大热潮

全球讯息：别煽动焦虑了，GPT-4还取代不了你
资讯
别煽动焦虑了，GPT-4还取代不了你,程序员要被淘汰了

当前要闻：H&M盯上中国中产的钱包
资讯
H&M盯上中国中产的钱包,H&M仍没有从“新疆棉事件”的冲击中缓过来

世界快看点丨去韩国做电商，已经卷到黎明交付了
资讯
去韩国做电商，已经卷到黎明交付了,作为来自中国的跨境卖家，在韩国做生意，需要注意什么？

MORE+ 资讯

天天短讯！我在欧洲做共享充电宝，一小时就收费25元

首发丨「碳佳科技」完成数千万元Pre-A轮融资，IDG资本独家投资

世界信息:睡不好的年轻人，熬出千亿睡眠经济

新动态：卷到澳洲之后，蜜雪冰城的「价格战」失效了？

今年3.15晚会，车企们逃过一劫

当前信息：大火猛火炒不好预制菜

二手电商闲鱼，踉跄迎来行业“乱纪元“

全球讯息：别煽动焦虑了，GPT-4还取代不了你

当前要闻：H&M盯上中国中产的钱包

世界快看点丨去韩国做电商，已经卷到黎明交付了

MORE+ 热点

复旦邱锡鹏：深度剖析 ChatGPT 类大语言模型的关键技术

2023年，AIGC颠覆游戏产业？

需要抵制的也许并不是AI应用于生产，而是随着AI深度参与生产，原有的版权体系、商业模式需要一场革新。

GPT4重磅发布，AI产业变革继续加速！

3月15日，GPT-4作为一个大型多模态模型发布，能接受图像和文本输入，再输出正确的文本回复。

精选！互联网时代的竞争战略：拼多多的大决战

占据优势位置、把握战略节奏、调动最大资源发起大决战，这是拼多多在互联网时代的竞争战略。

全球观点：茅台数字藏品被指是氪金游戏，数字化转型成割韭菜？

茅台数字藏品已成“元宇宙”中繁杂无聊、充满黄牛的氪金游戏？

天天速讯：「光谷企业家日」圆满落幕，社交生态营销成就线上千万级传播

本活动旨在响应国家“科技自立”的号召，让更多人了解到光谷企业家精神，认识到科技创新的重要性。

MORE+ 焦点

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨，苹果举行主题为超前瞻的秋季新品发布会，在此次发布会上，备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架提升新老显卡性能

Windows 12系统可能会在2024年到来，按照正常的节奏，其开发工作应该早已秘密进行。日前，有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息，一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap，旨在为盲人和视

2022年情况又要变了！华硕高管：今年PC恐怕要供过于求

这两年来，由于疫情导致的居家办公及远程教育需求爆发，一直在下跌的PC市场枯木逢春，2021年更是创下了2012年以来的最快增长，然而2022年情

垃圾佬的心头好！西数新款固态盘SN740曝光

对于DIY垃圾佬来说，散片、拆机件、工包……这些名词怕是并不陌生。本周，西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足，如果可以背靠巨头享受大树底下好乘凉的红利，那自然是皆大欢喜，没有这个福气，也大可凭借自己一步一个

MORE+ 智能

国内最火新能源中大型轿车数月订单就破10万

苹果iPhone备忘录还有隐藏功能可一键秒变扫描机

新能源汽车在我国异军突起预示着新能源汽车市场巨大增长潜力

苹果召开2022秋季新品发布会全新产品序列登场

中国大力发展新能源汽车产业绝对不会有错

智能家居进入我们生活使万物互联智能家居生活逐渐成为现实

亚马逊云科技助力念力科技打造云游戏解决方案实现全球化部署

特斯拉Semi卡车明年全新内饰谍照曝光：取消换挡拨杆

人的大脑相当于什么级别的CPU？超低功耗的神奇作品

如何“监视”作业本上的笔迹？这支笔告诉你答案

精彩推送

复旦邱锡鹏：深度剖析 ChatGPT 类大语言模型的关键技术

2023年，AIGC颠覆游戏产业？

GPT4重磅发布，AI产业变革继续加速！

首发丨「碳佳科技」完成数千万元Pre-A轮融资，IDG资本独家投资

世界信息:睡不好的年轻人，熬出千亿睡眠经济

新动态：卷到澳洲之后，蜜雪冰城的「价格战」失效了？

天天短讯！我在欧洲做共享充电宝，一小时就收费25元

公牛集团：3月16日融资买入1101.59万元，融资融券余额2.41亿元

今年3.15晚会，车企们逃过一劫

全球讯息：别煽动焦虑了，GPT-4还取代不了你

二手电商闲鱼，踉跄迎来行业“乱纪元“

当前信息：大火猛火炒不好预制菜

当前要闻：H&M盯上中国中产的钱包

天天速读：changing seasons绘本_changing

中国模特图片网_女酷模特网

每日动态!乌民调：85%乌克兰受访者信任泽连斯基，较2年前大幅上升

世界快看点丨去韩国做电商，已经卷到黎明交付了

黄南州立足三保奋力夺取夏粮丰收

全球时讯：融资丨「集视医疗」宣布完成天使轮融资，远毅资本独家投资

全球观点：茅台数字藏品被指是氪金游戏，数字化转型成割韭菜？

世界关注：AZ主帅：很难估计拉齐奥的阵容；不能在比赛中犯太多错误

精选！互联网时代的竞争战略：拼多多的大决战

融资丨「四叶咖」完成数千万元天使轮融资，天图投资、内向基金联合投资

【世界报资讯】315上榜企业来了：大米、医美、直播、卖药等各种“坑”

【热闻】18元10万赞，直播间人气全靠刷

全球要闻：【商界头条】民生证券股权竞拍91.05亿元落槌；香港大学辟谣委托中介机构招生；2月上海二手房成交近两万套

天天速讯：「光谷企业家日」圆满落幕，社交生态营销成就线上千万级传播

佳能g10相机拍摄视频？佳能相机怎么录像？

什么拍照的传感器最好?什么相机传感器最好?

搭载骁龙XR2+，Rokid 高性能AR主机将在3月发布

手机相机的定时拍照在哪里？手机相机怎么设置定时连续拍照？

初学者买什么单反相机好？适合初学者用的单反有哪些？

拍照要注意哪些要点？拍照时注意要注意哪些小细节？

苹果手机怎么关闭曝光？苹果全景拍摄怎么操作？

世界报道:深度剖析：ChatGPT 及其继任者会成为通用人工智能吗？

spark是什么意思英语翻译（spark是什么意思）

电影播放时能不能拍照？观看电影是否可以拍照？

如何拍出绝美风景照？怎么拍摄夕阳下的照片？

星空夜景摄影速成攻略是什么？夜晚星空的拍摄技巧？

明星直播带货，老套路能否拯救小红书商业化？

相机是怎么自己清洁传感器的?相机传感器脏了怎么办?

“加热即食”的预制菜，能抓住大众消费者的胃吗？

焦点热讯:美妆韩流遇寒流，中国美妆可否追赶？

要闻速递：千亿火锅市场复苏！2023年还有哪些机会点？

裁员1.1万人后，时隔3个月，巨头宣布再裁10000人！CEO：幸存员工“会更有效率”

西安半坡博物馆：探秘消失的成年人墓葬区

这个女首富，家里真的有矿

奇葩的创维汽车：碰撞试验0分，专攻司机养生，创始人豪言「开车可续命」

天天热点评！直播间的“儿子们”，坑走我爸15万

年入10亿，这个资本香饽饽要IPO了！靠为李子柒、汪小菲代工火出圈

当前观察：来看看新发布的GPT-4都有哪些变化吧

最新：小红书315被媒体点名！网络水军充斥，1500元就能删掉一篇帖子

陆正耀再“杀”瑞幸

资讯：GPT-4升级，让压力来到了中国公司这边

全球头条：超越99%的人类，GPT-4多模态模型有哪些技术上的突破？

天天观速讯丨国内如何免费使用ChatGPT-4，开放猫或将接入API

环球速看：知乎、小红书和keep，网络经济“三小强”谁会先走出“商业化泥潭”？

开放猫：让 ChatGPT 介绍GPT4

【世界独家】静组词和拼音（静组词）

融资丨「洞隐科技」完成超亿元A轮融资，构建全程供应链数字化版图

全球播报:GPT-4来了，它趴在谷歌和脸书们耳边说：毁灭你，与你何干

视点！千兆光网或成运营商新赛点价格战竞争是否会再现江湖

天天消息！工信部金壮龙：加快5G、工业互联网等新型信息基础设施建设和应用，壮大数字经济核心产业

震撼！GPT-4发布，打工人都要失业了吗？

天天最资讯丨ChatGPT之后标贝科技关于如何为预训练大语言模型提供终身学习语料的探索

字节跳动十万员工困在数据里

每日观察!下一个硅谷银行，可能在这张名单里

天天时讯：B站鬼畜难题：搞笑容易搞钱难

国货平替崛起，外资彩妆不香了？

焦点简讯:欧冠八强身价排行：曼城、切尔西超10亿欧拜仁第三、皇马第四

今日有没有可以刷商城的QQ飞车WG？

【世界新视野】海格通信: 关于暂不召开股东大会审议公司向特定对象发行股票相关事项的公告

台洪生变　赵少康：早有警讯绿自己骗自己

环球速读：融资丨「慧观生物」完成近千万元种子轮融资，德迅投资独家投资

【时快讯】终于不用卷了！人人发钱，AI带你进入躺平时代

【世界时快讯】GPT-4发布后，我离失业还有多远

环球热点！3月15日焦作民利冰晶石报价平稳

CP643连接不上电脑怎么办？如何解决？

有AGP8X标志的显卡是不是可以通用啊??AGP8x的显卡能在AGP4x的主板上用吗?

诺基亚6220c怎么格式化内存？诺基亚6120c储存卡格式化？

联想a60刷机步骤有哪些?卡刷是什么意思？

ps2模拟器怎么下载运行？ps2模拟器电脑版怎么用？

三星s5830怎么连接电脑？三星s22怎么连接电脑usb？

网秦软件怎么样？网秦安全管理好吗？

电脑xp系统出现开机密码框？怎么取消开机界面密码？

世界热资讯！诈捐？镜湖吴幽：因比特币爆仓无法履约有大佬曾因爆仓自杀

WIN8系统怎么样？激活win8的方法是什么？

声卡驱动为什么安装失败？如何来解决声卡驱动安装失败？

每日速看!融资丨锂电整线智能化方案及装备提供商「烽禾升」获过亿元B轮融资

环球焦点！融资丨电池回收企业「杰成新能源」获数亿元B轮融资

全球实时：硅谷银行暴雷，如何影响中国医药公司

创业邦3.8女神节直播丨如何定位自己的人生，创造无限可能

【焦点热闻】900亿没白花微软确认必应已用上GPT-4：搜索优于谷歌

环球短讯！商汤开源多模态多任务通用大模型“书生2.5”，迈向AGI

为什么多啦a梦不会老_最后的三个结局你猜到了吗

环球速读：大量高管离职，风平浪静的苹果暗流涌动

全球观速讯丨耐克、阿迪们也开始卖不动了？

当前时讯：OpenAI推出大型语言模型GPT-4 ，可以瞬间完成硕士论文

天天快消息！Meta第二轮裁员10000名员工，冻结5000个职位招聘

消息称网易内部多部门试水AI提效，利用ChatGPT进行业务测试