ChatGPT的胜利,宣告知识图谱的消亡?

2023-05-25 14:22:05   来源:商业新知网

过去 10年,知识图谱可谓是最接近“人工智能”的概念。业内普遍认为,知识图谱的概念最先是由谷歌于2012年正式提出,主要用来支撑下一代搜索和在线广告业务。

此后,这项技术迅速火爆,被国内外多家搜索引擎公司所采用,如:美国的微软必应,中国的百度、搜狗等,都在短短的一年内纷纷宣布了各自的“知识图谱”产品,足以看出这项革新对整个搜索引擎界的整体影响。

但这项技术的应用并不仅拘泥于搜索引擎领域范围。由于让人工智能具备了认知能力和逻辑能力,知识图谱进而实现了智能分析、智能搜索、人机交互、个性化推荐等场景应用,成为互联网知识驱动的智能应用的基础设施。


(资料图片仅供参考)

可以说知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。

然而,ChatGPT的横空出世让整个AI界都沸腾了。

C hatGPT带来的震撼在于,它不用借助知识图谱就可以很好地解决用户对话知识问答相关的任务,具有非常强大的理解能力、流畅的对话能力和上下文的刻画能力。

更重要的是,它将原来基于特定任务的模型变成了一个统一的、基于提示的、任务无关的模型,可以去尝试解决非常复杂或困难的、人类参与很多的任务。

这也让AI界认知产生了分化,有观点认为有了ChatGPT这种大语言模型后,知识图谱完全没有存在的意义,甚至有的公司已经彻底抛弃了知识图谱路线。

那么,在大模型时代,知识图谱真的要消亡了吗?

知识图谱vs大语言模型

在讨论这个问题之前,先来了解一下知识图谱和大语言模型的异同。

知识图谱从字面上看,可以拆分为知识+图谱,这样就可以理解:将需要的知识数据(结构化或非结构化数据)以图谱的形式进行展示,这种简单的过程也是知识图谱的构建过程。

知识图谱通常包含实体、关系和属性三个要素,例如人名、国家、语言等实体,以及人口、首都、官方语言等关系和属性。它可以根据图谱中定义的关系提供精确且逻辑一致的答案,因此对于信息检索、问答和结构化数据推理等任务特别有用。

大语言模型是基于深度学习和神经网络,像GPT-4这样的大语言模型是在大量文本数据上进行训练,以学习模式、上下文以及单词和短语之间的关系。

它们可以生成类似人类的文本、回答问题、提供建议以及执行其他自然语言任务,还可以很好地处理模棱两可和不完整的信息,并且处理广泛的主题。

不难发现,两者在知识的学习、分析、推理方面有着类似的功能,但却各有优劣势。

知识图谱通常需要手动或半自动构建,是一种非常耗时耗人力的工作,随着知识的不断扩展和变化,知识图谱也需要不断更新;

同时,它的作用仅限于图谱编码中的知识范围,这使得它在处理模棱两可或不完整的信息时准确率较低。

但它的优势在于准确的知识库,对于事实性的、专业性的知识有着非常高的准确度。

相反,专业知识在大模型训练语料里占比非常少,这也使得ChatGPT等语言大模型生成的内容的可靠性和真实性备受质疑。

它无法将真实与想象、真实与虚构分开,这种现象甚至促使创造了一个新术语:人工智能幻觉,维基百科将其定义为“人工智能的自信反应,其训练数据似乎没有合理性”。

同时,语言大模型需要大量的计算能力和资源来进行训练和微调,其花费的时间和成本也不容小觑。

目前,语言大模型只在通用领域给出了较为惊艳的表现,至于在知识图谱广泛应用的垂直领域,语言大模型暂时未显示出领先的一面。

知识图谱退场为时尚早

正因为语言大模型暂时还无法解决事实准确性、可信度、可追溯等问题,知识图谱的存在就非常有意义。

知识图谱或者类似的知识库、知识引擎,能够为大模型提供准确的知识,它可以被用来通知、聚焦、过滤和控制生成式人工智能,增强大模型响应的智能和可靠性,使其更适合关键任务。

当大模型真正落地到工业应用时,也需要有知识图谱对专业领域知识的支撑,至少短期来看是非常需要的。

因此,我们也可以说,知识图谱的构建原来有各种各样的构建方式,现在又多了一种构建方式——用大模型去辅助整个知识图谱构建,通过大量语料和大数据的学习,通过Prompt去进行知识的激发。

同时知识图谱反过来也能够去推动大模型Prompt工程里的相关工作,融入到大模型的训练中,使得生成更可控,更准确。同时,知识图谱也可以提供很多额外的语义信息,帮助大模型的知识推理做得更好。

所以从本质上看,大语言模型出现后,并不是将知识图谱消灭了,而是可以发挥知识图谱和大模型这两种技术的优势:在需要可控知识或可控逻辑的时候,知识图谱会发挥更大作用;在需要更自由的交互任务理解和生成时,大模型发挥更好的作用。

结合这两种方法的优势,可以产生更强大和有效的自然语言处理系统。

知识图谱

与大语言模型的结合

那么,知识图谱如何与大语言模型相结合呢?

有意思的是,ChatGPT给出了将知识图谱集成到大语言模型中的几种方法:

使用知识图谱数据进行预训练

将知识图谱中的知识注入到大语言模型的预训练阶段,可以帮助大模型学习实体与其属性之间的关系。可以通过将知识图谱三元组(主语、谓语、宾语)转换为自然语言句子并将它们添加到训练语料库中来完成。

使用基于图的目标进行微调

在预训练之后,使用基于图的目标对特定任务的模型进行微调,可以帮助大模型学习使用图中编码的知识进行推理和推理。这可能涉及将自然语言查询转换为基于图形的查询,以及开发将基于图形的推理与基于文本的推理相结合的方法。

例如,可以对模型进行微调,以预测图形中缺失的实体或关系,这可以提高其对底层结构的理解。

改进实体链接和消除歧义

增强模型识别文本中的实体并将其链接到知识图谱中相应节点的能力。这可以通过在训练或微调期间结合高级实体链接和消除歧义技术来实现。

集成图嵌入

图嵌入是一种用于将图中的节点、边或整个子图转换为连续向量或低维表示的技术,机器学习算法可以更轻松地处理这些向量或低维表示。

图嵌入在知识工程的上下文中特别有用,因为它可以帮助将知识图谱中的结构化信息转换为可以更容易地与机器学习算法(尤其是神经网络)集成的格式。

使用图神经网络或其他图表示学习方法学习,并可用于丰富模型对实体及其关系的理解。

推理时查询知识图谱

当模型遇到需要精确、结构化知识的问题或任务时,可以查询知识图谱获取相关信息。这可以通过将自然语言查询转换为基于图形的查询(例如,使用SPARQL),然后使用检索到的信息来回答问题或执行任务来完成。

知识图谱引导生成

将大语言模型的生成能力与知识图谱中的结构化信息相结合,可以生成更准确、更相关的文本。例如,在生成实体的摘要或描述时,模型可以对知识图谱中的信息进行优先级排序,以确保事实的正确性。

混合模型

开发包含基于图和基于神经网络的组件的混合模型,可以利用这两种方法的优势。例如,图神经网络(GNN)可用于学习图结构数据的潜在表示,然后可以将其与大语言模型集成以执行自然语言处理任务。

鼓励可解释性和可解释性

开发允许大语言模型基于知识图谱为其推理和预测生成解释的方法。这可以帮助用户了解模型如何利用知识图谱中的结构化信息,并有助于调试和优化模型。

结语

技术的浪潮总是汹涌而至,在新的技术革新来临之际,我们更应该客观看待新旧技术的优劣,而不是冲动地去拥抱新技术,抛弃现有成熟技术。

对于知识图谱来说,大模型的出现并不是一个冲击,恰恰是给了知识图谱一个新的生长空间。当我们将大模型与自身优势的行业应用去深度结合,形成数据和算法的持续迭代,必将看到更好的结果持续涌现。

关键词:

精彩阅读

ChatGPT的胜利,宣告知识图谱的消亡?

热点

过去10年,知识图谱可谓是最接近“人工智能”的概念。

每日时讯!云知声发布山海大模型,创始人黄伟:目标年内达到比肩ChatGPT的通用能力

热点

2022年底,云知声就已意识到U+X战略期待已久的AGI时代到来了,过去所有的积累都到了突破的时候。

百度何俊杰:用AI原生思维重构百度移动生态,让AI人人可用

热点

新浪潮汹涌而至,AI正在重构未来,千行百业都将迎来新的机会。

Glassnode 数据研究:回顾比特币铭文爆发的“疯狂一周”_当前讯息

热点

本文将深入探讨对BRC-20代币的需求对比特币链上活动、铭文类型以及矿工收入的影响。

让业务用起来 | 观远数据敏捷分析实践巡展上海站回顾-世界简讯

热点

5月19日,「让业务用起来」2023观远数据敏捷分析实践巡展·上海站圆满结束。

世界焦点!中兴通讯宣布加入“科学碳目标倡议”(SBTi)

热点

中兴通讯宣布加入“科学碳目标倡议”(SBTi)并举行承诺函签署仪式。

世界头条:有了AI,新的学习方式

热点

问了十几个问题,到了下车时间,我和AI停止了沟通。对话可以保存,明天有时间还能接着聊。

世界快看点丨孙燕姿回应AI孙燕姿,音乐行业也在回应AI音乐

热点

“冷门歌手”孙燕姿还是出面回应了这场AI界的狂欢。

JBD量产彩色MicroLED“蜂鸟”光引擎,内置微显示屏获SID 2023年度最佳 全球微资讯

热点

除了JBD蜂鸟光引擎外,JBD还在SID上展出了搭载JBD蜂鸟光引擎的双目彩色AR眼镜参考设计。

财富

我,25岁,陷入“衰老焦虑”

资讯

我,25岁,陷入“衰老焦虑”,年轻人的美貌焦虑,养肥了这条千亿赛道

小鹏汽车,等待拐点

资讯

小鹏汽车,等待拐点,“危”和“机”始终并存。

每日消息!泳池清洁的未来,机器正在取代人工

资讯

泳池清洁的未来,机器正在取代人工,干苦力活,机器人比人工更便宜。

便利店玩联名,奥特曼来了也不管用

资讯

便利店玩联名,奥特曼来了也不管用,小小的IP联动背后,牵涉的运营细节越来越多。

一个路口开5家店,零食集合店生意还能火多久?

资讯

一个路口开5家店,零食集合店生意还能火多久?,狂飙之后的零食集合店市场,会留下一地鸡毛吗?

全球快播:除了OpenAI,全球还有这12家生成式AI独角兽值得关注

资讯

除了OpenAI,全球还有这12家生成式AI独角兽值得关注,13家生成式AI公司成为独角兽的平均时间仅为3 6年

今日资本徐新:人的差距,往往来自是否专注 焦点热议

资讯

今日资本徐新:人的差距,往往来自是否专注,优秀的投资人是如何看待有潜力的企业的?成功的创业者具备哪些

微信的大动作,为了什么?_今日快看

资讯

微信的大动作,为了什么?,为啥很多创作者不赚钱?

全球快看点丨36.8万起,蔚来全新ES6开卖:激光雷达加持,零百4.5秒,会成为爆款吗

资讯

36 8万起,蔚来全新ES6开卖:激光雷达加持,零百4 5秒,会成为爆款吗,BaaS后不到30万

国内大模型迎来中场战事

资讯

国内大模型迎来中场战事,抢滩垂类。

每日时讯!云知声发布山海大模型,创始人黄伟:目标年内达到比肩ChatGPT的通用能力

2022年底,云知声就已意识到U+X战略期待已久的AGI时代到来了,过去所有的积累都到了突破的时候。

百度何俊杰:用AI原生思维重构百度移动生态,让AI人人可用

新浪潮汹涌而至,AI正在重构未来,千行百业都将迎来新的机会。

Glassnode 数据研究:回顾比特币铭文爆发的“疯狂一周”_当前讯息

本文将深入探讨对BRC-20代币的需求对比特币链上活动、铭文类型以及矿工收入的影响。

让业务用起来 | 观远数据敏捷分析实践巡展上海站回顾-世界简讯

5月19日,「让业务用起来」2023观远数据敏捷分析实践巡展·上海站圆满结束。

世界焦点!中兴通讯宣布加入“科学碳目标倡议”(SBTi)

中兴通讯宣布加入“科学碳目标倡议”(SBTi)并举行承诺函签署仪式。

A股申购 | 易实精密(836221.BJ)开启申购 2022年新能源汽车零部件产品收入占比增长至50.82% 天天热文

智通财经APP获悉,5月25日,易实精密(836221 BJ)开启申购,发行价格为5 98元 股,申购上限为85 50万股,市

世界快看点丨哈德森开启新赛季备战!下月初抵达国内,已确定加盟辽宁!

哈德森开启新赛季备战!下月初抵达国内,已确定加盟辽宁!,cba,辽宁飞豹,职业生涯,提姆·哈德森,莱斯特·哈

AI“直线段工具”如何使用 ai的直线段工具如何使用|环球精选

AI是一个比较强大的图像图像制作软件,怎么用它画出笔直精确的线条呢,一起来学习一下。打开AI,新建一个画

停产停销! 天天热门

江铃最终也没能甩掉重汽这个亏损“包袱”,为了向新能源转型,只能选择“断臂”。沃尔沃卡车收购计划落空后

热点聚焦:骂过之后,看看戴威的新创业项目「about time coffee」做对了什么

4月,瑞幸去了新加坡。5月,about+time+coffee+股东之一戴威浮出水面。about+time+coffee+的营销还算不上一