首页> 热点 >

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

2022-07-05 06:03:59 来源：商业新知网

前言

明明是只斑马，AI为什么说它是一条狗？

分类模型在归类图像时有时会错误地判断类别。

(资料图片)

经过学习的AI，还会搞砸一些预测，肯定是在其中的某个环节出现了纰漏。

斯坦福大学的两位博士生和教授James Zou在一篇论文中，带我们探究了分类模型犯错的原因。

随后，论文提出一种方法——反事实的概念性解释（Conceptual Counterfactual Explanations），并评估了它的效果。

通过这种方法，我们就能重新定义模型的分类标准，从而解释AI犯错的原因。

一起来看看吧。

AI为什么会犯错？

想要提高分类模型后续预测的准确性，就先得整明白这个模型在哪里出了岔子。

一般来说，AI搞砸预测是以下原因造成的：

首先是在模型实际预测的过程中，分类标准可能会与预训练时有些偏差，使得训练模型在实际预测的过程中效果不佳，进而降低预测结果的准确性。

比如说，病理学家使用预先训练好的模型来分类组织病理学图像，但效果在他的图像上却不是很好。

这就可能是在他的图像中，色调与原始训练数据中不同导致的。

其次，在模型学习的过程中，可能会学习到一种叫做“伪相关性”的东西，即将一些看似无关的要素与被识别的图像关联起来。

可以看这个例子：

在这个模型训练过程中，样本里所有狗的照片里都有雪，这导致该模型将雪与狗联系在一起，并错误地预测：没有雪的狗不是狗。

这可能是用的数据集，都是在同一场景下收集的，会阻碍模型的泛化。

除此之外，也可能是在训练模型时，人为制造的一些偏差。

例如，某一皮肤科专家利用训练好的AI来分类图像中的皮肤病，但其他同事使用的效果却不尽如人意。

这可能是因为在训练的样本中，皮肤的肤色单一、且年龄段分布窄。

了解了AI“犯错”的原因后，我们要怎样才能准确地判断模型哪里出现了错误呢？

AI犯错，它来解释

James Zou在论文中提出了一种叫反事实的概念性解释（CCE）的方法。

具体来说，就是通过这种方法，来探究输入数据与预测结果之间的联系，最终找到模型的错误之处。

那CCE是怎么来解释的呢？

定义概念库

首先要做的，就是设置并细化一个概念库C，即制作一个分类标准。

具体来说，概念库C中的各个概念可以用来分类图像，如装置c1（街道、雪等）、图片质量c2（清晰、模糊等）······

这样，就能获得一组可解释的概念库C={c1，c2，…}。

然后，需要给其中的每个概念找对应训练数据。

具体的，就是收集与其相符（Pci）和不符（Nci）的例子，一般来说数量上要一样（Pci=Nci=100）。

对于每个概念，CCE都要学习它们的分类方法和“思维方式”。

分别通过两种方法：

一个是通过学习支持向量机（SVM），来寻找可以区分两种事物最优方式的算法（线性分类器）。

另一个是学习相应的概念激活向量（CAV），它可以用来解释图像被错误分类的具体原因。

就像下图，都是斑马的图像，归类错误的原因却不一样。

这一步只需要对每个想要评估的模型做一次，之后CAV便可以用来解释任意数量的错误分类。

给定错误分类标准

我们可以通过改变不同概念在模型中的比重，对其分类标准进行相应的调整，这些调整要满足以下原则：

1、正确性：如果一个分类标准达到了预期的结果，那么它就被认为是正确的。

2、有效性：分类标准不能违反人类的基本认知。

3、稀疏性：最终目标是向用户传达模型的错误之处，太多的变量不利于有效传达信息。

我们的目的是尽可能地使预测结果贴近训练结果，即最小化交叉熵损失。

因此就要不断优化模型预测的标准，通过调整待修改的标准，对其进行加权，最终达到纠正错误分类的效果。

了解之后，我们通过一个实际例子来看看，怎么用CCE“探测”分类模型出错的地方。

在这里，分类模型错误地将斑马图像识别为非洲猎犬。

于是，我们首先生成这个模型将斑马识别成狗的一系列标准。

然后，对这些标准进行评分，如果评分为正，则代表在图像中增加这个概念，将会提高正确分类的概率，反之亦然。

在这个例子中，如果增加stripes（条纹）这个概念，识别出它为斑马的概率就会大一些。

在c）图中，通过CCE分析也可以直观地看到，“Polka Dots”（斑点）和“Dog”（狗）是导致模型预测错误的原因。

CCE效果怎么样？

看到这里，想必大家对CCE的原理都有了初步的认识。

那它判断得到底准不准确，效果究竟如何呢？

CCE的目的，主要是揭示模型在训练过程中学习到的“伪相关性”，用它就可以捕获图像中出现的其他“无关要素”和图像的伪相关性。

测试发现，在大多数情况下，该模型在超过90%的错误分类的测试样本中识别出伪相关。

看看这个表格，相较于其他方法，使用CCE，识别出样本中伪相关的概率最高。

CCE能够精准地识别出样本中的伪相关，可以看这个例子：

改变苹果图片的颜色（使图片变灰），分类模型识别错误的概率增大时（黑线），CCE辨别出“绿色”为伪相关的分数也就越高（绿线）。

除此之外，CCE也有用在医学领域的潜力。

像Abubakar Abid等人就使用CCE，在皮肤病学（皮肤状况分类）、胸片图像中的心脏病学（气胸分类）中都做了相关测试。

CCE使用学习到的偏差和图像质量条件来解释模型犯错，也已被专业的皮肤科医生证实——这些因素，确实很大程度上是导致皮肤图像难以分类的原因。

此外，CCE的速度也很快。

概念库只需要使用简单的支持向量机学习一次，每个测试示例在单个CPU上花费的时间小于0.3s。

重要的是，它可以很简单地应用到任何深度网络，在不需要训练数据的情况下检测到模型犯错的原因。

免责声明

文章来源：量子位

凡资讯来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网赞同其观点，也不代表本网对其真实性负责，转载请联系原出处。您若对该文章内容有任何疑问或质疑，请立即与后台小编联系，平台将迅速给您回应并做处理。注明本公司原创内容，转载请与我们联系

关键词：分类标准错误分类

精彩阅读

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

热点

明明是只斑马，AI为什么说它是一条狗？

世界视点！网易To B，柔外刚中

热点

随着数字经济的浪潮涌动，在ToB业务上，网易这种在外边看来缺乏进攻性的特质，更加明显了一些。

焦点热门:钉钉、企微、飞书学会赚钱了吗？

热点

“能用就行”的观念着实成为了钉钉、飞书、企微变现路上的绊脚石。

天天热讯:【前沿】邬贺铨院士：数字经济更需要成为可信经济

热点

安全可信的数字世界不仅需要技术支撑，更需要制度与管理来保障，强化网络安全意识才能居安思危。

世界要闻：6G网络架构远景与关键技术展望白皮书

热点

移动通信网络是一个复杂的系统，而网络架构就是这个复杂系统的基座，决定整个系统的效率和能力。

全球资讯：如何搭建数据指标体系

热点

UserJourneyMap模型，用户旅程地图。是指设计该业务时，必须要梳理的用户（使用者）的生命旅程。

全球快看：Soul冲刺港交所：约六成用户每月至少活跃15天，2021年营收同比增长158.3%

热点

2019年至2021年，销售费用在Soul的收入占比分别为289 1%、124 8%和118 1%，呈逐年下降趋势。

【世界速看料】元宇宙里只有求生欲

热点

元宇宙里没有孤勇者。

天天短讯！全新一代揽胜上市限量定制艺术数字藏品首发数藏中国

热点

数藏中国CEO王鹏飞表示，揽胜是全球驰名的豪华SUV，在广大消费者和车主心中具有十分重要的影响力。

全球热点评！北京淘宝科技公司更名昊超电商

热点

天眼查App显示，近日，北京淘宝科技有限公司更名为北京昊超电子商务有限公司，法定代表人由张锐变更为邱阳。

财富

【环球聚看点】快手、抖音、视频号交战内容付费

资讯

快手、抖音、视频号交战内容付费,“我们不一样，每个人都有不同的境遇。”

【天天播资讯】特斯拉开放超1200座超充站；比亚迪6月销量同比超过160%；Cruise无人车导致旧金山堵车数小时 | 每周撩车

资讯

特斯拉开放超1200座超充站；比亚迪6月销量同比超过160%；Cruise无人车导致旧金山堵车数小时|每周撩车,《撩车》是创业邦旗下的汽车栏目，我们将

每日速看!钉钉、企微、飞书学会赚钱了吗？

资讯

钉钉、企微、飞书学会赚钱了吗？,三种不同的盈利模式对应三种不同的平台理解

天天观热点：陌生人社交争议不断，二次冲击IPO的Soul还有新故事？

资讯

陌生人社交争议不断，二次冲击IPO的Soul还有新故事？,一切还是未知之数。

观速讯丨新能源难逃“锂焦虑”

资讯

新能源难逃“锂焦虑”,与其大肆买矿，不如主动出击。

每日看点！一夜没了14万元，B站虚拟主播还背上平台的「债」

资讯

一夜没了14万元，B站虚拟主播还背上平台的「债」,平台、家长、主播苦“未成年人打赏”久矣。

全球视讯！180天成为市场老大，这家公司要做非洲版「美团」

资讯

180天成为市场老大，这家公司要做非洲版「美团」,在非洲送外卖是一种什么体验？

环球要闻：元宇宙里只有求生欲

资讯

元宇宙里只有求生欲,元宇宙里没有孤勇者。

世界热文：麦趣尔往事

资讯

麦趣尔往事,食品危机背后。

【全球播资讯】“星巴克之父”如何度过精神危机？

资讯

“星巴克之父”如何度过精神危机？,摸着石头过河的时代，需要的是创业精神，好奇心，英勇无畏。

MORE+ 资讯

MORE+ 热点

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

世界视点！网易To B，柔外刚中

随着数字经济的浪潮涌动，在ToB业务上，网易这种在外边看来缺乏进攻性的特质，更加明显了一些。

焦点热门:钉钉、企微、飞书学会赚钱了吗？

“能用就行”的观念着实成为了钉钉、飞书、企微变现路上的绊脚石。

天天热讯:【前沿】邬贺铨院士：数字经济更需要成为可信经济

安全可信的数字世界不仅需要技术支撑，更需要制度与管理来保障，强化网络安全意识才能居安思危。

世界要闻：6G网络架构远景与关键技术展望白皮书

移动通信网络是一个复杂的系统，而网络架构就是这个复杂系统的基座，决定整个系统的效率和能力。

全球资讯：如何搭建数据指标体系

UserJourneyMap模型，用户旅程地图。是指设计该业务时，必须要梳理的用户（使用者）的生命旅程。

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

明明是只斑马，AI为什么说它是一条狗？

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

世界视点！网易To B，柔外刚中

焦点热门:钉钉、企微、飞书学会赚钱了吗？

天天热讯:【前沿】邬贺铨院士：数字经济更需要成为可信经济

世界要闻：6G网络架构远景与关键技术展望白皮书

全球资讯：如何搭建数据指标体系

全球快看：Soul冲刺港交所：约六成用户每月至少活跃15天，2021年营收同比增长158.3%

【世界速看料】元宇宙里只有求生欲

天天短讯！全新一代揽胜上市限量定制艺术数字藏品首发数藏中国

全球热点评！北京淘宝科技公司更名昊超电商

【环球聚看点】快手、抖音、视频号交战内容付费

【天天播资讯】特斯拉开放超1200座超充站；比亚迪6月销量同比超过160%；Cruise无人车导致旧金山堵车数小时 | 每周撩车

每日速看!钉钉、企微、飞书学会赚钱了吗？

天天观热点：陌生人社交争议不断，二次冲击IPO的Soul还有新故事？

观速讯丨新能源难逃“锂焦虑”

每日看点！一夜没了14万元，B站虚拟主播还背上平台的「债」

全球视讯！180天成为市场老大，这家公司要做非洲版「美团」

环球要闻：元宇宙里只有求生欲

世界热文：麦趣尔往事

【全球播资讯】“星巴克之父”如何度过精神危机？

MORE+ 资讯

MORE+ 热点

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

世界视点！网易To B，柔外刚中

焦点热门:钉钉、企微、飞书学会赚钱了吗？

天天热讯:【前沿】邬贺铨院士：数字经济更需要成为可信经济

世界要闻：6G网络架构远景与关键技术展望白皮书

全球资讯：如何搭建数据指标体系

MORE+ 焦点

华盛顿地铁站首次亮相为视障人士扩展旅行路线

2022年情况又要变了！华硕高管：今年PC恐怕要供过于求

垃圾佬的心头好！西数新款固态盘SN740曝光

虚假宣传、误导消费者倍至冲牙器关联公司被处罚

吉利几何EX3功夫牛高居榜首，4月投诉量230起

“说好了未达到目标全额退款，结果都是骗人的！”

MORE+ 智能

精彩推送

当前速读：斑马识别成狗 AI犯错的原因被斯坦福找到了

明明是只斑马，AI为什么说它是一条 狗？

明明是只斑马，AI为什么说它是一条狗？