微软开源多项工具和数据集审计AI驱动的内容审核系统

2022-05-25 10:31:12   来源:cnBeta

今天微软宣布多项工具和数据集开源 ,这些工具旨在审计 AI 驱动的内容审核系统,以及自动编写突出显示 AI 模型中潜在错误的测试。微软表示 AdaTest 和(De)ToxiGen 项目可以产生更可靠的大型语言模型 (LLMs),或者类似于 OpenAI 的 GPT-3的模型,用于分析和生成具有人类水平复杂性的文本。

目前 LLMs 存在诸多风险。因为这些模型经过了大量来自于互联网(包括社交媒体)的数据培训,因此它们在训练过程中可能会遇到有毒文本(toxic text)。由于重新训练模型的成本以及存在的大量错误,发现和修复这些模型中的缺陷仍然是一个挑战。

为了解决毒性问题,Microsoft Research 团队开发了 ToxiGen,这是一个用于训练可用于标记有害语言的内容审核工具的数据集。据微软称,ToxiGen 包含 274,000 个“中性”(neutral)和“有毒”(toxic)陈述的示例,使其成为最大的公开仇恨言论数据集之一。

为了生成样本,Microsoft Research 团队提供了一个针对 13 个少数群体的“中性”陈述和仇恨言论的 LLM 示例,这些群体包括黑人、身体和认知障碍者、穆斯林、亚洲人、拉丁裔、LGBTQ+ 和美洲原住民。这些陈述来自现有的数据集以及新闻文章、观点文章、播客记录和其他类似的公共文本来源。

微软团队解释说,用于创建 ToxiGen 语句的过程被称为 (De)ToxiGen,旨在通过指导 LLM 生成工具可能错误识别的语句来揭示特定审核工具的弱点。通过对三个人工编写的毒性数据集的研究,该团队发现从一个工具开始并使用 ToxiGen 对其进行微调可以“显着”提高该工具的性能。

关键词: 数据集开源 内容审核系统 大型语言模型 公共文本来源

精彩阅读

微软开源多项工具和数据集审计AI驱动的内容审核系统

资讯

今天微软宣布多项工具和数据集开源 ,这些工具旨在审计 AI 驱动的内容审核系统,以及自动编写突出显示 AI 模型中潜在错误的测试。微软

博通开始与软件集团VMware洽谈收购事宜

资讯

博通(Broadcom)据报道开始与软件集团VMware洽谈收购事宜,交易价值可能超过500亿美元,因为这家美国芯片制造商继续努力将自己转变为一家多

庞巴迪揭开最新型Global8000公务机的面纱

资讯

庞巴迪公司已经揭开了其最新型Global 8000公务机的面纱,公司声称这是世界上速度最快、航程最远的量产公务机,将豪华的机舱与623节(716英

高通宣布维持多晶圆厂合作策略 包括台积电与三星

资讯

今日,台北电脑展COMPUTEX 2022开始举行,实体展举办日期为5月24日至27日。据中国台湾地区经济日报报道,台北国际电脑展期间,高通高级副

室内定位市场规模扩大 华为发布首个商用方案

资讯

室内定位市场在全球发展非常迅猛,目前已经形成了比较大的产业规模,预计到2025年,室内定位产业会达到每年新增70多亿美元的产业增长速度。

供应链:苹果正在要求富士康为iPhone14做准备

资讯

对于苹果来说,为了降低疫情对新品的冲击,他们也在积极准备相关的生产工作。据供应链最新消息称,苹果正在要求富士康为iPhone 14生产工作

微软正在不遗余力的提高Windows11的用户体验

资讯

很显然,微软正在不遗余力的提高Windows 11的用户体验,因为在他们看来,这个系统得到了用户的认可。在2022年的Computex期间,微软的Windo

苹果与LGInnotek合作生产自拍相机 将由韩国供应商承担

资讯

据报道,苹果已经委托韩国制造商LG Innotek大规模生产属于iPhone14的自拍相机。根据最新报告,这将是iPhone历史上第一次由韩国供应商承担

微软主管:Windows11的质量得分是最高的

资讯

Windows 11现在已经广泛推送,它包含了一些好的想法,但它也从用户和评论家那里得到了不同的评价。虽然一些用户喜欢新的WinUI和设计上的改

华硕X670-PWIFI设计图曝光,将推出新平台

资讯

在下周召开的 Computex 大展期间,AMD有望展示各种 AM5 主板。不过在展会开始之前,国内百度贴吧@amd吧已经有网友分享了华硕 X670 PR

财富

微软开源多项工具和数据集审计AI驱动的内容审核系统

资讯

今天微软宣布多项工具和数据集开源 ,这些工具旨在审计 AI 驱动的内容审核系统,以及自动编写突出显示 AI 模型中潜在错误的测试。微软

博通开始与软件集团VMware洽谈收购事宜

资讯

博通(Broadcom)据报道开始与软件集团VMware洽谈收购事宜,交易价值可能超过500亿美元,因为这家美国芯片制造商继续努力将自己转变为一家多

庞巴迪揭开最新型Global8000公务机的面纱

资讯

庞巴迪公司已经揭开了其最新型Global 8000公务机的面纱,公司声称这是世界上速度最快、航程最远的量产公务机,将豪华的机舱与623节(716英

高通宣布维持多晶圆厂合作策略 包括台积电与三星

资讯

今日,台北电脑展COMPUTEX 2022开始举行,实体展举办日期为5月24日至27日。据中国台湾地区经济日报报道,台北国际电脑展期间,高通高级副

室内定位市场规模扩大 华为发布首个商用方案

资讯

室内定位市场在全球发展非常迅猛,目前已经形成了比较大的产业规模,预计到2025年,室内定位产业会达到每年新增70多亿美元的产业增长速度。

供应链:苹果正在要求富士康为iPhone14做准备

资讯

对于苹果来说,为了降低疫情对新品的冲击,他们也在积极准备相关的生产工作。据供应链最新消息称,苹果正在要求富士康为iPhone 14生产工作

微软正在不遗余力的提高Windows11的用户体验

资讯

很显然,微软正在不遗余力的提高Windows 11的用户体验,因为在他们看来,这个系统得到了用户的认可。在2022年的Computex期间,微软的Windo

苹果与LGInnotek合作生产自拍相机 将由韩国供应商承担

资讯

据报道,苹果已经委托韩国制造商LG Innotek大规模生产属于iPhone14的自拍相机。根据最新报告,这将是iPhone历史上第一次由韩国供应商承担

微软主管:Windows11的质量得分是最高的

资讯

Windows 11现在已经广泛推送,它包含了一些好的想法,但它也从用户和评论家那里得到了不同的评价。虽然一些用户喜欢新的WinUI和设计上的改

华硕X670-PWIFI设计图曝光,将推出新平台

资讯

在下周召开的 Computex 大展期间,AMD有望展示各种 AM5 主板。不过在展会开始之前,国内百度贴吧@amd吧已经有网友分享了华硕 X670 PR

一个顶流虚拟偶像的退圈风波

虚拟偶像是一个新生事物,现在还处于初级阶段,粉丝可以与虚拟偶像共同成长,可以去定义,去创造与之前饭圈文化不一样的文化。

李飞飞团队提出零样本泛化的技术,性能超越SOTA!

强化学习中的泛化,是指通过不断跟环境交互,产生出一种网络的记忆性。

钉钉“贪财”出下策

SaaS仍非金矿,PaaS并非铲子。

盘点海外电竞与数据行业超百起合作:8家机构案例最多,定制数据分析为主要诉求

目前电竞数据应用主要集中在B端;电竞数据行业生态固化,行业由几家垄断。

好运的李檬,难讲天下秀新故事

从某种意义上来说,李檬在红人经济的成功是一种运气,但天下秀一路风光仅仅靠运气是不够的。

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个

吉利几何EX3功夫牛高居榜首,4月投诉量230起

近日,车质网发布了2022年4月车型投诉排行八卦(前30名),其中有不少产品的出现属实让人没想到。具体来看,吉利几何EX3功夫牛高居榜首,4月

“说好了未达到目标全额退款,结果都是骗人的!”

春天不减肥,夏天徒伤悲。一波减肥大军抱着坚定的信念踏上征途,发现身边各式各样的高端减肥训练营正打着健康减肥封闭管理保质保量包吃包住

龙芯中科胡伟武:自主又兼容夯实信息产业“三箭齐发”

龙芯中科董事长胡伟武在线上发表了关于LoongArch生态建设的演讲。胡伟武表示,指令系统是自主信息产业绕不过去的话题,我国不可能基于国外