首页> 热点 >

天天时讯：真正的包罗“万”象！上海AI实验室、港中文等提出V3Det目标检测数据集，含有13029个类别！

2023-04-11 10:01:45 来源：商业新知网

介绍一篇今天新出的文章，来自上海人工智能实验室和香港中文大学的学者提出了一个海量类别的目标检测数据集 V3Det ，总类别数达到 13029 ！

(相关资料图)

▌V3Det: Vast Vocabulary Visual Detection Dataset

论文作者：Jiaqi Wang,Pan Zhang,Tao Chu,Yuhang Cao,Yujie Zhou,Tong Wu,Bin Wang,Conghui He,Dahua Lin

作者单位：Shanghai AI Laboratory(上海人工智能实验室); The Chinese University of Hong Kong(香港中文大学); Centre of Perceptual and Interactive Intelligence

论文链接：http://arxiv.org/abs/2304.03752v1

这个世界有多少种类别的物体？仅目前已经发现的昆虫，就有1000多万种。而目前计算机视觉领域大部分的数据集类别都是非常有限的，之前最多类别的LVIS有1203类，所以在真实世界中检测任意对象的研究往往是在类别受限的目标检测数据集上训练和评估的。

V3Det，正是为了应对这一挑战而开发的，不仅图像数量多（245k），而且类别个数多(13029)，且具有精确的标注(1753k个包围框)。

相信构建这一数据集过程也是异常费时费力的！

为更好地理解数据，作者们还为V3Det构建了层次分类树，可以方便访问和研究类别之间的包含关系，每个类别都有专业的描述。

V3Det提供了广泛的探索空间，可以在广泛和开放的目标检测任务上进行广泛的基准测试，为研究提供新的观察、实践和见解。它有潜力成为开发更普遍的视觉感知系统的重要参考数据集！

V3Det与其他知名目标检测数据集的统计比较：

V3Det类别数是之前最大数据集的10倍！

如此大规模多类别的数据集标注过程肯定是异常艰辛的，为了保证标注数据的准确性，数据创建团队付出了大量的工作。

V3Det的标注过程：

包括分组、粗粒度标注、合并与联合验证、细粒度标注、类别的验证、类别描述等过程。

比较有意思的是，在对类别进行描述的步骤中，ChatGPT也参与进来。

下图是对V3Det和其他数据集的统计分析：

包括类别分布、均值分辨率、包围框分布。

下图展示了常见的目标检测算法在V3Det上评估的表现：

作者还根据不同采样方法、表示方法、算法框架等对数据集进行了各种评估：

下面这张图展示了类别层次图的可视化，相当震撼！

V3Det数据集中“粗类别”的统计和描述：

可见Animal & Human 相关的类别是最多的，达到7485类，其次是Flower,1911类。

类别描述示例：

标注示例：

包围框真是密密麻麻！（数据创建团队辛苦了！！）

这是一项特别有意义的工作，也是非常有价值的资产，相信能够促进大规模海量类别目标检测的相关研究。

作者说数据集将于6月份公开，大家拭目以待！

关键词：

精彩阅读

财富

天天时讯：真正的包罗“万”象！上海AI实验室、港中文等提出V3Det目标检测数据集，含有13029个类别！

天天时讯：真正的包罗“万”象！上海AI实验室、港中文等提出V3Det目标检测数据集，含有13029个类别！

【环球热闻】字节跳动已超越腾讯、阿里成中国最赚钱互联网公司

【全球聚看点】海外设计师打造苹果MR头显概念渲染图；索尼新型3D显示屏即将上市，无需 VR 头显也可支持沉浸式体验

环球观速讯丨涉图片侵权、错误信息诽谤等，AIGC将迎来侵权潮？

环球热推荐：政企市场成运营商比拼新焦点一季度四家战绩谁更给力

世界快播：谷歌云游戏四年探索，全剧终

天天短讯！为何“周一睡觉俱乐部”上海首店开出就能制造社交话题？

环球资讯：GPT-4，究竟强大在哪里？

焦点短讯！科普 | 号称以太坊“黑暗森林”的MEV是什么？

全球观察：深陷免费泥潭的视频会议厂商，该醒醒了

没有冰箱怎么保存芒果？芒果能不能放冰箱里？

昆仑万维2022年净利润11.5亿经营性净利润同比大增112%

零跑汽车的2022：年亏51亿，还需要克服哪些挑战？

跟小学生抢饭吃，和老人争学上，不安分的年轻人在想什么鬼点子？

微头条丨年轻人集体“上山”，捧出一个IPO

B 站停更潮，一场内容生产危机？

全球热文：小米会不会收购小鹏？

【快播报】为什么说抖音已成为餐饮人线上经营的必争之地？

【播资讯】TikTok、Lazada混战：东南亚电商的“面子”和“里子”

世界新动态：腾讯游戏一个400多人工作室被“掏空”了

MORE+ 资讯

MORE+ 热点

天天时讯：真正的包罗“万”象！上海AI实验室、港中文等提出V3Det目标检测数据集，含有13029个类别！

【环球热闻】字节跳动已超越腾讯、阿里成中国最赚钱互联网公司

【全球聚看点】海外设计师打造苹果MR头显概念渲染图；索尼新型3D显示屏即将上市，无需 VR 头显也可支持沉浸式体验

环球观速讯丨涉图片侵权、错误信息诽谤等，AIGC将迎来侵权潮？

环球热推荐：政企市场成运营商比拼新焦点一季度四家战绩谁更给力

世界快播：谷歌云游戏四年探索，全剧终

MORE+ 焦点

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

微软正为Windows12开发新驱动框架提升新老显卡性能

华盛顿地铁站首次亮相为视障人士扩展旅行路线

2022年情况又要变了！华硕高管：今年PC恐怕要供过于求

垃圾佬的心头好！西数新款固态盘SN740曝光

虚假宣传、误导消费者倍至冲牙器关联公司被处罚

MORE+ 智能

精彩推送