深度学习与目标检测:工具、原理与算法
上QQ阅读APP看书,第一时间看更新

1.4 目标检测领域重要的公开评测集

如何对算法进行比较呢?一个重要的方法就是在相同的公开数据集上进行评测,根据评测得到的性能指标,大致判断算法优劣。评测集在算法领域有至关重要的作用,本节将介绍几个在目标检测领域有较大影响力的公开评测集。

1.PASCAL VOC

PASCAL VOC(Visual Object Classes)挑战赛是计算机视觉领域早期重要的比赛之一,包括图像分类、目标检测、场景分割、事件检测4个主题。在目标检测方向,最常用的评测集是VOC2007和VOC2012。评测集包含20类日常生活中常见的物品,分别是人、鸟、猫、奶牛、狗、马、羊、飞机、自行车、船、公共汽车、小轿车、摩托车、火车、瓶子、椅子、餐桌、盆栽、沙发、电视。VOC2007包含5000张训练图像和1.2万个标注目标;VOC2012包含1.1万张训练图像和2.7万个标注目标。不过,随着近几年更大规模评测集的发布,VOC评测集的重要性正在逐步降低。

2.ILSVRC

ILSVRC(ImageNet Large Scale Visual Recognition Challenge,大规模图像识别挑战赛)从2010年开始每年都会举办,其中包含一个目标检测主题。ILSVRC的目标检测的评测集包含200种类别,评测集中图像的数量和目标的数量比VOC的评测集高两个数量级。以ILSVRC-14评测集为例,其中包含51.7万张训练图像和53.4万个标注目标。

3.MS-COCO

MS-COCO是当前最具挑战的目标检测评测集,从2015年开始,基于MS-COCO的目标检测比赛每年举行一次,一直持续至今。MS-COCO包含的检测目标类别不及ILSVRC,但包含更多实例。以MS-COCO-17为例,其中包含80个类别,16.4万张训练图像和89.7万个标注目标。与VOC和ILSVRC相比,MS-COCO最大的进步在于除了标注每个目标实例的包围盒之外,还标注了每个实例的分割信息。除此之外,MS-COCO包含了很多小目标(占有区域不足整幅图像的1%)以及众多密集目标。这些特点使得MS-COCO的数据分布更接近真实世界,因此成为目前目标检测领域最为重要的评测集之一。

4.Open Images

Open Images挑战赛始于2018年,包含两个主题:①标准的目标检测;②目标之间的关系分析。其中检测任务的评测集包含600种目标类别,合计191万张训练图像和1544万个标注目标。

5.其他特定场景的目标检测评测集

除了上述通用场景的目标检测评测集,在一些重要领域,如行人检测、人脸检测、文本检测、交通信号灯及交通标志检测等,也都有对应的评测集。表1-1~表1-4列出了一些在特定领域比较有影响力的评测集。

表1-1 行人检测评测集

表1-2 人脸检测评测集

表1-3 文本检测评测集

表1-4 交通信号灯及交通标志检测评测集