计算机视觉数据集 (3)

php中文网 2024-11-27 14:11:06

请我喝杯咖啡☕

*备忘录：

(1) 牛津-IIIT 宠物 (2012):

有 7,349 张猫和狗图像，每个图像都连接到来自 37 个类别的标签： *备注：
- 每个类大约有 200 张图像。
- 3,680 用于训练或训练和验证，3,669 用于测试。
是 PyTorch 中的 OxfordIIITPet()。

（2）牛津102花（2008）：

有 8,189 个花卉图像（1,020 个用于训练，1,020 个用于验证，6,149 个用于测试），有 102 个类别（类）。 *每个班级有 40 至 258 张图片。
是 PyTorch 中的 Flowers102()。

(3) 斯坦福汽车 (2013):

(4) Places365(2017)：

地点数据库中包含 434 个场景类别（类）中的 365 个场景类别（类）的场景图像，其中有 Places365-Standard、Places365-Challenge 和Places-Extra69 如您所见： *备注：
- Places365-Standard 拥有 2,168,460 张图像（1,803,460 张用于训练，36,500 张用于验证，328,500 张用于测试），地点数据库中有 434 个类别（类），其中包含 365 个类别（类）。 *验证集中每个类别（类）有 50 张图像，测试集中每个类别（类）有 900 张图像。
- Places365-Challenge 有 8,391,628 个图像（8,026,628 个用于训练，36,500 个用于验证，328,500 个用于测试），为 Places365-Standard 的训练集添加了 6,223,168 个额外图像。
- Places-Extra69 拥有 105,321 张图像（98,721 张用于训练，6,600 张用于测试），以及 Places 数据库中 434 个类别（类）中额外的 69 个类别（类）。 *目前无法下载。
是 PyTorch 中的 Places365()。