2023-02-21 15个开源最佳自动驾驶数据集

近年来,越来越多的企业和研究机构将其自动驾驶数据集对外开放。然而,最好的数据集并不总是很容易找到,在互联网上搜索它们需要时间。

为了提供帮助,我们在 SiaSearch 汇总了自动驾驶的前 15 个开放数据集列表。下面的资源总共包含数百万个数据样本,其中许多已经进行了注释。我们希望这份清单能为您提供一个坚实的起点,让您更深入地了解该领域,或开始您自己的自动驾驶项目。

自动驾驶项目的顶级开放数据集

1. A2D2 数据集

奥迪自动驾驶数据集 (A2D2) 包含超过 41,000 个标记的 38 个特征。A2D2 总共约 2.3 TB,按注释类型(即语义分割、3D 边界框)拆分。

2. ApolloScape 数据集

ApolloScape 是一个不断发展的研究项目,旨在促进自动驾驶各个方面的创新,从感知到导航和控制。通过他们的网站,用户可以探索各种模拟工具和超过 10 万个街景框架、8 万个激光雷达点云和 1000 公里的城市交通轨迹。

3.Argoverse数据集

Argoverse 数据集包括 113 个场景的 3D 跟踪注释和超过 324,000 个用于运动预测的独特车辆轨迹。

4. Berkeley DeepDrive 数据集

DeepDrive 数据集也称为 BDD 100K,用户可以访问 100,000 个带注释的视频和 10 个任务来评估自动驾驶的图像识别算法。该数据集代表超过 1000 小时的驾驶体验,超过 1 亿帧,以及有关地理、环境和天气多样性的信息。

5. CityScapes 数据集

CityScapes 是一个大型数据集,专注于对德国 50 个城市的城市街景进行语义理解。它具有针对 8 个类别的 30 个类的语义、实例和密集像素注释。整个数据集包括 5,000 张带有精细注释的注释图像,以及另外 20,000 张带有粗注释的注释图像。

6. Comma2k19 数据集

该数据集包括在加利福尼亚州 280 号高速公路上记录的 33 小时通勤时间。每个 1 分钟的场景都是在圣何塞和旧金山之间 20 公里的高速公路路段上拍摄的。数据是使用逗号 EON 收集的,它具有面向道路的摄像头、手机 GPS、温度计和 9 轴 IMU。

7. Google-地标数据集

谷歌于 2018 年发布的 Landmarks 数据集分为两组图像,以评估对人造和自然地标的识别和检索。原始数据集包含超过 200 万张图像,描绘了来自世界各地的 3 万个独特地标。2019 年,谷歌发布了 Landmarks-v2,这是一个更大的数据集,包含 500 万张图像和 20 万个地标。

8. KITTI 视觉基准套件

KITTI 数据集于 2012 年由 Geiger 等人首次发布,旨在通过一组新颖的真实世界计算机视觉基准推进自动驾驶研究。作为有史以来第一个自动驾驶数据集之一,KITTI 拥有超过 4000 次学术引用和计数。

9. LeddarTech PixSet 数据集

Leddar PixSet 于 2021 年推出,是一个用于自动驾驶研发的全新公开数据集,包含来自完整 AV 传感器套件(相机、LiDAR、雷达、IMU)的数据,并包括来自 Leddar Pixell 的全波形数据,a 3D固态闪光激光雷达传感器。该数据集包含 97 个序列中的 29k 帧,注释了超过 1.3M 的 3D 框

10. Level 5 开放数据

Level5 数据集由流行的拼车应用 Lyft 发布,是自动驾驶数据的另一个重要来源。它包括超过 55,000 个人工标记的 3D 注释帧、表面图和底层高清空间语义图,该图由 7 个摄像头和最多 3 个可用于对数据进行语境化的 LiDAR 传感器捕获。

11. nuScenes 数据集

nuScenes 数据集由 Motional 开发,是最大的自动驾驶开源数据集之一。该数据集使用完整的传感器套件(32 光束 LiDAR、6 个 360° 摄像头和雷达)在波士顿和新加坡记录,包含超过 144 万张摄像头图像,捕捉各种交通情况、驾驶操作和意外行为。来自 nuScenes 数据集的示例:从晴朗天气(第 1 栏)、夜间(第 2 栏)、雨天(第 3 栏)和施工区(第 4 栏)收集的图像。

12. Oxford Radar RobotCar 数据集

Oxford RobotCar 数据集包含 100 多条通过英国牛津的一致路线的记录,记录时间超过一年。该数据集捕捉了许多不同的环境条件,包括天气、交通和行人,以及建筑和道路工程等长期变化。

13.熊猫套装

PandaSet 是第一个可用于学术和商业用途的开源 AV 数据集。它包含 48,000 个摄像头图像、16,000 个 LiDAR 扫描、28 个注释类和从完整传感器套件中获取的 37 个语义分割标签。

14. Udacity 自动驾驶汽车数据集

在线教育平台 Udacity 开源了各种自动驾驶项目,包括训练有素的预测汽车转向角的神经网络、摄像头支架和数十小时的真实驾驶数据。

15. Waymo 开放数据集

Waymo Open 数据集是一个用于自动驾驶的开源多模式传感器数据集。从 Waymo 自动驾驶车辆中提取的数据涵盖了广泛的驾驶场景和环境。它包含 1000 种不同的片段,其中每个片段捕获 20 秒的连续驾驶,对应于每个传感器 10 Hz 的 200,000 帧。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注


往期评论