教程介绍

在正式进入学习前，我们将简单介绍数据集使用现状及问题，由此提出对应的解决思路和方案，旨在让用户操作数据更加得心应手。

对于数据集发布方，由于没有统一的规范和标准约束数据集描述方式及发布途径，使得：

上述现象使得数据集使用者在数据获取和使用时存在一系列问题：

为了解决数据检索和下载问题，我们搭建OpenDataLab公开数据集平台，收集了大量AI数据集，并对LICENSE、元信息等进行整理，提供高效检索和高速下载能力。

为了解决数据集无统一规范而导致的数据集使用繁杂问题，我们提出了新一代AI数据集描述语言DSDL（Data Set Description Language），DSDL可以让不同任务、甚至不同模态的数据标注以相对统一的规范进行描述，用户无需再为格式统一问题而在数据使用的各个环节耗费时间。

为了方便用户快速的对数据进行检索、下载、管理、统计分析、可视化等操作，我们提供了一整套的数据工具链ODL (Open Dataset Library)，可大幅提升用户使用数据效率。

用户教程将对AI模型开发全流程中的数据操作进行展开：

1.数据集准备

2.数据集可视化

3.模型训练&推理

4. 高阶教程