购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

| 第4章 |

数据准备

在学术界,虽然已有不少研究在数据准备方面做出了巨大的贡献(如著名的ImageNet等),但是大部分研究专注算法的创新设计和开发,而较少去做数据的采集、处理、标注、分析等工作。在工业界,情况恰好相反,往往需要在数据方面做非常多的准备工作。例如,在实际业务场景中,通常会面临数据采集难、数据质量差、数据冗余性大、标签少、数据分析难等问题。另外,在大多数人工智能应用开发的过程中,数据准备不仅重要,而且工作量非常大。据Cognilytica的调查,在很多机器学习项目的开发中,数据相关的工作量占据了80%,如图4-1所示。

图4-1 在机器学习项目中开发者在数据准备和算法模型准备上所花时间的比例

因此,完备的数据采集、数据处理、数据标注、数据分析和优化等系统是十分重要的。ModelArts在数据管理方面提供了一系列智能化数据服务,可大幅降低开发成本,提升开发效率。下面将分别介绍几个重点部分。 CMnv4IRy07NEcKJRpejfxmsOAkb+6NcTy75fhbNl/6hWxKkoFLWLkjPqkvWeTdOa

点击中间区域
呼出菜单
上一章
目录
下一章
×