要获得真正可发现的数据,很重要的一点在于数据不仅要“编目”,而且从摄取到利用这一过程要准确、干净且完全可观测,换言之:要可靠。只有了解你的数据及其状态,以及在其生命周期的所有阶段和跨领域的使用方式,我们才能开始信任它。在下一章中,我们将讨论如何跨管道管理数据质量,并分享大规模收集、清洗、转换和测试数据的基础知识。 ByYdbuvzYASwriVLgoO2asMP35S5YT5xbhcMhUkbA4Ri1y3TasXRZ3Uyn5JgUciH