书籍目录
首页
分类
免费
排行
我的书架
1-50章
51-84章
共84章
免费
版权信息
免费
O'Reilly Media,Inc.介绍
免费
本书赞誉
免费
译者序
免费
前言
免费
第1章 为什么数据质量值得关注
免费
1.1 什么是数据质量
免费
1.2 构筑当下
免费
1.3 总结
免费
第2章 对可靠数据系统的构建模块进行组装
免费
2.1 了解事务型数据和分析型数据之间的差异
免费
2.2 是什么让它们有所不同
免费
2.3 数据仓库与数据湖
免费
2.4 收集数据质量指标
免费
2.5 设计数据目录
免费
2.6 构建数据目录
免费
2.7 总结
免费
第3章 收集、清洗、转换和测试数据
免费
3.1 收集数据
免费
3.2 清洗数据
免费
3.3 批处理与流处理
免费
3.4 流处理的数据质量
免费
3.5 数据标准化
免费
3.6 运行分析型数据转换
3.7 警报和测试
3.8 使用Apache Airflow管理数据质量
3.9 总结
第4章 数据管道的监控和异常检测
4.1 了解已知的未知和未知的未知
4.2 构建异常检测的算法
4.3 为模式和沿袭构建监控器
4.4 使用Python和机器学习扩展异常检测
4.5 深入探究:其他有用的异常检测方法
4.6 为数据仓库和数据湖分别设计数据质量监控器
4.7 总结
第5章 为数据可靠性进行架构设计
5.1 在摄取数据时评估并维护高数据可靠性
5.2 度量和维护管道中的数据质量
5.3 了解下游的数据质量
5.4 构建数据平台
5.5 建立对数据的信任
5.6 案例分析:Blinkist
5.7 总结
第6章 解决大规模数据质量问题
6.1 在软件研发过程中解决数据质量问题
6.2 数据事件管理
6.3 事件应对与缓解策略
6.4 案例分析:PagerDuty公司的数据事件管理
6.5 总结
第7章 构建端到端的数据沿袭
×