书籍目录
首页
分类
免费
排行
我的书架
1-50章
51-60章
共60章
免费
版权信息
免费
作者简介
免费
内容简介
免费
前言
免费
第1章 CUDA基础与计算平台概述
免费
1.1 CUDA架构与工作原理
免费
1.2 CUDA开发环境搭建
免费
1.3 CUDA核心API与内存管理
免费
1.4 CUDA调度与线程管理
免费
1.5 CUDA性能分析与优化基础
免费
1.6 本章小结
免费
第2章 CUDA在深度学习中的应用
免费
2.1 深度学习框架概述
2.2 CUDA加速的神经网络前向传播与反向传播
2.3 卷积操作的CUDA优化
2.4 CUDA在大规模数据处理中的应用
2.5 使用CUDA优化神经网络模型训练
2.6 本章小结
第3章 CUDA与高性能计算
3.1 高性能计算基础
3.2 大规模线性代数运算加速
3.3 CUDA并行算法设计
3.4 使用CUDA加速科学仿真与建模
3.5 高性能计算中GPU与CPU协同计算
3.6 本章小结
第4章 模型压缩与加速
4.1 模型压缩概述
4.2 CUDA在模型量化中的应用
4.3 CUDA在模型蒸馏中的应用
4.4 CUDA在模型剪枝中的优化
4.5 本章小结
第5章 深度学习推理加速
5.1 推理与训练的区别
5.2 CUDA推理优化技术
5.3 多模型并行推理
5.4 端侧推理加速
5.5 本章小结
第6章 NCCL加速分布式训练
6.1 大模型训练的挑战
6.2 分布式训练的基本概念
6.3 本章小结
第7章 自定义算子
7.1 自定义算子的定义与应用
7.2 TensorFlow与PyTorch中的自定义算子
7.3 本章小结
第8章 GPU内存优化
8.1 GPU内存管理与优化概述
8.2 共享内存与常量内存优化
8.3 内存层级与跨设备内存管理
8.4 本章小结
×