本章内容
● 沐曦GPU并行架构
● 线程束执行的本质
● MXMACA流和并发执行
● MXMACA动态并行
● MXMACA事件
● MXMACA核函数计时
本章介绍MXMACA执行模型,这是比硬件高一层的抽象。理解了MXMACA执行模型,就可以沿着沐曦GPU硬件设计的思路来设计程序。执行模型会提供一个操作视图来说明如何在特定的计算架构上执行指令。MXMACA执行模型解释了沐曦GPU并行架构的抽象视图,这有助于编写指令吞吐量大和内存访问效率高的代码。
GPU软硬件知识分层示意图如图5-1所示。学习MXMACA编程的目的不仅是如第2.3节所述去打印“Hello World”,而是为了用GPU编程实现高速计算。为了更有效地挖掘和发挥GPU的潜力,提升沐曦GPU的工作效率,我们需要深入理解GPU能成为高性能算力主要提供者的原因。这涉及对从应用层到语言层,再到指令集架构的深入了解,包括对硬件逻辑门、寄存器等底层知识的掌握。通过讲解MXMACA执行模型,本章将帮助读者理解GPU硬件架构设计的原理和GPU硬件工作的机理,为后续章节的学习打下基础。
图5-1 GPU软硬件知识分层示意图