当前GPU设备已经普及,通过GPU可以进行并行计算,因此模型的并行化程度(Degree of Parallelism)也是衡量模型运行效率的重要指标。
以VGG为代表的串行模型(见图2.2),是并行化程度较低的模型,实际的推理速度往往比较慢。
图2.2 并行化程度低的VGG模型
而以Xception为代表的分组模型(见图2.3),是并行化程度较高的模型,其基于通道分组的卷积来实现较高程度的并行化。
图2.3 并行化程度高的Xception模型 LzrExUM1t5aB0XgNM5uSsW4qtbbe00mOyPqfEuiMkRjMnywjuMesO2Mnz3fAeDHE