图算法：行业应用与实践最新章节_嬴图团队著

3.1 什么是算法效率

算法效率主要指的是算法的时间复杂度，在第2章中提到了一种图算法的分类方式，即按照从恒定时间、线性、多项式到指数级复杂度的自低到高的多级分类。需要指出的是，不同的底层计算资源的规模是会影响算法的执行效率的，例如可并发的规模。另外，也需要关注算法的空间复杂度，即用于完成算法执行所需要的存储空间，包括外存与内存等。

评价算法效率的“金指标”就是在相同计算与存储资源条件下，运行时耗越低，算法实现效率越高。换言之，如果有更高配置的计算（及存储）资源，就能够实现更高的计算效率。

算法效率的提升涉及算法逻辑优化、数据结构优化、系统架构优化、代码实现优化等多个方面。但是所有的优化形式在本质上可以总结为两个要点：一是尽可能地实现并发，二是尽可能地让存储的数据靠近计算资源。

图3-1中的7层存储架构示意了算法效率提升的金字塔，可以简单地理解为：

图3-1 多级存储架构与计算效率金字塔

1）网络化存储的计算效率是最低的，特别是当数据之间存在关联关系时。在一个大规模分布式的系统中，多个存储节点需要不断地交换或迁移数据，所造成的时耗是惊人的。而这个时候，即便再高的网络带宽也可能于事无补。举个简单的例子，假设用10Gb/s的速度传输100万个4KB的小文件与传输一个4GB的文件（在文件大小层面，4GB=4KB×10 ⁴ ），两者的传输时间差异是多少？答案是前者的时耗至少是后者的100倍以上，这是多实例间大量频繁的I/O操作使然。

2）磁盘的效率较网络存储已经大幅（10倍）提升，因为它已经是一种存储与计算较紧密耦合的架构模式，尽管磁盘I/O依然存在，但是不再需要考虑网络造成的延迟。

3）固态硬盘（包括大容量固态硬盘和高性能固态硬盘）的特点是规避了传统磁盘的可移动的机械部件，而获得了10～100倍于磁盘存储访问的性能提升。尽管固态硬盘经过多次擦写后可能会出现数据遗失的问题，但是在真正追求高性能的系统中，可以通过各种数据冗余与保护机制来规避这个问题。如果只因为担心固态硬盘在经过7000次擦写后可能会遗失数据就彻底规避使用，无异于因噎废食。

4）持久化内存（Persistent Memory）是图3-1的7层堆栈中出现最晚的一种产品形态，本质上它融合了固态硬盘与动态随机存储内存（DRAM）的特点，同时兼具了数据持久化的能力与内存级的访问速度。持久化内存相对于固态硬盘也有了10倍的性能提升。

5）内存相对于固态硬盘有100～1000倍的读写性能提升，但是单位价格却便宜10～20倍。从投入产出比上来说，如果你听过“内存就是新的存储”（Memory is the New Disk!）的说法，背后的原因就在这里。

6）多级存储计算架构中的最后一层是CPU，如果觉得CPU仅仅是用来计算的，就显得有些不求甚解了。实际上，现代CPU的架构设计中都会有多级内置缓存，而多级缓存的价值在于每一层都给CPU与内存之间的数据迁移和加载进行了提速，毕竟内存和CPU之间还存在着千倍级的性能差（图3-1中只体现了10倍差异），而每层缓存都大概有10倍的提速效果。

图3-2示意了这种多级存储加速的效果。

❑ 机械硬盘：单次操作延时如果是3ms，进行一个四千万次的迭代操作，延时就变成了120000s，即1.5天，这就是很多批处理操作的耗时都是 T +1、 T +2的直接原因。

❑ 固态硬盘：可以带来约30倍的性能提升，与上面同样的操作耗时会降低到1个多小时，可以算作 T +0的效果。

❑ 内存：在内存上进行同样的操作时，可以获得上千倍的性能提升，这个时候“批处理”的操作已经可以以近实时的方式完成。

❑ CPU缓存：理论上，如果所有的数据都可以在CPU（借助多级缓存的力量）内完成，时间会缩短到毫秒级，如40ms。

图3-2 多级存储加速与并发计算

事实上，在存储与计算加速的道路上，CPU也不是终点，通过对数据结构、系统架构、最大化并发执行等进行优化，还有可能获得更低的耗时与更高的效率。