概括地讲,目前的数据中心使用和考虑的资源调度算法/方法可以分为以下5类。
①采用比较简单的按需分配调度,按用户预订和立即使用的计算资源要求在线分配资源。例如,IBM等提供的科学计算和虚拟计算平台(文献[11~13]详细介绍了相关设计实现和调度情况)。
②将资源进行分类并确定单位时间的收费标准,然后按照需求在线出租,如Amazon EC2 [8~10] 。
③采用多级和分布式的数据中心,以响应用户速度和质量为优化目标,如Google 搜索引擎。
④针对海量信息处理的并行MapReduce:先将大文件分割,映射到不同的一级处理(Map),然后再分配到不同的并行处理阶段(Reduce)进行整合。例如开源系统Hadoop,利用Hadoop设计的监控管理功能进行调度并实现负载均衡。
⑤采用多级和分布式的数据中心,以能源消耗效率为优化目标,目前多处于实验模拟阶段。
文献[4]是目前较为权威和详细的关于数据中心设计的专著,其中关于数据中心的软硬件、基本构件、能源消耗、成本模型等都有详细阐述,在进行数据中心调度算法设计时可参考。