购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

8.7 网络存储技术

网络存储技术是基于数据存储的一种通用网络术语。网络存储设备提供网络信息系统的信息存取和共享服务,其主要特征体现在:超大存储容量、大数据传输率,以及高系统可用性。要实现存储设备的性能特征,采用RAID作为存储实体是所有厂家的必然选择。传统的网络存储设备都是将RAID硬盘阵列直接连接到网络系统的服务器上,这种形式的网络存储结构称为DAS(Direct Attached Storage),目前,按照信息存储系统的构成,SAN(Storage Area Network)和NAS(Network Attached Storage)是常见的两种选择,代表了网络存储的最新成果。

8.7.1 NAS和SAN

1.直接联网存储NAS

在NAS存储结构中,存储系统不再通过I/O总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络直接相连,由用户通过网络访问。

NAS实际上是一个带有瘦服务器(Thin Server)的存储设备,其作用类似于一个专用的文件服务器。这种专用存储服务器不同于传统的通用服务器,它去掉了通用服务器原有的不适用的大多数计算功能,而仅仅提供文件系统功能用于存储服务,大大降低了存储设备的成本。为方便存储服务器到网络之间以最有效的方式发送数据,专门优化了系统硬软件体系结构,多线程、多任务的网络操作系统内核特别适合处理来自网络的I/O请求,不仅响应速度快,而且数据传输速率也很高。

与传统以服务器为中心的存储系统相比,数据不再通过服务器内存转发(这会引起额外延迟和阻塞),数据直接在客户机和存储设备间传送(即所谓第三方传送),服务器仅起控制管理的作用,因而具有更快的响应速度和更高的数据带宽。另外,对服务器的要求降低,可大大降低服务器成本,这样就有利于高性能存储系统在更广的范围内普及应用。

在NAS方案中,存储设备在功能上完全独立于网络中的主服务器,客户机与存储设备之间的数据访问已不再需要文件服务器的干预,允许客户机与存储设备之间进行直接的数据访问。利用专用的硬件软件构造的专用服务器,与其他资源独立,不会占用网络主服务器的系统资源,不需要在服务器上安装任何软件,不用关闭网络上的主服务器,就可以为网络增加存储设备。服务器则从原先的I/O负载中解脱出来。另外,它具有较好的协议独立性,支持UNIX、Netware、Windows NT、OS/2或Intranet Web的数据访问,客户端也不需要任何专用的软件,安装容易,甚至可以充当其他机器的网络驱动器,可以方便地利用现有的管理工具进行管理。

与传统的通用服务器不同,NAS专用服务器能在不增加复杂度、管理开销、降低可靠性的基础上,使网络的存储容量增加,具有非常好的可扩展性。由于不需要服务器提供更多的硬件及服务,使服务器的可靠性和I/O性能大大提高,能充分利用可得到的10MB/S~100MB/S网络带宽,有较大的数据吞吐量。

NAS可以通过集线器或交换机方便地接入到用户网络上,是一种即插即用的网络设备。为用户提供了易于安装、易于使用和管理、可靠性高和可扩展性好的网络存储解决方案。

2.存储区域网络SAN

SAN是一种类似于普通局域网的高速存储网络,SAN提供了一种与现有局域网连接的简易方法,允许企业独立地增加它们的存储容量,并使网络性能不至于受到数据访问的影响。这种独立的专有网络存储方式使得SAN具有不少优势:可扩展性高,存储硬件功能的发挥不受LAN的影响;易管理,集中式管理软件使远程管理和无人值守得以实现;容错能力强。

Open SAN(开放式存储区域网)是SAN存储技术发展的最高境界,它可以在不考虑服务器操作系统或存储设备制造商的情况下,将任何平台的服务器、存储系统完整地连接起来,完全实现SAN技术所承诺的一切。目前,众多高速发展的机构正密切关注Open SAN的进展。Open SAN指的是在包括服务器、磁盘、磁带存储和交换机在内的各种水平的SAN环境中,遵循已公布的业界标准,用通用工具管理存储数据。SAN能为任何类型的服务器、操作系统、应用与文件系统的组合提供存储的集中区域。相对于封闭的SAN来说,设备要由单一厂商提供且通常需要额外的软件。开放式SAN的优势是:它可以选择任何厂商的产品,采用最优的存储设备、服务器和应用程序以满足业务需求;保证对现存的存储设备、服务器和应用程序的投资保护;在存储和SAN基础结构之间有一组开放接口,便于用户应用实施。

同时,SAN在向智能化的方向发展,智能化的SAN的好处是:管理功能内嵌,使服务器和存储控制器摆脱了管理负荷,发挥最优的性能;分布式智能可以使SAN具有高可靠性、可用性和可伸缩性;智能化的SAN为实施跨异构平台环境的先进的存储管理功能奠定了基础。集成的SAN可以做到:智能化的基础结构与存储设备和存储管理功能的完整集成,可产生经互操作认证的SAN解决方案;有保证的可伸缩性、可管理性和可服务性;完整的设计、实施和支持来自同一厂家。

不过,SAN主要适用于存储量大的工作环境,并且SAN的适用性和通用性较差,在系统的安装和升级方面效率不高,成本也比较高。

8.7.2 数据管理

在网络存储管理中,如何做好数据的备份和恢复是至关重要的。

1.备份策略及恢复计划

备份是最简单的可用性服务,是指对重要的信息制作一份拷贝,并将其存储在安全的地方。备份可以是纸质文件(如重要文本的复印件),也可以是电子文件(如计算机的后备磁带)。

备份系统为一个目的而存在:尽可能快地全盘恢复运行计算机系统所需的数据和系统信息。根据系统安全需求可选择的备份机制有:场地内高速度、大容量自动的数据存储、备份与恢复;场地外的数据存储、备份与恢复;对系统设备的备份。备份不仅在网络系统硬件故障或人为失误时起到保护作用,也在入侵者非授权访问或对网络攻击及破坏数据完整性时起到保护作用,同时也是系统灾难恢复的前提之一。

一般的数据备份操作有三种。一是全盘备份,即将所有文件写入备份介质;二是增量备份,只备份那些上次备份之后更改过的文件,是最有效的备份方法;三是差分备份,备份上次全盘备份之后更改过的所有文件,其优点是只需两组磁带就可恢复最后一次全盘备份的磁带和最后一次差分备份的磁带。

在确定备份的指导思想和备份方案之后,需要选择安全的存储媒介和技术进行数据备份。一般说来,备份的硬件设备包括磁盘、磁带和光盘塔。利用磁盘备份常用的方法是磁盘镜像、磁盘双工,以及磁盘阵列,其中磁盘镜像是指系统中使用两块一样大小的磁盘,在写入数据时,先将数据写入原盘,然后再写入镜像盘,这样镜像盘中的数据与原盘的数据一模一样,从而起到了备份的作用。而磁盘双工是两个互为备份的盘同时写入。磁盘阵列是指将多个类型、容量、接口甚至品牌一致的专用磁盘或普通磁盘连成一个阵列,使其能以某种快速、准确和安全的方式来读写磁盘数据。其主要功能是可提高网络数据的可用性及存储容量,并能免除单块硬盘故障所带来的灾难性后果,由于可见磁盘阵列是一种高效、快速、易用的网络存储备份设备。

备份的技术有“冷备份”和“热备份”两种。热备份是指“在线”的备份,即下载备份的数据还在整个计算机系统和网络中,只不过传到另一个非工作的分区或是另一个非实时处理的业务系统中存放,如前面提到的磁盘镜像、磁盘双工和磁盘阵列都属于热备份。“冷备份”则是指“不在线”的备份,下载的备份存放到安全的存储媒介中,而这种存储媒介与正在运行的整个计算机系统和网络没有直接联系,在系统恢复时重新安装,有一部分原始的数据长期保存并作为查询使用,磁带就是一种冷备份的设备。热备份的优点是调用快,使用方便,当系统恢复中需要反复调试时更显优势,但投资比较昂贵。冷备份则弥补了热备份的一些不足,二者优势互补,相辅相成,因为冷备份在回避风险中还具有便于保管的特殊优点。

在进行备份的过程中,常使用备份软件,它一般应具有以下功能。保证备份数据的完整性,并具有对备份介质的管理能力;支持多种备份方式,可以定时自动备份,还可设置备份自动启动和停止日期;支持多种校验手段(如字节校验、CRC循环冗余校验、快速磁带扫描),以保证备份的正确性;提供联机数据备份功能;支持RAID容错技术和图像备份功能。

与备份同样重要的是在备份完成之后对它们进行存储。备份的目的是为了在发生事故时能够及时进行恢复,而事故的类型可能从用户误删数据到站点的灾难性毁坏。前者需要备份存储于附近以便于快速恢复,而后者却要求将备份存储在其他地方。实践证明最好的方法是将备份存储在其他地方,以最大程度地保护数据。当需要还原时,再将备份及时取回。

日常备份制度描述了每天的备份以什么方式、使用什么备份介质进行,是系统备份方案的具体实施细则。在制订完毕后,应严格按照制度进行日常备份,否则将无法达到备份方案的目标。数据备份有多种方式:全备份、增量备份、差分备份、按需备份等。

(1)全备份:备份系统中所有的数据;

(2)增量备份:只备份上次备份以后有变化的数据;

(3)差分备份:只备份上次完全备份以后有变化的数据。

(4)按需备份:根据临时需要有选择地进行数据备份。

全备份所需时间最长,但恢复时间最短,操作最方便,当系统中数据量不大时,采用全备份最可靠;但是随着数据量的不断增大,我们将无法每天做全备份,而只能在周末进行全备份,其他时间我们采用所用时间更少的增量备份或采用介于两者之间的差分备份。各种备份的数据量不同:全备份>差分备份>增量备份。在备份时要根据它们的特点灵活使用。

2.网络备份系统的目的

理想的备份系统应该是全方位、多层次的。首先要使用硬件备份来防止硬件故障。如果由于软件故障或人为误操作造成了数据的逻辑损坏,则使用网络存储备份系统和硬件容错相结合的方式来恢复。这种结合方式构成了对系统软硬件的多级防护,不仅能有效地防止物理损坏,还能比较好地防止逻辑损坏。

在网络系统安全建设中必不可少的一个环节就是数据的常规备份和历史保存。在生产本地的备份目的主要有两个:一是生产系统的业务数据由于系统或人为误操作造成损坏或丢失后,可及时在生产本地实现数据的恢复;另一个目的是在发生地域性灾难(地震、火灾、机器毁坏等)时,可及时在本地或异地实现数据及整个系统的灾难恢复。考虑到生产本地环境安全性原因,常规数据备份要求一份数据至少应有两个拷贝,一份放在生产中心以保证数据的正常恢复和数据查询恢复,另一份则要移到异地保存,以保证在生产本地出现灾难后最低限度的数据恢复。此外更应建立历史归档数据的异地存放制度,从而确保对历史业务数据的可靠恢复与有效稽核的实现。

综上所述,现代企业可以拥有的比较理想的网络备份系统应该具备以下功能。

(1)集中式管理: 网络存储备份管理系统对整个网络的数据进行管理。利用集中式管理工具的帮助,系统管理员可对整个网络的备份策略进行统一管理,备份服务器可以监控所有计算机的备份作业,也可以及时地修改备份策略,而且可即时浏览所有目录。所有的数据可以备份到同备份服务器或应用服务器相连的任意一个磁带库内,这样就有了最大的可管理性。

(2)全自动的备份: 对于大多数机房管理人员来说,备份是一项繁重而且枯燥的工作,小企业还好,大企业的数据量十分庞大,这就要求相干的人员每天都要小心翼翼,不敢有半点闪失,生怕一个错误就带来不可挽回的损失。可见如果一旦网络备份能够实现定时自动备份,就可以大大减轻管理员的压力。备份系统可以根据用户的实际需求,合理的定义需要备份的数据,然后以图形界面方式根据需要设置备份时间表,备份系统将自动启动备份作业,无须人工干预。这个自动备份作业是可自定的,包括一次备份作业、每周的某几日、每月的第几天等项目。设定好计划后,备份作业就会按计划自动进行。

(3)数据库备份和恢复: 如今,数据库系统已经相当复杂和庞大,用文件的备份方式来备份数据库已不适用。是否能够将需要的数据从庞大的数据库文件中抽取出来进行备份,是网络备份系统是否先进的标志之一。

(4)在线式的索引: 备份系统应为每天的备份在服务器中建立在线式的索引,当用户需要恢复时,只需点取在线式索引中需要恢复的文件或数据,该系统就会自动进行文件的恢复。

(5)归档管理: 用户可以按项目、时间定期对所有数据进行有效的归档处理。提供统一的open tape format数据存储格式,从而保证所有的应用数据由一个统一的数据格式来进行永久的保存,保证数据的永久可利用性。

(6)有效的媒体管理: 备份系统对每一个用于进行备份的磁带自动加入一个电子标签,同时在软件中提供识别标签的功能,如果磁带外面的标签脱落,只需执行这一功能,就会迅速知道该磁带的内容。

(7)HSM分级存储管理: 对出版业、制造业等易产生大量资料数据的行业而言,资料多属于极占空间的图形影像,且每张设计底稿及文件资料又常需随时保持在线状态。基于管理及成本的考虑,HSM(Hierarchical Storage Management,分级存储管理)系统是一个合适的在线备份解决方案。它利用硬盘、可擦写磁光盘、磁带进行三层式存储管理。所谓分级存储管理系统是一套自动化的网络存储管理设备,会自动判断硬盘中资料的使用频率,自动将不常用的资料移至速度较慢的光盘,而最不常用的资料则移到磁带中,这些都由系统管理员自行设定。在线的资料经过一段时间的搬移后,即可达到最佳化。

(8)系统灾难恢复: 由于网络备份的最终目的是保障网络系统的顺利运行。所以优秀的网络备份方案应能够备份系统的关键数据,在网络出现故障甚至损坏时,能够迅速地恢复网络系统。从发现故障到完全恢复系统,理想的备份方案耗时不应超过半个工作日。

(9)满足系统不断增加的需求: 备份软件必须能支持多平台系统,当网络上连接上其他的应用服务器时,对于网络存储管理系统来说,只需在其上安装支持这种服务器的客户端软件即可将数据备份到磁带库或光盘库中。

3.网络备份存储管理系统

网络数据存储管理系统是指在分布式网络环境下,通过专业的数据存储管理软件,结合相应的硬件和存储设备,对全网络的数据备份进行集中管理,从而实现自动化的备份、文件归档、数据分级存储及灾难恢复等。

为在整个网络系统内实现全自动的数据存储管理,备份服务器、备份管理软件与智能存储设备的有机结合是这一目标实现的基础。网络数据存储管理系统的工作原理是在网络上选择一台应用服务器(当然也可以在网络中另配一台服务器作为专用的备份服务器)作为网络数据存储管理服务器,安装网络数据存储管理服务器端软件,作为整个网络的备份服务器。在备份服务器上连接一台大容量存储设备(磁带库、光盘库)。在网络中其他需要进行数据备份管理的服务器上安装备份客户端软件,通过局域网将数据集中备份管理到与备份服务器连接的存储设备上。

网络数据存储管理系统的核心是备份管理软件,通过备份软件的计划功能,可为整个企业建立一个完善的备份计划及策略,并可借助备份时的呼叫功能,让所有的服务器备份都能在同一时间进行。备份软件也提供完善的灾难恢复手段,能够将备份硬件的优良特性完全发挥出来,使备份和灾难恢复时间大大缩短,实现网络数据备份的全自动智能化管理。目前在数据存储领域可以完成网络数据备份管理的软件产品主要有legatonetworker,IBM adsm,veritas netbackup等。

4.在线恢复

在线恢复提供信息和能力的重构。带有在线恢复配置的系统能检测出故障,并重建诸如处理、信息访问、通信等能力。它是通过使用冗余硬件来自动处理的。冗余技术的基础是合理有效地对系统运行状态进行监控,在及时发现故障的前提下启动冗余部件。

(1)磁盘系统冗余: 通过配置热插拔硬盘并使用RAID系统,可以完全避免由于硬盘损坏造成的系统故障。

(2)电源系统冗余: 热插拔冗余电源,正常工作时,两台电源各输出一半功率,从而使每一台电源都工作在轻负载状态,利于电源稳定工作。当其中一台发生故障时,暂时由另一台接替其工作,并报警。系统管理员可在不关闭系统的情况下更换损坏的电源。采用热插拔冗余电源可以避免系统由于电源损坏而造成的停机。

(3)网络系统冗余: 采用自动控制的冗余网卡,当系统正常时多网卡自动分摊网络流量,使系统网络通信带宽提高,而在有网卡损坏或出现线路故障时,其工作自动切换到其他网卡。不会由于网络通道故障或网卡故障影响正常服务。

(4)冷却系统冗余: 自动切换的冗余风扇,对风扇转速实时监测,发现故障自动报警并启动备用风扇。系统工作正常时,主风扇工作,备份风扇不工作,当主风扇出现故障或转速低于规定转速时自动启动备用风扇。由于备用风扇平时处于停止状态,保证在工作风扇损坏时可以马上接替服务,不会造成由于系统风扇损坏导致的系统内部温度升高而产生的工作不稳定或停机现象。

(5)系统冗余: 双机热备份高可用系统(HA),通过对关键部件的冗余设计,可以保证系统硬件具有很高的可用性,对于一般非关键应用场合,其硬件系统的可用性可以达到99.99%。但对于一些极其关键的应用场合,可以采用双机热备份的高可用(HighAvailability,HA)系统,使系统可用性达到99.999%。正常工作时,两台服务器同时工作,通过以太网和RS-232口互相进行侦测,并不断地完成同步操作,数据保存在共享磁盘阵列中,当任何一台服务器出现故障,另一台服务器将快速接管服务。其切换时间仅需1~2分钟。

由于操作系统和应用软件故障而引起的系统停机,具有较大的不确定性,很难进行有效的管理和预测,因此快速恢复软件系统,缩短系统停止服务的时间就变得十分重要。通常处理由操作系统和应用软件造成的系统性能降低或瘫痪最好的办法是重装系统,但重装和配置系统所花费的时间相当长,无法适应高可用性的要求,采用操作系统和应用程序备份恢复系统,可以大幅度降低系统恢复的时间,在软件系统出现故障后迅速恢复,使停机时间减到最低。

5.灾难恢复

灾难恢复是针对大的灾难来保护系统、信息和能力。灾难恢复措施在整个备份制度中占有相当重要的地位。因为它关系到系统在经历灾难后能否迅速恢复。灾难恢复操作通常可以分为两类。第一类是全盘恢复,第二类是个别文件恢复,还有一种值得一提的是重定向恢复。

(1)全盘恢复。 全盘恢复一般应用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、系统重组等,也称为系统恢复。

(2)个别文件恢复。 由于操作人员的水平不高,个别文件恢复可能要比全盘恢复常见得多,利用网络备份系统的恢复功能,我们很容易恢复受损的个别文件。只需浏览备份数据库或目录,找到该文件,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件。

(3)重定向恢复。 重定向恢复是将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时它们当时所在的位置。重定向恢复可以是整个系统恢复也可以是个别文件恢复。重定向恢复时需要慎重考虑,要确保系统或文件恢复后的可用性。

为了防备数据丢失,我们需要做好详细的灾难恢复计划,同时还要定期进行灾难演练。每过一段时间,应进行一次灾难演习。可以利用淘汰的机器或多余的硬盘进行灾难模拟,以熟练灾难恢复的操作过程,并检验所生成的灾难恢复软盘和灾难恢复备份是否可靠。 YjpBKtNQU1Onj80ZzgG5ATcQMApQAEv+shtwloLSs9rk2PhDYwtmOGTH6CJjGI4D

点击中间区域
呼出菜单
上一章
目录
下一章
×