最新
推荐
2014年高等教育信息化十大“关... 01-04 教育部成立教育信息化专家组 12-24
我国首次开展全国性教育信息化... 12-22 CERNET第二十一届学术年会 11-24
|
在信息资源越来越重要的今天,数据已经成为最为宝贵的财富,数据的安全存储和高可用性已经被提高到了一个前所未有的高度,并且已经成为衡量系统服务质量和性能的一个主要方面。数据7×24小时的不间断在线已经成为信息时代的普遍要求,数据必须具备容灾能力。 容灾是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。 当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行。在容灾中涉及到许多技术,如RAID技术、NAS或SAN技术、备份技术、快照技术、镜像技术、基于IP的SAN的互连技术、集群技术等等。因为篇幅限制,本刊将网络存储区域的容灾分为上下两篇文章来介绍,5月刊中主要介绍备份方式、存储备份主要技术等内容,6月刊中将为读者介绍快照、远程镜像、连续数据保护等技术。 备份工作的实现层次 备份的作用是定期地把本地的重要数据转存到另一处较安全的介质中(一般是磁带设备,也有用可写光盘等),以便在数据丢失的时候找回以前的记录,减少损失。它一般是在某一个指定的时间范围内把要备份的数据从硬盘拷贝到磁带中。当硬盘出现问题,或者操作失误的时候,用户就可以把上次备份的数据恢复到硬盘中,但不一定是出现问题时的最新数据版本;而且备份和恢复的时间开销都是比较大的。但是它可以保存大量的,多个时间段的数据,而且磁带也比较廉价,易于保存,并且存储容量大。这些都是备份的优势所在。一般重要的数据都需要通过备份进行保护。 文件是由逻辑块组成的,逻辑块又称为页面。这些页面大小固定,每个页面在物理磁盘上连续存储。然而,不同的页面在磁盘上的分布并不连续,而是一个较随机的分布。 从这个层面上来说,备份软件是可以基于物理磁盘的备份(device based),也可以是基于文件系统的备份(file system based)。这两种方式的比较参见表1: 完全备份(full backup)是把备份文件集合中的所有文件都被备份。这种备份方式的好处是恢复方便。它的不足之处在于:备份数据中有大量内容重复,备份时间长,备份窗口(计算机空闲下来可以进行数据备份的时间称为备份窗口)很短,且占用大量的磁带空间,每一次的完全备份将需要一个不小于源数据空间的备份空间,增加了成本。因此,在实际的备份中,单一使用完全备份是不现实的。 增量备份(incremental backup)是针对前一次备份,只备份新建和修改过的。差别增量备份是只备份在上一次备份(无论哪种方式的备份)后修改过的文件。因为在两次备份间被修改过的文件相对于整个备份文件集合来说一般只是少数。因此它节省磁带空间,又缩短了备份时间。但它的缺点在于:当发生灾难时,恢复数据比较麻烦,恢复工作从最近一次的完全备份开始,可能需要查看一系列的修改操作。将最近一次的完全备份,叠加上之后的增量操作,来获得最后的恢复。一个典型的增量备份方法在初始时,需要进行一次完全备份,在运行过程中,也在系统空闲时期进行完全备份。在完全备份的间隔期内,增量备份可以采取不同策略经常进行对上次完全备份的增量备份。 还有一种增量备份方式称为累积备份。累积备份是指自上一个完全备份开始被修改的全部文件的拷贝。从累积备份恢复一个文件系统仅需要一个最新的完全备份和一个最新的累积备份,恢复文件系统变得更简单快捷。但是随着与上一次完全备份的间隔增长,将导致备份时间增加。 完全备份、累积备份和差别备份可以通过互相组合以平衡备份对应用的影响以及整个文件系统和数据库的恢复时间。现有的备份方法中,一些企业备份管理软件提供折衷的方法:把一个基本完全备份和几个差分增量备份集中成为一个较新的“完全备份”,这个新的合成完全备份成为未来做增量备份的基准备份。尽管合成完全备份从物理资源和时间来看消耗很大,但是它简化了恢复过程,所以这个功能对于系统管理者还是很流行的。 离线备份与在线备份 离线备份方式是在备份期间服务器停止了应用程序,中断对外的服务。显然,进行离线备份可以有效保障数据一致性。离线备份对于长时间提供服务的应用来说是不可取的。在线备份系统允许备份的同时不影响原系统的使用。在线备份系统提供了原系统的更高的可用性,但是在某种程度上引入了备份的不一致问题。 解决这些备份不一致的问题有两种主要策略:一种策略是加锁机制(locking)和侦察机制(detection),另外一种策略是copy-on-write。对在线备份来说,加锁机制使系统的可用性受到了破坏,如何将加锁的时间压缩到最小是备份软件应当考虑的问题。 并发备份是多服务器情况下需要考虑的一个主要问题。当系统中包括有多个服务器时,每个服务器有其自身的文件系统,就需要进行并发备份,或者备份到单一的磁带上,或者备份到多个磁带设备上。现有的多数备份软件支持并发备份,例如Amanda Backup Manager、Legato Networker、IBM公司的ADSM等。
几种基本的备份/恢复结构模型 传统的备份模式是基于本机的,需要在每台需要进行数据备份的机器上连接备份设备(比如磁带机);或者是基于局域网的,通过一台备份服务器来备份LAN中每台机器的内容。而SAN结构由于具有优良的性能和高度的可扩展性、可用性与可靠性,成为目前先进的一种存储系统结构。针对SAN体系结构,目前有两种备份模式:LAN-Free备份和Server-Free备份。它们的结构模型如图1、2所示: 各种备份模式的区别参见表2: 从上面的各种备份方法来看,理想化的备份方案是不存在的,所有的备份方案都有优点,同时也有无法解决的问题。例如在线备份和文件系统的可用性是一对矛盾。基于磁盘的备份和基于文件系统的备份也是互有优缺点。 网络存储备份的主要技术备份管理 备份不仅只是数据的保护,其最终目的是为了在系统遇到人为或自然灾难时,能够通过备份内容对系统进行有效地灾难恢复。因此,备份不等于单纯的拷贝,管理也是备份重要的组成部分,备份应该是“拷贝+管理”。 备份管理主要包括:备份数据记录管理、数据的生存周期管理、磁带驱动器管理、磁带库管理等。 快照技术 快照技术为在线备份提供有力的支持。快照建立后,备份程序将快照映像进行备份,而且快照可以很好地利用类似增量备份的特点,即只针对上一次完全备份后所修改的数据进行快照,可以大大缩小快照的时间窗口。在为逻辑卷创建快照之后,可以通过快照卷读取数据对逻辑卷的数据进行无服务器备份。现有的备份系统中,比较著名的有EMC的SnapView采用了快照备份。 磁盘调度技术 备份属于磁盘密集型操作,大量的I/O操作会为存储设备处理器带来严重的负担,从而会对前端的应用造成影响。相关研究表明,磁盘的寻道、旋转时间在I/O操作中占有很大的比重。当磁盘进行一系列定位操作时,前端的应用会处于等待状态。有效利用这一段时间进行后台的I/O密集型操作将会在不影响前端应用的同时大幅度提高效率。目前在磁盘调度技术领域已经有了很多研究成果,如free block scheduling技术等。 虚拟磁带技术 随着备份数据量越来越庞大,磁带驱动器的速度成为数据备份的瓶颈。近年来,磁盘设备的容量以每年50%的速度增长,这使得一些公司开始采用磁盘作为直接备份设备。因此虚拟磁带技术是近年涌现的技术,它使磁盘设备对外表现的完全和传统磁带设备一样,为用户提供了极大的方便。这一技术的优点在于极大缩减了备份时间,因为磁盘读写速度大大优于磁带设备,此外,磁盘设备的定位时间相对于磁带设备的重绕时间可以忽略不计。 虚拟磁带还可以使一个物理磁带机被虚拟仿真成多台磁带机的镜像,多个虚拟磁带卷经叠加后写进物理磁带介质,这样可有效并充分地使用磁带介质和磁带机资源,降低运营成本,提高备份性能。例如从事金融服务的Fortis公司安装了虚拟磁带服务器之后,盒带使用量从45万盘减少到了10万盘,而且还在减少中。 |
版权所有:中国教育和科研计算机网网络中心 CERNIC,CERNET,京ICP备15006448号-16,京网文[2017]10376-1180号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@staff.cernet.com