灾难备份建设是一项周密的系统工程,也是一个全新的危机管理领域。灾难备份建设不仅需要进行灾难备份中心建设和IT系统购置,更需要有灾难备份技术、危机管理、风险管理、业务连续计划制订、灾难演练和灾难恢复等灾难备份专业领域知识。此外,灾难备份也不同于一般的IT项目,它是单位机构业务流程的延续,它需要建立完善的灾难备份中心运营管理体系,需要不断保持业务连续性计划的有效性,以保障灾难备份中心能持续发挥灾难备份功能。
>常见容灾系统按业务系统不同、所要求的RTO和RPO不同,可分为介质容灾、远程备份容灾、数据容灾和应用容灾等四种类型。
>介质容灾
>业务系统已将数据备份到可移动介质(如磁带、光盘、胶片等)上,为了保证这些数据在灾难发生时能够被妥善的保存,并在系统重新安装或恢复后,将介质上的数据恢复回去,最简单的容灾方法就是将这些介质定期地以人工的方式收集到容灾中心,在容灾中心进行最为妥善的介质保存措施。
>远程备份容灾
>对恢复时间要求较高,没有在本地实施备份系统的部门,可通过远程网络直接将数据备份到容灾中心的存储池中,保证数据的安全性。采用这种容灾方式,一般要求恢复的数据时间点在灾难发生前的几十分钟到几个小时;而从灾难发生后,需要完成从恢复系统、恢复数据、直到实现对外提供应用服务这么一整套的恢复工作,所需要时间大约为几小时到一天。
>数据容灾
>数据容灾的保护对象是生产系统产生的业务数据。为了更好地实现数据的容灾,数据容灾方案必须能够实现对数据库数据、基于文件系统的数据,甚至对系统的数据卷,进行实时有效保护。数据容灾的根本目的,是能够重新利用复制的数据。也就是说,数据容灾的核心是恢复,如果容灾的数据无法恢复和重新使用,就失去了容灾的意义。
>基于数据容灾的实现技术有很多,为了实现不同用户数据容灾的需要,容灾中心的数据容灾架构应该能够支持和实现多级别的数据容灾,根据功能框架的设计,需要实现的数据容灾方案包括:
>l 数据文件容灾实现
>l 数据库容灾实现
>l 存储网络层数据容灾实现
>l 数据卷容灾实现
>l 磁盘阵列级数据容灾
>一、数据文件容灾
>数据文件容灾主要实现用户端文件级数据到容灾中心的复制。通过容灾中心复制软件的和用户端复制代理软件的配合,容灾中心可以监控用户端文件的修改,定时或实时(根据数据设定的策略)将用户端文件同步到容灾中心。系统能够实现基于数据文件或数据字节层次的数据复制、时间调度复制等,并可以采用一对多和多对一的数据复制方式。
>二、数据库容灾
>通过使用基于数据库软件复制技术保证远程数据库的复制。用户端主机安装数据库同步软件的客户端和数据库agent,通过搭建的网络环境和容灾中心数据库同步软件的服务器端通讯,按照定义的规则实现整库级、用户级、表级的数据同步。在不同用户端的生产服务器上都部署上数据库同步软件的客户端和数据库agent,可以和容灾中心的数据库同步软件服务器端实现N对一模式的远程数据复制。
>三、数据卷容灾
>数据卷容灾采用卷管理器的磁盘镜像功能来实现。通过在容灾中心主机和用户端主机上安装卷管理器软件,可以将容灾中心的镜像磁盘和用户端的主磁盘上的分区或卷虚拟为服务器能够看到的同一分区或卷,这样在用户端主机发生I/O操作时,系统会自动将数据分别写入本地的主磁盘阵列和容灾中心的镜像磁盘阵列中,从而实现数据的镜像。这种写操作是对主机而言的,是逻辑上的。当客户端数据发生灾难时,容灾中心数据可以被接管应用。当客户端中心系统重建后,数据可以随时从容灾中心得到恢复。
>数据卷容灾的实现,需要在用户端主机上安装专用的数据复制软件。这种方式需要对客户端的改动较大,而且卷复制操作系统平台不同和数据传输性能的影响,很难实现大规模“一对多”容灾模式。因此,建议容灾中心先期不作本方案的实施,如果有具体用户需求,再设计具体的方案,具体实现。
>四、网络层数据容灾
>存储网络级数据容灾,一般通过专门的设备为远程复制容灾提供I/O路径和复制路径,实现基于SAN层次的数据容灾。通过在用户端和容灾中心的系统中配置专用服务器,在其上安装专用软件。容灾中心的专用服务器可以配置为定时对用户端专用服务器的数据进行复制,从而实现关键数据的远程复制和保护。传输链路可以选择IP网络和FC网络,如果IP城域网或广域网的带宽较低,可以采用异步的复制形式。
>五、磁盘阵列级数据容灾
>利用高性能磁盘阵列(硬件层次)的高级数据复制功能,通过存储子系统之间的通讯,并结合一些主机端的管理工具,来实现用户端数据和容灾中心对数据的传输复制。复制通过用户端和容灾中心磁盘阵列上的微处理器实时完成。将灾难发生时,可以将关键数据的损失降至最低,而且不需要主机干涉或占用主机资源,可以做到灾难发生的同时实现应用处理过程的恢复。
>应用容灾
>对于恢复时间要求非常高,而且具备在本地和容灾中心可以实现短时间范围内的数据复制能力的部门,一方面可以通过远程网络直接将数据复制到容灾中心的磁盘阵列中,另一方面可以通过远程集群管理软件实现容灾中心的待机状态的应用服务器和本地应用服务器保持一定的同步,从而在灾难时可以直接快速启动容灾中心的服务器,在最短的时间内对外提供服务。采用这种容灾方式,一般要求恢复的数据时间点在灾难发生前的几分钟到几十分钟;而从灾难发生后,只需要完成网络和应用服务的切换工作,所需要时间大约为几分钟到一小时。