“双活”容灾,走好容灾建设每一步
摘要:
建设容灾系统就是指利用各种技术和管理手段将灾难的影响化解,它的主要表现形式为两个方面:一是保证企业数据的安全;二是保证业务的连续性。当各企业的信息化建设走向了一个新的层次,面临各类法规、竞争、高质量服务的新的要求时,能否有效的建立灾难防御
建设容灾系统就是指利用各种技术和管理手段将灾难的影响化解,它的主要表现形式为两个方面:一是保证企业数据的安全;二是保证业务的连续性。当各企业的信息化建设走向了一个新的层次,面临各类法规、竞争、高质量服务的新的要求时,能否有效的建立灾难防御体系就成了企业进一步发展的一个里程碑。
容灾系统的建设意义已经被铺天盖地的渲染,各级政府和行业也开始制定规则,规范信息系统在各种灾难下的危机响应水平,从各方面来看,是否有必要建设容灾系统已经走过了探讨的阶段,而摆在人们面前的却是另一个过去始料不及的问题---建立容灾系统的复杂性。这个问题的复杂度在人们考虑灾备系统规划和建设方案时凸现了出来,例如:人们会发现当提出一个理想的各类业务统一灾难防御体系的建设目标之后,却无法选出满足要求的技术路线或者需要极为高昂的造价。又比如,人们发现容灾体系建设中,IT部门却无法控制一个整体的容灾流程,而流程的制定又是一个需要全民意识的多兵种工程,等等诸如此类。
在建设容灾系统中,通常会遇到下面几个问题。
第一,在制定容灾系统方案的过程中要考虑的就是容灾系统建设对原有业务系统带来的影响。比如,采用数据复制技术对系统I/O带来的延迟,应用数据同步对日常业务处理系统带来的压力等。因此,企业要通过周密的测试和分析来规避容灾系统建设时带来的这些风险,以保证业务系统不会因容灾系统的建设而出现在处理性能上下降的问题。
第二,数据状态要保持同步。为保证在灾难发生时,业务可以成功地切换到备份中心,就必须保证容灾系统数据同步机制的可靠性。因此,建立可靠的数据同步校验机制是必须的;同时,还要考虑建立定时的、自动的数据同步核查对比机制,以检验两个中心数据的一致性,这是数据容灾工作中非常重要的一部分。
第三,容灾系统的日常维护工作要尽可能轻,并能承担部分业务处理和测试的工作。容灾系统的维护和管理是容灾切换成功的重要保证,在系统建设中,就必须要考虑系统的维护管理流程。生产中心任何业务处理过程的改变都必须完整地复制到备份中心;所有新业务系统上线时,必须通知备份中心,并在备份中心配置好数据同步机制;对原程序的改动也必须保证两个中心同时上线。
第四,系统恢复时间要尽可能短。容灾系统主要是为了实现在主中心系统发生灾难时,可以在规定时间切换到备份中心,保证数据不会丢失,并且继续向用户提供服务。但往往在灾难发生时,主要技术人员不能及时到达现场,为了顺利实现系统间的切换,应该让系统切换操作尽可能地简单;并建立固定化的、标准化的切换流程,要求维护人员在切换演习时严格按照流程的指导步骤进行操作。
第五,可实现部分业务子系统的切换和回切。当人事变动、业务变化、IT设施变化以及其他可能引起恢复规划文档失效的变化发生时,应及时更新各恢复规划文档,并在必要时启动模拟测试或演习,确保业务连续性系统的工作能力。
第六,技术方案选择要遵循成熟稳定、高可靠性、可扩展性、透明性的原则。目前,国际上比较成熟的容灾技术包括: SAN/NAS技术、远程镜像技术、虚拟存储、基于IP的SAN互连技术以及快照技术等。其中基于IP的SAN远程数据容灾备份技术应用比较广泛,其是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备份中心的SAN中的。当备份中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库。这种基于IP的SAN远程容灾备份,可以跨越LAN、MAN和WAN,成本低、可扩展性好。基于IP的互连协议主要包括FCIP、iFCP、InfiniBand、iSCSI等。
第七,构建系统方案可以选择多种技术组合方式。目前,业内应用较多的容灾方案是基于智能存储系统的远程数据复制技术,它是由智能存储系统自身实现的数据远程复制和同步,即智能存储系统将对该系统中的存储器I/O操作请求复制到远端的存储系统中并执行。由于在这种方式下,数据复制软件运行在存储系统内,因此较容易实现主中心和容灾备份中心的操作系统、数据库、系统库和目录的实时拷贝及维护能力,且不会影响主中心主机系统的性能。如果在系统恢复场具备了实时数据,那么就可以做到在灾难发生时,及时开始应用处理过程的恢复。但这种方案也有开放性差(不同厂家的存储设备系统一般不能配合使用)、对于主、备中心之间的网络条件(稳定性、带宽、链路空间距离)要求较苛刻等缺点。
浪擎科技作为国内最大的备份容灾软件厂商,始终致力于各种数据实时备份、数据库实时复制技术研发的厂商,具备完整的技术架构和多系列的产品。既有高端的基于应用层的、备端在线的镜像系统,以及基于私有云架构的大型灾备中心方案,又有基于逻辑卷层的实时数据复制产品,还有容错CDP级的产品线。
浪擎能为用户提供标杆性的技术和服务——备端在线的“双活”容灾
1)浪擎备端在线的“双活”容灾能保障备用系统的一致性
容灾系统与生产系统的数据一致性考虑在容灾建设中极其重要。什么叫数据一致性,简单的讲就是要保证生产系统、容灾系统的数据相一致。如果不能保障复制过去的数据的一致性,那么容灾端的数据就不完整,整个应用系统就不可用,容灾完全失去意义。
浪擎A系镜像系统采用数据库层复制技术,备端容灾系统处于在线状态,避免了数据库级别一致性的问题,简单的说就是容灾数据库肯定能够使用,不存在不能正常启动的问题。
2)备端在线的容灾是可靠的、令人放心的“双活”容灾
浪擎科技备端在线的容灾带来一个最大的好处就是可以验证容灾的结果,就是可以直接去验证备用数据库的好坏,进而可以验证主、备两端的数据差异。
仅就备用数据库而言,要做到可靠就必须保障数据库级别的一致性,就是要保证备用数据库的数据存储结构是好的,内部关联性和秩序是一致性的,浪擎A系镜像系统的备用数据库处于在线状态,没有数据库级别不一致的问题,因此容灾结果是可靠的、正确的。
3)具备完整技术架构的解决方案能力
用户自身的软硬件环境也是是复杂的和多元化的,需求是复杂的和多元化的,投入相对是有限的。要做容灾,用户首先要理清信息系统的环境、技术要求、预算规划、维护人力等等。搞清楚一共有多少业务系统,每套业务系统的软硬环境、目前数据量多大、每天增量多大等等;每套业务系统对自身企业运作的影响,就是RTO和RPO要求,以及建设迫切程度。
没有一种技术可以解决所有的问题,多种技术的组合是正确的,浪擎科技具备全面的产品线,可提供多种技术的、完整的解决方案。