3月
21

为什么恢复指标对容灾规划至关重要

为什么恢复指标对容灾规划至关重要

3月21日
通过

《哈佛商业评论》一针见血地提到了“真正的措施成功的”。目前,指标在医疗保健领域、体育领域和许多其他行业中发挥着重要作用。容灾也不例外。当谈到灾备规划时,指标不仅可以衡量有效性,还可以帮助组织实现对恢复工作至关重要的目标。

组织可以使用三个主要指标来引导他们灾难恢复计划:

  1. 恢复时间目标(RTO):确定在业务遭受不可挽回的损害之前,IT系统必须以多快的速度恢复。RTO通常以分钟、小时或天计算。
  2. 恢复点目标(RPO):确定灾难场景中可能丢失的最大数据量。RPO也以时间为单位,基于备份频率和其他数据保护策略。
  3. 实际恢复时间(RTA):经过验证的灾难后恢复IT系统所需的时间。这个目标可以在实际的紧急情况或恢复演练中确定。RTA可以帮助组织满足RTO,或者确定是否需要额外的战略或资源来满足该目标。

通过目标确定您的DR度量

尽管灾难恢复度量标准应该围绕组织的需求进行调整,但是对于每个单独的目标,仍然有特定的因素需要考虑。

RTO

手里拿着秒表

地点和资源配置在制定恢复目标方面起着关键作用。假设你正在恢复到一个寒冷的地方。您已经配备了一个基本的基础设施,它要求您在恢复开始之前将数据和IT人员转移到该设施,购买额外的许可证,并安装新的软件。在这种情况下,RTO的范围可能从几天到一周不等,因为完全恢复系统可能需要相当长的时间。

在热站点场景中,恢复位置已经全部设置好,可以开始了。在大多数情况下,您只是将故障转移到新系统,这可以在几分钟内完成,具体时间取决于备份的大小。由于您的数据随时可用,IT可以进入并立即开始工作,使您的系统恢复联机。这两个例子说明了如何以资源为代价来确定RTO,以及这些资源如何影响恢复时间。

RPO

数字数据被恢复到整个文件

你的RPO和备份策略是同步的。备份数据需要时间、技术和人力等资源,以确保一切顺利进行。要实现接近于零的RPO,组织需要不断地将数据发送到高度可伸缩的恢复目的地,比如云。这是一个相当崇高的目标,需要灵活的资源来容纳容量和网络流量,而不妨碍核心业务运营。

一般的经验法则是根据业务功能或应用程序的复杂性来制定RPO。我们将以SQL Server为例。在这个动态环境中,数据的速度和容量是不断变化的,因此一个小时的最小RPO将确保备份策略保护足够的数据,以满足恢复目标。了解RPO通常与详尽的成本效益分析一起确定是很有帮助的。无论您的目标是2小时还是24小时,重要的是要权衡丢失数据的成本和更频繁地备份数据的成本。

备份数据正在刷新到本地计算机

灾难恢复是一项复杂的工作。实现预定的目标需要大量的资源、测试和优化。有一个全面的应对计划会有所帮助,但实际结果可能会受到几个因素的影响。由于这个原因,RTO和RTA有很大程度的差异并不罕见。重要的是从实际恢复时间中收集见解,并使用它进一步改进RTO和DR功能。

关于参数的最后一句话

在许多组织中,IT部门承担了实现和管理灾难恢复策略的责任。但这不应该只是it的负担。一种有效的DR方案需要多方的协调努力。高级管理人员、IT人员和关键决策者必须共同努力,使恢复目标与业务影响分析的结果和组织的个人需求保持一致。在灾难发生之前定义您的恢复度量,当需要启动您的响应计划时,将会有很大的不同。