上世纪70年代,IT革命处于萌芽阶段。那时的数据量很小,通常只有几十兆到几百兆。当时的硬盘成本更是接近天价,每兆硬盘空间的售价超过了3000美元,购买一个容量小于10兆的硬盘所需的费用,甚至超过了一个系统程序员全年的工资。另一方面,基于硬盘的存储技术却还刚刚起步。基于上述原因,当初进行备份/恢复操作时,往往采用磁带作为备份介质。
基于磁带的”备份/恢复”面临的问题
进入21世纪的海量数据时代,与30年前相比,数据量已经从几十、几百兆增长至几千TB;而且由于数据备份和恢复操作几乎是贯穿全年的例行工作(Routine Job),如果现在仍然以磁带作为最基本的备份介质,不仅会耗费管理员大量的时间和精力,同时也会产生诸多问题。主要表现在以下几方面:
工作量巨大
数据备份和恢复操作贯穿全年365天
备份/恢复的工作量占整个存储管理的60%-70%
数据很难有效恢复
由于备份窗口或介质失效等原因,备份作业的成功率只有70%左右
恢复时间太长,从磁带中恢复单个文件往往要花费几个小时甚至1天
本质上是一项”体力活”
磁带库内磁带的循环更新,将磁带拿进取出,不可避免仍需要大量人工干预
进行离场保护时,大量磁带在数据中心和异地之间的来回运输,需要耗费大量的人力
“一体化数据保护”是解决问题的最佳途径
好在时至今日,随着数据量的成倍增长,计算机技术也有了突飞猛进。硬件尤其是硬盘的价格与早期相比有了大幅下降,不断刷新的硬盘容量也令人惊喜。基于磁盘的存储新技术(如快照、镜象等)日益涌现。调查显示,目前超过80%的恢复请求是在数据丢失后48小时内提出的,这意味着恢复速度更快的基于磁盘的存储技术开始成为主流。而由于磁带在某些方面仍具有不可取代的优势,如价格低廉、适合数据的长久保留等,因此采用以磁盘和磁带技术相结合的所谓”一体化数据保护”方案,成为很多企业在进行数据保护时的最佳做法。
本地镜象(快速恢复卷):
在某一时间点,对生产数据进行同步,然后断开,以保留生产数据在该时间点的静止状态
用于对保留期内整个数据的快速恢复
一天可做一次或若干次本地快速恢复卷,保留24小时
磁盘消耗量高(100%)
对应用影响较大
数据快照:
采用Copy-on-Write的方法保留与前一基准点相比已变化的数据
基准点数据出现问题就无法使用
用于保留期内对少量数据的快速恢复
使用频率较高, 例如:每2小时快照一次,常保留24-48小时
磁盘消耗量较低(5%-20%)
对应用影响较小
异地镜象:
对生产数据的100%异地镜像
对由于逻辑错误而丢失的数据没有保护作用
常用于对生产站点的容灾保护
采用连续复制以保持与生产数据一致
同步复制方式
异步复制方式
近线存储:
用于对生产数据进行备份
常采用廉价的ATA/SATA磁盘阵列作为备份设备,以提高速度和可靠性
通常数据保留时间为1周-1个月,然后,被迁至磁带库作更长时间的保留或归档
磁带库:
磁带是数据长久保留/归档的最佳选择
磁带上的数据往往被视为数据保护的最后防线
由于磁带可以在物理上与生产系统脱离,磁带可以用于数据离场保护
磁带存储成本仍然是最低的
某世界著名的大型石油公司的”一体化数据保护”做法就很值得借鉴:每天上午8点,对重要的SAP数据做一次”克隆”,产生本地镜象;之后每隔4小时对数据变化量进行快照,每个快照保留48小时。每天晚上12点,将快照中的数据备份到近线存储设备,保留两周。两周后,将数据拷贝到磁带库中保留一年。磁带库中的数据同时复制有多个副本,其中一个数据副本作离场保护,妥善保管到异地的仓库或办公室。与此同时,这些数据也采用复制的方式产生异地镜象,以实现容灾保护。
可想而知,在上述”一体化数据保护”措施的周密保全下,该公司面对各种情况下的数据丢失都能从容应对:若需要恢复48小时内丢失的数据,可从本地镜象和快照中恢复;若需恢复两周内遗失的数据,可从近线存储设备中恢复;而两周以后的数据则可以从磁带库中进行恢复;万一发生了火灾或类似”9.11″之类的大型灾难,也不必惊慌失措,则可以切换到容灾点(异地镜象),也可以从离场保护的磁带副本中恢复所有数据。