桌面终端硬盘数据快照技术研究

(整期优先)网络出版时间:2021-08-18
/ 2

桌面终端硬盘数据快照技术研究

周源、赵雄江

云南电网有限责任公司临沧供电局,云南临沧, 677000


摘要:近几年随着科学技术的发展,磁盘数据的保存早已遍布生活工作的方方面面,但是移动硬盘因为磁盘固有属性的原因,无法保证数据的永久安全,为了避免重要数据流失带来的各类问题,终端硬盘数据快照技术解决了这个问题,改变了传统的数据备份方式,本文就终端硬盘的数据快照技术的概念、特点、实现技术进行了概括性阐述,并对数据快照技术的发展前景进行了展望。


关键词:快照、备份、复制、镜像

前言:随着计算机技术和网络技术的不断发展,各种信息呈现爆炸式的增长趋势,存储技术成为信息计算技术的核心技术之一,存储容量的不断升级也对信息存储技术提出了新的要求,现代企业对计算机的依赖性严重增强,信息数据逐渐成为企业赖以生存的基础,数据损坏或丢失将给企业带来巨大的损失,因此将数据备份窗口尽可能地缩小,甚至缩小为零,数据快照、持续数据保护等技术,就是为了满足这样的需求而出现的数据保护技术,随着计算机存储技术的发展,该项技术将会对企业稳定发展具有非常重要意义。

1.桌面终端硬盘数据快照技术的概念

桌面终端硬盘数据快照技术,简称快照(Snapshot)是某个数据集在某一特定时刻的镜像,也称为即时拷贝,它是这个数据集的一个完整可用的副本,其中存储网络行业协会(SNIA)对快照的定义是:关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本(duplicate),也可以是数据的一个复制品(replicate)。

快照具有很广泛的应用,例如作为备份的源、作为数据挖掘的源、作为保存应用程序状态的检查点,甚至就是作为单纯的数据复制的一种手段等。创建快照的方法也有很多种,主要可以分为镜像分离(split mirror)、改变块(changed block)、并发(concurrent)三大类。后两种在实现时通常使用指针重映射(pointer remapping)和写时拷贝(copyonwrite)技术。changedblock方式的灵活性及使用存储空间的高效性,使得它成为快照技术的主流。

所谓改变块,是在数据创建成功后,源和目标共享同一份物理数据拷贝,直到数据发生写操作,此时源或目标将被写向新的存储空间。共享的数据单元可是块、扇区、扇道或其他的粒度级别。为了记录和追踪块的变化和复制信息,需要一个位图(bitmap),它用于确定实际拷贝数据的位置,以及确定从源还是目标来获取数据,以此来将数据实现快照备份报错,减少数据流失风险及损失。

2.快照技术实现原理概述

为了实现稳定高效的硬盘数据快照功能,通过在存储系统中不同层次来实现,可以在磁盘阵列、文件系统、卷管理器、NAS系统或备份系统中来实现,快照技术实现原理图如下所示:

611ccbf158939_html_4079f9f094bdb875.png

(图1 快照技术实现原理图)

如图所示,在数据快照的整个流程中,大致可以分为右侧的这几个层,存储子系统由一组硬件和软件组件组成,为运行在主机操作系统上的应用系统提供物理存储介质,基于控制器的快照,在存储设备层或硬件层中实现,由存储系统硬件提供商管理并集成于磁盘阵列中,并在LUN级(块级)完成,从上图中不难看出,在各个存储层次中,物理存储层和卷管理器是最适合实现快照的两个组件,它们可以方便地利用物理存储,并且基于硬件层的快照往往更高的性能和容错性,使得硬盘的数据快照功能有了良好的速度保障硬件,并且依赖volume management和闪存速度上的优势,可以在极短的时间内实现所有数据的一个完整的副本保存,提升快照的存储性能和安全性。

2.1 数据快照数据复制

快照数据复制即在选定的数据磁盘,快速复制磁盘数据,写时复制快照使用预先分配的快照空间进行快照创建,在快照时间点之后,没有物理数据复制发生,仅仅复制了原始数据物理位置的元数据。因此,快照创建非常快,可以瞬间完成。然后,快照副本跟踪原始卷的数据变化(即原始卷写操作),一旦原始卷数据块发生首次更新,则先将原始卷数据块读出并写入快照卷,然后用新数据块覆盖原始卷,这样的数据拷贝方式即满足了在需要快速备份时的时效性要求,也兼顾了数据的安全性,为桌面终端硬盘中的数据提供了一个良好高效的备份入口,进一步降低了数据流失带来的风险。

这种快照技术在创建快照时才建立快照卷,但只需分配相对少量的存储空间,用于保存快照时间点之后源数据卷中被更新的数据。每个源数据卷都具有一个数据指针表,每条记录保存着指向对应数据块的指针。在创建快照时,存储子系统为源数据卷的指针表建立一个副本,作为快照卷的数据指针表。当快照时间点结束时,快照建立了一个可供上层应用访问的逻辑副本,快照卷与源数据卷通过各自的指针表共享同一份物理数据。快照创建之后,当源数据卷中某数据将要被更新时,为了保证快照操作的完整性,使用写时复制技术。对快照卷中数据的访问,通过查询数据指针表,根据对应数据块的指针确定所访问数据的物理存储位置,快照数据复制原理示意图如下:

611ccbf158939_html_d4e1c07c23ac9aee.png

(图2 快照数据复制原理示意图)

如上图所示,复制技术的操作必须确保复制操作发生在更新操作之前,使快照时间点后的数据更新不会出现在快照卷上,极大程度上保证了快照操作的完整性。因此复制操作只在源数据卷发生更新时才发生,所以系统开销非常低,在节约系统资源的同时能有效的备份数据是该项技术的一大亮点。


2.2 数据快照存储技术优势

为了加强对硬盘数据快照备份的时效性,在存储模型技术设计层面,采用阵列的快照来做数据库的备份,该技术支持多个LUN或者叫卷volume同时做快照,保证数据的一致性,优点是与应用的藕合比较松,性能和效率比较高,系统连续不间断运行,不存在快照窗口问题,虽然对存储空间的要求相对高一些,但是通过物理升级的方式便可有效解决该问题。

2.3 增量快照与持续数据保护

为了实现稳定高效的硬盘数据快照功能,除了依靠良好的技术架构和硬盘容量优势,在数据增量备份和持续保护方面也需要特殊处理,毕竟数据的变化是非常频繁的。

2.3.1增量快照(Incremental)

增量快照的特点是可以跟踪数据卷和快照卷的变化,当一个新的增量快照生成之后,旧的快照数据将被刷新。第一个快照和随后创建的每一个增量快照数据上都有时间戳标记,利用时间戳我们能够将快照数据回滚到任意的一个时间点。增量快照技术能够加快后续快照的生成速度,而且仅仅在名义上多消耗了一点空间而已,由此可以提高创建快照的频率,也能让快照保留得更久。

2.3.2持续数据保护(CDP)

CDP的出现是为了实现零数据丢失的RPO指标,以及瞬时数据恢复的RTO指标。它本身与同步数据镜像很类似,不同之处在于CDP还可以对软性灾难进行恢复。包括人为误操作、恶意软件攻击、意外删除、数据损坏等情况。持续数据保护颇像频率很高的增量快照。它会捕获并复制任何时刻发生的数据变化,并且给这些数据块打上时间戳。CDP本质上相当于每个时刻都创建一份增量快照,提供细粒度的精确数据恢复。有些CDP产品同时提供基于时间和基于事件(例如应用程序升级事件)两种粒度的恢复方式。还有一个理解CDP概念的好方法就是将它看成一个快照的Journal日志。对于邮件系统、数据库和基于数据库的应用来说,CDP是一个极好的保护方案,能将数据回滚到任意的历史时间点,恢复过程也简便、迅速。现在运用也非常广泛,它是一个集成了CDP功能的存储系统兼存储虚拟化设备。

随着越来越多的数据需要保护,备份窗口也变得越来越紧张,因此需要快照技术来帮助我们解决备份问题。在现实的应用环境中,快照利用的是否恰当对数据保护的等级和恢复的速度有着很大的影响,快照技术都将在数据保护领域和日常存储管理中扮演重要的角色。

结论:快照技术是对传统数据备份与复制技术的重大革新,解决了备份窗口问题,有效拉近了恢复时间目标和恢复时间点目标,成为了事实上的存储行业标准。随着快照窗口不断缩小,从几秒到瞬间完成;几乎可以在任意时刻创建快照,粒度越来越细,数量不断增大;快照性能大幅提升,对主机、应用的影响降低至微;快照灵活性、可扩展性、可管理性不断增强。然而,人们对技术的进步要求从来都是没有止境的。针对当前的各种解决方案,在综合性能、灵活性、管理性方面,快照技术仍然存在很大的改进空间。存储厂商不断推出新的快照存储产品或新的版本,是最有力的证明。近年来,存储技术的发展日新月异,面向硬盘数据快照,新的存储架构、技术和解决方案不断涌现。这些可能会对快照技术的变革产生更加深远的影响,为快照技术的发展创造更加宽广的空间,在数据复制和备份领域将有更加广泛的应用前景。


参考文献:

[1]沈豪, 张延园. 高效数据快照方法设计[J]. 微处理机, 2008, 29(004):141-143.

[2]吕建华, 张柏礼, 魏巨巍. 基于数据快照图的异常检测方法:.

[3]孟祥宏. 一种数据快照首写拷贝方法及装置:, 2017.

[4]吴海洋, 缪巍巍, 郭波,等. 基于统计量的数据快照在电力通信统计分析中的应用[C]//中国电机工程学会电力通信专业委员会学术年会. 2015.

[5]赵慧慧. 一种块存储数据快照类型的转化方法,装置及设备:, 2019.

[6]常娲. 深入解析浪潮AS1000G2软件数据应用功能之二 AS1000G2的数据快照功能详解[J]. 科技浪潮, 2006, 000(009):15-16.