计算机数据库的备份与恢复技术研究

2022-11-22 07:18娄斌
电子技术与软件工程 2022年16期
关键词:数据备份事务备份

娄斌

(北京市丰台区职工大学 北京市 100164)

信息化时代,计算机作为科学技术的重要代表,被广泛应用到社会各界,成为现代人们生活不可或缺的重要工具,为社会发展带来了福音,代表着传统社会走向现代科技发展的一大变革。就事实来看,计算机的涵盖领域在不断扩大,为居民生活与企业办公带来较大便捷,但同时也是一把双刃剑,提供便利的同时,也带来了前所未有的挑战[1]。其中,计算机数据库内资料信息的存储问题,受到来自社会各界的高度重视,极易受到系统本身或外来因素的影响,使得计算机系统发生故障,无法保证内部数据的真实与完整性。正因如此,计算机数据库备份与恢复技术,成为现代社会人们的热点研究话题,也是本文章的重点探讨课题。

1 计算机数据库特点分析

1.1 数据规模比较庞大

计算机数据库的存在意义,便是对各项网络数据的整理与存储,为数据使用者提供更准确的参考数据。纵观我国社会的发展历程,在人类社会的建设期间,各项印刷材料数据的总量达到200PB(1PB=21TB),人类在经过语言能力掌握初期到21世纪,所说过的话数量大约在5EB(1EB=210PB)。在信息技术蓬勃发展的今天,数据库早已成为社会各界发展的必然选择,在技术手段的全力辅助下,个人计算机硬盘早已从传统常规发展为现如今的TB 量级。以常见事物“高速公路”为例,在每个高速公路的收费站中,每天行驶的车辆可高达数百万量,而通过信息技术,将公路收费系统、监控系统、运营管理系统等其他配套系统归纳至同一系统中,各系统产生的数据总量可达到PB,全部通过数据库来统一存储、查阅与使用,因此可以说计算机数据库的数据规模巨大[2]。

1.2 数据类型居多

正如文章上述所讲,计算机数据库被广泛应用在各个行业领域中,因此内部产生并存储的数据类型比较繁杂。按照数据类别划分,主要由“结构化数据”“非机构化数据”两种形式组成,相比于传统模式下文本存储类的数据信息,信息技术模式下的数据存储形式更加灵活多样,不再以单一的纸质为主,更多的是图片、音频、视频等非结构化数据量在不断增加,使枯燥的数据信息变得更加形象、具体化。在现代社会机构中,将数据库应用在管理中,可以实现多种数据的在线查阅与实时处理,使管理人员准确掌握实际经营情况,并根据外部经济环境的变动情况,及时调整发展战略,便于各类预警信息的发布与共享。在数据库的应用与推行过程中,数据形式正在出现转变,数量、种类也在不断增加,为现代社会的发展建设提供了强有力的数据支撑。

1.3 数据处理速度明显提高

说起计算机数据库的处理速度,主要在传统信息处理方式的对比分析下而得出,在实际应用数据的过程中,在信息技术高效、便捷、快速等优势的带领下,使数据信息得到快速处理,使各使用主体的实际需求得到更好满足。举例说明:社会企业的财务管理系统、银行运行系统等,都需要在信息技术的辅助下,对企事业单位生产经营中产生的各类数据信息,进行系统化的处理与分析,因此财务系统与银行机构的工作性质比较特殊,所以产生的数据信息比较庞大,需要通过计算机内高效的数据处理方式,使数据信息的价值得到真实体现,进而更好达到预期目标,提高数据资源利用率[3]。并且,以信息技术为载体的数据库,在数据的采集、分析、汇总、存储等多方面得到极大程度改善,使用主体只需操作信息技术便可实现目标数据的传输与接收,突破了传统模式下空间、领域的限制,进一步提高数据传递效果,使信息共享变为可能,这是数据库在数据应用与处理中,所呈现出的一大特点。

2 计算机数据库的备份与恢复技术的基本含义

在计算机数据库的运行期间,数据备份与恢复技术至关重要,属于一种强有力的保障技术,在保证数据信息安全、真实、完整方面起到十分关键的作用。现阶段,计算机几乎成为每户家庭的必备品,数据备份与恢复技术是计算机中比较基础、常见的技术,需要充分掌握这两项技术手段的含义特点的基础上,才能更好发挥其实际优势和价值,以此来保证计算机的稳定运行。

2.1 数据备份技术

数据备份是容灾的基础,是为避免系统故障或操作失误出现数据丢失,而将数据(全部或部分)集合从应用主机的硬盘或阵列复制到其他存储介质的过程。简单来讲,在日常使用计算机时,当遇到关机、死机等突发情况,将会出现一系列的数据丢失、泄漏等风险,这就需要数据备份技术提供保证,其存在的根本价值,便是保证数据信息的安全性。从技术层面来看,计算机数据备份技术主要分为“动态式备份”和“静态式备份”两种形式组成。其中,动态式数据备份,更加倾向于突发情况,当计算机在使用期间突发故障问题,无法正常运行时,计算机系统会自动保存并备份故障前用户的各项数据信息,在计算机恢复正常后,之前所应用的数据信息能够快速恢复并继续使用[4]。而静态式数据备份有所不同,促使计算机的信息存储与记忆功能更加先进、智能,并按照不同数据的类别进行自动分类与归纳,以此来保证系统内部信息的完整性。值得一提的是,无论是动态化数据备份,还是静态化数据备份,尽管方式不同,但最终的目的都是相同的,便是计算机数据信息安全的保证。

2.2 数据恢复

数据恢复技术属于现代社会的新兴产物,在多种技术手段的灵活运用下,将已经丢失或受到破损的数据,重新还原成正常数据。说起数据恢复的过程,主要以存储介质内的资料为基础,进行重新拼接整理,即使出现资料误删、硬盘故障等突发情况,当存储介质尚未受到严重损失的前提下,还可以使用数据恢复技术,将原有的数据资料完好无损地恢复原样,以便信息使用者的正常运用。在计算机地操作使用过程中,往往会出现误删重要信息,或者突然需要应用往期数据信息,但数据已经被损坏等情况使,便需要依托数据恢复技术,将目标信息进行恢复处理,以此保证工作的有序进行,保证数据信息的利用率。目前,在数据恢复技术的应用中,比较常见的方法便是按照计算机数据库内的数据信息分类、格式以及时间进行复制、保存,这属于计算机系统中比较基础的功能,也是至关重要的一项工作,之所以该项技术得到各界的广泛应用,主要原因便是因为自身的便捷性,用户在寻找目标信息时,只需在浏览页面中搜索关键词便可快速找到相关的数据信息[5]。

3 计算机数据库备份技术的应用

3.1 数据归档与分级备份

相比于其他数据备份方法,数据归档与分级备份方法的应用更加具有实践意义,使用起来更加井然有序,这是因为该方法提出要对不同数据进行分类、分级处理,并在整理过程中筛选、清除一些不必要的数据信息,使数据库内信息的使用价值更高,这样用户在使用数据库内备份数据时,便可以在短时间内快速找到目标数据。数据归档与分级备份流程比较规范,可以使数据安全得到有力保障,并为计算机数据管理、查阅、使用等提供较大便捷。

3.2 数据网络备份

所谓的数据网络备份,主要指在使用计算机数据库备份技术期间,以网络为载体,实现目标数据信息从原始位置到数据主机的传输、备份过程,并在客户端数据软件的辅助下,将此类数据向其他服务器进行传输[6]。在进行数据备份时,需要保证与服务器之间的有效衔接,进而保证备份数据能够实现科学分类,并且有效降低备份数据所受的安全威胁,进一步增强整个系统服务器的稳定与可靠性。

3.3 数据远程备份

在计算机数据库的运行期间,容易受到黑客侵入、人为损坏、系统故障、软件崩溃以及自然灾害等因素的影响,出现不同程度的数据丢失、泄漏,而在常规的数据备份方法无法满足实际需求的情况下,这就需要通过数据远程备份法,妥善处理紧急事故并完成数据备份。在使用数据远程备份技术时,需要做好计算机硬件与软件的转移工作,将软件内部数据信息快速转移并存储至远程备份系统中,然后操作远程备份系统,分析、整理、归纳、存储多种数据信息,尽可能减少自然灾害、系统故障等不良因素对数据信息安全性带来的影响。深圳木浪科技旗下多备份是专注于企业数据云端备份、恢复、迁移、存储和归档的云平台(SaaS)应用提供商。下面以多备份为例,远程备份数据库的具体流程如下:

(1)注册多备份官网,注册成功后进入控制面板,操作鼠标点击go,进入备份类型的选择界面;

(2)点击界面弹出框,进入系统界面右边的数据库进行备份,根据系统提示选择是否进行远程操作授权,然后点击左边可以即可;

(3)保证数据库名的准确输入,具体包括:用户名称、账号密码、IP 地址等,随即填写域名,合理设置备份频率、云盘以及时段等主要参数;

(4)在完成备份操作后,操作鼠标回到控制面板,以此来实现远程备份数据库[7]。

3.4 数据库的备份时机

针对计算机数据库的备份时机选择,主要分为定期备份、不定期备份两种。定期备份,顾名思义就是在固定周期内进行相应的数据备份,因为数据种类居多,备份期间往往需要消耗大量的资源和时间,因此可以通过每日、月度、年度不同方式进行备份。其中,spl server 备份系统,可以通过系统本身自行完成,也可以通过人工辅助完成,并且要远离机房、远离火源。而不定期的数据备份,主要指在数据库发生事务运行时,进行同步备份,并建立相互匹配的备份日志,即使备份发生故障,也不会影响原有数据库的正常运行,规避备份资料滞后性问题的出现。

在具体操作流程中,可以按照以下步骤进行:

(1)在进行数据库创建、修改、删除等操作时,应做好备份处理,通过database、database、drop database、alter等执行命令完成处理;

(2)备份数据库。在创建用户自定义对象期间,master数据库内部被修改,数据发生变动,需要保证master 数据库的及时创建与备份;

(3)做好服务器系统存储的流程优化,增加或删除相应的存储过程;

(4)结合实际情况,对master、model、msdb 数据库进行调整、修改,以此保证计算机的正常运行;

(5)针对事务日志、已执行但并未写入事务日志的操作,要及时处理并做好清除工作。

4 计算机数据库恢复技术的应用

4.1 利用恢复向导进行数据库恢复

利用“恢复向导”恢复计算机数据库资料信息,其最大的优势便是数据恢复效率、质量高,在保证数据库原有信息完整性的同时,可以根据用户群体的实际需求,合理安排相应的备份与储存工作[8]。在应用该类技术时,需要在计算机操作系统的全力支持下,对计算机操作者进行正确的引导与帮助,以便已经丢失的数据信息得到快速恢复、找回,利用计算机系统提供后台操作平台,以便促进这一技术作用的充分发挥。

4.2 逆向数据库恢复技术

在使用逆向数据库恢复技术时,需要应用到计算机系统内部的记录日志,因为在发生数据丢失前,这些系统记录日志会将系统内部各项数据完整留存下来,而在数据出现丢失、泄漏后,便可以通过记录日志、逆向数据恢复技术的有机结合,对各类分散数据进行集中化处理。具体来讲,将逆向数据库恢复技术应用在计算机系统中,可以灵活选用逆向查找的方式,实现系统原有记录信息的重现,在保证数据恢复效率的同时,不会对原有数据的真实、完整性带来破坏,减少外部病毒对计算机系统带来的侵害[9]。在逆向数据库恢复技术中,监控系统属于比较常见且比较重要的技术之一,能够对计算机系统整体运行状态进行实时追踪管控,且在信息技术不断发展的今天,监控系统的涵盖领域在不断增加,系统功能正在走向完善化,起到良好的数据保障作用。

5 计算机数据库备份技术与恢复技术的结合使用

5.1 需要结合应用备份与恢复技术的常见情况

对于计算机数据库而言,无论在前期如何优化、配置和精心设计,在运行过程中,难免会受到系统故障等不可抗拒因素的影响,进而导致故障问题的出现,这就需要相关人员结合实际情况,充分考虑数据库规模特点、备份与恢复技术的常见情况,根据故障问题特点妥善选择处理方法,以便故障问题的准确发现并且得到及时处理。

(1)介质故障。介质故障是计算机运行期间比较寻常的故障问题,在操作数据库进行存储介质文件的读或写时,可能会出现错误,这便是介质故障中的一种,因为在文件使用期间会出现一系列的物理问题,其中最常见的,便是因磁头碰撞而使得硬盘内数据文件出现破损、丢失现象。在数据库的运行期间,介质故障的威胁力比较大,极易导致日志文件、控制文件以及数据文件出现意外损坏和删除。当发现数据库内数据信息正在被侵蚀、破坏时,管理人员需要及时做出反应,灵活采用多种恢复策略进行数据恢复,进而将损失降到最低,不会对用户的正常使用带来影响。

(2)进程故障。该故障主要指在数据库的运行期间,因受到服务器、后台软件、数据库实力用户等因素影响而出现的故障,基本现象为进程异常断开或终止。一旦出现进程故障,将会导致该进程和子线程无法保持正常工作状态,进而影响到数据库系统内部分功能的完善性。

(3)网络故障。网络故障的出现频率相对较高,主要在数据库服务器、客户端工作站,或者组成一个分布式数据库系统的多个数据库服务器之间的网络故障,例如:路由器受损、网线被截等,进而使数据库系统陷入运行困难,无法更好提供数据服务。

5.2 计算机操作事务的备份和恢复的关系

在计算机数据的恢复处理中,事务是一项基本单元,需要建立科学合理的恢复管理机制,对事务的原始性、永久性提供有力保障,以此减少不可预知的失败或风险对数据带来的破坏力。在系统恢复正常运行状态,恢复管理机制需要做到以下几点内容:

(1)保证事务处理结果的绝对性,要么保证在数据库内准确记录全部的永久记录,要么全部都不做永久记录,因为数据库的写操作流程相对比较繁杂,实际情况则显得愈发复杂。在实践中,往往会出现一个事务已经提交,但数据库并未接收到相关的执行结果的情况,一旦在该环节发生失败,那么执行结果的准确性将受到影响,无法在数据库中被永久记录。

(2)在事务执行特定数据库写操作的过程中,首先要做的,便是在数据库缓冲区内准确填写数据。数据库缓冲区在内存中占据特定的区域,数据经此再回到二级存储器。基本上,数据库缓冲区内的数据信息具有显著的流动性、临时性特点,只有在进入缓冲区并经过处理,最终归纳至二级存储器后,才能保证这些数据信息的永久性[10]。在进行计算机系统数据信息处理,从数据库缓冲区会写到二级存储器的操作,需要通过DBMS 指令来完成,还可以在数据库缓冲区满时,由数据库系统进行自主执行处理。有时会需要将所有的数据库缓冲区一次全部倒入二级存储器,称之为强制写。

(3)当数据写入缓冲区,或者在数据从缓冲区写入二级存储器期间发生失败时,应充分发挥恢复管理机制的实际作业,对引起这次写操作事务的实时状态进行确认。如果该事务处于已经提交状态,应着重加强对事务一致性的关注与保证,由恢复管理机制对该事务执行一次Redo 操作,进而保证该事务执行的合理性,将最终执行结果准确记录至数据库中。在失败发生时,如果事务正处于活跃状态,为进一步保证事务的原子性,应利用恢复管理机制,进行事务执行Undo 操作,以此来降低事务对数据库带来的不利影响。针对单一的事务Undo 操作,我们将其统称为Undo 操作,而部分的Undo 操作,可以直接通过事务调度器引发。

(4)在单方面废除某个事务时,例如:用户Abort 操作,可以通过Undo 进行执行操作,并对已经执行的数据操作进行取消处理。如果需要Undo 操作面向所有活跃事务办理,可以将其统称为全局Undo 操作。为保证该项操作的永久性,我们习惯将二级存储器称之为永久存储器,这是因为即使在断电的情况下,它的整体数据存储也依然具有可靠性、有效性。相比于其他数据存储技术,二级存储器的优势更加显著,计算机数据库中的数据信息安全性得以有效保障,被缓存在主存缓冲区的那部分数据,不会在断电情况下消失。

诱发存储介质失败的原因有很多,最常见的有:系统磁盘内磁头受到破损、分布式环境下数据通信受阻等,进而出现不同程度网络失败现象。为妥善处理此类情况,需要充分发挥恢复管理机制的规范与保证作用,在发生失败情况时,应通过恢复管理机制进行事务识别,对需要Redo 操作的事务进行具体划分,分析类别种类,将需要Undo 操作的事务进行单独划分,随即安排这些必须操作的具体执行。值得一提的是,数据库日志是该过程中必不可少的关键环节,需要灵活运用数据库日志,将数据备份技术与恢复技术应用到实际工作中。

5.3 数据块和记录

在计算机系统中,数据块在磁盘与内存中扮演着传话筒的角色,属于数据库文件中最基本的存储单位。在块长度远超于记录长度的情况下,可以将多条记录分别存放在每个数据块内,而在记录长度超出数据块长度的同时,单一的数据块将很难实现对这种记录的准确存放。在此期间,如果将数据块的长度设置为BS 个字节,假设每条定长记录字节长度为RS,且当BS ≥RS 时,那么可以将bfr=[BS/RS]条记录放置在每个数据块中。通常情况下,BS 无法快速整除RS,因此在计算机系统的每个数据块中便会存在未使用空间,字节为(BS‐(bfr×RS))。为使这些未使用的空间得到充分利用,需要在每一个数据块中存放相应字节的数据信息,并在数据块的中心位置存放指针,以此指明字段的记录位置,便于数据使用者的快速查阅、合理使用。

针对数据文件的数据块分配环节,主要有连续分配法、连接分配法、按簇分配法三种形式来完后才能。

(1)连续分配法。将完整的数据表合理分配至连续的数据块中,这种方式在数据信息的访问、使用以及存储方面比较便捷,整体速度较快,但在数据表扩展处理中会存在一定困难,要求相关人员高度重视。

(2)连接分配法。在进行数据表分配的过程中,保证每个数据块中指针设置合理,准确指向前一数据块或下一数据块,以便数据使用者更方便地进行各数据块访问,为数据表扩充创造更多有利条件,但整体访问速度要稍慢于连续分配法,这是使用期间要努力克服的。

(3)按簇分配法。该方法是由以上两种方法融合运用而成,在几个连续的数据块的结合下组成多个簇,进而形成完整的簇间数据链,既方便了数据链表的使用,又促进其得以有效扩充。

6 结束语

综上所述,社会在发展,时代在进步,信息技术的蓬勃发展,带领社会各行业走向全新的发展道路,为社会数字化转型作出了巨大贡献。在新时期背景下,我们应充分了解计算机数据库的优势与特点,灵活采用多种网络数据维护手段,将数据备份与恢复技术切实落到实处,对计算机数据库实施有效管理,进一步保证数据库内数据信息的真实完整性,保证计算机系统得以正常运行,更好为社会民众提供更优质的数据服务。

猜你喜欢
数据备份事务备份
泉州高速公路收费系统远程数据备份研究
基于分布式事务的门架数据处理系统设计与实现
海洋数据备份平台的设计和实现
程控交换机的数据备份与恢复技术分析
河湖事务
创建vSphere 备份任务
No.4 IDC:2019年上半年数据备份与恢复市场同比增长10.0%
旧瓶装新酒天宫二号从备份变实验室
出版原图数据库迁移与备份恢复
SQLServer自治事务实现方案探析