单机存储系统中的故障恢复
单机存储系统中的故障恢复
2018-05-31 10:56:29 来源:拂晓杂谈抢沙发
2018-05-31 10:56:29 来源:拂晓杂谈
摘要:本文中介绍的故障恢复主要是只单机存储系统中的故障恢复,就是只有一台电脑,与之相对的是分布式存储系统,暂且不谈。
关键词:
单机
存储
一、故障与恢复
本文中介绍的故障恢复主要是只单机存储系统中的故障恢复,就是只有一台电脑,与之相对的是分布式存储系统,暂且不谈。
所谓故障,就是指电脑中途突然挂掉,死机,断电等等。
所谓恢复,主要是恢复内存中的数据,而不是硬盘上的,因为硬盘上的数据是持久化的,而内存中的数据是易失的。恢复主要通过日志来进行恢复。
二、日志
日志主要分为两种类型。undo日志和redo日志。日志记录的最小单位是事务,因为事务是原子性的,一个事务中可能会包含多个操作,一个事务中的操作要么全部执行成功,要不全部执行失败。对于每个事务,都会记录日志。undo日志记录的是事务更改前的状态,而redo日志记录的是事务更改后的状态。
举个例子:X最初的值是5,你要在一个事务里将X的值更改为10。那么undo日志会记录事务修改前的状态<X,5>,而redo日志会记录事务更改之后的状态,<X,10>。
操作系统会在内存中执行事务,并且将内存中的数据定期刷到磁盘中,从而实现将随机写转化为顺序写。
三、redo日志
重点讲一下redo日志。它记录的是事务修改后的状态。redo日志记录的顺序是这样的:
将redo日志以追加的方式写到磁盘的日志文件中
将redo日志记录的操作在内存中进行真正的执行
返回操作成功或者失败。
需要注意的点,是对于redo日志来说,是要先将日志写到磁盘中,才能去内存中执行修改。这个顺序不能颠倒。当电脑故障的时候,内存中的东西,比如X的值会丢失,但是X得值在日志中是有记录的,日志又是被写到磁盘上的,断电不会丢失,所以可以通过读取redo日志成功找回X的值,将其在内存中进行恢复。
四、redo操作的优化
我们来看一下redo操作,对于每一个事务,当事务在内存中被真正执行之前,都要先往磁盘里写redo日志,但是,写磁盘这个行为代价是很高的,并且如果同时有大量的事务要执行,每次都要写磁盘,那么会带来较差的性能。
这里就要分情况了,对于一致性要求高的应用,应该保证每一个事务开始前,redo日志立刻刷入磁盘。但是对于一致性要求不高的应用,则可以先将redo日志在内存的缓冲区中先进行缓存,等到一定的时间(如10ms)或者一定的大小(512KB)之后再定期刷入磁盘,这种优化方式被称为成组提交,这样就会提高系统吞吐量。但是这样做的缺点,是如果发生故障,被缓存在内存中的一些redo日志也会丢失,所以可能会丢失部分操作。另外,会牺牲写事务的时延,因为提交的写事务并不是立刻执行,要先等足够的redo日志被刷到磁盘才会开始执行。
五、checkpoint 检查点
除了内存中缓存的redo日志要被定期刷入磁盘外,内存中的数据也要被定期刷入磁盘,每当内存中的一组数据被刷入磁盘后,需要记录日志的回放点,以后的故障恢复只需要redo回放点后边的日志即可,回放点之前的日志不需要被redo了,因为相关数据已经被刷入磁盘,不会丢失。当内存中的数据被刷入磁盘后,会在磁盘上形成一个checkpoint文件,文件中有记录的日志回放点。
第三十四届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。