查看: 30923|回复: 63

[精华] 深入oracle log buffer发展史

[复制链接]
论坛徽章:
21
奔驰
日期:2013-08-06 15:23:05日产
日期:2013-08-07 22:56:38蜘蛛蛋
日期:2012-12-29 19:15:08奥迪
日期:2013-08-07 17:02:24数据库板块每日发贴之星
日期:2010-06-28 01:01:03奥迪
日期:2013-08-13 10:10:28本田
日期:2013-11-20 15:17:02优秀写手
日期:2013-12-18 09:29:08玉兔
日期:2014-03-04 16:47:17铁扇公主
日期:2012-02-21 15:02:40
跳转到指定楼层
1#
发表于 2013-7-17 15:16 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 wei-xh 于 2013-7-19 16:45 编辑

log buffer在Oracle的各个版本里一共发生过2次重大的改变:
1)多log buffer(redo strands)的出现(9I)
2)private redo和in memory undo的出现(10g)
你可能会补充说,还应该包括12c的多lgwr,是的,这也是一次革命性的改变,但是目前还没有对它有深刻的研究。我们暂时先把目光放回到11G之前。
ORACLE两次log buffer的重大改变,都跟redo allocation latch有着直接性的联系。本文以redo allocation latch切入点,描述log buffer的发展进化史。

由于题目写的比较大,不可能面面俱到,没有做太多细节性的描述。


redo allocation latch存在的问题
既然说是redo allocation latch的问题,那么你可能会问,redo allocation latch出了什么问题,为什么要对它进行改进?
我来给大家一个简单的示例,一目了然的能知道一个小小的redo allocation latch存在什么严重的性能问题:
下面的代码里有一张wxh_tbd的表,表上无索引,我们更新了3条记录。下面的代码中,你只需要关注update的语句,其他的语句都是我采的快照,为了做分析用,你可以简单的把它忽略。
execute snap_latch.start_snap
execute snap_my_stats.start_snap
update wxh_tbd set object_name='t' where rownum<4;
execute snap_latch.end_snap
execute snap_my_stats.end_snap

---------------------------------
Latch waits:-   17-Jul 08:51:59
Interval:-      0 seconds
---------------------------------
Latch                              Gets      Misses     Sp_Get     Sleeps     Im_Gets   Im_Miss Holding Woken Time ms
-----                              ----      ------     ------     ------     -------   ------- ------- ----- -------
redo copy                             0           0          0          0           3         0       0     0      .0
redo allocation                       0           0          0          0           3         0       0     0      .0
Session stats - 17-Jul 09:11:39
Interval:-  0 seconds
---------------------------------
Name                                                                     Value
----                                                                     -----
redo entries                                                                 3
redo size                                                                1,180
非常容易看到,仅仅是修改了3条记录,ORACLE就申请了三次的redo copy latch,redo allocation latch。产生了3个redo entries,也就是3个redo record。
不难分析出每产生一个redo record,oracle就要申请一次redo copy latch+redo allocation latch。
那什么时候会产生一个redo record呢?它由什么组成的呢?
先回答第一个问题:每修改数据块一次!就产生一个redo record。
一般情况下,一个redo recored由一个undo record(用来描述undo的修改)和一个redo change vector(用来描述数据块的修改)组成,如下:
REDO RECORD - Thread:1 RBA: 0x00036f.00000005.008c LEN: 0x00f8 VLD: 0x01
SCN: 0x0000.03ee485a SUBSCN: 1 03/13/2011 17:43:01
CHANGE #1 TYP:0 CLS:36 AFN:2 DBA:0x0080009a SCN:0x0000.03ee485a SEQ: 4 OP:5.1 ---------undo record

CHANGE #2 TYP:0 CLS: 1 AFN:11 DBA:0x02c0018a SCN:0x0000.03ee485a SEQ: 2 OP:11.5--------redo change vector

上面的dump记录里,OP:5.1代表的是undo 块的修改,OP:11.5代表对数据块的修改。还有更多的OP代码,大家可以去参照了解下。


我们的实验里,修改了三次数据块,产生了三个redo record。如果object_name有索引的话,redo copy latch,redo allocation latch的数字至少是9.因为索引的每次update相当于是delete+insert,索引部分至少会增加6次redo copy latch,redo allocation latch的申请。

ORACLE里对于redo copy latch的数量一般是比较多的,依据你的CPU数来决定,缺省是CPU数的两倍(通过隐含参数_log_simultaneous_copies控制)。因此造成竞争的几率很低。
但是对于redo allocation latch来说,在多redo strands出现之前,就只有一把。在一个交易频繁的系统里,势必会造成对redo allocation latch的竞争。

Redo allocation latch有什么用?

毋庸置疑,log buffer是个共享的地方,有很多会话需要在这个空间里为自己的日志分配空间,必须要机制去保证保证会话间彼此的日志不互相覆盖。
ORACLE里是通过redo allocation latch做到的这一点。

看上面的图,我们设定了log buffer 由9个log buffer block组成,典型的,一般一个log buffer block跟磁盘的扇区大小匹配,512字节。SSD之类的固态盘很多已经不是这个扇区大小了。
这里面有2个指针需要特别指出来,一个是start of free space,一个是end of free space。这两个指针的移动靠redo allocation latch去保护。
我们可以举个例子来,这样更容易理解:
session 1,session 2,session 3同时想要在log buffer里分配空间,为了简化我们的场景,我们假设每个SESSION计划分配512字节的空间,也就是刚好是一个log buffer block块的大小。
redo allocation latch被session 1抢到,假如当前的start of free space的位置在块1,那么session 1持有redo allocation latch后,移动start of free space指针到2。然后释放latch。

由于session 2,session 3没有抢到唯一的一把redo allocation latch,它不能去log buffer 里预留空间,只能等待latch释放。
session 1释放latch后,假如session 2获得了,它继续移动start of free space到3,然后释放latch。

通过上面的机制,保证了多个session并发往log buffer分配空间的时候,不会导致日志覆盖。
你可能会问:你怎么没有提到end of free space?
好,我们来说说这个end of free space什么时候会移动。
假如session 2的记录是一个commit record,那么它会触发lgwr写,lgwr刷新完日志后(我们的例子中,会把1,2两个buffer刷到磁盘),移动end of free space到3。
这个时候end of free space和start of free space在位置上是重合的

最后session 3获得了redo allocation latch,移动start of free space到4.




经过前面的描述,相信你基本上明白了redo allocatoin latch为什么面临性能问题:争用严重,以及它存在的价值:保护空间分配。


/************这一块的内容大家了解下就可以,稍微的有点深入*****************************************************************/
在我们真正去看9I出现的redo strands之前,我们可以再看一个稍微深入的实验。这个实验里,仅仅跟我们第一次的实验,多了一个commit
execute snap_latch.start_snap
update wxh_tbd set object_name='t' where rownum<4;
commit;
execute snap_latch.end_snap
---------------------------------
Latch waits:-   17-Jul 11:42:52
Interval:-      0 seconds
---------------------------------
Latch                              Gets      Misses     Sp_Get     Sleeps     Im_Gets   Im_Miss Holding Woken Time ms
-----                              ----      ------     ------     ------     -------   ------- ------- ----- -------
redo copy                             0           0          0          0           4         0       0     0      .0
redo allocation                       3           0          0          0           4         0       0     0      .0
仅仅多了一个commit,redo allocation latch的申请的数量多了4次!!!!!
commit本身产生的redo record要申请一次redo allocation。+1
由于我的环境里有2个redo strands,因此提交的时候,lgwr要获得每个redo strand的redo allocation latch,lgwr此时获取redo allocation latch是为了start of free space指针到当前buffer block的结尾(日志写浪费就是这么产生的) +2
写完日志后,ORACLE要再次获取redo allocation latch,移动end of free space指针到当前写位置处。由于我只有一个redo strand有日志要写(另外一个是空的),所以申请一个redo strand的redo allocation latch。+1
/************这一块的内容大家了解下就可以,稍微的有点深入*****************************************************************/



9I 多log buffer的出现
ORACLE从9I起,有了一个新特性,允许使用多个redo strands,多个redo strands组成一个log buffer。每一个redo strand由一个redo allocation latch保护。这样的话,一定程度上增加的redo分配空间的扩展性。
但是多redo strands的出现,ORACLE需要解决一些棘手的问题,首先就是:事物日志的顺序问题
我们假设现在系统里存在2个redo strands。
1)首先考虑单个SESSION的情况
update xxx set name=1 where rowid=xxx;
update xxx set name=2 where rowid=xxx;
对于同样的rowid,一个事物内修改了2次,最终的结果是name=2。
如果name=1的日志拷贝到了redo strand2,name=2的日志拷贝到了redo strand1。
lgwr刷新日志后,真正写到log里的日志顺序,可能是先更新name=2,再更新name=1。
这样就会导致最终的数据不正确。
如何解决?
ORACLE可以通过会话与固定的redo strand做绑定,保证一个会话产生的redo一定在一个redo strand里就可以了,这点我相信不难做到。
2)我们再看看多个session的情况。
SESSION 1:
update xxx set name=1 where rowid=xxx;
SESSION 2:
update xxx set name=1 where rowid=xxx;
貌似依然会出现我们情况一里的那种问题。但是,但是,真的不会出现。(后面我会又否认不会出现,慢慢看吧)
SESSION1更新成功后,如果不提交,SESSION 2的会话被等待锁,不会产生日志。
如果session 2能够更新成功了,说明SESSION 1一定提交了,提交一定代表日志已经在SESSION 2前持久化到磁盘了。所以,这种情况,SESSION 2的日志一定是落后于SESSION 1到LOG里的。
因此有了ORACLE里的锁做保障,我们可以对这种情况高枕无忧了。
但是?我又要说但是了,ORACLE里存在一些ACID的异常。相信很多人知道这个特性了,但是并不知道,它跟这里说的日志顺序有什么关系。
如果你对于ORACLE的ACID已经非常了解了,下面的一块内容,你直接跳过。


什么是ACID异常?
首先我们需要了解,commit到底做了什么?
事物开始的时候,会先在回滚段段头(undo segment header)的事物表内申请一个slot,并在这个slot内记录下此事物的一些信息:比如事物的状态:活跃/提交,事物当前用的最后一个undo块是哪个(回滚的起点),一共使用了多少undo块等等。
事物结束的时候,也还会在这个slot上登记这个事物已经提交了,并且产生一个commit recored,这个commit recored说白了就是用来描述回滚段头这个slot的改变,最最重要的是描述了事物已经从活跃变为了提交。
事物表的slot一旦标记为提交,也就意味着别的会话能够看到此事物所作的所有修改了。
我们来列下commit后,触发的操作:
1)产生一个redo record去描述对于事物表slot的修改
2)拷贝这个redo record到log buffer
3)应用这个redo recored到对应的undo segment header
4)通知lgwr去写日志
我们要知道,我们在步骤3的时候,别的会话就认为这个事物已经提交了。但是这个时候,日志是还没持久化到磁盘的,会话仅仅是通知了LGWR去写。
步骤3和步骤4之间是有时间差的,虽然这个时间差很小!

OK,我们知道了什么是ACID异常,我们继续我们的问题:
我们再看看多个session的情况。
SESSION 1:
update xxx set name=1 where rowid=xxx;
SESSION 2:
update xxx set name=1 where rowid=xxx;
假如session 1提交了,通知lgwr去写了,但是lgwr在没真正开始工作之前,session 2已经看到session 1释放了锁,它可以产生它的事物日志往redo buffer里拷贝了。
由于ORACLE的GROUP COMMIT特性,LGWR每次都会尽可能多的拷贝BUFFER里的数据。很有可能session 2,session 1的LOG都同时刷新到了磁盘里,而且很可能是乱序的。
世界再一次变乱了,因为ORACLE的锁机制遇到ACID异常后,失灵了!
因此我认为ORACLE在恢复阶段,必须要对日志进行排序来规避这个问题。这里我们并不去探讨这个问题。

我们接着聊我们的主题:redo allocation latch的问题(有时候路走的太远了,就忘记了我们当初为什么出发)。
虽然我们看到ORACLE引入多redo strands后,似乎缓解了redo allocation latch的争用问题。但是解决的不够彻底。仅仅是对redo allocation latch做了非常有限的扩展。很容易看到,大多数的系统里默认的这个strands的数量是2,仅仅是提升了2倍的扩展性。当然这个值你可以设定,但是并不是越大越好。原因很复杂,看情况,可以再写一写这个方面的博客。

10G private redo的出现
如果我们能把一个事物产生的redo一次性的拷贝到log buffer(一次事务只申请一次redo allocation latch),而不是之前的one change=one allocation latch,那么就能极大程度的缓解了redo allocation latch竞争的问题。
ORACLE 10G后引入了private redo和in memory undo,解决了这个问题,之所以说的是解决,而不是彻底解决,是因为新机制的限制比较多。


/************新机制有哪些限制?*****************************************************************/
在你打开辅助日志、FLASHBACK DATABASE特性、事务过大(超过了pool的大小)、RAC,都将不能使用这一特性
/************新机制有哪些限制?*****************************************************************/

private redo,in memory undo本质上就是在内存里开辟出一块区域用来临时存放会话的私有日志,等提交的时候,一次性的刷入到公共的log buffer里。
这些私有区域由许多的private redo  pool,in memory undo pool组成,在64位系统上,每个pool都接近128K的大小,这些pool用来临时存放会话的日志:数据块的redo放入private redo pool中,undo块的redo放入in memory undo pool中。
在private redo和in memory undo机制下,我们文章刚开始的一个update流程,可以用如下顺序表示:
update wxh_tbd set object_name='t' where rownum<4;
1)首先获取一对私有的memory pool:private redo pool,in memory undo pool
2)标记每一个修改的块有private redo
3)把产生的undo change vector写入in memory undo pool
4)把产生的redo change vector写入private redo pool
5)事物提交的时候,把2个pool里的change vector结合成一个大的redo record
6)拷贝这个record到公有的redo buffer里,并且应用这个record到对应的数据块和undo块。
从上面的流程描述可以知道:

1)一个事物的所有的change vector在提交的时刻从私有memory结合成一个大的redo record拷贝到公有的redo buffer里,只需要申请一次redo allocation latch。
大大的降低了redo allocation latch的申请数。

2)数据块、undo块只有在最后事务提交的时刻,才去应用日志改变。
其实在上面的描述中,为了简化,故意漏掉了一些细节:
1)每个private redo pool是由私有的redo allocation latch来保护的,每次事务期间,会话只需要申请一次私有的redo allocation latch就可以了,个人认为ORACLE将会话与私有redo pool做了绑定,比如在PGA里留一个指针或者描述符来指向这个redo pool。会话获得私有redo allocation latch后,标记一下这个私有pool已被使用,告诉别的会话不要再来使用这个pool。
2)每个in memory undo pool是由in memory undo latch来保护的,对于这个latch的申请要频繁一些,每一条undo record都要申请一次in memory undo latch。貌似ORACLE仅仅是把竞争从redo allocation latch变为了in memory undo latch的竞争,但是事实并不是这样,因为in memory undo latch的数量是很多的,每个pool都对应了一个in memory undo latch。
3)我的描述中说,直到事务提交,否则ORACLE不会去应用日志到任何的数据块和UNDO块。但是对于UNDO段头的事物表是个特殊,每次事务开始前,都必须要修改这个slot。
我们可以重新梳理一下update流程:
1)首先获取一对私有的memory pool:private redo pool,in memory undo pool。private redo pool的使用要获取私有的redo allocation latch,获取后,标记此pool被使用,释放latch。in memory undo pool的使用要获取in memory undo latch,每次有undo change vector产生都要持有in memory undo latch。
2)在undo段头的slot中,记录事务已经开始,以及相关信息

3)标记每一个修改的块有private redo(但是并不真正的修改数据块)
3)把产生的undo change vector写入in memory undo pool
4)把产生的redo change vector写入private redo pool
5)事物提交的时候,把2个pool里的change vector结合成一个大的redo record
6)拷贝这个record到公有的redo buffer里,并且应用这个record到对应的数据块和undo块。


虽然文章很长,但是由于牵扯的知识面较广,限于文章篇幅,有些细节并没有做过多的描述。里面很多的内容都可以单独再拉出来讨论。



论坛徽章:
0
2#
发表于 2013-7-17 15:25 | 只看该作者
沙发?

使用道具 举报

回复
论坛徽章:
0
3#
发表于 2013-7-17 15:30 | 只看该作者
围观精华帖

使用道具 举报

回复
论坛徽章:
24
技术图书徽章
日期:2013-08-16 14:31:52问答徽章
日期:2013-11-04 08:53:14目光如炬
日期:2013-12-23 06:00:11目光如炬
日期:2013-12-30 06:00:11明星写手
日期:2014-02-22 06:00:12马上有钱
日期:2014-03-31 14:09:05沸羊羊
日期:2015-05-20 12:42:59秀才
日期:2015-06-24 13:05:36秀才
日期:2015-07-13 09:48:14
4#
发表于 2013-7-17 16:09 | 只看该作者
很厉害啊。膜拜

使用道具 举报

回复
论坛徽章:
0
5#
发表于 2013-7-17 16:39 | 只看该作者
写的好深入啊,什么是group commit,楼主能解释一下吗?

使用道具 举报

回复
论坛徽章:
21
奔驰
日期:2013-08-06 15:23:05日产
日期:2013-08-07 22:56:38蜘蛛蛋
日期:2012-12-29 19:15:08奥迪
日期:2013-08-07 17:02:24数据库板块每日发贴之星
日期:2010-06-28 01:01:03奥迪
日期:2013-08-13 10:10:28本田
日期:2013-11-20 15:17:02优秀写手
日期:2013-12-18 09:29:08玉兔
日期:2014-03-04 16:47:17铁扇公主
日期:2012-02-21 15:02:40
6#
 楼主| 发表于 2013-7-17 17:04 | 只看该作者

使用道具 举报

回复
论坛徽章:
21
奔驰
日期:2013-08-06 15:23:05日产
日期:2013-08-07 22:56:38蜘蛛蛋
日期:2012-12-29 19:15:08奥迪
日期:2013-08-07 17:02:24数据库板块每日发贴之星
日期:2010-06-28 01:01:03奥迪
日期:2013-08-13 10:10:28本田
日期:2013-11-20 15:17:02优秀写手
日期:2013-12-18 09:29:08玉兔
日期:2014-03-04 16:47:17铁扇公主
日期:2012-02-21 15:02:40
7#
 楼主| 发表于 2013-7-17 17:05 | 只看该作者
失落的孤球 发表于 2013-7-17 16:39
写的好深入啊,什么是group commit,楼主能解释一下吗?

参考:http://space.itpub.net/22034023/viewspace-733280,关于group commit的

使用道具 举报

回复
论坛徽章:
8
2010广州亚运会纪念徽章:板球
日期:2011-04-15 13:42:532010广州亚运会纪念徽章:自行车
日期:2011-05-19 10:31:22鲜花蛋
日期:2011-08-02 14:29:02鲜花蛋
日期:2011-08-03 11:52:52ITPUB十周年纪念徽章
日期:2011-11-01 16:25:22鲜花蛋
日期:2012-04-24 13:27:35蜘蛛蛋
日期:2012-05-16 16:47:09优秀写手
日期:2013-12-18 09:29:11
8#
发表于 2013-7-17 17:37 | 只看该作者
很深入啊,Mark!

使用道具 举报

回复
论坛徽章:
226
BLOG每日发帖之星
日期:2010-02-11 01:01:06紫蛋头
日期:2013-01-12 23:45:222013年新春福章
日期:2013-02-25 14:51:24问答徽章
日期:2013-10-17 18:06:40优秀写手
日期:2013-12-18 09:29:10马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:14
9#
发表于 2013-7-17 17:42 | 只看该作者
每次看wei-xh的帖子,都是一次学习的过程。
PUB里面这种技术帖太少了

使用道具 举报

回复
论坛徽章:
21
奔驰
日期:2013-08-06 15:23:05日产
日期:2013-08-07 22:56:38蜘蛛蛋
日期:2012-12-29 19:15:08奥迪
日期:2013-08-07 17:02:24数据库板块每日发贴之星
日期:2010-06-28 01:01:03奥迪
日期:2013-08-13 10:10:28本田
日期:2013-11-20 15:17:02优秀写手
日期:2013-12-18 09:29:08玉兔
日期:2014-03-04 16:47:17铁扇公主
日期:2012-02-21 15:02:40
10#
 楼主| 发表于 2013-7-17 17:46 | 只看该作者
yangtingkun 发表于 2013-7-17 17:42
每次看wei-xh的帖子,都是一次学习的过程。
PUB里面这种技术帖太少了

能得到老杨的认可,值了!!!!

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表