楼主: feng_yz

[精华] IBM590+DS8100+SAP 有超高的I/O Wait

[复制链接]
论坛徽章:
59
狮子座
日期:2016-03-26 13:35:402013年新春福章
日期:2013-02-25 14:51:24双黄蛋
日期:2013-02-25 11:06:15ITPUB 11周年纪念徽章
日期:2012-10-09 18:06:20灰彻蛋
日期:2012-04-25 13:19:33紫蛋头
日期:2012-03-14 11:16:09最佳人气徽章
日期:2012-03-13 17:39:18玉石琵琶
日期:2012-02-21 15:04:38鲜花蛋
日期:2011-11-30 14:13:01ITPUB十周年纪念徽章
日期:2011-11-01 16:21:15
41#
发表于 2007-12-26 22:54 | 只看该作者
好贴就要学习

使用道具 举报

回复
招聘 : Java研发
论坛徽章:
71
马上加薪
日期:2014-02-19 11:55:14蜘蛛蛋
日期:2012-12-26 18:16:01茶鸡蛋
日期:2012-11-16 08:12:48ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:07奥运会纪念徽章:网球
日期:2012-08-23 14:58:08奥运会纪念徽章:沙滩排球
日期:2012-07-19 17:28:14版主2段
日期:2012-07-07 02:21:02咸鸭蛋
日期:2012-03-23 18:17:482012新春纪念徽章
日期:2012-02-13 15:13:512012新春纪念徽章
日期:2012-02-13 15:13:51
42#
发表于 2007-12-26 23:27 | 只看该作者
原帖由 feng_yz 于 2007-12-26 22:21 发表

这些参数是SAP 推荐要设置的,具体的原因要参考SAP的相关note.

OLTP系统?从report看起来又不像

[ 本帖最后由 anlinew 于 2007-12-26 23:30 编辑 ]

使用道具 举报

回复
论坛徽章:
0
43#
 楼主| 发表于 2007-12-27 08:17 | 只看该作者
原帖由 anlinew 于 2007-12-26 23:27 发表

OLTP系统?从report看起来又不像

是OLTP ....

使用道具 举报

回复
招聘 : Java研发
论坛徽章:
71
马上加薪
日期:2014-02-19 11:55:14蜘蛛蛋
日期:2012-12-26 18:16:01茶鸡蛋
日期:2012-11-16 08:12:48ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:07奥运会纪念徽章:网球
日期:2012-08-23 14:58:08奥运会纪念徽章:沙滩排球
日期:2012-07-19 17:28:14版主2段
日期:2012-07-07 02:21:02咸鸭蛋
日期:2012-03-23 18:17:482012新春纪念徽章
日期:2012-02-13 15:13:512012新春纪念徽章
日期:2012-02-13 15:13:51
44#
发表于 2007-12-27 09:00 | 只看该作者
原帖由 feng_yz 于 2007-12-27 08:17 发表

是OLTP ....

top sql里很多sql都不是sap基本产品的吧,也不像是OLTP业务

比如:
    2,418,789            1    2,418,789.0    1.7    41.61   1057.87 1813408425
Module: ZIEIP0011
SELECT T_01 . "MATNR" , T_01 . "WERKS" , T_01 . "BWART" , T_01 .
"LGORT" , T_01 . "BUKRS" , T_01 . "MEINS" , T_01 . "MENGE" , T_
01 . "SHKZG" , T_02 . "MTART" , T_00 . "MBLNR" , T_00 . "MJAHR"
, T_00 . "BUDAT" , T_01 . "CHARG" FROM "MKPF" T_00 , "MSEG" T_01
, "MARA" T_02 WHERE ( T_01 . "MANDT" = :A0 AND T_00 . "MBLNR" =

9,034,144           16      564,634.0    6.2   238.91   1854.79 4065876404
Module: ZMMRT0024
SELECT T_00 . "MATNR" , T_00 . "LGORT" , T_00 . "WERKS" , T_00 .
"LABST" FROM "MARD" T_00 , "MARA" T_01 WHERE ( T_01 . "MANDT" =
:A0 AND T_00 . "MATNR" = T_01 . "MATNR" ) AND T_00 . "MANDT" =
:A1 AND T_00 . "WERKS" = :A2 AND T_00 . "LGORT" = :A3

很奇怪你的系统不缓慢,从report看很多业务都是1分钟甚至10几分钟才能执行完的

[ 本帖最后由 anlinew 于 2007-12-27 09:03 编辑 ]

使用道具 举报

回复
论坛徽章:
86
ITPUB元老
日期:2005-02-28 12:57:002012新春纪念徽章
日期:2012-01-04 11:49:542012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:202012新春纪念徽章
日期:2012-02-13 15:13:20咸鸭蛋
日期:2012-05-08 10:27:19版主8段
日期:2012-05-15 15:24:112013年新春福章
日期:2013-02-25 14:51:24
45#
发表于 2007-12-27 09:06 | 只看该作者
这种通用的系统,要想从 sql 上下工夫可行性很小,比如 SAP \ oracle EBS \ people soft \ IBM RPM 等等  具备通用性由的系统,包括 用友和金碟我想对于客户来说情况应该差不多。

有时候一个用户登陆或者点击操作,要执行上百条sql…… 因为很多东西都是配置好的,有的界面上按钮都是根据配置生成出来的…… 所以tuning sql的可行性比较小。这种系统往往对硬件资源的要求非常高,不过整体上来说,系统在硬件上的投入也不过是比较小比例的一块。

使用道具 举报

回复
论坛徽章:
13
数据库板块每日发贴之星
日期:2007-09-20 01:04:22铁扇公主
日期:2012-02-21 15:02:402010新春纪念徽章
日期:2010-03-01 11:08:28月度精华徽章
日期:2009-04-01 02:15:18数据库板块每日发贴之星
日期:2008-05-17 01:02:08生肖徽章2007版:兔
日期:2008-04-07 19:49:48生肖徽章2007版:鼠
日期:2008-01-02 17:35:53生肖徽章2007版:鸡
日期:2008-01-02 17:35:53ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44数据库板块每日发贴之星
日期:2007-10-20 01:03:31
46#
发表于 2007-12-27 09:07 | 只看该作者
原帖由 biti_rainy 于 2007-12-26 09:22 发表
你存储有多少 cache 多少磁盘?  cache 命中率太低,是不是应用和db 在一台机器上跑的,db_cache_size 是否可以增加?

看 小io响应在2ms, 整体iops 有1w9 以上,看起来算是不错的响应了。
前台io wait 显示高未必是严重异常,有可能说明cpu 除了等io外并没有其他事情好做。




小io响应在2ms, 整体iops 有1w9 以上。
请教一下,这两个是怎么看出来的?

使用道具 举报

回复
论坛徽章:
131
2006年度最佳技术回答
日期:2007-01-24 12:58:48福特
日期:2013-10-24 13:57:422014年新春福章
日期:2014-02-18 16:41:11马上有车
日期:2014-02-18 16:41:11马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:14马上加薪
日期:2014-02-19 11:55:142013年新春福章
日期:2013-02-25 14:51:24
47#
发表于 2007-12-27 09:14 | 只看该作者
IOPS 看起来很高的原因在于 OS file system cache.

可以这么看:

DB Logical read  

||
\/

(Not found in DB cache) ==> 反映为 db hit ratio ,跟db_cache_size相关,本例为12G
DB Physical read ==> 本例中Random IO反应时间(db file sequntial read average wait time )为2ms

||
\/

(Not found in OS cache, or use raw device , direct IO ) ==> 反映为file system cache hit ratio, 跟用作file cache的OS memory相关,本例中高达64G-18G(SGA)-4G(PGA)-2G(系统开销)-0G(看到的free memory)=40G
Storage IO

||
\/

(Not found in Storage cache) ==>反映为 Storage cache hit ratio, 跟Storage cache size有关
Disk IO

||
\/

(Not found in Disk cache)
磁道IO ==> 这个Random IO反应时间通常为大约 7ms (Average seek time + latency time)



所以,从DB看到的接近1W多 IOPS,并没有真正反映到底层Disks上,而是很大一部分被“file system cache hit ”给吃掉了。
这也是为什么很多statspack显示的Random IO反应时间(db file sequntial read average wait time ) 会很明显低于disk io 反应时间 (Average seek time + latency time).



原帖由 Fenng 于 2007-12-26 21:12 发表
这么几块 10K 转的硬盘能跑到 将近 20000 个 IOPS , 已经发挥到刘翔奥运会跨栏的表现水平了

不知道平均负载如何

这 DB 主要是                Transactions:                  5.70 太小了, 否则的话, 事务多一点, 这么大的 IO 早翘了

使用道具 举报

回复
招聘 : Java研发
论坛徽章:
71
马上加薪
日期:2014-02-19 11:55:14蜘蛛蛋
日期:2012-12-26 18:16:01茶鸡蛋
日期:2012-11-16 08:12:48ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:07奥运会纪念徽章:网球
日期:2012-08-23 14:58:08奥运会纪念徽章:沙滩排球
日期:2012-07-19 17:28:14版主2段
日期:2012-07-07 02:21:02咸鸭蛋
日期:2012-03-23 18:17:482012新春纪念徽章
日期:2012-02-13 15:13:512012新春纪念徽章
日期:2012-02-13 15:13:51
48#
发表于 2007-12-27 09:15 | 只看该作者
原帖由 biti_rainy 于 2007-12-27 09:06 发表
这种通用的系统,要想从 sql 上下工夫可行性很小,比如 SAP \ oracle EBS \ people soft \ IBM RPM 等等  具备通用性由的系统,包括 用友和金碟我想对于客户来说情况应该差不多。

有时候一个用户登陆或者点击操作,要执行上百条sql…… 因为很多东西都是配置好的,有的界面上按钮都是根据配置生成出来的…… 所以tuning sql的可行性比较小。这种系统往往对硬件资源的要求非常高,不过整体上来说,系统在硬件上的投入也不过是比较小比例的一块。

topsql 里大多数sql可能都不是标准SAP的,如果是,也是必须要tuning的

使用道具 举报

回复
招聘 : Java研发
论坛徽章:
71
马上加薪
日期:2014-02-19 11:55:14蜘蛛蛋
日期:2012-12-26 18:16:01茶鸡蛋
日期:2012-11-16 08:12:48ITPUB 11周年纪念徽章
日期:2012-10-09 18:05:07奥运会纪念徽章:网球
日期:2012-08-23 14:58:08奥运会纪念徽章:沙滩排球
日期:2012-07-19 17:28:14版主2段
日期:2012-07-07 02:21:02咸鸭蛋
日期:2012-03-23 18:17:482012新春纪念徽章
日期:2012-02-13 15:13:512012新春纪念徽章
日期:2012-02-13 15:13:51
49#
发表于 2007-12-27 09:21 | 只看该作者
原帖由 anlinew 于 2007-12-26 21:00 发表
SAP这样的系统不知道处于什么考虑要这么设置参数:
_optim_peek_user_binds        FALSE
_optimizer_join_sel_sanity_ch TRUE
_optimizer_or_expansion       DEPTH
_push_join_predicate          FALSE
_sort_elimination_cost_ratio  10
db_file_multiblock_read_count 8
hash_join_enabled             FALSE
optimizer_index_cost_adj      10

还不如干脆就RBO呢

这样的设置会严重倾向于使用index 以及NLJ,比RBO更甚,对于纯OLTP系统当然无所谓
一旦系统里有一些需要访问较多数据的查询,如report里的top sql ,其直接的后果可能就是大量的db file sequential read wait产生

使用道具 举报

回复
论坛徽章:
0
50#
 楼主| 发表于 2007-12-27 09:25 | 只看该作者
原帖由 anlinew 于 2007-12-27 09:15 发表

topsql 里大多数sql可能都不是标准SAP的,如果是,也是必须要tuning的

确实是这样的,Module: Z*** 这些程序都是我们自己开发的,性能较差,有可优化的空间。
因为有些report要跑好几个月的资料,所以时间长点用户能接受,整体看系统并不慢。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表