楼主: houxp666

etl增量刷新业务系统数据的方案选择问题

[复制链接]
论坛徽章:
3
生肖徽章2007版:猴
日期:2008-01-02 17:35:53生肖徽章2007版:鼠
日期:2008-01-02 17:35:532012新春纪念徽章
日期:2012-01-04 11:50:44
11#
 楼主| 发表于 2012-7-2 18:16 | 只看该作者
piliskys 发表于 2012-6-27 09:13
能用物化视图日志就很好解决了,分清楚哪个步骤解决哪个问题就行了

按照你前几天给我说的利用快照日志的这个思路做了一些测试,觉得这个思路就是CDC,比较复杂

使用道具 举报

回复
论坛徽章:
3
2012新春纪念徽章
日期:2012-01-04 11:50:44鲜花蛋
日期:2012-01-31 22:23:392013年新春福章
日期:2013-02-25 14:51:24
12#
发表于 2012-7-8 11:34 | 只看该作者
"2.时间戳方式。这个也对业务系统有侵入,而且要维护这个时间戳,这怕得修改程序,这也不现实的,没人去给我修改这么多程序。"
难道业务系统 没有数据插入时间、数据修改时间么?

使用道具 举报

回复
论坛徽章:
3
2012新春纪念徽章
日期:2012-01-04 11:50:44鲜花蛋
日期:2012-01-31 22:23:392013年新春福章
日期:2013-02-25 14:51:24
13#
发表于 2012-7-8 11:36 | 只看该作者
1.性能太烂。insert/update的性能现在最快到300,很难再提高,最后一个步骤update性能更差,多个转换同时跑时,还有少于10条每秒的,性能受不了。
请考虑能否增加索引么?
以前我遇到过,16w数据,没增加索引非常慢,增加了索引后。。哼哼。。

使用道具 举报

回复
论坛徽章:
15
ITPUB9周年纪念徽章
日期:2010-10-08 09:32:27马上有房
日期:2014-04-04 19:42:43马上有对象
日期:2014-02-18 16:44:082014年新春福章
日期:2014-02-18 16:44:08本田
日期:2014-01-16 21:44:06大众
日期:2013-12-14 09:29:562013年新春福章
日期:2013-02-25 14:51:24ITPUB 11周年纪念徽章
日期:2012-10-09 18:14:48奥运会纪念徽章:射箭
日期:2012-07-26 13:53:55奥运会纪念徽章:跆拳道
日期:2012-07-13 13:54:19
14#
发表于 2012-7-8 20:34 | 只看该作者
业务系统数据分布在各地还是集中的?

使用道具 举报

回复
论坛徽章:
3
生肖徽章2007版:猴
日期:2008-01-02 17:35:53生肖徽章2007版:鼠
日期:2008-01-02 17:35:532012新春纪念徽章
日期:2012-01-04 11:50:44
15#
 楼主| 发表于 2012-7-9 08:47 | 只看该作者
squall3128 发表于 2012-7-8 11:34
"2.时间戳方式。这个也对业务系统有侵入,而且要维护这个时间戳,这怕得修改程序,这也不现实的,没人去给我 ...

业务系统里,有的表根本就没有时间这个字段,仔细的分析,没有时间的表,也都可以跟随主表的时间,最多是数据重复传。时间戳这个方案,应该是可以的,只是要处理没有时间字段的表,让他跟着主表用关联,这就很麻烦了。

使用道具 举报

回复
论坛徽章:
3
生肖徽章2007版:猴
日期:2008-01-02 17:35:53生肖徽章2007版:鼠
日期:2008-01-02 17:35:532012新春纪念徽章
日期:2012-01-04 11:50:44
16#
 楼主| 发表于 2012-7-9 08:48 | 只看该作者
squall3128 发表于 2012-7-8 11:36
1.性能太烂。insert/update的性能现在最快到300,很难再提高,最后一个步骤update性能更差,多个转换同时跑 ...

insert/update增加索引确实是快点,但是,我的反复测试,也只是快到300多,不能上1千这个我都不能接受。

使用道具 举报

回复
论坛徽章:
3
生肖徽章2007版:猴
日期:2008-01-02 17:35:53生肖徽章2007版:鼠
日期:2008-01-02 17:35:532012新春纪念徽章
日期:2012-01-04 11:50:44
17#
 楼主| 发表于 2012-7-9 08:48 | 只看该作者
gszoracle 发表于 2012-7-8 20:34
业务系统数据分布在各地还是集中的?

分布的点很多,上千个

使用道具 举报

回复
论坛徽章:
15
ITPUB9周年纪念徽章
日期:2010-10-08 09:32:27马上有房
日期:2014-04-04 19:42:43马上有对象
日期:2014-02-18 16:44:082014年新春福章
日期:2014-02-18 16:44:08本田
日期:2014-01-16 21:44:06大众
日期:2013-12-14 09:29:562013年新春福章
日期:2013-02-25 14:51:24ITPUB 11周年纪念徽章
日期:2012-10-09 18:14:48奥运会纪念徽章:射箭
日期:2012-07-26 13:53:55奥运会纪念徽章:跆拳道
日期:2012-07-13 13:54:19
18#
发表于 2012-7-9 12:45 | 只看该作者
本帖最后由 gszoracle 于 2012-7-9 12:45 编辑
houxp666 发表于 2012-7-9 08:48
分布的点很多,上千个


这怎么管?
还不如把业务系统先集中起来更有效

使用道具 举报

回复
论坛徽章:
1
ITPUB 11周年纪念徽章
日期:2012-10-09 18:08:15
19#
发表于 2012-10-4 10:35 | 只看该作者
CDC为什么不靠谱?或者用GoldenGate啊。

使用道具 举报

回复
招聘 : 数据挖掘工程师
论坛徽章:
0
20#
发表于 2012-12-10 12:42 | 只看该作者
CDC我部署过Autolog模式的,archivelog多的时候,加载归档的sequence#每次需要重建build 生成fst_SCN。类似于MV_LOG

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表