123
返回列表 发新帖
楼主: houxp666

etl增量刷新业务系统数据的方案选择问题

[复制链接]
论坛徽章:
47
2011新春纪念徽章
日期:2011-01-04 10:24:02奥迪
日期:2013-11-09 23:09:27保时捷
日期:2013-10-15 20:14:48阿斯顿马丁
日期:2013-10-12 09:11:59三菱
日期:2013-09-14 16:45:56雪铁龙
日期:2013-08-21 12:50:25马自达
日期:2013-08-14 12:51:35ITPUB社区千里马徽章
日期:2013-06-09 10:15:34蓝锆石
日期:2013-04-12 00:10:42劳斯莱斯
日期:2013-11-09 23:09:27
21#
发表于 2012-12-13 16:07 | 只看该作者
houxp666 发表于 2012-7-9 08:47
业务系统里,有的表根本就没有时间这个字段,仔细的分析,没有时间的表,也都可以跟随主表的时间,最多是 ...

从业务上来讲,主从表的数据同步本来就应该一同进行。
是否可以采用增量同步,和表的业务情况也有关系,一些快照表,可能本身就应该每次全量截取快照,不应该去强行做增量。况且从你描述来看,每个县市的表数据量也不大。
除了时间戳、日志榨取、CDC或触发器,增量抽取还有一种方案是做全表比对,也可以尝试一下。

另外,我也用过kettle,效率没你说的那么低吧?尽量使用数据库自身脚本去处理业务逻辑,少用kettle自带的组件。比如你的insert/update组件,完全可以通过sql脚本组建中编写oracle merge into的语句实现,效率肯定提高不少。

使用道具 举报

回复
论坛徽章:
168
马上加薪
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:10:582012新春纪念徽章
日期:2012-01-04 11:49:54蜘蛛蛋
日期:2011-12-05 16:08:56ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41设计板块每日发贴之星
日期:2011-07-22 01:01:02ITPUB官方微博粉丝徽章
日期:2011-06-30 12:30:16管理团队成员
日期:2011-05-07 01:45:082011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:33
22#
发表于 2012-12-24 14:05 | 只看该作者
kettle没有楼主说的这么不济吧?
把kettle的方案摆出来讨论讨论?

使用道具 举报

回复
论坛徽章:
10
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44祖国60周年纪念徽章
日期:2009-10-09 08:28:002009新春纪念徽章
日期:2009-01-04 14:52:28奥运会纪念徽章:沙滩排球
日期:2008-10-24 13:14:46奥运会纪念徽章:举重
日期:2008-08-09 07:34:41奥运会纪念徽章:沙滩排球
日期:2008-07-27 20:48:01奥运会纪念徽章:皮划艇激流回旋
日期:2008-07-22 19:31:45奥运会纪念徽章:拳击
日期:2008-07-19 16:09:472008新春纪念徽章
日期:2008-02-13 12:43:032010年世界杯参赛球队:斯洛伐克
日期:2010-06-13 00:10:04
23#
发表于 2012-12-29 07:03 | 只看该作者
这个问题我痛苦了一年多,考虑的几个问题:
1 源表数据删除情况
2 源表主键有多个字段,当用户更新其中一个字段的时候(cdc解决不了这个问题)
3 确保BI系统的ods表和业务系统一致
我公司用cdc,10g的版本,但是维护工作量太麻烦了,当某个表新加字段的时候很麻烦。反正现在不用cdc了,
在业务系统新建一个用户,里面建立一套业务系统一致的表,每个表只放主键和时间戳记录,好处:
1 解决了上面的两个问题
2 能恢复业务系统没有时间错的缺陷,方便业务系统维护人员查询记录写入更新时间
3 就算对性能有影响,但是不至于影响业务的程度

使用道具 举报

回复
论坛徽章:
3
生肖徽章2007版:猴
日期:2008-01-02 17:35:53生肖徽章2007版:鼠
日期:2008-01-02 17:35:532012新春纪念徽章
日期:2012-01-04 11:50:44
24#
 楼主| 发表于 2013-1-4 09:11 | 只看该作者
hjinhe 发表于 2012-12-29 07:03
这个问题我痛苦了一年多,考虑的几个问题:
1 源表数据删除情况
2 源表主键有多个字段,当用户更新其中一 ...

谢谢你的方案。可否进一步说一下这个新用户的数据是如何维护的,用触发器还是修改程序,以维护时间戳和数据的变动?

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表