12
返回列表 发新帖
楼主: sweetwow

(基于时间戳方式的ETL)2个大表的对比

[复制链接]
论坛徽章:
5
ITPUB9周年纪念徽章
日期:2010-10-08 09:34:02ITPUB 11周年纪念徽章
日期:2012-10-09 18:08:152013年新春福章
日期:2013-02-25 14:51:24蛋疼蛋
日期:2013-06-25 16:06:32咸鸭蛋
日期:2013-06-26 00:05:05
11#
 楼主| 发表于 2012-12-24 15:30 | 只看该作者
husthxd 发表于 2012-12-24 15:23
目前在使用kettle,处理方式是通过对比增量更新的机制,输入是新旧两个数据源,通过关键字进行数据值比对 ...

恩 这个跟我现在用的甲方找人开发的工具差不多
这个工具是完全pl/sql的
有功夫我要好好研究一下

使用道具 举报

回复
论坛徽章:
5
ITPUB9周年纪念徽章
日期:2010-10-08 09:34:02ITPUB 11周年纪念徽章
日期:2012-10-09 18:08:152013年新春福章
日期:2013-02-25 14:51:24蛋疼蛋
日期:2013-06-25 16:06:32咸鸭蛋
日期:2013-06-26 00:05:05
12#
 楼主| 发表于 2012-12-24 15:31 | 只看该作者
starhot 发表于 2012-12-24 15:26
Steps of Solution1:
1. 分区--基于业务创建
2. 创建中间表,存储ERP表的PK字段,基于PK的范围值进行并行l ...

Steps of Solution1 - 这个很好

创建针对删除的Trigger基于ERP表 - 这个不太现实

使用道具 举报

回复
论坛徽章:
35
ITPUB9周年纪念徽章
日期:2010-10-08 09:32:25劳斯莱斯
日期:2013-11-04 15:42:11奥迪
日期:2013-11-04 15:42:11福特
日期:2013-11-04 15:42:11比亚迪
日期:2013-11-02 11:33:55法拉利
日期:2013-11-10 17:40:262014年新春福章
日期:2014-02-18 16:41:11马上有车
日期:2014-02-18 16:41:11马上有对象
日期:2014-03-06 14:09:44马上有房
日期:2014-05-06 18:40:39
13#
发表于 2012-12-24 15:39 | 只看该作者
sweetwow 发表于 2012-12-24 15:31
Steps of Solution1 - 这个很好

创建针对删除的Trigger基于ERP表 - 这个不太现实

如果你的记录量很大,如果经常采用方案1进行数据清理动作,比如每天一次,那么你就不一定会认为方案会很好,方案2固然实现周期长,但如果每天即便你做多次数据清理动作,也不会耗费很多时间。

同时,针对方案1,你可以考虑如果你能保证在某段时间以前的记录会产生Delete的动作,那边你可以将这部分的数据在staging表和DW表时就不用考虑,这样也会增加处理的性能。

个人认为:很多ETL for DW的方案都是要参考业务进行设计的,同时结合DB的分区,并行等技术,这样会有意想不到的效果。

使用道具 举报

回复
论坛徽章:
168
马上加薪
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:10:582012新春纪念徽章
日期:2012-01-04 11:49:54蜘蛛蛋
日期:2011-12-05 16:08:56ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41设计板块每日发贴之星
日期:2011-07-22 01:01:02ITPUB官方微博粉丝徽章
日期:2011-06-30 12:30:16管理团队成员
日期:2011-05-07 01:45:082011新春纪念徽章
日期:2011-01-25 15:42:562011新春纪念徽章
日期:2011-01-25 15:42:33
14#
发表于 2012-12-24 15:39 | 只看该作者
sweetwow 发表于 2012-12-24 15:30
恩 这个跟我现在用的甲方找人开发的工具差不多
这个工具是完全pl/sql的
有功夫我要好好研究一下

输入的流是经过排序的,类似于merge join的方式。
性能方面,在普通的pc机上,大概是5w/min。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表