ITPUB??ì3
新一届的微软MVP评选已经开始,欢迎各位推荐!
ITPUB论坛 » 数据仓库与数据挖掘 » 大家ETL都用哪些工具比较多?

标题: 大家ETL都用哪些工具比较多?
离线 owlstudio
db.dw.dm@gmail.com
9i OCP


来自 北京
精华贴数 0
个人空间 154
技术积分 2187 (727)
社区积分 65 (4285)
注册日期 2005-3-16
论坛徽章:9
ITPUB元老数据库板块每日发贴之星    
      

发表于 2008-7-4 16:42 


QUOTE:
原帖由 senaku 于 2008-7-4 01:01 发表
使用kettle处理上亿条数据的多表连接.
导出的结果与数据库内部测试结果相差太大---->结果本应有上亿条,用kettle导出来只有100多万条,极度郁闷ing.

3张表
表a----->1亿多条记录
表b----->9千万条记录
表c----->30万条记录

需求需要连接这3张表,大家是如何处理的?



兄弟用到kettle吗?能谈谈项目的感受吗?


__________________
纸上来得终觉浅,绝知此事要躬行!

MSN/Email: db.dw.dm@gmail.com   欢迎交流!  
BLOG:         专注 - 思考 - 创新

1. Oracle数据库备份与恢复总结

2. 10g 新特性 Recyclebin 空间的自动清理
只看该作者    顶部
离线 bestball
一般会员



精华贴数 0
个人空间 0
技术积分 205 (9236)
社区积分 33 (5974)
注册日期 2003-1-28
论坛徽章:0
      
      

发表于 2008-7-4 17:25 


QUOTE:
原帖由 owlstudio 于 2008-7-4 16:25 发表



informatica有哪些方面比较糟糕呢?

不够灵活?还是性能上不行?

个人觉得是informatica操作太繁琐,功能还算不错的吧。


只看该作者    顶部
离线 liangf215


来自 火星
精华贴数 0
个人空间 0
技术积分 1723 (966)
社区积分 711 (1149)
注册日期 2005-4-27
论坛徽章:5
会员2007贡献徽章生肖徽章2007版:鼠生肖徽章2007版:鼠ITPUB新首页上线纪念徽章  
      

发表于 2008-7-4 22:45 
以前用SSIS,SSIS总结起来简单、上手快,但存在bug,对SQL Server数据库衔接的不错,但是对别的数据存在不兼容有些功能不能使用的缺陷,而且数据量特别大的时候ETL比较吃力;
现在再用ds,感觉一个字 繁,当源是用户自己写的SQL时 数据源stage output不能自动映射输出列,需要自己添加,顺序还要对应好,不过ds用DB2数据库时抽取速度的确客观;
informatica没实际用过,不发表评论,希望大家继续给出自己的使用经验。


__________________
My Blog:www.mowoa.com 数据库 数据仓库

好铺好米http://6san.e.now.cn

MSN:zhang_wust@hotmail.com
即便一小步,也有新高度。做最好的自己,我能!!!
只看该作者    顶部
离线 hch2001cn
初级会员



精华贴数 0
个人空间 0
技术积分 20 (54304)
社区积分 0 (697552)
注册日期 2005-11-23
论坛徽章:0
      
      

发表于 2008-7-6 23:49 
可怜俺们自己写代码的,没工具用.....

不过试过owb,个人感觉不咋满意,呵呵


只看该作者    顶部
离线 yuanqingyu0123
☆暴君秦始皇☆


来自 DL
精华贴数 0
个人空间 0
技术积分 459 (4231)
社区积分 432 (1537)
注册日期 2006-11-9
论坛徽章:1
授权会员     
      

发表于 2008-7-7 09:28 
俺有个Datastage。


__________________
只看该作者    顶部
离线 yuanqingyu0123
☆暴君秦始皇☆


来自 DL
精华贴数 0
个人空间 0
技术积分 459 (4231)
社区积分 432 (1537)
注册日期 2006-11-9
论坛徽章:1
授权会员     
      

发表于 2008-7-7 09:28 
不过俺也不在广州怎么给你


__________________
只看该作者    顶部
离线 johnson.beijing
小小书虫



精华贴数 0
个人空间 0
技术积分 324 (6064)
社区积分 2 (27990)
注册日期 2005-10-17
论坛徽章:0
      
      

发表于 2008-7-7 15:35 
回复 #5 esestt 的帖子

只用过owb, ds, ssis, informatica,前三款都不错,最糟糕的是informatica
------------
倒过来说,就是我的观点,在加上BO的DI


__________________
不在于你学过多少,在于你解决问题的思路。
只看该作者    顶部
相关内容


CopyRight 1999-2006 itpub.net All Right Reserved.
北京皓辰广域网络信息技术有限公司. 版权所有
E-mail:Webmaster@itpub.net
京ICP证:010037号 联系我们 法律顾问