查看: 33781|回复: 75

[精华] Etl考虑

[复制链接]
论坛徽章:
0
跳转到指定楼层
1#
发表于 2002-5-22 22:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
大家是怎么处理ETL的?

论坛徽章:
20
ITPUB元老
日期:2005-02-28 12:57:002012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:18马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:11:18
2#
发表于 2002-5-24 19:31 | 只看该作者
去了解ORACLE OWB,并不一定要用会,里面有ETL的流程。

如果后台选用ORACLE,OWB是你比较好ETL工具

使用道具 举报

回复
论坛徽章:
0
3#
 楼主| 发表于 2002-5-25 21:41 | 只看该作者

owb好用吗?

那玩艺只能跑在oracle数据库里面,生成一堆的pl/sql,感觉不爽。应该说,如果源和目标都是oracle还可以考虑,如果源是五花八门,owb就很不爽了

使用道具 举报

回复
论坛徽章:
20
ITPUB元老
日期:2005-02-28 12:57:002012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:18马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:11:18
4#
发表于 2002-5-27 19:09 | 只看该作者
OWB的数据源也可以接其它的东西。

OWB是一个数据项目管理工具,它可以管理整个数据仓库项目的生命周期,而且由于ORACLE编写的,对于大数据的转换加载,其优势不言而喻

使用道具 举报

回复
论坛徽章:
1
授权会员
日期:2005-10-30 17:05:33
5#
发表于 2002-5-28 09:04 | 只看该作者
ETL工具太多了,每个数据库/仓库厂商都提供,还有好多三方厂家提供的。Oracle有OWB,DB2有WareHouse Manager。。。,三方比较流行的是Ascential的DataStage。如果采用工具,就得看实际得应用了,如果在整个系统中只有DB2数据库,那么WareHouse Manager当然是首选,她可以利用DB2好多特用的功能,如EEE Load等,但是缺点是需要单独的一台Windows NT服务器,造价倒是不算高,但是Windows平台的稳定性太成问题。如果数据源异常复杂,选用工具还是使用三方的产品比较好,对数据源的广谱支持更好些。

如果提取逻辑非常复杂,任何工具中都需要自己写嵌入代码来实现。

我自己的考虑是自己开发,这样既可以节省掉买ETL服务器和ETL软件的开销(一笔不小的数目),又可以利用各种数据源/数据仓库的特殊功能,况且各种ETL软件都需要一个熟悉使用的过程,DataStage还容易掌握一些,Warehouse Manager稍困难点,但是至少也需要一个星期的时间去摸索。

使用道具 举报

回复
论坛徽章:
0
6#
 楼主| 发表于 2002-5-29 11:38 | 只看该作者

ETL是必经之路,大家聊聊心得

甭管handcode或者tools,反正都得把数据拿过来,大家最头痛的是啥?

使用道具 举报

回复
论坛徽章:
1
授权会员
日期:2005-10-30 17:05:33
7#
发表于 2002-5-29 12:18 | 只看该作者
我倒是觉得ETL并不是一个很重要得环节,无论采用那种方式,只要性能达到并且对生产系统影响不是很大就可以了。可能我的配置不是很好,用DataStage实现最简单的提取最高只能达到200记录/秒。

使用道具 举报

回复
论坛徽章:
0
8#
 楼主| 发表于 2002-5-30 13:18 | 只看该作者
不会吧?我这里datastage随便找台笔记本从oracle->oracle都能得到2000多条每秒抽取速度。你是怎么做的,可以交流一下。

做银行的数据量象对不大,转换复杂,电信的数据量大,转换简单,不过确实都把不对业务系统造成影响放在首要位置

使用道具 举报

回复
论坛徽章:
1
授权会员
日期:2005-10-30 17:05:33
9#
发表于 2002-5-30 13:23 | 只看该作者
我们是10M的网,我也是在笔记本上试的,从Oracle到DB2,从Oracle到Oracle我也试过,都不是很理想,你怎么配置的呢?

使用道具 举报

回复
论坛徽章:
0
10#
 楼主| 发表于 2002-5-30 18:32 | 只看该作者
在input页面中,你把transcation size跟array size搞大一点,大概1000条的样子,你再试试

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表