楼主: shwenwen

[精华] ETL的本质

[复制链接]
论坛徽章:
0
31#
发表于 2005-6-28 22:18 | 只看该作者

趁着还有精力胡乱说两句

说明:我不喜欢ETL,趁着还没完全丧失兴趣之前胡乱说几句

ETL的工作本质是简单的,但只是由于环境复杂,导致了工作的复杂性。

大多数时候大家的争论的ETL,ELT,ETL的定义等等,实际上已经将注意力转到其他方面,对ETL的本质反而复杂化了,其实很简单,就是数据的迁移。 至于你用工具并不重要,你迁移的步骤野不重要,只要达到效果就行。

所以你用shell  C编程 ,还是Datastage Informatica ,还是使用SQL都可以,没有好坏,重要的能满足要求,再这里尤其重要的是,能满足你的要求。再好的工具,如果你对其掌握的程度不够,对实际的需求不方面实现,工具的意义也是不大。

所以好的ETL工程师应该在项目实施前,对其将要使用的工具进行评估,将需求评估,规矩本身的实际情况,来适当的调整ETL的策略,从而达到ETL工作的优化。
(好像上面是废话啊)

其实重要的不在这里,有两个方面加重了ETL工作的复杂化
数据本身的信息
数据转换逻辑规则的信息

数据本身的信息 又包括
数据本身反应的业务信息
数据&数据之间的规则信息

业务信息(指源数据&目标数据)应如何体现,一般应通过某种工具来体现,如Erwin Powerdesiner 或者你用Excel也可以.一般情况下,往往容易忽略的,也容易受到限制就是源数据的业务信息。试问如果源数据的业务逻辑信息都不能清楚的表达,ETL做的再好,也是意义不大的。

所以,好的ETL工程师应该对源数据&目标数据的业务信息,业务逻辑,数据属性也有相应的了解,ETl框架设计师更是应该对此有深刻的认知,才可以确保优质的ETL任务。缺乏对源数据的认识,没有清晰的框架结构,必然会给随后的ETL工作加大难度&复杂性

(说句大白话,如果对数据仓库的数据要求一张报表,能否对源数据的接口数据也同样出一张报表,看看两者之间有he差异,就可以看出ETL的工作质量了)

先到这里吧,敲字很麻烦的。待续

使用道具 举报

回复
论坛徽章:
2
授权会员
日期:2005-10-30 17:05:33生肖徽章2007版:鸡
日期:2008-01-02 17:35:53
32#
发表于 2005-6-29 18:06 | 只看该作者
d

使用道具 举报

回复
论坛徽章:
0
33#
发表于 2005-6-30 15:37 | 只看该作者

RE:ETL的本质

附件无法下载,有那位可以通过email给我?谢谢!我的email:acromaster@hotmail.com.

使用道具 举报

回复
论坛徽章:
0
34#
发表于 2005-7-1 14:59 | 只看该作者

thanks

thanks a lot

使用道具 举报

回复
论坛徽章:
0
35#
发表于 2005-7-1 15:03 | 只看该作者

使用道具 举报

回复
论坛徽章:
1014
红宝石
日期:2013-01-17 12:18:56红宝石
日期:2013-01-17 12:18:56复活蛋
日期:2013-02-27 00:11:48复活蛋
日期:2013-02-27 00:17:48复活蛋
日期:2013-02-27 00:17:48复活蛋
日期:2013-02-27 00:17:48红宝石
日期:2013-01-17 12:18:56红宝石
日期:2012-04-19 09:03:31海蓝宝石
日期:2013-01-18 16:17:53鲜花蛋
日期:2013-02-27 00:11:48
36#
发表于 2005-7-1 20:26 | 只看该作者
非常感謝,看看

使用道具 举报

回复
论坛徽章:
0
37#
发表于 2005-9-12 11:34 | 只看该作者
很经典的帖子,受益匪浅,非常感谢!!!

使用道具 举报

回复
论坛徽章:
0
38#
发表于 2005-9-14 17:30 | 只看该作者
不错的心得!值得顶

使用道具 举报

回复
论坛徽章:
0
39#
发表于 2005-9-20 12:14 | 只看该作者
谢谢!

使用道具 举报

回复
论坛徽章:
1
数据库板块每日发贴之星
日期:2005-09-26 01:01:30
40#
发表于 2005-9-25 11:03 | 只看该作者
好~~

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表