楼主: shwenwen

[精华] ETL的本质

[复制链接]
论坛徽章:
0
21#
发表于 2005-5-25 13:04 | 只看该作者

谢谢!

知道了一些东西,非常感谢!这个看似简单的东西,做起来可复杂和难以控制!

使用道具 举报

回复
论坛徽章:
65
生肖徽章2007版:兔
日期:2011-01-20 12:58:49秀才
日期:2016-12-21 16:55:07秀才
日期:2016-03-24 09:10:242016猴年福章
日期:2016-02-23 09:58:34秀才
日期:2015-10-08 17:57:58双子座
日期:2015-09-17 10:07:092015年新春福章
日期:2015-03-06 11:57:312015年新春福章
日期:2015-03-04 14:19:11马上有车
日期:2014-02-18 16:41:112014年新春福章
日期:2014-02-18 16:41:11
22#
发表于 2005-5-26 12:15 | 只看该作者
学习

使用道具 举报

回复
论坛徽章:
0
23#
发表于 2005-5-26 19:58 | 只看该作者
谢谢

使用道具 举报

回复
论坛徽章:
0
24#
发表于 2005-5-30 13:50 | 只看该作者

thanks!

很不错,对我这个入门者,很有帮助!多谢!

使用道具 举报

回复
论坛徽章:
0
25#
发表于 2005-5-30 16:44 | 只看该作者
先学习!

使用道具 举报

回复
论坛徽章:
4
ITPUB8周年纪念徽章
日期:2009-09-27 10:21:22ITPUB十周年纪念徽章
日期:2011-11-01 16:19:41
26#
发表于 2005-5-30 18:27 | 只看该作者
看看先,谢谢!

使用道具 举报

回复
论坛徽章:
5
授权会员
日期:2005-10-30 17:05:33会员2007贡献徽章
日期:2007-09-26 18:42:10ITPUB元老
日期:2007-09-30 21:58:22ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44奥运会纪念徽章:拳击
日期:2008-10-24 13:22:33
27#
发表于 2005-5-31 18:20 | 只看该作者
到现在也没觉着这里有多复杂的东东,Excel已经实现的蛮好的了,可能了解不多,先看看再说

使用道具 举报

回复
论坛徽章:
0
28#
发表于 2005-6-24 19:08 | 只看该作者
thanks!

使用道具 举报

回复
论坛徽章:
0
29#
发表于 2005-6-25 07:24 | 只看该作者
做ETL责任重大罢了,复杂?叫繁琐还差不多。

使用道具 举报

回复
论坛徽章:
0
30#
发表于 2005-6-28 22:18 | 只看该作者

趁着还有精力胡乱说两句

说明:我不喜欢ETL,趁着还没完全丧失兴趣之前胡乱说几句

ETL的工作本质是简单的,但只是由于环境复杂,导致了工作的复杂性。

大多数时候大家的争论的ETL,ELT,ETL的定义等等,实际上已经将注意力转到其他方面,对ETL的本质反而复杂化了,其实很简单,就是数据的迁移。 至于你用工具并不重要,你迁移的步骤野不重要,只要达到效果就行。

所以你用shell  C编程 ,还是Datastage Informatica ,还是使用SQL都可以,没有好坏,重要的能满足要求,再这里尤其重要的是,能满足你的要求。再好的工具,如果你对其掌握的程度不够,对实际的需求不方面实现,工具的意义也是不大。

所以好的ETL工程师应该在项目实施前,对其将要使用的工具进行评估,将需求评估,规矩本身的实际情况,来适当的调整ETL的策略,从而达到ETL工作的优化。
(好像上面是废话啊)

其实重要的不在这里,有两个方面加重了ETL工作的复杂化
数据本身的信息
数据转换逻辑规则的信息

数据本身的信息 又包括
数据本身反应的业务信息
数据&数据之间的规则信息

业务信息(指源数据&目标数据)应如何体现,一般应通过某种工具来体现,如Erwin Powerdesiner 或者你用Excel也可以.一般情况下,往往容易忽略的,也容易受到限制就是源数据的业务信息。试问如果源数据的业务逻辑信息都不能清楚的表达,ETL做的再好,也是意义不大的。

所以,好的ETL工程师应该对源数据&目标数据的业务信息,业务逻辑,数据属性也有相应的了解,ETl框架设计师更是应该对此有深刻的认知,才可以确保优质的ETL任务。缺乏对源数据的认识,没有清晰的框架结构,必然会给随后的ETL工作加大难度&复杂性

(说句大白话,如果对数据仓库的数据要求一张报表,能否对源数据的接口数据也同样出一张报表,看看两者之间有he差异,就可以看出ETL的工作质量了)

先到这里吧,敲字很麻烦的。待续

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表