|
呵呵
innovate511总是一付DW高手的样子,动不动世界500强用EDW,中国移动经营EDW多么高深. 如何充分按照实践大师Kimball思路来做,以前还谈inmon,现在不谈了. 因为innovate511所说的DW一直是在讲CIF的DW,从来不讲MD的DW,甚至他不把MD的DW认为是DW.这在以前的交流中,他提到过.
OK,为什么会造成这种情况,我个人估计innovate511就是从DW 2.0开始学习和实践,所以他的操作性很强(至少从他的自信中感觉到,希望事实如此)
但奇怪是,为什么innovate511这次只提Kimball,不提Inmon.而把Kimball定义为实践大师,让这里的BIers 感觉Inmon是架构定义者,Kimball是实践者.
其实,据我所知.Kimball也是DW架构的定义者!!
Inmon首先提出了数据仓库的定义,但Inmon最早定义数据仓库架构,Kimball先定义出DW架构,Inmon对Kimball的DW架构并不满意,但Inmon费劲力气也没能驳倒Kimball。这样Inmon没办法了,就提出DW2.0后立刻就注册了商标. 他注册了商标!!!! 这是很幽默的事情,这样Kimball所说的DW,就不是DW了.只有DW2.0中提到的才是DW.如果innovate511这里所说的DW就是Inmon所注册商标的DW 2.0, 那我无法可讲了,因为并定义住了.
但业内并没有被Inmon这个幽默的举动固定住,还是认为DW架构比较成熟并已经形成理论的主要有两个,一个是Corporate Information Factory,简称CIF,代表人物是Bill Inmon。另一个是Mutildimensional Architecture,简称MD,代表人物是Ralph Kimball。 业内并把Bill Inmon注册的那个DW2.0改为CIF 2.0.
CIF 2.0主要包括集成转换层(Integrated and Transformation Layer)、操作数据存储(Operational Data Store)、数据仓库(Enterprise Data Warehouse)、数据集市(Data Mart)、探索仓库(Exploration Warehouse)等部件。
MD分为后台(Back Room)和前台(Front Room)两部分。后台主要负责数据准备工作,称为数据准备区(Staging Area),前台主要负责数据展示工作,称为数据集市(Data Mart)。而数据仓库是一个虚拟的部件,它指的是全部数据集市的集合。
innovate511看来是Bill Inmon的信教徒,就是这样混淆大众的是非,把Kimball说成实践大师,这样就把DWBI分开了,DW是 Bill Inmon的领域,BI是DW的实践,实践大师是Kimball.
呵呵,所以,当我提到BI的时候,一旦基于MD的DW就被他以EDW嘲之. CIF和MD都是DW.这是你改变不了的. |
|