|
Re: 大家都上当了
最初由 thrips 发布
[B]除了 interstage 发的,别人的我都认真看了。 [/B]
看来拍砖的人越来越多,欢迎讨论,但不要人身攻击,做人要厚道点,居然出现ITPUB的注册用户无耻盗版我的文章的现象.
我就技术层面对OLAP技术本身(不涉及产品,一涉及到产品,就有推销之嫌疑,做人真累))的趋势做出自己的看法:
.ROLAP,MOLAP,HOLAP就这3个技术来讲,因为HOLAP技术就是低层用ROLAP技术,数据颗粒细化,放入RDB中,这样数据量非常大;而汇总层用MOLAP技术,多维数据明确,算法众多,CUBE运算可以实现. 为什么会出现HOLAP技术,就是做穿透式钻取有问题,当在汇总的CUBE做各角度分析时,如果需要更细化的数据来做分析,就需要做穿透式钻取,这样MOLAP的问题就无法解决,需要ROLAP来实现. 因此我们不过在技术层面讨论HOLAP,只要讨论ROLAP和MOLAP的技术上存在的问题就可以了,MOLAP是以多维的方式组织和存储数据,ROLAP则利用现有的关系数据库技术来模拟多维数据。那在技术上,ROLAP有什么问题吗,主要有2点:
1.ROLAP的数据基础是RDB,RDB经典的"时间与空间"矛盾时刻存在,就是在技术人员眼中的"查询和更新(insert,delete,update)"的矛盾,就是在做select的时候,RDB希望数据颗粒要大(最好一次IO能读64K以上),而做update的时候,RDB又希望数据颗粒要小; 这样的矛盾是不可避免的. 所以从ROLAP来看技术上最大的问题是大数据量即席查询的问题,如果大数据量即席查询的问题能解决,我们就可以把整个DW看成一个大CUBE,这样很多问题会解决.
2,所谓分析,必要需要角度,在技术上就是多维的概念,而ROLAP是利用星型等数据模型逻辑上模拟了多维数据,不如MOLAP直接通过物理上的CUBE来的直接,就一个实际CUBE包含的数据量(一般10G左右)范围内来做查询和运算,MOLAP在这2方面都领先于ROLAP,当然当数据量远远大于CUBE所能承受的范围,MOLAP又不如ROLAP了.
以上的问题,就是在BI项目早期内(一般是BI第1-2期中), 用户更喜欢采用MOLAP,因为CUBE直接了当,多维角度直观明确,每个CUBE都包含着业务模型的价值,所以这就是目前BI市场上对MOLAP产品比较亲赖,导致连BO这样原来没有MOLAP技术的公司,也做了个类CUBE,说自己支持MOLAP技术(不好意思,又谈产品公司).
而看完了ROLAP技术的问题,MOLAP在技术上又有什么问题,其实MOLAP的问题更大,主要体现在2点:
1,CUBE的方式受制于一个主题的业务模型,汇总数据有限,但主题汇总性分析可以,但跨CUBE之间的分析比较痛苦,在汇总性分析(就是现在使用的分析性BI)往下做细节性分析(就是现在特别关注的操作性BI),MOLAP本身无法实现,需要借助于ROLAP.
2,每个CUBE所定义基于主题式的业务模型相对固化,便于做日常统计,限制了分析者(人)极大思维,这样BI项目就变成了日常统计了.让用户感觉上了BI系统的当了.目前BI实施只能以主题式的业务模型是行业最先进的模型来告诉客户,希望客户努力学习这些业务模型中所包含的管理思路(陷入了ERP失败一样的误区).
以上的问题,就是在BI项目后期内(一般是BI第3-4期), 用户对细节分析的要求越来越高,IT部门对物理上管理越来越多的CUBE越的非常厌烦了,所以以DW为思路的ROLAP技术被推崇了,这也是当时为什么HYPERION会收购BRIO的关键,也是MSR只有ROLAP技术却能卖不错的关键(因为它进来中国的时候,MOLAP的市场已经成熟,用户转向ROLAP了)
以上就是在ROLAP和MOLAP技术上最大的问题. 其实INMON在定义DW,已经看到了这些问题,所以提出了MD和CIF的DW模式,数据集市的DW和EDW(相对应MOLAP和ROLAP的技术), 这也是目前BI实施者经验越丰富越希望做CIF的EDW而却轻视MD的DW关键.
看来这些问题了,我们就非常清晰的知道OLAP技术的未来趋势(就是解决这个问题的道路,但最无耻的是厂商们知道这个问题和解决方向,但不直接告诉我们,却以应用方向概念炒作,出现什么新名字,比如IBM有出了一个叫什么动态式的数据仓库,然后配合简单问题复杂化的架构来迷惑用户,让技术人员忙着学他们自定义复杂化的架构,而忽视问题的实质),OLAP技术上的未来趋势就是:
1,改变RDB的行存储方式,单独为查询做列存储的DB,实现即席查询,你连即席查询都很快实现,这些多维角度完全可以以星型,雪花型等逻辑模拟出来,本来这个技术只有SYBASE IQ有(还有就是teradata的专用硬件也可以),但他们由于市场的关系,一直没说出来或者说明白,没被接受,但今年随着ORACLE 列存储技术的出现,以ORACLE 在市场的领导定位,用户开始会接受. 这样就解释了ORACLE收购HYPERION的理由了,他主要不是为了ESSBASE(当然近期还是会给它带来销售额),他是为了基于ESSBASE上的这些模型(由很多成功验证的行业模型),把这些模型放入新的以行存储方式DB后,配合ROLAP技术的BRIO,将是非常可怕的.这种方式,最大的受害者是COGNOS(REPORTNET出来太晚了),接着是MSR,最后才是BO.所以MOLAP的退出成为必然,因为它的出现就是当时RDB"时间和空间"的经典矛盾出来的.
2,用"松偶合"理论把EDW和OLAP前端分解,OLAP的报表展现部分将会趋于MS Excel或者基于浏览器的标准报表工具(就看GOOGLE).而OLAP多维角度和EDW的数据模型的结合以"松偶合"理论配合验证行业业务模型(这就是MOLAP最大的历史贡献),让业务人员和IT部门分开定义多维,这样业务部门分析是依靠IT部门的拐杖将会丢弃,企业共同分析的模式将出现,业务人员用OLAP分析,而市场部门用数据挖掘的时代会到来.
3,解决结构化数据分析(RDB更多的是度量值存放)的同时,将以非结构化数据分析将会应用(主要是BI前端+XML数据库)的方式,配合搜索引擎,结合算法,实现文本分析和文本挖掘.
这就是为了解决技术问题而引出的趋势,但在宣传中,他们不会这样说,会告诉我们什么分析性BI向操作性BI转变,直适应式的数据仓库等等. 其实这些趋势就是技术补丁.
以上就是我去OLAP技术的认知,欢迎拍砖,谢谢!! |
|