|
从这2个分析逻辑来看,演绎法认知在BI中可以理解为OLAP分析,因为纬度模型是验证的经验得出来的,而归纳法认知在BI中理解为数据挖掘,因为通过数学算法(神经元,决策树,回归,聚类等)来实证的.
但在BI实践中,OLAP和数据挖掘都会出现分析上问题,必须两者结合.我们举经典的"啤酒和尿布"结果来谈这2种分析上的问题.
1,OLAP分析来得到啤酒和尿布,假设这2类商品都属于业务人员来管理,他根据经验认为“如果他给小孩子来买尿布的时候,同时也会买啤酒”,那么这种可能性有多大,根据对数据的收集,发现这2种商品同时成立的次数很多,验证他的判断。
问题在于,业务人员管理的商品很多,很难就每2种商品做同时分析,只有对由经验预知的“啤酒和尿布”来做判断,这样会失去其他商品的相关性。
而目前OLAP分析应用系统受制于IT部门的数据模型,如果需要新的分析角度来验证,需要IT部门重新定义数据模型,分析变成了日常统计,这种应用也没什么用处。
2,用数据挖掘分析来得到啤酒和尿布,分析人员通过相关性的数学算法(FP-growth算法),从几万中商品的信息进行计算,发现“啤酒和尿布”相关的强度和支持度很大.
但问题也出来了,分析人员会找出很多与”啤酒“相关的商品,但这些相关性的商品因此缺乏经验支撑,不了解出现的原因,因此,“啤酒和尿布”的相关性被采纳的同时,可能“啤酒和花生”也被采纳。
而目前数据挖掘分析出来的结果,经常得到“地球人都知道”或者“地球人都不知道”的报表。归纳法的应用系统对企业也没有太大的改善.
我们不能因为“啤酒和尿布”这个榜样而忽略了它产生的过程.过程就是OLAP分析和数据挖掘分析结合得到了这个结果.
我在这里并没质疑过数据挖掘工具,却在质疑OLAP工具,就是这个原因,因为,我们目前OLAP工具还没有让业务人员经常使用经验法分析,就无法给数据挖掘分析提供帮助,这样导致数据挖掘分析也架空了.
所以,还是这句话:OLAP工具毁了商业智能. |
|