查看: 17709|回复: 24

[精华] 连接 数据仓库跟数据集市的关系

[复制链接]
论坛徽章:
0
跳转到指定楼层
1#
发表于 2002-6-5 01:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
http://www.csdn.net/expert/topic/576/576587.xml

诸位哥们给点意见



懒得转贴,别无它意
论坛徽章:
20
ITPUB元老
日期:2005-02-28 12:57:002012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:182012新春纪念徽章
日期:2012-02-13 15:11:18马上有车
日期:2014-02-19 11:55:14马上有房
日期:2014-02-19 11:55:14马上有钱
日期:2014-02-19 11:55:14马上有对象
日期:2014-02-19 11:55:142012新春纪念徽章
日期:2012-02-13 15:11:18
2#
发表于 2002-6-6 18:59 | 只看该作者
讨论很精彩!!值得一看。
不过,实在说不出什么,做个项目体会就深了

使用道具 举报

回复
论坛徽章:
4
ITPUB元老
日期:2005-02-28 12:57:00授权会员
日期:2005-10-30 17:05:33管理团队2006纪念徽章
日期:2006-04-16 22:44:45会员2006贡献徽章
日期:2006-04-17 13:46:34
3#
发表于 2002-6-8 08:46 | 只看该作者
为什么要设立数据集市呢,我觉得这个方面有些值得考虑的事情
企业决策者有时要根据一些数据进行决策,但要找出所需要的不是很容易的一件事情,于是设立了数据集市。数据集市实际上是为各种特殊需要而专门设计的数据表。数据集市并不是在主题内,而在数据仓库的范畴中,也就是说,可以在原来主题的基础上,为决策的需要,进行跨主题的重组

使用道具 举报

回复
论坛徽章:
0
4#
 楼主| 发表于 2002-6-8 12:44 | 只看该作者
呵呵
理由一:数据仓库如果按照分析的需求直接设计,整合性很差,而且随着客户需求的变化要不断做调整,数据仓库层就失去意义了。不过在数据仓库上,可以做一些通用性的查询甚至ad hoc
理由二:数据仓库基本不会写入数据,而数据集市就无所谓,所以数据集市可以做一些what if等东西,而不仅仅是分析
理由三:有时候是为了一些查询优化,会建立数据集市,比如仅挑出有用的测量甚至不要测量、生成一些聚合表、为数据仓库中的复杂查询而建立数据集市(常见的就是一些跨部门的查询)等
理由四:数据仓库并不是什么星星、雪花的东东,还是走标准范式那一套,而集市才是星星、雪花xxx。 如果你的数据仓库有大量的星星,恐怕就只是一堆的数据集市
理由五:。。。。。。。

数据仓库跟数据集市并不矛盾,只是用途不一样。目前国内很多人为了一些简单olap分析应用,建了一堆数据集市,居然认为这就是数据仓库,混淆视听,把这个行当搅得乌烟瘴气

使用道具 举报

回复
论坛徽章:
1
授权会员
日期:2005-10-30 17:05:33
5#
发表于 2002-6-13 20:03 | 只看该作者
在SAS的理念里,好像并不明显区分这两个概念, 我是这样理解SAS的想法的: 不管DM还是DW,最终是为了分析挖掘服务的, 所以SAS的数据仓库策略更偏重于更好地支持挖掘.

我们这儿一直认为DB2 Olap Server中的立方体存储是数据集市, 不知道对不对. 如果对的话, 那和数据仓库区别就比较大了, 毕竟数据仓库是传统的关系模型存储.

使用道具 举报

回复
论坛徽章:
4
ITPUB元老
日期:2005-02-28 12:57:00授权会员
日期:2005-10-30 17:05:33管理团队2006纪念徽章
日期:2006-04-16 22:44:45会员2006贡献徽章
日期:2006-04-17 13:46:34
6#
发表于 2002-6-14 09:42 | 只看该作者
有时,数据集市可以作为数据仓库的廉价替代品
因为前者的创建所花费的时间和金钱更少
但是,因为如此,过多的数据集市会造成数据内容、管理等等的重叠

使用道具 举报

回复
论坛徽章:
1
授权会员
日期:2005-10-30 17:05:33
7#
发表于 2002-6-14 21:09 | 只看该作者
概念上讲, 这两个区分是很明确的
INMON的书中讲过, DW主要是存放明细数据,和少数的聚集; 而数据集市主要是基于原始数据的聚集;

但是从物理存储的角度讲, 我真的有些胡涂, DW当然是比较明确了, DM究竟存放在哪儿? 是我们BI部门所说的存放在DW中, 还是我理解的就是那些CUBE, 如果按INMON的说法, 我的理解也算正确吧.

使用道具 举报

回复
论坛徽章:
0
8#
 楼主| 发表于 2002-6-16 23:58 | 只看该作者
通常,cube跟dm有直接的对应关系,但不等价。我更倾向于认为cube是一个多维的视图或实体(要看后面是怎样的olap产品),数据集市是根本的数据来源

使用道具 举报

回复
论坛徽章:
0
9#
发表于 2002-6-18 13:15 | 只看该作者
和你的观点不太一样,数据仓库最终目的还是为了作数据分析,所以不能说完全采用雪花/星星结构的就不是数据仓库。目前,我们所提到的“数据仓库”实际上就是一大堆数据集市的集合,都是建立在明确的需求上的,与Inmon数据仓库理论不同。主要原因还是无论是开发人员还是使用者对数据仓库没有一个清晰的认识,或者说我们目前的国情不允许我们向那一方向发展。数据集市的建设应该建立在明确的分析途径/手段上,数据仓库则应该是任取所需的地方,二者结构有不同,但从结构的设计理念上应该是相同的。

使用道具 举报

回复
论坛徽章:
1
授权会员
日期:2005-10-30 17:05:33
10#
发表于 2002-6-18 13:34 | 只看该作者

同意scy_cd所说数据仓库应该是任取所需的地方

同意scy_cd所说数据仓库应该是任取所需的地方,那么如何能做到?那就是要原子化,把数据分解为最小有意义的单位,然后依据一定的主题组织,我认为数据仓库中的数据应该尽可能符合第三范式,而不是为了查询的方便和速度进行组织(这样做往往存在大量的冗余)。至于数据集市则自然是从数据仓库中refresh过来,既方便又快速。如果从数据集市开始做,最后作数据仓库,我认为通常都是某种折中或是历史原因造成。

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表