请
登录
后使用快捷导航
没有帐号?
注册
登录
注册
快捷导航
首页
论坛
BBS
博客
技术栈
ITPUB学院
名人堂
版主团
搜索
高级搜索
热搜:
oracle
SAP
sap
二维码
dba
Oracle
c++
C++
CRM
银联信息中心
比特币
小额贷款
贷款
crm
ORACLE
项目管理系统
thread
android
python
java
本版
文章
帖子
用户
ITPUB论坛-专业的IT技术社区
»
论坛
›
≡ 大数据与数据库 ≡
›
数据仓库与数据挖掘
›
【话题讨论】谈话题 得门票 数据治理要面临的问题
1
2
3
4
5
6
/ 6 页
下一页
返回列表
楼主:
arron刘
收藏
|
【话题讨论】谈话题 得门票 数据治理要面临的问题
[复制链接]
foreversunyao
foreversunyao
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
0
21
#
发表于 2013-1-25 14:17
|
只看该作者
kelsoncong 发表于 2013-1-24 16:09
如果是数据仓库环境下,人工处理太夸张了
版主有什么好的自动化方式么?
使用道具
举报
回复
显身卡
ccceleven
ccceleven
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
24
22
#
发表于 2013-1-25 16:04
|
只看该作者
1、你们在工作中有没有用到数据治理?
有一部分吧,毕竟运维这块 接触到数据这块不多,但是 过期 或无效数据这块需要从数据源头解决。
2、数据治理项目的基本流程是什么?
源头解决 不能解决的 后面进行数据处理。。
3、在2013数据库大会上你期待听到有关数据治理的那些内容?
越全越好。
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
23
#
发表于 2013-1-26 10:52
|
只看该作者
现在我所在的团队就在做这些事情,
大家不要灰心,真的做数仓和集市,一定是内部人和外购项目组一起做的。
我们团队请的是文思的bi团队,问题是有的,但是都能解决的。
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
24
#
发表于 2013-1-26 10:56
|
只看该作者
现在这里的架构是
源系统表入数据仓库
仓库标准化入集市
集市建立模型设计中间汇总宽表层
推数据到报表数据库
报表库加工产生报表
集市和数据仓库用greenplum
数据库用oracle
报表用cognos
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
25
#
发表于 2013-1-26 10:59
|
只看该作者
建设中遇到的问题
如何支持数据仓库和集市的数据重新跑批处理
因为有些表是加工出来的时点数据,
有些表是发生数值,
一旦过了时间点,时点数据就无法重跑了,除非备份数据仓库的数据,但是这样吃存储。
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
26
#
发表于 2013-1-26 11:03
|
只看该作者
另外就是整个数据链条太长,发现和修复问题的成本很高。报表出的问题可能是集市那边的问题,
但可能集市加工没有问题,是数据仓库的问题,甚至是源头系统的问题,链条长,即使发现问题想要给用户修复,也不能及时完成,因为修复得需要较长的时间。
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
27
#
发表于 2013-1-26 11:07
|
只看该作者
还有就是数据准确性问题,相对技术而言,数据准确性更重要,哪怕系统差点,数据只要是准确的,用户也是认可的。这就需要对数据和业务知识的理解,个人认为,这是最难的。数据准确性是任何数据应用的灵魂。解决办法是基于逻辑的,即数据无论从哪里加工的,它的源头是业务系统,一层层核对直到对明细。
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
28
#
发表于 2013-1-26 11:13
|
只看该作者
还有就是数据应用和业务系统是有依赖性的,一旦业务系统有业务架构上的变动,对数据应用改造影响十分巨大,白白消耗了人力,在一个业务系统业务架构相对稳定的环境下,数据分析和报表能提供更大的作用。
使用道具
举报
回复
显身卡
xgghxkhuang
xgghxkhuang
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
57
29
#
发表于 2013-1-26 11:20
|
只看该作者
另外,建议想入数据集市的同学注意
集市没有你们想象的那么完美,其实工作是整天和业务数据打交道,然后开发,对数据,查问题,
有时需要很大的耐心的。而且,得数据准确后才有什么挖掘和分析的。
如果想立竿见影的出成绩,交易系统可能更适合,因为交易系统直接创造价值,不允许任何出错,做好了,收效马上见。
使用道具
举报
回复
显身卡
fk1987614
fk1987614
当前离线
积分
101
IP卡
狗仔卡
论坛徽章:
7
30
#
发表于 2013-1-26 21:10
|
只看该作者
你们在工作中有没有遇到数据治理?
原来在做运维的时候遇到过,主要是ETL(informatic),来处理数据。
数据治理的基本流程是什么?
1.根据需求来制定一些转换清理规则来进行处理。
需求--规则--清理--治理
2.通过配置一些阈值来制定转换规则。
阈值-规则--转换--治理
3、在2013数据库大会上你期待听到有关数据治理的那些内容?
主要是未来数据发展的一个方向。以及对于大数据是否还是需要治理?
使用道具
举报
回复
显身卡
1
2
3
4
5
6
/ 6 页
下一页
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
企业管理咨询
TOP
技术积分榜
社区积分榜
徽章
团队
统计
知识索引树
积分竞拍
文本模式
帮助
ITPUB首页
|
ITPUB论坛
|
数据库技术
|
企业信息化
|
开发技术
|
微软技术
|
软件工程与项目管理
|
IBM技术园地
|
行业纵向讨论
|
IT招聘
|
IT文档
ChinaUnix
|
ChinaUnix博客
|
ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有
联系我们
未成年人举报专区
京ICP备16024965号-8
北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
快速回复
返回顶部
返回列表