楼主: 王楠w_n

【大话IT】数据不再遥远——你对数据库平台架构知多少?

[复制链接]
论坛徽章:
8
2015年新春福章
日期:2015-04-22 09:15:50美羊羊
日期:2015-04-28 08:58:41暖羊羊
日期:2015-05-05 11:13:16慢羊羊
日期:2015-07-03 14:57:08目光如炬
日期:2016-06-05 22:00:002017金鸡报晓
日期:2017-01-10 15:25:58秀才
日期:2017-04-06 18:09:28秀才
日期:2017-05-09 11:37:55
11#
 楼主| 发表于 2016-8-22 14:25 | 只看该作者

坐等大神分享经验

使用道具 举报

回复
论坛徽章:
8
2015年新春福章
日期:2015-04-22 09:15:50美羊羊
日期:2015-04-28 08:58:41暖羊羊
日期:2015-05-05 11:13:16慢羊羊
日期:2015-07-03 14:57:08目光如炬
日期:2016-06-05 22:00:002017金鸡报晓
日期:2017-01-10 15:25:58秀才
日期:2017-04-06 18:09:28秀才
日期:2017-05-09 11:37:55
12#
 楼主| 发表于 2016-8-22 14:25 | 只看该作者
期待更过优质回复

使用道具 举报

回复
论坛徽章:
386
生肖徽章2007版:猴
日期:2008-12-12 08:36:08指数菠菜纪念章
日期:2017-01-09 16:05:33秀才
日期:2017-03-01 13:53:39秀才
日期:2017-03-20 13:42:20秀才
日期:2017-03-27 17:42:03秀才
日期:2017-04-06 18:09:28
13#
发表于 2016-8-23 09:39 | 只看该作者
3.数据应用:数据一般以哪种形式,呈现给用户?技术上是通过哪些策略实现?

交互后通过静态图表来展现。通过数据挖掘来实现。

使用道具 举报

回复
论坛徽章:
8286
菠菜神灯
日期:2016-10-27 15:43:20菠菜神灯
日期:2016-10-27 16:05:30菠菜神灯
日期:2016-10-27 16:05:30菠菜神灯
日期:2015-07-24 14:56:20菠菜神灯
日期:2016-10-27 16:05:30菠菜神灯
日期:2015-04-17 18:02:23菠菜神灯
日期:2015-04-17 18:02:23菠菜神灯
日期:2016-10-27 16:05:30菠菜神灯
日期:2016-10-27 16:05:30菠菜神灯
日期:2016-10-27 16:05:30
14#
发表于 2016-8-23 15:26 | 只看该作者
支持。。。。。。。。。。

使用道具 举报

回复
论坛徽章:
85
2015年中国系统架构师大会纪念徽章
日期:2015-09-17 11:10:00举人
日期:2015-09-21 16:42:17秀才
日期:2015-10-08 15:07:00秀才
日期:2015-10-08 17:57:58秀才
日期:2015-10-19 15:31:25秀才
日期:2015-10-19 15:36:25秀才
日期:2015-10-19 15:49:55秀才
日期:2015-10-19 15:50:39秀才
日期:2015-10-26 09:24:12举人
日期:2015-09-21 16:42:09
15#
发表于 2016-8-25 12:31 | 只看该作者
论坛好冷清,顶一个,支持活动。

使用道具 举报

回复
论坛徽章:
223
2010新春纪念徽章
日期:2010-03-01 11:20:51ITPUB元老
日期:2019-04-25 13:46:07至尊黑钻
日期:2015-08-13 13:38:12至尊黑钻
日期:2015-02-15 09:47:472015年中国系统架构师大会纪念徽章
日期:2015-07-31 17:48:20管理团队2007贡献徽章
日期:2015-01-19 09:48:272015中国数据库技术大会纪念徽章
日期:2015-05-15 14:08:23海蓝宝石
日期:2015-02-03 10:23:39红宝石
日期:2015-02-03 10:26:04会员2007贡献徽章
日期:2015-02-03 10:26:41
16#
发表于 2016-8-26 17:16 | 只看该作者
不了解这个领域,我是来学习的。

使用道具 举报

回复
论坛徽章:
10
秀才
日期:2015-07-14 09:44:30秀才
日期:2015-08-17 13:13:142015年中国系统架构师大会纪念徽章
日期:2015-08-03 13:54:362014系统架构师大会纪念章
日期:2015-08-03 13:54:362013系统架构师大会纪念章
日期:2015-08-03 13:54:362012系统架构师大会纪念章
日期:2015-08-03 13:54:362011系统架构师大会纪念章
日期:2015-08-03 13:54:362010系统架构师大会纪念
日期:2015-08-03 13:54:362009架构师大会纪念徽章
日期:2015-08-03 13:54:36秀才
日期:2015-09-11 10:43:06
17#
发表于 2016-8-29 09:01 | 只看该作者
1.数据方面:如何进行模型分层?一般模型分层计算程序,以哪种语言为主?(请说出此种语言在数据架构方面较于其他语言的优势又哪些?)
                从数据仓库 或 大数据平台 的角度来讲,数据的分层,大体有两种思路:
                a) 基础数据层:主要避免后续数据应用层的大变更。一般面向各业务系统或数据源集,利用业界较为先进的数据模型(如FS-LDM),
                   按数据的特性(即数据驱动)进行数据的整合,以形成相对稳定的基础数据模型层。
                b) 应用数据层:一般是面向各应用需求 或 业务用户,利用业界较为合理的数据模型理念(如星型\维度模型),
                   按需求的要求(即需求驱动)进行数据的分布,以形成统计方便、展示友好、满足需求的应用数据模型层。
               
                在数据流向 或 数据处理的过程中,所使用到的语言或方式可能更多的是以下两大类:
                a) 基于传统数据库:大多采用ETL的方式,进行数据的抽取、清洗、整合;这中间,可能会利用到类似DataStage,Kettle等工具,
                   用得最多的,可能就是各数据库提供的SQL语言了,SQL语言使用简单、方便、学习门槛较低,且易于掌握。
                b) 基于大数据平台:大多采用的开源的工具 或 语言,如Hive, Hbase , Spark,Python等。这里面,可能使用更多的是Hive 与 Python,
                   这两个工具学习简单,易于掌握,并且,进行数据处理时,也更直观、方便。

2.架构方面:在架构过程中,一般以7点展开,如:
a. 存储和计算都基于HIVE;
b. GREENPLUM作为HIVE的“cache”存在,供用户做一些小数据的快查询,报表存储;
c. 调度:和canaan框架进行整合,支持用户快速新增任务,并自动导入任务依赖;
d. 主数据:保存了数据仓库元数据信息,供用户查询和系统内部各个模块交互;
e. ACL:构建了数据仓库数据访问权限控制,包括用户权限申请、审批者审批、数据赋权等;
f. 传输;
g.监控:由于任务数量增长较快(2000+),运维已经是个问题此外,需花了较大精力做了可视化的工作:

您的工作,主要涉及以上哪几点?在架构过程中遇到的难点有哪些?

   架构方面,所列的7点,说实话,有点乱,从楼主的思路来看,可能是想了解以下的四大类:
   a) 大数据的计算处理
   b) 数据治理
   c) 数据安全
   d) 系统监控
   
   首先,我不认为Hive是一个数据库,我认为Hive是一个类似传统数据库的SQL引擎的工具,虽然Hive有自带的元数据存储库,但这个库里面,
   也只是存放了Hive工具为完成用户提交的请求而必须要的Hadoop的元数据信息 及两者的映射关系数据;并没有存放用户的任何数据,用户的
   数据还是存放在Hadoop或Hbase等文件系统或数据库中。
   
   关于作业的调度,可能各家企业,都会跟据自身的需求,自行开发 或 购买成熟的工具,比如:Control-M.
   
   关于数据治理:这是一个很大的话题,主要包括:元数据管理,主数据管理,数据标准,数据质量及检查 等几大主题。
   
   关于数据安全:权限体系依然是核心,审计是必要的手段。
   
   关于系统监控:系统的稳定运行,离不开完善的监控体系,而且监控必须实时、并具有预测性。
   
   其实,在这些工作中,最具难点的是:数据治理 与 系统监控 这两块。
   数据治理涉及面较广,牵涉人员较多(有IT,也有业务人员),沟通较为复杂,责任较难厘清。
   系统监控主要是预测性与实时性较难实现,预测性主要是人员的经验的体现 及 对业务系统的运行情况的掌握。
   而实时性主要是实施系统监控的工具本身可能就不具备实时性的性能及特性,总是只能达到一个准实时。



3.数据应用:数据一般以哪种形式,呈现给用户?技术上是通过哪些策略实现?
         数据应用主要分成两大类:
         a) 面向业务人员:一般是自行研发一个界面美观的WEB应用,调用业界成熟的工具(如MSTR,COGNOS)的API,实现数据展示给终端用户进行查看。
         b) 面向IT专业人员:一般是直接从数据库/文件系统中,借助SQL或其它的开源工具,直接查询、统计、分析、挖掘;这样会更直接、更方便。

---------------------------
以上仅个人观点

使用道具 举报

回复
论坛徽章:
18
指数菠菜纪念章
日期:2012-04-24 17:58:41罗罗诺亚·索隆
日期:2017-07-27 17:18:30三菱
日期:2013-08-06 18:23:03蛋疼蛋
日期:2013-07-03 13:36:342013年新春福章
日期:2013-02-25 14:51:24紫蛋头
日期:2013-02-01 16:03:19鲜花蛋
日期:2012-11-13 09:26:21ITPUB 11周年纪念徽章
日期:2012-10-25 15:00:33奥运会纪念徽章:皮划艇静水
日期:2012-09-25 10:22:40奥运会纪念徽章:沙滩排球
日期:2012-09-24 14:17:31
18#
发表于 2016-8-31 19:12 | 只看该作者
2年都没拿章子了,参与即有。。

使用道具 举报

回复
论坛徽章:
19
秀才
日期:2015-12-14 15:02:13秀才
日期:2017-05-09 11:37:55秀才
日期:2017-04-06 18:09:28秀才
日期:2017-03-28 15:59:38秀才
日期:2017-03-28 15:11:09秀才
日期:2017-03-27 17:42:03秀才
日期:2017-03-20 13:42:20秀才
日期:2017-03-01 13:53:39秀才
日期:2017-02-22 15:18:00秀才
日期:2017-02-22 15:16:26
19#
发表于 2016-9-1 13:09 | 只看该作者
为了徽章顶

使用道具 举报

回复
论坛徽章:
20
2014年世界杯参赛球队:巴西
日期:2014-06-12 16:34:36秀才
日期:2015-10-19 15:36:25ITPUB14周年纪念章
日期:2015-10-26 17:24:11秀才
日期:2015-12-14 14:51:16秀才
日期:2015-12-14 14:56:09秀才
日期:2016-01-05 09:35:58秀才
日期:2016-01-21 13:37:04秀才
日期:2016-06-23 14:15:06山治
日期:2016-07-19 17:42:53秀才
日期:2015-10-19 15:31:25
20#
发表于 2016-9-2 14:56 | 只看该作者
路过帮顶, 学习~

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表