|
本帖最后由 pastime_Wang 于 2013-5-21 11:51 编辑
先占位, 再好好总结!
不过bigdata目前的发展,ms 好多都是不"落地"的, 所以还是需要时间检验的我理解的大数据:
/************************************************************/
1、你认为大数据真正的价值体现在哪里?
从 "海量的且不断增长的"、多样的 (非结构 / 半结构 / 结构化)、真实的数据海洋中,
"快速" 获取以往不知道或很难获取的有价值信息的能力, 实现组织的深入洞察 (Insight)
价值体现与其" 4V " 特性和信息管理上的方式 是密不可分的:
1、更有效的处理和分析更大的数据集而不仅仅是 "抽样性" 数据
2、快速分析来自不同源、不同格式 (非 / 半 / 结构) 数据集
3、对预测或未确定的指标进行 "探索式、迭代式" 的分析和度量, 如: 欺诈检测模型
4、可作为无法用传统的 RDBMS \ DW 等方法或工具来处理信息挑战的补充
另外,目前流行的 "社交媒体和客户观点" 和 "风险建模和管理" 也是大数据应用模式的主要价值体现
/************************************************************/
2、你对于大数据的发展是怎么看的?
业务角度发展:
1、从物联化的发展趋势, 大数据未来应用核心仍然以 "互联网" 为主, 还有来自传感器的高频数据流 (如: 能源领域) 实时处理
2、对传统的处理方法的补充和延伸, 实现完全的"互联互通", 目前还不能完全取代传统应用
3、企业商用前景可预期, 但短时间内可 "落地" 的应用不多, 还不能真实评估应用风险, 此外 扩展成本经济、容错性、可用性和安全性有待加强
技术角度发展:
1、新的混合系统架构, DW + Bigdata / DB + Stream
2、可作为数据整合、数据治理需求的有益补充
不足:
1、Hadoop 平台虽然是开源, 但目前支持的企业生产环境有限, 技术还不够成熟
2、技术架构目前以Hadoop 为主, 主要是HDFS + HBase + MapReduce, 开发维护复杂, 需要统一高效的工具封装和集成, 使开发人员和用户轻松适用 (目前IBM 有相关的应用平台 biginsights + streams)
3、与现有企业应用架构的集成
|
|