123
返回列表 发新帖
楼主: hwayw

如何做到敏捷数据分析:用Hadoop创建数据分析应用

[复制链接]
论坛徽章:
0
21#
发表于 2014-8-4 00:56 | 只看该作者
本帖最后由 assd2001 于 2014-8-4 00:59 编辑

1. 为什么需要敏捷数据分析?
就职于金融系统IT部,目前大数据方面的工作刚刚起步,纳入数据包含网银日至,电商平台日志,行内咨询,用户的交易明细等,目前面临的主要问题是:
a.业务部门不知道自己要的是什么,往往都是一些零散的想法,按照开发部门以往的瀑布式模型,不能很快的看到成效。目前已经搭建了类似的实验室环境,与生产数据对接,尽量提升版本交付频度,看到成效。
b.目前正在组建分析师团队,就如书中所说,团队成员基本都是通才,提供给其使用的数据分析平台面临着很大的挑战,提出的需求需要立即看到效果。
所以平时正在考虑开发工作中加入跟多的敏捷方法、工具与框架。

2. 如何做到敏捷数据分析?
目前的做法是通过搭建流数据处理平台实现,采用大内存技术,对数据进行自动采集、清洗、存储、计算和分发等款速处理,用于支持客户营销、风险监控、客户服务等,例如骗贷、反欺诈、大额资金流通预警等。现在看来还是比较保守,未来会引入更多灵活、高效的方法与工具。

3. 说说您读完试读样章后的启发
读了试读章节,目前正在读英文版【Agile.Data.Science】,书中阐述的方法融合了目前业界一些适用的框架,如spark、flask、bootstrap等,较现使用的Hadoop+j2ee更为灵活,我们会考虑在实验环境部署。数据科学作为一门新兴学科,本身内容不多,本书较为通俗的介绍了数据分析的一整套方法与工具,值得一读。

使用道具 举报

回复
论坛徽章:
0
22#
发表于 2014-9-12 08:59 | 只看该作者
只需构建一次,就能得到可扩展性的应用。

        * 快速前并处理所有可用数据
        * 不丢弃数据
        * 不需要在系统运行时重新构建
        * 不是不断重复开发

使用道具 举报

回复
论坛徽章:
0
23#
发表于 2014-9-12 09:01 | 只看该作者
ecapc 发表于 2014-9-12 08:59
只需构建一次,就能得到可扩展性的应用。

        * 快速前并处理所有可用数据

软件栈=主要流程

        * 收集
        * 存储
        * 处理
        * 发布
        * 润色

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表