楼主: pipihappy8888

专家坐堂:没有数据分析,掘金从何说起?

[复制链接]
论坛徽章:
2
ITPUB 11周年纪念徽章
日期:2012-10-09 18:09:19秀才
日期:2015-08-24 09:48:07
11#
发表于 2015-8-5 11:30 | 只看该作者
刚刚试读过那本书,仔细看了前几页,后几页粗粗的过了一下,感觉还是不错的,挺详细 ,总体感觉适合于底层的开发实施人员阅读

使用道具 举报

回复
论坛徽章:
0
12#
发表于 2015-8-5 13:30 来自手机 | 只看该作者
bobo307135136 发表于 2015-8-5 11:23
我个人是做大数据分析的,目前从事的是政府行业大数据,在这个行业目前遇到最大的问题的 政府大数据项目落地比 ...

这位同行您好,对您的观点深表同意。玩数据真的是一个综合性的素质的体现,是需要多年的积累。
关于政府的数据方面,从我个人的职业生涯跟您分享一些吧,我自己是宁波市节能和清洁生产审核专家库成员,宁波市所有的规上企业每月要上报相关的数据到政府部门。但是统计数据由财务部门上报政府统计部门,能耗数据由生产部门上报至经委部门。有条件的公司甚至将实时数据库直接与政府的实时数据库进行对接,但是问题仍然是政府部门之间的壁垒没有打破,企业同一套数据要多处上报好几次,各个部门之间加工或处理之后的数据又不太相同。所以,如果您要做数据分析,我绝对首先看您针对的对象,再想办法看能不能链接到相关政府部门的数据库。
巧妇难为无米之炊,如果连数据都拿不到,分析什么呢。
但是个人觉得政府的很多数据的确不太好拿到

使用道具 举报

回复
论坛徽章:
0
13#
发表于 2015-8-5 13:31 来自手机 | 只看该作者
bobo307135136 发表于 2015-8-5 11:30
刚刚试读过那本书,仔细看了前几页,后几页粗粗的过了一下,感觉还是不错的,挺详细 ,总体感觉适合于底层的开发 ...

谢谢您的支持,太感谢了

使用道具 举报

回复
论坛徽章:
0
14#
发表于 2015-8-5 16:17 | 只看该作者
bobo307135136 发表于 2015-8-5 11:23
我个人是做大数据分析的,目前从事的是政府行业大数据,在这个行业目前遇到最大的问题的 政府大数据项目落地比 ...

我是在佛山的,下属的南海区最近成立了一个被外界称为数据统筹局的部门。当然里面的核心数据都是打包给北京某公司进行分析提取的,外行人或者公司想要插足这领域,很难,政府部门,你懂的。

使用道具 举报

回复
论坛徽章:
0
15#
发表于 2015-8-5 16:21 | 只看该作者
不管是用什么平台进行数据分析,在整个数据分析或者数据挖掘的流程中,最耗时的依然实在数据收集和清晰这方面。实际上进行数据分析也不是大家想象中的那样在平台上敲几行代码就可以谈笑风生的等待结果,然后写报告。更多时是在海量数据中,进行整理清晰工作,如标准化、排除缺失值,变量选择或者成分分析等。说穿了其实是很枯燥的工作。

使用道具 举报

回复
论坛徽章:
0
16#
发表于 2015-8-5 16:56 来自手机 | 只看该作者
bohrium 发表于 2015-8-5 16:17
我是在佛山的,下属的南海区最近成立了一个被外界称为数据统筹局的部门。当然里面的核心数据都是打包给北 ...

没错,有价值的就是数据本身

使用道具 举报

回复
论坛徽章:
0
17#
发表于 2015-8-5 16:59 来自手机 | 只看该作者
bohrium 发表于 2015-8-5 16:21
不管是用什么平台进行数据分析,在整个数据分析或者数据挖掘的流程中,最耗时的依然实在数据收集和清晰这方 ...

这位同行说的没错,一整段的数据分析过程,最耗时的往往是数据的整理工作,往往我们很多时候的数据都是不齐整的。在你整理数据的过程当中,本身也可以发现很多的问题。

使用道具 举报

回复
论坛徽章:
26
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44奥运会纪念徽章:铁人三项
日期:2012-08-21 21:48:242013年新春福章
日期:2013-02-25 14:51:24劳斯莱斯
日期:2013-08-11 20:46:31本田
日期:2013-12-10 22:01:02劳斯莱斯
日期:2013-12-16 22:07:38本田
日期:2013-12-19 20:35:46技术图书徽章
日期:2014-03-10 14:09:19喜羊羊
日期:2015-02-22 13:44:282015年新春福章
日期:2015-03-04 14:51:12
18#
发表于 2015-8-5 20:33 | 只看该作者
zzqu629 发表于 2015-8-5 10:26
谢谢这位童鞋的问题,excel的确是存在这样的问题,解决方案如下:
1.多几张sheet,最笨的办法,也最简单。 ...

crystal ball不错,拟合、模拟、最优化、时间序列这些常用的都有了,新版本还支持hyperion planning和essbase。就是价格不便宜……

使用道具 举报

回复
论坛徽章:
26
ITPUB新首页上线纪念徽章
日期:2007-10-20 08:38:44奥运会纪念徽章:铁人三项
日期:2012-08-21 21:48:242013年新春福章
日期:2013-02-25 14:51:24劳斯莱斯
日期:2013-08-11 20:46:31本田
日期:2013-12-10 22:01:02劳斯莱斯
日期:2013-12-16 22:07:38本田
日期:2013-12-19 20:35:46技术图书徽章
日期:2014-03-10 14:09:19喜羊羊
日期:2015-02-22 13:44:282015年新春福章
日期:2015-03-04 14:51:12
19#
发表于 2015-8-5 20:39 | 只看该作者
bobo307135136 发表于 2015-8-5 11:23
我个人是做大数据分析的,目前从事的是政府行业大数据,在这个行业目前遇到最大的问题的 政府大数据项目落地比 ...

政府行业大数据我觉得很多时候是个笑话,数据对不对都不清楚,有啥好分析的。
每季度统计局收集行业数据,要我们报数时,我们都瞎报,因为统计局给的excel模板根本不适应我们企业情况,对方也不对字段做说明和要求,反正都知道是捣糨糊。
不要说行业数据,就是企业内部数据也不好整,做合并报表,每个实体的coa都不一样,头痛死了,只能凑数。

使用道具 举报

回复
招聘 : 系统架构师
论坛徽章:
142
摩羯座
日期:2016-03-30 23:01:17秀才
日期:2015-07-31 14:17:16秀才
日期:2015-07-31 09:12:09秀才
日期:2015-07-28 10:22:54秀才
日期:2015-07-24 09:00:17秀才
日期:2015-07-20 08:54:46秀才
日期:2015-07-15 12:49:25秀才
日期:2015-07-09 09:23:47秀才
日期:2015-07-06 10:44:32秀才
日期:2015-07-06 10:34:54
20#
发表于 2015-8-5 21:20 | 只看该作者
, 占个位先

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

TOP技术积分榜 社区积分榜 徽章 团队 统计 知识索引树 积分竞拍 文本模式 帮助
  ITPUB首页 | ITPUB论坛 | 数据库技术 | 企业信息化 | 开发技术 | 微软技术 | 软件工程与项目管理 | IBM技术园地 | 行业纵向讨论 | IT招聘 | IT文档
  ChinaUnix | ChinaUnix博客 | ChinaUnix论坛
CopyRight 1999-2011 itpub.net All Right Reserved. 北京盛拓优讯信息技术有限公司版权所有 联系我们 未成年人举报专区 
京ICP备16024965号-8  北京市公安局海淀分局网监中心备案编号:11010802021510 广播电视节目制作经营许可证:编号(京)字第1149号
  
快速回复 返回顶部 返回列表