|
1.要监控的关键威胁是什么?
数据的真实性,有效性及客观性。现在好多数据都缺乏这些性质,在一堆不真实有效客观的数据基础之上分析出来的结果又有什么意义呢。
2.涉及的分析方法有哪些、这些分析方法又需要哪些数据?
大数据分析主要依靠机器学习和大规模计算。机器学习包括监督学习、非监督学习、强化学习等,而监督学习又包括分类学习、回归学习、排序学习、匹配学习等。分类是最常见的机器学习应用问题,比如垃圾邮件过滤、人脸检测、用户画像、文本情感分析、网页归类等,本质上都是分类问题。分类学习也是机器学习领域,研究最彻底、使用最广泛的一个分支。
4.需要什么样的平台系统来支持分析工作,平台选择的关键能力指标有哪些?
统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求,在这方面,一些实时性需求会用到EMC的GreenPlum、Oracle的Exadata,以及基MySQL
的列式存储Infobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop。统计与分析这部分的主要特点和挑战是分析涉及的数据量大,其对系统资源,特别是I/O会有极大的占用。
5.现有技术能力下建立起的平台,适合怎样的人来使用,是否已经具备这样的人员,是否能够·购买相应的安全服务?
适合对数据库,非关系数据库,计算机,数学理论功能深厚的人来使用。购买相应的安全服务也是没有问题的,一般平台提供方会将相应的安全服务当做增值服务来收费,只要出得起钱,就能买到相应服务,至于服务质量嘛,谁用谁知道
6.采集数据和人员水平受限情况下,如何选择切实的目标保障有实际的效果?
人员水平受限,只能根据自身的实际情况来进行安全分析。不要制定过高的不切实际的目标,那样只能导致失败。
|
|