大数据技术入门
上QQ阅读APP看书,第一时间看更新

1.4 大数据分析

大数据平台可以存储所有类型的数据。从简单的文件存储,到不强调一致性的非关系型数据库存储。得益于自身基础设计理念,大数据平台可以无限扩展。如果大数据平台在云端运行维护,那么它的灵活性将更强。从概念上讲,存储数据是大数据应用中最易于实现的部分。

光有大数据还不够。那么,在大数据平台上存储了足够多的数据后,我们该怎么将其加以利用呢?分析大数据,并将分析结果应用于决策中才是最重要的事情。预测分析(predictive analytics)是大数据分析领域中的一个常用模式,它通过分析采集的数据来预测未来的行为或趋势。它根据事物的过去和现在估计未来,根据已知预测未知,从而减少对未来事物认识的不确定性,以用来指导我们的决策行动,减少决策的盲目性。在大数据分析领域,预测分析常常与预测模型、机器学习和数据挖掘有关。对于一个政府部门而言,通过预测分析来精准把握政府工作的重点。比如:云升科技帮助湖州市公安局分析来自各个渠道的海量群众诉求,预测下个月的警务工作热点,从而帮助湖州市公安局合理安排警力,最终实现民意引领警务。美国的医疗决策支持系统基于预测分析来判断某些人得某些疾病的风险,并基于当前的健康状态给出最正确的医疗决定。国内的很多金融企业通过预测分析来实现业务的风险控制。比如:某银行分析其客户的消费数据和基本数据,从而预测该客户的信用卡和贷款的偿还能力。环保部门用数据决策,利用环保大数据综合研判,制定环境政策措施,预警环境风险,提供环境综合治理科学化水平。

除了预测分析,还有关联分析。关联分析的目的在于,找出数据之间内在的联系。比如,购物篮分析,即消费者常常会同时购买哪些产品(例如游泳裤、防晒霜),从而有助于商家的捆绑销售。