1.3 大数据挖掘与应用
通过随机抽样采集到的数据已不能满足大数据时代人们的需求,人们对微观数据的精确性要求不断提高,并且要求通过估计、预测等方式把握事物发展的宏观趋势,包括因果关系、相关关系。人们对社会经济环境的认知发生了改变,深度挖掘而来的大数据被应用于社会经济的各个领域。
1.寻找海量数据的关联
数据关联是数据库中的一种可寻信息。关联的定义为两个或两个以上的变量在取值上存在一定规律。关联可分为简单关联、因果关联和时序关联。数据库中隐匿的关联网是关联分析的目的所在。数据的关联函数一般是未知或不可知的,同时缺乏系统归纳性。因此,利用具有一定可信度的关联分析规则挖掘出关联性信息或知识就显得更为重要。
1993年,阿格拉沃尔等专家最早提出了在顾客交易数据库中挖掘数据关联的可能性,此后的研究者对关联规则进行了大量研究,并通过引入随机抽样和采用并行的思想优化原有算法,以提高数据挖掘的效率。如今,数据关联的挖掘规则和研究成果已经在实践中得到广泛应用。海量数据中的关系、趋势、模式通过数据挖掘而出,为决策者提供最新的可用信息,人类认知范围从“已知的”“过去的”延伸到“未知的”“将来的”,为各种决策活动提供依据。
2.服务于生产经营决策
大数据可以精准地预测未来可能发生的行为和事件,有效地提高决策的准确性。使用信息技术可以助力复杂数据的收集、整理与挖掘分析,从纷繁的数据资源中寻找规律和关键节点,为生产经营与政策制定提供决策依据。
服务于预测和决策的大数据技术通过探寻数据关联性,以强大的判断力和决策力,成为决策优化中不可或缺的科学工具。例如,针对医疗方案的选择,美国医生利用大数据技术提高医疗服务的有效性;华尔街“德温特资本市场”公司CEO保罗·霍廷通过对网络留言的分析来了解民众情绪,从而决定对股票的处理;北京美福润医药科技公司通过分析药价、运输距离等因素,提高药物的销售量。在上述案例中,大数据分析技术在辅助行为决策、提高决策准确性和运营效率上发挥了重要作用。
3.优化社会经济生态圈
社会经济生态圈也可以用大数据进行分析。例如,通过大数据的分析确定麦当劳、肯德基的店铺选址。数据分析和挖掘改变了沃尔玛公司的供应链模式,形成了新的销售“生态圈”。对消费者需求的数据分析,使企业管理层可以提供更加契合消费者需求的产品。大数据已成为产业转型升级中优化产业链、推动产业分工和细化、延长产品的生命周期、降低企业运行风险和成本的重要驱动因素。大数据技术优化了社会经济生态圈,提高了企业的价值创造能力。
4.提升社会智能系统能力
在社会服务上运用大数据可以为人们的生活改善创造条件,在城市的科学化管理上,互通互联的城市数据是智慧城市运行维护、决策、服务、管理的核心,政府在城市管理和运行能力上的提高,支撑着智能交通、智能电网、智能医疗等智能社会服务。在节省社会资源的情况下,既可以优化城市管理布局,也可以提高社会服务能力。比如智能医疗系统通过大数据分析,可以预测医院医疗水平和机构配置,帮助政府改善社会医疗结构。不断发展中的大数据技术应用领域不断扩大,已经融入经济、社会管理的各个领域。便捷、可靠的信息获取使社会的价值创造能力、商业模式和管理方式创新能力不断提高,成为社会进步的重要引擎。