1.4 数据的多维集合——大数据
近几年来,由于计算机、物联网等信息化技术以及传感技术的发展,现代生活中出现了“一切皆可数据化”的思维,数据的产生方式由“人机”“机物”的二元世界向着融合社会资源、信息系统以及物理资源的三元世界转变,数据规模呈膨胀式发展态势。
1.4.1 大数据的内涵
1.大数据的多维定义
目前对大数据尚未形成统一的定义,最早提出“大数据”概念的机构——麦肯锡公司认为:大数据是规模超过常规数据库工具获取、存储、管理和分析能力的数据集。该定义有两方面的内涵:一是符合大数据标准的数据集的大小会随着时间的推移、技术的进步而增长;二是不同部门符合大数据标准的数据集的大小会存在差别。麦肯锡公司在研究报告中还指出,大数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素,而人们对于海量数据的运用预示着新一波生产率增长和消费者盈余浪潮的到来。在麦肯锡公司的报告发布后,大数据迅速成为计算机、金融、物流、交通等领域的热点研究问题,并被认为是关系到社会生产、生活的关键技术,更受到了企业的高度关注。
国际商用机器公司将大数据的特点总结为“4V”理论:
(1)数据规模庞大(Volume)当数据规模很小时,所遇到的问题已有非常成熟的数据存储、计算、分析、呈现方案,数据模型方面也有非常多的研究成果。大数据则必须是规模异常庞大的数据,只有当规模庞大时,才有新的研究价值。
大数据的“大”,不是说一定要超过特定TB。由于过去计算能力、存储能力、分析能力有限,现在看起来很简单的问题,可能曾是大数据相关问题。
(2)数据更新频繁(Velocity)摩尔定律揭示了处理器分析能力与时间的关系,也就是说,每隔18个月左右处理器的分析能力翻一番。对一个静止的数据集,今天的处理器无法处理,存储器不好存储,但随着技术的进步,未来可能非常容易处理。
大数据技术,要求人们想出更多的巧妙的分析办法,提出更优秀的处理模型,而不能只依赖存储能力、处理水平、网络带宽等硬件设备的性能改进。大数据技术要求分析对象是频繁更新的数据集。
(3)数据类型多样(Variety)传统的关系型数据库,无论从理论上还是在应用上都非常成熟。关系型数据库一般保存格式固定、类型单一的数据,多年数据库理论、数据挖掘、数据仓库的研究,已经有相当多的成果。
大数据要求分析对象是异构、异质的数据集,可能包括文本、音频、视频等多种形式,也可能是结构化、半结构化或无结构的。
(4)数据价值巨大(Value)如果数据没有价值,就没有分析的必要。因此,大数据要求待处理数据集有巨大的商业价值或社会价值。
在价值这个层面,除了要求价值巨大外,一般还会增加一点要求,即价值密度极低。人们常说,大数据是一个“金矿”,金矿包含两个方面的含义:一方面,黄金很值钱,金矿很有价值;另一方面,金矿不是金库,几万吨的矿砂,也许只有几十千克黄金,也就是说金矿的价值密度是非常低的。大数据也要求价值密度非常低。如果每一条数据都是非常有价值的,那么也就无所谓“挖掘”了,没有挖掘,大数据的意义也就荡然无存了。
高德纳研究机构认为,大数据是只有运用新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的数据资产。从数据的类别上看,大数据指的是无法使用传统流程或工具处理或分析的信息。它定义了那些超出正常处理范围和规模、迫使用户采用非传统处理方法的数据集,这些数据集呈现多样化的特征,即非结构化或半结构化的特征。维基百科对大数据的另外一个定义是:大数据是指所涉及的数据量规模巨大到无法通过人工在合理时间内达到收集、提取、管理、处理并整理成为人类所能解读的信息。该定义同样指出,大数据的数据规模已经大到没有办法用人工的方式加以处理。
美国国家标准和技术研究院从学术的角度对大数据的定义做了解释:大数据是指由于受其数据量、采集速度或数据表示的限制而无法使用传统关系型方法进行有效分析,或需要使用重要的水平缩放技术来实现高效处理的数据。
综上所述,从大数据的定义及其解释来看,其定义、存储、数据结构、并行计算与分析技术、数据处理技术等方面的需求已经超出了传统方式的分析和处理能力,也就是说,运用现有的数据库管理结构、数据仓库架构很难实现大数据的存储、处理与分析。因此,必须研发一套全新的系统开发架构、处理模式和综合管理工具,来完成大数据的管理、处理与分析。
目前,大数据已经成为信息综合管理与处理、知识管理与决策、商务智能与信息增值等相关领域最热门的话题之一。大数据产业链条包含了数据生成、数据存储、数据处理和数据展示等完整生态系统的多个环节。大数据所涉及的企业已经不仅是传统IT企业或者少数互联网巨头企业,其影响范畴甚至已经涵盖了那些应用大数据处理结果的企业。大数据通常包括如下相关的企业:①与海量数据的存储和处理相关的企业;②与数据中心建设和运营维护相关的企业;③与视频化应用相关的企业;④与智能化和人机交互概念相关的企业。
2.大数据的产生
(1)企业级需求孵化出早期大数据 随着电子商务业务的拓展、各行各业信息化应用的普及与深入发展,计算机处理信息的领域不断扩大,其信息处理系统随之产生了大量现行的和历史的重要数据。企业在经营管理过程中,如企业资源计划系统、业务生产系统、产品市场交易系统、生产资料管理系统、财务系统、办公自动化系统、客户关系管理系统、物流供应链管理系统等都产生了大量数据,同时也产生了众多文档、交易记录、操作日志、客户反馈等非结构化数据,以及传感器数据、图像视频监控文件等实时多媒体数据。尽管企业已经意识到这些复杂格式数据的潜在价值,也通过数据挖掘技术对客户的交易过程、业务处理流程等进行了分析和预测,但是企业所处的信息化环境正在变化,企业应用与互联网、移动互联网的融合越来越快,来自企业外部的非结构化数据大大增多。
由此可见,企业级应用的需求拉动了大数据管理与分析技术的发展,而IT企业的积极参与也加速了这一进程的发展步伐,企业级应用的普及成为大数据产生的首要因素。
(2)网络发展推动数据巨量增长 随着互联网的普及、新型互联网应用的不断产生、网络信息与数据的不断增长,目前网络数据量已经在全球数据量中占比很大。伴随数据量增长而来的是网络中日益增多的数据类型,文本、图片、视频、声音数据等大量半结构化、非结构化的复杂数据类型应运而生。
网络数据不仅来自于传统互联网,随着传统互联网到移动互联网的转变,移动宽带的迅速提升,产生数据的终端由个人计算机转向了包括个人计算机、功能手机等在内的多样化终端,因而移动互联网也成为网络数据的重要来源。个人智能手机和平板计算机的快速普及,使得越来越多的人、设备和传感器通过数字网络连接起来,并且产生、分享和访问数据,移动互联网正逐渐渗透到人们工作和生活的各个领域,移动终端逐渐演变成了一个提供通话管理、游戏娱乐、办公记录、网页浏览、购物理财、视频分享等各类应用的运行环境。
(3)云计算的出现带来革新浪潮 云计算是信息技术领域继计算机、互联网之后的第三次革新浪潮。2006年谷歌公司在搜索引擎大会首次提出“云计算”的概念,短短数年间,云计算就给信息领域带来了巨大的变革。
云计算是一种基于互联网相关服务的增加、使用和交付的模式,通过互联网提供动态易扩展且经常是虚拟化的数据资源。作为一种新型计算模式,云计算体现了网格计算、分布计算、并行计算、效用计算等技术的融合与发展。云计算为数据存储与计算提供了一个新型的平台,也为大数据的发展提供了动力。
从技术上看,大数据与云计算是密不可分的,云计算是大数据的基础与平台,大数据则是云计算的重要应用,两者相辅相成,缺一不可。大数据的特点在于对海量数据的挖掘,其必然无法用单台计算机进行处理,需要依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。由此可见,云计算的出现是大数据产生必不可缺的前提条件。
(4)物联网将大数据渗透到多维领域 物联网背景下的大数据成倍增长,这不仅体现在联网终端数量逐渐增多,还体现在,由于互联网和电子商务已经渗透到人们工作和生活的各方面,也带来了各个业务领域的数据采集数量的大规模增加。另外,物联网的感知层也出现了多样化的数据需求,涌现了基于物联网领域的感知技术,主要包括传感器技术、红外技术、蓝牙技术等短距离传输技术,音频、视频、图像、文本等的大量数据采集技术。这些技术作为物联网最为重要的技术,使工业、农业、医疗、教育、交通运输、物流、通信、金融等各行各业及相关领域获得了更为广泛的数据来源与数据资产,也为物联网应用的数据采集提供了丰富的数据源。因此,物联网技术已经成为大数据时代的重要技术之一,推动了大数据的发展。
3.大数据的特征
大数据的特征可以体现在以下方面:从容量上看,数量容量大,数据量的大小决定数据的价值和潜在的信息;从种类上看,数据类型具有多样性;从速度上看,要求处理数据的速度非常快;从复杂性上看,数据量巨大,来源多、渠道多,价值密度低;在可变性、真实性等方面,大数据也都具有自己的特征。
(1)数据容量大 大数据的特征首先体现为“大”,在使用MP3技术的时代,一个小小的MB级别的MP3就可以满足很多人的需求,然而随着时间的推移,存储单位从过去的GB到TB,乃至现在的PB、EB级别。随着信息技术的高速发展,数据开始爆发性增长。社交网络(微博、微信)、移动网络、智能工具、服务工具等,都成为数据的来源。迫切需要智能的算法、强大的数据处理平台和新的数据处理技术来统计、分析、预测和实时处理如此大规模的数据。
(2)数据类型多 按照数据的结构,数据可以划分为结构化数据、半结构化数据和非结构化数据。广泛的数据来源决定了大数据形式的多样性。任何形式的数据都可以发挥作用,目前应用最广泛的就是推荐系统,如淘宝、网易云音乐、今日头条等,这些平台都会通过对用户日志数据的分析,推荐用户喜欢的内容。日志数据是结构化明显的数据,还有一些数据结构化不明显,例如图片、音频、视频等,这些数据关系弱,需要人工对其进行标注。
如今,人们会借助互联网发布各种信息,如网络日志、社会数据、互联网文本和文件、互联网搜索索引、呼叫的详细记录,天文学、大气科学、基因组学、生物学和其他复杂学科或跨学科的科研数据,以及军事侦察、医疗记录、摄影档案馆视频档案和大规模的电子商务信息等。大数据已经不仅包含这些发布的信息,全世界范围内的工业设备、汽车、电表上有着无数的传感器,随时测量和传递着位置、运动、振动、温度、湿度乃至空气中化学物质的变化,产生着海量的数据信息,这些数据也包含在大数据中。
(3)价值密度低 虽然大数据具有巨大的商业价值,但是不可否认的是,大数据价值密度的高低与数据总量的大小成反比,这也是大数据的核心特征。以视频为例,一部1h的视频,在连续不间断的监控中,有用数据可能仅有2s。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
现实世界所产生的数据中,有价值的数据所占比例很小。相比于传统的小数据,大数据最大的价值在于:通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,利用机器学习方法、人工智能方法或数据挖掘方法进行深度分析,发现新规律和新知识,并将它们运用于农业、金融、医疗等各个领域,最终达到提升社会治理水平、提高生产效率、推进科学研究的效果。
(4)处理速度快 对数据处理速度的要求是,一般要在秒级时间范围内从各种类型的数据中快速获得高价值的信息,时间太长就失去了价值,这是大数据处理区别于传统数据挖掘的最显著特征。
1.4.2 大数据成为经济社会发展新能源
如今数据逐渐成为与物质资产、人力资本并列的重要的生产要素,大数据将成为提高竞争力、生产力、创新能力以及创造消费者价值的关键要素。
1.大数据有助于政府决策精准化
大数据有助于政府横向部门间、政府与市民间的协作沟通,消除信息孤岛现象,使政府数据的共享和开放成为可能。首先,大数据技术可以集中各部门的数据资源而形成“数据云”,通过制定访问协议并分配访问权限,使各部门根据需要在权限范围内获取云端数据,这种方式可以打破原有时间和空间的束缚,提高数据共享效率。其次,大数据技术有助于规范政府各部门的数据采集存储标准,增强各部门间数据治理工作的一致性。在此基础上建立政府智能系统,可以有效地解决政府部门间数据的冲突或矛盾等问题。再次,大数据使行政过程更加公开透明,公众可以实时监督政府行为,督促公务人员提高工作效率,使得权力在阳光下运行。
决策是政府管理的核心环节,决策水平决定着政府公共管理的成败。数据和信息是决策的基础,关乎决策的准确性和科学性。传统的政府决策方式是通过座谈会、听证会和公民意见箱等方式搜集信息,而这些信息严格来说属于小范围的抽样调查数据,数据和信息本身就是不全面的,据此制定出来的决策难免出现偏差。大数据技术摒弃了抽样调查和经验判断等传统决策方式,利用数据融合、数据挖掘、智能运算等技术,使用完整的、全面的信息进行分析,得出的决策方案更加科学合理。
正如美国著名学者丹尼尔·埃斯蒂(Daniel C.Esty)所说:任何精英或利益集团的判断都是片面的,只有相信基于整体分析的大数据技术,政府才能做出正确的决策,进而提高其管理效率。大数据技术将模糊决策转化成精准决策,增强了决策的科学性。此外,大数据技术对信息的收集、分析和处理过程是实时的,保证了决策的时效性。这让本来静态的政府决策动态化,大幅提升了决策的效率。总而言之,大数据技术可以充分利用政府拥有的信息资源,为政府决策的科学性提供保障。
2.大数据有助于公共服务精细化
在公共服务领域,大数据凭借数据维度多、处理速度快的特点,有利于深化治理改革、激活治理资源、创新管理手段、提升公共服务水平。在医疗卫生领域,大数据有利于避免过度治疗,减少错误治疗和重复治疗,从而降低系统成本、提高工作效率,改进和提升治疗质量。在公共管理领域,大数据有利于有效推动税收工作的开展,提高企业纳税效率,同时可以提高教育部门和就业部门的服务效率,根据大数据分析,做到“对症下药”。在交通领域,基于大数据的交通路网动态分析正深入发展,各种各样的互联网感知器使得交通通行效率越来越高。
在助力公共服务做大的同时,大数据还推动着公共服务做细做深。以往政府的公共服务对每个人都是相同的,由于技术的限制,公共服务很难针对不同人的特征进行精细化管理。随着经济社会的不断发展,生活水平的不断提高,人们的需求也在不断升级。公众已经不再满足于被动接受服务,而是希望能够选择符合自身要求的个性化的公共服务,因此,政府公共服务的精细化将越来越重要。大数据技术以其全面、准确、高效、智慧等特性,将“人类普遍”还原为“人类特殊”,能够满足公众的个性化需求,为政府公共服务精细化提供技术支持。例如精细化的交通管理,大数据技术能够根据城市实时、全面的路况信息,快速合理、精细准确地调整交通管理策略,提高道路使用效率。此外,大数据还可以应用到公共安全、公共卫生、食品安全、人口管理等领域,以提升这些领域公共服务的精细化水平。这种方式的广泛应用和全面覆盖,将满足公民的个性化需求,提高政府的公共管理能力。
3.大数据有利于经济可持续发展
在产业升级与经济发展方面,大数据发挥着巨大的作用。经济是由数据构成的,也是由数据驱动的。经济的发展就是数据的运动,经济改革就是数据的重新定义。运用大数据,能对市场做出精准、快速、实时的反应和判断。
(1)创新产业发展模式 大数据产业链涵盖数据采集、数据存储与管理、数据分析与挖掘、数据运行维护及应用、数据安全、数据标准与规范等多个环节,覆盖数据从产生到应用的全部生命周期。在大数据产业链中,可以实现对数据的全面采集、深度分析和系统优化,并将相关数据终端有效连接起来,从而打破产业类别与信息服务之间的壁垒,重构产业发展模式。
(2)促进关联产业集聚 大数据产业的优势不仅在于对庞大数据信息的专业化处理,更在于通过云计算、分布式处理、存储和感知等技术的运用,提升相关产品制造能力,攻克关键核心技术,并在数据获取与应用层面形成产业集聚效应。通过建设大数据发展核心区,建立数据交易流通机制和规范标准体系,在医疗、商业、城市服务等领域实现数据流通和产业体系内各部门的信息互通,促进核心企业周围形成产业集群,显著提升经济发展的规模效应。
(3)促进经济社会可持续发展 大数据的应用有助于推动环保、节能、绿色产业发展,促进环境保护和经济社会可持续发展。首先,利用大数据,可以对环境进行立体监测,通过数据模拟技术和排放清单等工具建立环保大数据系统,提高环境监测数据的可靠性,夯实数据应用基础。其次,利用大数据,可以对污染物排放集中、能源消耗大的产业进行精准治理,从而优化产业结构,提高资源利用效率。再次,大数据所具有的多元化、交互性特征可以为经济决策提供科学依据,有利于促进经济发展与改善民生、保护生态环境相协调,让人民群众更好地共享经济社会发展成果。
4.大数据加速企业创新能力升级
大量传统企业、制造业、加工行业、快消行业都面临着数字化转型。现有的业务数据化以及与大数据云计算技术相整合、落地,需要更多的传统企业能够跟大数据企业对接。
(1)大数据应用优化企业运营 大数据分析能够为企业的经营管理提供数据和决策支持。企业通过分析大量数据,可以进一步挖掘市场机会和细分市场,然后对每个群体采取有针对性的行动。用创新的方法解构消费者的生活方式,剖析消费者的生活习惯,让吻合消费者未来生活方式的产品研发不再成为问题。如果了解了消费者的特点,就知道了其潜藏的真正需求。大数据分析是发现新客户群体、确定最优供应商、创新产品、理解销售季节性等的最好方法。通过数据驱动产生应用,最后通过技术保障来实现整个产品的生命周期。大数据分析为企业提供了洞察市场规律的条件,也为企业制定营销策略、充分把握市场上转瞬即逝的发展机会、提高经营管理效率创造了良好的环境。
(2)大数据提高决策能力 大数据的核心作用在于实现企业运营数据的价值化,数据价值化包括数据分析和决策两个重要的环节,数据分析的目的之一就是辅助各种决策的制定。大数据能够有效帮助各个行业用户做出更为准确的商业决策,从而实现更大的商业价值,它从诞生开始就是站在决策的角度的。虽然不同行业的业务不同,所产生的数据及其所支撑的管理形态也千差万别,但从数据的获取、数据的整合、数据的加工、数据的综合应用、数据的服务和推广、数据处理的生命线流程来分析,所有行业的模式是一致的。
(3)大数据创新企业管理模式 大数据技术与企业管理核心因素高度契合。企业管理最核心的因素之一是信息搜集与传递,大数据的内涵和实质则在于大数据内部信息的关联、挖掘,由此发现新知识、创造新价值。两者在这一特征上具有高度契合性,甚至可以宣称大数据分析就是企业管理的又一种工具。因为对于任何企业而言,信息即财富,所以从企业战略着眼,利用大数据,充分发挥其辅助决策的潜力,可以更好地服务企业发展战略。企业的智能化运营管理,主要针对其与用户之间的动态交流,根据用户反馈为用户提供更加动态、合理、优质的服务。借助互联网,现代企业可以更好地实现与用户的沟通交流,用户也可以利用互联网享受到更多的设备资源,并通过及时反馈其体验而得到更好的服务。与此同时,数据分析水平的不断提高,使得动态数据的收集、管理、分析、研究有了更重要的意义:一方面,它保证了企业运营管理的有效性;另一方面也为管理用户体验和预测用户消费提供了有力的保障。企业通过与用户交互信息,为用户提供并推荐相关互联网资源,在保证用户体验的前提下,促进了企业资源的优化以及合理分配,也推进了企业的智能化运营进程。
1.4.3 机遇与挑战并存的大数据发展之路
1.大数据应用的未来发展方向
大数据带来了巨大的技术创新与商业发展机遇,小数据的不断累积,使数据具备更加完善和深层次的价值,开启了时代转型之路。大数据的分析和挖掘功能可以为企业经济发展提供数据支持,帮助企业和社会实现更高的经济效益。
大数据时代下,丰富的数据内容为企业的决策奠定了基础。大数据软件处理平台的出现,使企业可以对数据进行实时的追踪处理和分析,极大提高了信息传播的时效性。例如,一些产业在产品发行后通过大数据(网友的评价、吐槽等相关数据)分析调查,了解顾客的满意度以及消费倾向,从而生产适销对路的产品,缩短开发周期,使产品在市场更具竞争力,最大限度地提高效益。同时也可以根据多年的数据进行经济发展趋势和动向的预判,这种方法能有效规避风险和把握市场动向,精准投放生产,开拓市场。大数据的利用将成为企业提高核心竞争力、抢占市场先机的关键。企业/行业经济决策正在从“业务驱动”转变为“数据驱动”。
当前,在大数据应用的实践中,描述性、预测性分析应用较多,决策指导性等更深层次的分析应用偏少。做出决策的流程通常包括认知现状、预测未来和选择策略这三个基本步骤。这些步骤也对应了大数据分析应用的三个不同类型(描述、预测、决策指导)。不同类型的应用意味着人类和计算机在决策流程中不同的分工和协作。
第一层次的描述性分析中,计算机仅负责将与现状相关的信息和知识展现给人类专家,而对未来态势的判断及对最优策略的选择仍然由人类专家来完成。应用层次越深,计算机承担的任务越多、越复杂,效率提升幅度也越大,价值也越大。
随着研究和应用的不断深入,人们逐渐意识到前期在大数据分析应用中大放异彩的深度神经网络尚存在基础理论不完善、模型不具可解释性等问题。因此,虽然层次最深的决策指导性应用当前已在人机博弈等非关键性领域取得较好应用效果,但是在自动驾驶、政府决策、军事指挥、医疗健康等应用价值更高,且与人类生命、财产、发展和安全紧密关联的领域,要真正获得有效应用,仍面临一系列亟待解决的重大基础理论和核心技术挑战。
2.大数据发展仍面临诸多挑战
由于各行各业对大数据的需求日益增多,未来越来越多的领域将依靠大数据进行研究和决策,大数据技术的应用将会普及到每个涉及数据处理或计算的领域中。在带来巨大机遇的同时,大数据也带来了许多挑战。大数据在技术、安全和人才方面的要求越来越严苛,需求却又越来越广泛;数据的挖掘、分析和价值实现,都需要强大的技术支持以及大量的人才,这些问题都是在大数据时代全面来临的时候亟待解决的。
(1)技术创新成为制约发展的重要因素 数据的处理主要包括信息采集、信息实时处理、信息结果显示三个过程。丰富的数据源是大数据产业发展的前提,而处理错综复杂的海量数据存在两方面问题:一方面,人们需要从中采集有用的数据信息,抛弃错误数据信息;另一方面,人们在大数据分析中的某些重大要件或技术还不够成熟,挖掘有效信息的能力尚且不足。现在的数据很多都是非结构化的,如何兼顾数据元的存储和数据的保存,仍是一个问题。数据分析在很多应用中成了一项瓶颈,现有技术对此还没有良策。大数据时代下,数据以迅雷不及掩耳之势海量来袭,而大数据分析逻辑不足,大数据技术还有待发展。
(2)开放共享与隐私安全问题亟待解决 数据蕴藏着巨大的潜藏价值,因此数据的安全性问题显得尤为重要,这既需要技术层面的支持,又需要通过制度来约束。大数据现已成为网络攻击的主要目标,存在网络黑客和数据管理漏洞等问题,一旦数据泄密,或者使用了来源不可靠的数据,那么经济、社会安定等各方面就可能遭受不可估量的损失。而与隐私安全所对立的一面便是开放共享的问题,很多企业之间、部门之间不愿意共享数据,这就使得数据投资浪费或所需数据资源缺失。即使企业之间、部门之间愿意数据共享,又该怎样保证其安全性呢?如何平衡开放共享与隐私安全之间的矛盾显得尤为重要。
(3)人才供需矛盾较为突出 经济的发展离不开人的发展。互联网时代知识更新速度快,大数据的发展需要既了解经济知识又具备数据分析能力的人才,一般来说传统用户不具备大数据开发的能力,目前的大数据人才供不应求,缺口较大。某个大数据专业处理平台并不是对所有行业的所有方面都适用的,这就更需要专业人才对数据进行整合,因此,人才的匮乏无疑会阻碍大数据时代下经济的发展。
(4)工业互联网发展存在障碍 当前,工业互联网成为互联网发展的新领域,也是发展智能制造的重要载体和工具。然而工业互联网的发展中仍存在不少问题:政府热、企业冷,政府时常会“项目式”“运动式”推进,而企业由于没看到直接、快捷的好处,接受度低;设备设施的数字化率和联网率偏低;大多数大型企业仍然倾向打造难以与外部系统交互数据的封闭系统,而众多中小型企业数字化转型的动力和能力严重不足;国外厂商的设备在我国具有主导地位,这些厂商纷纷推出相应的工业互联网平台抢占工业领域的大数据基础服务市场。
3.加速构建新的数据治理体系
要解决这些问题,需要构建一个基于大数据的数据治理体系。该体系必须跳出单个组织的边界,从营造国家大数据产业发展环境的视角来进行全面和系统化考虑。
(1)为经济发展创造大数据环境 在经济活动中,合理有效利用大数据能帮助实现利益的最大化。在这个过程中,需要多方面的配合,共同为经济发展创造一个良好的大数据环境。政府首先应对大数据的发展给予高度重视并落实到政策中,有效推行大数据技术,并在科研上加大技术投入,加快突破海量数据采集、存储、清洗、分析挖掘、可视化、安全与隐私等领域的技术难关。在企业方面,应该意识到大数据对企业效益的影响,深化企业内部改革,整合有效资源,主动培养既了解经营管理又掌握大数据分析挖掘技术的全方位人才,为经济的发展输送动力。推动数据共享开放是各国大数据战略的重中之重,应构建一体化数据共享开放平台,探索政府数据和社会数据融合利用,使数据得到全面利用开发。只有政府、企业、社会三方共同努力,才能为经济发展创造出一个良好的大数据环境。
(2)加强数据安全和隐私保护 数据安全问题是一个全球性问题,也是经济方面至关重要的问题。针对这一问题,目前可以采取数据加密的形式。加密技术是直接作用于数据本身的,从数据源开始加密,加密后,文件便以密文的形式存在。数据加密技术在一定程度上保护了数据的安全,但还远远不够。数据安全问题不仅是技术攻防的较量,也是对隐私保护制度的考验。目前,许多国家已立法保护公众隐私,政府通过法律来保护数据的安全,建立健全安全保障体系。企业也要学习如何统筹安全部署,应对网络攻击、数据泄露等风险,提前做好预案。要提高安全意识,每个人都要重视大数据的安全问题,开展数据服务的同时加强数据安全保护,建立数据保密制度,在技术上提高安全防护能力,为经济的健康发展保驾护航。
(3)完善人才培养机制 人才是经济发展的核心竞争力。大力培养人才,能够为经济的发展提供更多的核心能力。加强大数据研究人员与管理者的联系,培养数据与经济跨领域复合型人才。在国家层面,应将大数据人才的培养提升到战略层次,加强大数据时代所需人才教育的投资与扶助力度。加强企业经济领域与计算机领域的互动,让经济分析人员更加了解大数据的技术与模式,加强专业人员的培训和考查,鼓励经济分析人员重视大数据专业技能的训练。在企业内部培养人才的同时,要扩大校企合作的范围,可以根据市场的实际需要来培养高素质人才。从目前的发展情况来看,校企合作是当前培育大数据人才的一个重要手段。