1.1 数据孤岛,无法打通
数据工作者在将数据用起来的过程中,最常面临的问题就是数据孤岛、数据无法打通。这里面有技术的原因,也有管理制度的原因,更有数据观的原因,如图1-2所示。
图1-2 数据无法打通的三大原因
1. 技术原因
企业在进行信息化建设的过程中,往往会根据不同业务条线的情况和特点,按需采购不同的信息化工具,这种情况在大型集团公司中尤为常见。不同厂家的数据库或数据存储方式就像海平面下的岛屿,相互之间无法连通,这种情况属于因技术原因无法打通。既然是技术原因,就可以通过日新月异的技术手段来进行数据交换、汇聚和打通:基于异构数据源、异构厂商集群、时效性和技术栈等因素考虑,当前业内一般采用离线数据同步和实时数据同步两种技术方式来进行数据迁移打通。
2. 管理制度原因
数据使用一般可以分为三个层次,如图1-3所示。
图1-3 数据使用的三个层次
- 数据使用1.0:自生自用,即部门、企业的数据自己生产加工,自己使用。
- 数据使用2.0:自生他用,即部门、企业的数据自己生产、加工、授权后供他人使用。
- 数据使用3.0:共生共用,即多部门或多企业将数据进行融合再加工,授权后供多部门、企业共同使用。
信息化建设的初衷往往是满足某业务线管理自身业务的需要,因此采集后的数据大多处于数据使用的1.0层次。各部门对自身数据进行加工处理并形成分析报告,查找原因以进行针对性改进,实现了业务数据化→数据业务化的小循环过程。这样,一方面使数据价值得到了体现,但另一方面也在部门间铸起了数据交换的壁垒。部门间数据不共享的情况源于公司管理制度的欠缺,公司内有很厚的部门墙。
3. 数据观原因
一些公司的信息化建设仅仅实施到软件铺设,员工能够通过系统完成日常工作就戛然而止了。从CEO到管理层,再到基层员工,都没有重视留存在信息系统中的数据的重要性,往往将其束之高阁甚至直接删除。部门各自为政,数据并不打通,大家各行其道。这些问题都可以追因到数据观层面。
这几种问题中最容易解决的是技术问题,因为技术、工具可以通过学习或直接采购快速获得。当前有非常多优秀的商业化数据交换工具和开源数据同步工具,均可供选择。这些软件工具的采购、铺设、运行的实施周期往往在3~6个月。
稍难解决的是部门间数据不共享问题,这类问题往往需要由公司总部来统筹解决。数据是一种特别的资源,它可再生,融合价值大于原有价值之和,越用越有价值。因此只有把数据汇聚在一起,才能实现数据世界的完整复刻。如何跨越部门间的小利益,让生态效应发挥大价值,这是公司级战略需要考量的方向。要将数据使用从1.0层次推进到2.0层次或3.0层次,即将某一部门数据共享给其他部门使用,或将多部门数据汇集加工,创造出更具价值的数据资产,这种跨部门的数据资源调度、共享机制的构建至少需要一年的铺垫、宣传、推动和验证。
最难解决的是企业自上而下对数据的认知偏差问题。数据是有认知门槛的,并不是所有的业务人员都知道如何读懂数据或操作数据,而数据人员又缺少向业务人员生动解释数据的能力。因此企业需要一种数据和业务间的转化术语,来帮助业务人员、运营人员、职能人员等快速理解数据,掌握数据应用技能,进而认识到数据的重要性,达到数据使用的3.0层次:实现数据的共生共用。共生共用并不是把所有数据倾倒在一起,使用时从数据池中直接捞数据的野蛮方式。共生共用意味着数据的接入、生产、使用、管理进入系统化阶段:所有数据的来源、现状、去向都清晰可查,生命周期都得到有效管理,使用都有章可循。这种数据观的构建往往需要3~5年持续不断的耕耘建设,甚至需要融入企业的文化建设中。
当一个企业需要切实解决数据孤岛问题时,我们建议采用从难到易的方法。
首先,塑造企业的数据认知。因为只有企业全体员工都理解数据的重要性,才能目标一致,相互配合,而不会因为认知不同或认知不足,造成数据工作各环节的障碍和断层。
其次,促进推动部门间的数据融合。各部门数据的加入是为了更好地享用其他部门的数据或在加工后得到更具价值的数据资产。以此作为突破口说服各部门交换数据,并保障后续数据共享机制的正常推进。
最后,选择数据同步的技术或工具。在数据认知充分,政策到位,各部门配合默契的前提条件下,选择合适的同步工具实现数据的交换汇聚是一件水到渠成的事。