标签类目体系:面向业务的数据资产设计方法论
上QQ阅读APP看书,第一时间看更新

1.2 烟囱式建设,重复造轮子

除了数据孤岛,最重要的数据问题是烟囱式建设,重复造轮子,即每个业务部门各自从业务需求出发,从头至尾构建一套数据基座,以满足自身的数据能力建设需要。

烟囱式的数据建设会带来三大危害,如图1-4所示。

1. 烟囱越建越高,难以支撑

企业各部门从自身需求出发建设的数据就像工厂中的烟囱一样,纵横林立,相互之间没有联系,时间久了自然难以支撑。从部门出发的数据梳理容易过于关注部门的内部需求,既无法获得跨部门的数据资源,也无法得到全局视野上的数据支撑。在具体实施过程中,年轻的数据工程师并没有充分考虑数据底层的系统梳理和清洗溯源,就进行了快速的数据开发工作;在开发过程中,也缺乏数据逻辑和建模分层上的思考和指导。一切都以业务为导向,为了及时产出最终的数据结果,中间步骤是否合规合理、代码程序是否稳健正确都可能会被忽略。这样进行的数据建设极容易倾斜倒塌。

026-1

图1-4 烟囱式数据建设带来的三大危害

2. 数据治理在局部难以成功

近几年,数据治理概念受到了企业的认可。企业要用数据反映企业的真实情况,需要清洗、梳理、治理出干净的数据,只有数据加工逻辑准确无误,最终的数据结果才能反映出问题的本质。如果数据建设是各业务林立的烟囱式做法,并没有统一的部门来进行源头管理,那么数据治理很难在局部获得成功。

3. 重复投入容易造成资源浪费

烟囱式数据建设的最大弊端是造成了企业在数据建设上的重复投入,造成资源浪费。虽然各部门都有自己的业务特色和业务目标,但在数据建设中,底层原始层数据、中间明细层数据,乃至上层应用层数据都可能存在大量重复。如果各部门都自建一套数据系统,会发生反复存储、反复计算的问题,导致资源浪费。这种浪费会随着数据量的增加而越发凸显。

烟囱式的数据建设也使得部门间的信息通道天然割裂。数据人员埋头苦干几个月,殊不知他希望得到的数据成果早就有别的部门开发完成了。即使通过数据工作分享会,数据人员了解到其他部门开发的数据成果,想要申请使用,也会因为底层开发模式或开发语言不同而难以阅读、修改、使用。如果仍然需要使用这些数据成果,则需要在理解其开发逻辑后重新开发,这也会造成一定程度的数据资源浪费,并且降低企业使用数据的整体效率。

产生烟囱式数据建设的根源有以下几种。

  • 在企业发展过程中,集团总部层面没有重视数据建设,而某些业务部门提前发现了数据价值,开始了数据建设,形成了事实上的倒挂。而业务部门进行的数据建设具有局限性,它们并不会太多考虑数据建设的规范性和完整性。
  • 业务发展有先后。企业各时期都有不同的业务布局,新业务兴起往往会带动其发展所需的配套数据。业务部门通常并不会基于企业过去积累的全部数据建设成果来规划完整的企业数据建设计划,而只是按照部门的当前需求进行规划。
  • 各部门间存在部门墙,相互之间不愿意共享、共建数据。部门间对数据过度保护,不愿意分享给其他部门使用,也会产生烟囱式的建设结果:对于数据资产,如果部门无法通过授权共享的方式获得,那么就只能通过自己重新开发的方式获得。
  • 企业总部缺乏整体性的数据建设规划。这是一个总结性的原因,因为不管是以上哪种具体成因,都存在总部缺乏管控和协调各部门联动配合的因素。烟囱之所以会形成,就是因为各部门有自己的决策想法,有可调度的资源空间,自建比等待总部建设时效更快等。烟囱式的建设对部门来说有一定的好处,但是对于公司来说一定会产生浪费。因此企业在不同阶段需要做好策略抉择,最佳的方式是找到一种既能保障业务变化下的数据所需,又能统一组织规划以减少浪费的数据建设方案。这种方案是可能存在的,我们在后文中会提到。