概述
关于数据治理您应该问的五个问题
越来越多的数据处理被推到边缘。在这里获取您需要了解的内容,以推动敏捷创新。
随着世界的日益互联,越来越多的数据处理被推到了边缘。据Gartner称,到2022年,超过一半的企业生成的数据将在数据中心和云之外创建和处理。这是新冠病毒之前做出的预测,它正在加速办公室外的远程工作和监控。
随着生成数据地点的增加,隐私法规也变得更加严格,数据保护和广泛访问两者之间的平衡变得越来越复杂。但是,只有确保数据的完整性和安全性,确保我们以如此多样化和传播方式使用的所有技术,创新才能向前推进。例如,一些公司将人工智能(AI)投资的最近下降归因于对提供这些算法的数据缺乏信任。良好的治理提供了可见性和质量,增强了人们对人工智能和其他先进创新的信心。
如果您正在创建数据治理框架以支持敏捷的基础设施,则需要提出正确的问题,以确保您不仅保护数据,而且为敏捷创新和协作的企业文化打下基础。以下是由高级客户主管迈克·丹皮尔拟定的几个最关键的问题:
1. 谁部署数据?
从历史上看,数据保护和治理一直是决策者讨论的话题,因为技术专家敦促商业用户对“他们的”数据拥有所有权。今天,这些讨论更加复杂。随着业务团队被要求跨多个平台进行数据创新,IT和业务现在分担数据部署和管理责任。
但是,IT和业务部门部署的数据可能具有非常不同的沿袭、来源和生命周期。我们建议IT仍拥有和部署企业数据,这些数据是应用源、受信任、事务性和主要数据。业务团队的工作是将这些数据与其他来源(如外部公共领域数据(天气)或在其沙盒、湖泊和其他环境中购买的数据(人口/心理图)集成。
了解谁在使用这些数据类型以及他们访问这些数据类型的频率至关重要。在构建Teradata Vantage时,我们考虑到了这一需求,从而更容易监控用户登录会话和查询。其他平台可能需要您开发和部署各种监控方才能获得这种可见性:一些完全自动化,其他大多是手动的。
2. 谁治理什么?
这个问题可能很棘手。如果您猜想摄入数据的小组应该管理它,这只是部分正确。从质量角度来看,企业仍然拥有所有数据治理以及与企业数据相关的业务元数据。但现在,企业还拥有他们摄入的数据的业务上下文(业务和技术元数据)的治理,以确保它可以在需要时与企业数据集成。
3. 数据部署在哪里?
这个问题可能会产生一些激烈的讨论。如果您一直在四处寻找云供应商,您可能会一遍又一遍地听到这句话:“您的所有数据都应该交给我们。”我们建议在数据湖中部署您的一些数据,无论是本地数据还是云数据。但是,您的一些数据也应该位于沙盒、实验室和数据集市。 此外,您的干净、策展和受信任的数据应位于您的数据仓库中。
最重要的是,平台应通过能够进行物理和虚拟投影的高速结构进行互连。IT负责建立正确的数据治理框架来支持此基础架构。部署集中管理、可扩展的数据虚拟化技术可促进运行时的数据共享,而无需构建复杂的数据同步过程。这对于某些分析性使用案例具有真正的业务价值,应作为分析生态系统中的标准功能进行部署。
4. 每个人都同意数据定义吗?
业务用户需要知道在哪里可以找到他们需要的数据以及这些数据的含义。正如Datanami的杰夫·伯克所写的那样:“可用业务数据的数量、多样性和范围呈指数级增长,使得查找、理解和信任变得越来越困难。伯克建议创建系统,帮助IT和企业使用相同的语言。例如,受管理的数据目录可以将数据转换为业务术语,并连接和关联各种数据集。”
5. 您的人员致力于数据治理吗?
与任何政府一样,建立正确的技术和流程并不能保证良好的领导地位。决定治理是否真的行得通的是大众。作为数据治理框架的一部分而建立的工具和流程只有在持续更新状态下才能发挥作用。
IT与企业之间的沟通至关重要,每一步都是至关重要的。随着IT建立对企业数据和自助分析的安全访问,企业的工作是公开和坦率地了解哪些是有效的,哪些是非工作的。一旦创建流程,企业就可以依靠IT作为资源来管理流程。至于IT,他们应该期望承担新的治理角色,以创建一个繁荣、自备和具有成本效益的分析生态系统。
在努力设计一流的数据治理时,花点时间问问自己这些问题是值得的。好的治理回报的将不仅仅是数据保护和诚信、业务价值推进、更明智的战略决策以及更敏捷、协作的文化。