概述
集成数据仓(IDW)的创新
除了成为组织唯一的真相来源外,了解集成数据仓库(IDW)还有什么其他重要性。

在当今的数字环境中,随着来自人员、产品和事物的信息源源不断地涌入,数据仓储的一个关键挑战是捕获、组合和分析如此多的不同类型的数据。这就是集成数据仓库(IDW)的目标。该仓库集中存储详细和汇总数据,有效地汇集了多个主题和部门区域,以提供公司内功能区域的360度视图。
集成数据的两种方法
在构建数据集成系统时,系统架构师通常采用数据仓库设计开拓者威廉·因蒙和拉尔夫·金鲍尔开发的两种理念之一:
- Inmon或“自上而下”方法可识别业务运营的主题领域和实体,如客户、产品和供应商。为每个主要实体建立详细的逻辑模型,并且所有数据都事先进行了集成和定义。此模型使加载数据不那么复杂,但构建查询结构更加困难。
- Kimball或“自下而上”方法可识别数据仓库希望回答的关键业务流程和问题,并创建数据市场以满足这些需求。数据被加载到暂存区域,但与实体耦合不如在Inmon模型中紧密。
Inmon方法的一个关键优势是,数据仓库是真相的单一来源,也是所有数据集成和标准化的地方。Kimball方法缺乏这种集中标准化,因为在进行查询之前,数据尚未完全集成。但是,Kimball方法允许快速构建数据仓库并高效地应用于业务应用。
Teradata提倡“自上而下”的方法。 这样用户总是有查询自由,他们能够随时询问任何数据的问题。数据仓本身的设计就鼓励深入探查不断找到下一个问题,以了解根本原因。 在Kimball方法中,用户可能需要回去重新设计才能回答关键问题,从而最终导致获得特定答案的时间更长。
为什么集成数据仓库(IDW)很重要
通过以广泛访问的方式整合来自不同来源的海量数据,企业可以:
跨功能单元共享信息
不同的数据源聚集在一个地方,减少企业中可能存在的数据孤岛,并确保数据一致性。
在整合多种观点的同时,快速准确地提供重要的业务答案
有效地获得最棘手的商业问题的答案,以便决策者能够做出正确的战略选择。
显示真相的唯一版本
允许组织中的每个人从相同的信息中得出有关业务状态的结论。随着越来越多的民众熟悉数据并能够提供价值,这种普遍访问水平减轻了对IT的压力。
这些功能可以深刻地改变组织在数据可访问性方面的文化。精心设计的IDW可以让数据安全的、并以正确的格式满足用户的需求,而不是限制用户对数据的访问、阻碍创新。这可以使分析快速和敏捷,确保业务用户和数据科学家都得出对业务最重要的答案。
集成数据仓(IDW)的演变
虽然数据仓的想法在20世纪60年代和70年代首次形成,但1988年出现了一个开创性的时刻,当时巴里·德夫林和保罗·墨菲写道,需要一个“公司数据集成仓库”来“汇集公司内部的各种信息系统活动链”。
几十年来,计算机科学家一直在严格研究建造这种大型平台的最佳方法。1991年,IPUMS展示了使用数据仓储方法的力量——他们通过采用提取、转换和加载(ETL)的方法将来自不同来源的数据集成到一个系统中。
随着互联网的扩展、智能手机的出现和云计算的兴起,ETL对于必须不断更新的数据集变得不那么可行。此后,数据中心和数据湖方法应运而生,将非结构化数据汇集在一起,而无需紧密耦合关系数据过程。
Teradata视角
四十多年来,Teradata一直走在IDW设计和开发的最前沿。今天,Teradata继续创新该领域,在Teradata Vantage中应用最佳实践。
Teradata Vantage是领先的混合云数据分析软件,可利用您100%的数据随时随地分析任何数据。Teradata Vantage将IDW的能力和独创性与云的灵活性和可扩展性相结合,为行业领先的规模性能而构建和定价。它易于使用、也易于集成当前系统,无论您需要什么或技术如何革新,它都能提供灵活性和控制性。