Teradata和数据湖

原始数据保真

什么是数据湖?

原始数据保真度和云中的长期存储。

数据湖和数据仓都是设计模式,但它们正好相反。数据仓结构化和打包数据,满足质量、一致性、重复使用和高并发性能。数据湖的设计模式与数据仓相辅相成,以低成本专注于原始数据保真度和长期存储,同时提供一种新的敏捷性分析形式。

数据湖的价值

数据湖解决方案满足了从爆炸性数据量中低成本收获和提取价值的需要。这种来自新来源(网页、移动、互联设备)的“黑暗”数据过去经常被丢弃,但它其实包含有价值的见解。庞大的数据量,加上新的分析形式,需要一种新的方法来管理和从数据中获取价值。

数据湖是长期数据容器的集合,可捕获、细化和大规模探索任何形式的原始数据。它通过多个下游设施可以借鉴的低成本技术(包括数据市场、数据仓和推荐引擎)提供支持。

数据湖泊的常见陷阱

从表面上看,数据湖似乎很简单,提供了管理和利用大量结构化和非结构化数据的方法。但是,它们并不像看上去那么简单,而且失败的数据湖项目在许多类型的行业和组织中并不少见。早期数据湖项目面临挑战是因为最佳实践尚未出现。现在,缺乏可靠的设计是数据湖泊无法实现其全部价值的主要原因。

Teradata数据湖解决方案 Teradata Vantage是普及数据智能的平台,旨在帮助客户利用其数据中的大量信息。Teradata服务团队精通利用数据湖及其相关技术(如Hadoop、Cassandra)和亚马逊S3、Azure Blob等对象存储的诸多优势。
数据湖解决方案 AWS
亚马逊网络服务 将AWS基础设施与Teradata Vantage搭配使用
数据湖解决方案 Azure
微软 Azure 将Azure资源与Teradata Vantage相结合
数据湖解决方案谷歌云
谷歌云 通过Teradata Vantage利用谷歌云
即刻开始云分析

避免不必要的瓶颈和复杂性,将分析带到云中

下载白皮书