Hadoop过时了吗?

Hadoop上场已经15年多了。曾几何时,似乎每个人都在谈论分布式文件系统的开源框架如何可以提供大量的数据存储和廉价的处理。如今呢?嗯,没有那么多讨论了。

Hadoop对比原生对象存储

Hadoop催生了数十家初创公司,并推动了数亿美元的资本投资。Hadoop的主要优势在于它能够廉价地存储结构化、半结构化和非结构化数据。由于数据存储在分布式环境中,因此数据会并行处理以获得更快的结果。Hadoop还使数据易于检索。

十多年前,“大数据”成为流行语时,Hadoop为经济高效地存储和处理不断发展的数据类型提供了解决方案。这使得组织能够快速确定该数据的价值,并决定是否要对数据进行更深入的分析。但正如博客中所解析的,Hadoop的缺点是在管理企业核心数据方面做得不好。

博客里说道:“当涉及到以跨企业共享的方式管理数据时,没有什么能比得上数据库,而Hadoop并不是数据库。没有数据类型安全,也没有工作负载管理”。

原生对象商店提供现代方法

技术创新可以很快实现。有时速度非常快。有了新的解决方案,一度流行的Hadoop已经失宠。其中一项新技术是对象存储。对象存储提供了Hadoop可提供的优势:廉价存储功能以及灵活数据类型的支持。同时,对象存储也超出了Hadoop的性能:提供的存储成本便宜了三倍,对象存储可以支持更多可以被人工智能使用的数据类型,如音频、视频和图像文件。

许多组织正在摆脱其传统的Hadoop系统,转向对象存储技术,以降低成本并使其大数据环境现代化。数据湖和数据存储的这种演变正使对象存储成为捕获、提炼和探索任何形式的原始数据的首选存储库。

对象存储对于分析至关重要,因为它允许将大量数据汇集在一起进行分析。分析的数据越多,结果就越准确。

Teradata Vantage™ 2.0可以提供本地对象商店(NOS)。NOS是Vantage的一种功能 ,允许用户执行仅读的搜索和查询位于外部对象存储平台上的CVS、JSON和Parquet格式数据集。它允许用户利用Vantage的分析能力来对抗对象存储(如亚马逊S3和Azure博客存储)中的数据。NOS为希望逐步淘汰Hadoop基础设施的公司提供了现代、经济的方法。

从Hadoop迁移到获得性能和可扩展性

世界级公司需要能够跟上不断增长的数据量的技术,同时帮助加快其数字化转型并满足其他业务重点。这就是创新组织正在转向一个互联的多云数据平台进行企业分析的原因。这种类型的平台提供了Hadoop无法比拟的超可扩展性和高性能。

仍在使用Hadoop的组织发现,其整体复杂性可能会限制它们快速响应不断变化的业务要求的能力。因此,许多此类公司都希望迁移到一个可以提供业务用户和分析师所需的可扩展性、性能和成本效益、且不复杂的平台。

在选择Hadoop的替代方案时,公司应考虑五个因素。这些考虑因素——易用性、分析生态系统集成、灵活的部署选项、性能和可扩展性以及迁移专业知识——有助于使迁移尽可能快速无痛完成。

一些公司正在迁移到Vantage, 以获得分析敏捷性和其他好处。Teradata提供Hadoop迁移计划,用三个简单的步骤迁移到一个现代平台。该程序使用经过验证的迁移方法和工具快速无缝地将现有的Hadoop数据和工作负载迁移到 Vantage和云对象存储。

统一一切,建立互联数据分析生态系统

数据必须集成才能获得单一的真相来源。孤立的数据会很快过时,并限制洞察力。这就是为什么现代企业需要能够通过使用互联的多云数据平台整合其所有数据,包括基于Hadoop的数据湖中的数据。例如,Vantage将所有内容(包括数据湖、数据仓库、分析和新数据源)统一在一起,为企业提供无限的智能。

虽然Hadoop在大数据的早期提供了解决问题的方案,但它已不再是最尖端的。当今的公司需要一个具有灵活性的平台来处理当前和未来的大量混合数据工作负载。这包括为导入、探索、开发和运营创造无缝体验的能力。大规模连接和分析所有数据,使公司能够全面了解其跨数据湖泊、对象存储、云服务和生态系统任何其他部分的业务,以获得最大的见解。

你准备好从Hadoop迁移移了吗?只需要简单的三步。