本地与云:各自的优缺点

数据分析的未来在于。Gartner估计,到2022年,四分之三的数据库将位于云中,其中仅有5%被认为是有可能返回本地环境的情况。预计到明年,云数据库管理系统(DBMS)也将占所有DBMS收入的一半。

本地与云

从本地到云分析

即使在半导体制造等行业,采用云解决方案进行分析的速度相对较慢,云计算趋势也在重塑数据架构。对本地数据仓的传统依赖正逐渐让位于云基础架构和混合架构,这些架构将本地公司数据中心资源与公共云服务相结合。

根据2021年Semiconductor Engineering的一篇文章,公司正在转向云分析,以应对数据量的指数级增长,以及其供应链中数据类型和运营的复杂性增加。与此同时,由于以下方面的考虑,这些公司及其同行的本地选项并没有完全消失:

  • 云计算和云存储的按需成本
  • 云连接的数据可靠性和性能
  • 专有公司数据的安全性和控制

这种情况凸显了一个更广泛的问题,即本地和云架构如何比较,以及何时以及为什么使用每种架构。尽管将问题描述为非此即彼的“本地还是云”情况很常见,但实际上,许多组织需要这两种架构,或者至少可以从这两种架构中受益。

用于分析的本地与云:主要区别

本地环境是一种单租户设置,由专门构建的硬件(如Teradata IntelliFlex)或公司现有的数据中心基础结构提供支持。它位于现场,因此得名。VMWare虚拟机还可以作为运行本地应用程序的基础。

公共云计算是一种云服务模型,通过该模型,云提供商通过网络与多个组织共享基础架构、平台和应用程序的某种组合。提供商的数据中心资源按每个客户进行分区,每个客户订阅或按要求支付使用这些服务的权利。

可以将一个或多个公有云服务连接到在客户环境中运行的单租户数据平台。将这些公共云与本地基础架构相结合, 可以创建混合云

除了部署位置和责任方面的这些基本区别之外,本地和云计算在更具体的方式上有所不同:

成本

  • 本地:大多数本地成本来自购买、管理和维护数据中心基础结构,例如服务器或现场数据仓。资本支出,尤其是硬件的资本支出,占主导地位。
  • :云成本,至少对于数据仓而言,主要是基于订阅的。云服务器容量可以提前从云提供商处保留。业务支出占主导地位。

性能

  • 本地:由于本地基础结构在物理上非常接近组织的数据源和数据体系结构,因此本地基础结构可以具有低延迟——前提是它维护良好、大小适当并保持最新状态。
  • :云基础架构提供商提供对几乎无限资源的访问,这些资源在与现代数据平台配对时提供高级数据分析所需的性能。

可扩展性和弹性

  • 本地:扩展本地环境意味着添加更多的物理或虚拟基础架构,通常成本相当高,并且无法将容量与实际需求紧密匹配(例如,经常发生过度配置)。
  • :公有云可以随着分析工作负载需求的发展而更轻松地进行扩展和缩减。云也提供弹性,即这种资源大小调整对动态工作负载的快速适应性。

安全

  • 本地:保护本地数据中心是企业独自承担的责任。公司保持对安全实践和工具的完全控制,并具有随之而来的所有优点和缺点。
  • :云安全是服务提供商和客户之间的共同责任。前者根据所使用的云服务类型(基础架构即服务,软件即服务等)监督安全堆栈的不同层,其余的则由客户负责。而该选项始终可适应所需数据安全性。

功能性

  • 本地:企业主要在硬件级别控制其本地环境的工作方式及其长期路线图。它购买和维护基础架构,以支持所需的性能级别、存储需求、使用中的特定数据体系结构(数据仓、数据湖等)以及所有数据加载和查询。
  • :云服务提供商 (CSP) 和独立软件供应商 (ISV) 提供一组不断发展的基于软件的服务,用于存储、处理和扩展企业数据。特别是云交付的人工智能和机器学习创新是高级分析工作负载的重要功能,可以与云服务产品捆绑在一起。总体而言,云中的创新和可用性步伐比本地快得多。

本地分析与云分析的优缺点

本地资源和云资源之间的这些关键差异并不能让一个选项优于另一个。理想的选择取决于特定的业务需求——事实上,两者兼而有之。

尽管云是未来趋势,但在某些情况下,本地分析仍然有用武之地,例如,当云可能无法为给定工作负载提供最佳的成本和性能组合时,或者当现有投资需要优化时。在决定在何处运行分析工作负载时,要考虑的最重要利弊是:

本地优点

  • 本地性能实现低延迟
  • 完全控制技术堆栈
  • 对基础设施的物理访问
  • 保留数据中心资产

本地缺点

  • 硬件成本高,折旧率高
  • 相对有限的弹性
  • 企业对故障和安全事件负全部责任
  • 对尖端分析功能的访问能力有限
  • 终止支持和更换时的复杂情况

本地摘要和用例

本地数据分析实施已成为许多公司的常态。他们依靠速度、控制力和熟悉度的组合来加载和查询业务数据。

本地分析还可以折叠到混合云架构中,该架构使用公共云资源进行突发情况或用于灾难恢复等特定用途。与仅云数据仓相比,对性能敏感的工作负荷可能更适合本地和混合云部署。

从本地体系结构迁移的原因包括它们所需的硬件成本不断上升、过时的功能以及可伸缩性和弹性方面的困难。

例如,老化的本地仓推动了澳大利亚私人保险提供商Medibank迁移到多云数据平台。它转向部署在公共云上的数据平台,以更快地访问和提取其数据中的见解

云优点

  • 巨大的可扩展性和弹性
  • 定价模式是“按实际使用量付费”
  • 负责正常运行时间、可用性和某些安全方面的提供商
  • 通过人工智能和机器学习等创新快速扩展功能集

云缺点

  • 对于某些工作负载而言,延迟可能过大
  • 如果仅按需计费,则定价不可预测
  • 对于没有可变性/持续利用率的工作负载而言,这不是最具成本效益的
  • 混合架构需要紧密的兼容性和互操作性

云使用案例

云数据仓、数据湖和数据湖仓已成为本地基础结构的可行替代方案。它们提供卓越的弹性,以及通过人工智能和机器学习处理进行高级分析的广泛且不断扩展的功能集。

随着数据量的增加和数据源数量的激增,云计算服务提供了巨大的资源和灵活性。Seagate和IDC的2021年报告发现,企业数据增长预计将在未来两年内超过40%,这在很大程度上要归功于数据分析项目。

但是,充分利用云分析并避免按需定价带来的过高成本需要一个连贯的策略,该策略由现代数据平台提供支持,该平台可以根据需要连接到多个云和本地资源。Seagate和IDC的受访者将管理所有这些不同环境的复杂性的担忧列为最大的挑战。

对于休闲餐厅公司Brinker来说,一个互联的多云平台提供了低延迟和对数据的简单、一致访问的精确组合,这些数据是其老化的传统环境和之前尝试过的纯云数据仓所缺少的。该组织消除了孤岛,并获得了可靠地运行和扩展任何类型的工作负载的能力。

连接本地和云:混合云注意事项

Brinker的案例表明,尽管“本地还是云”是一个流行且有用的比较框架,“本地” “云”经常成为现实。对于希望保护现有投资、最大限度地减少延迟并仍然可以访问云中最新创新的组织来说,将本地环境连接到公有云的混合云通常是最实用的解决方案。

数据引力的概念是这些混合云环境的主要驱动力,这些环境致力于从本地和云领域提供两全其美的服务。数据引力是这样一种想法,即大量不断增长的数据将不可避免地吸引更多的应用程序和服务,随着时间的推移,移动起来变得更加复杂。因此,在设置混合云环境时,将组件从一个环境转移到另一个环境需要仔细考虑:

  • 数据重力聚类的位置及其包含的数据源。
  • 与在这些群集中移动大量数据相关的潜在云出口费用。
  • 这些移动中涉及的延迟以及在相关用例上是否可以接受。
  • 来自一个环境的应用程序组件是否在另一个环境中工作。

混合云不可避免地涉及这些类型的复杂考虑因素,但使用正确的数据平台仍然可以简化整个旅程。

如何使分析在任何地方工作

在前面讨论的Medibank的案例中,Teradata Vantage在本地和云中是完全相同的软件,这一事实简化了其分析现代化项目。迁移非常简单,无需对其关键应用程序进行大量重新编码。

像Vantage这样的现代数据平台提供了灵活的部署选项,可以在本地或所选的公共云中提供相同的高级功能。关键功能包括引入任何数据源和格式、复杂的工作负载管理以及无孤岛的企业范围的数据访问。在云中,它还提供混合定价——预留容量加上按需使用,与客户需求和查询相匹配——以优化成本。

无论企业是希望将其本地数据迁移到多个云,只需将其连接到单个公共云,还是采用其他部署模式,Vantage都可以完成它。

继续阅读

云迁移指南