当存储库中的数据量增加且使用次数也增加时,数据重力就会出现。在某些时候,复制或迁移数据变得繁重且昂贵。因此,数据倾向于将服务、应用程序和其他数据拉入其存储库。数据重力的主要例子是数据仓和数据湖。这些系统中的数据具有惯性。可扩展的数据量经常会破坏现有的基础设施和流程,这些基础设施和流程需要风险和昂贵的补救措施。因此,最佳实践设计是将处理转移到数据上,而不是相反。
多年来,数据重力一直影响TB和PB级别的数据仓。这是需要可扩展的大数据并行处理的原因之一。这个原则现在扩展到提供不同使用案例的数据湖。Teradata可以帮助客户管理数据重力。