什么是大数据,它仍然重要吗?

新时代的大数据定义

随着技术和商业智能的进步,大数据的定义继续变化。然而,新的定义取决于每个企业选择如何使用它。大数据应考虑特定的业务目标、客户行为环境和长期市场趋势。

什么是大数据?大数据定义

“大数据”的开始

20多年前,计算机机械协会(ACM)图书馆首次提到“大数据”一词。迈克尔·考克斯和大卫·埃尔斯沃思写道:“可视化为计算机系统提供了一个有趣的挑战:数据集通常相当大,对主内存、本地磁盘甚至远程磁盘的容量造成负担。我们称之为大数据问题。当数据集不适合主内存(核心)时,或者即使不适合本地磁盘,最常见的解决方案是获取更多资源。”换句话说,当时,大数据定义本质上是“无法再适用于可用硬件的数据”。

放眼现在 — 什么是大数据?

互联网、智能手机、物联网、云计算和大数据定义的爆炸式发展,已经远远超出了“本地磁盘”的范围。

维基百科的大数据定义是“传统数据处理应用软件不足以处理的大或复杂的数据集的术语”,也可以定义为“来自各种来源的大量非结构化或结构化数据”。一些专家用“四个V”来定义大数据,包括Volume(数量):信息量、Variety(多样性)数据的多样性、Velocity(速度):数据创建速度、以及Varacity(真实性):您创建和收集的数据的完整性和准确性。

但对许多人来说,这些定义不够精确。在Quora或谷歌中输入“什么是大数据”这句话,你会发现各种各样的答案,善于思考的人会想知道,“数据需要有多大才算‘大’?” “如果‘大数据’是无法使用典型工具处理的数据,那么哪些工具算作‘典型’?”当然,即使我们正确定义了大数据,收集大量数据是否为当今企业设定了正确的目标?

新的大数据定义

2015年,Gartner分析师尼克·休德克写道,大数据“自身不再是一个话题”。相反,该术语现在可以分为其他几个理念,包括高级分析和数据科学、商业智能、企业信息管理等。他写道:“定义大数据的特征……不再是遥远的。它们很常见。技术格局继续快速变化,但新选项看起来越来越像旧选项,旧选项正在快速演变。”休德克认为,更好的方法是少考虑“做”大数据,多考虑“实际业务需求、基础设施影响以及企业架构需要如何发展”。

在Teradata,这是一个有用的框架,为我们帮助企业从数据中获得切实的成果。我们发现,最好从实际推动业务的增值操作的角度考虑大数据。企业经常花费太多的时间、精力和金钱在大数据的准备和加载上,而没有足够的资源应用分析来寻找与众不同的见解。

大数据不是一种方法或工具——例如,在某些情况下需要可视化,而其他情况下需要连接分析。与大数据中的其他许多内容一样,它归结到业务问题和目标上。用户是否在寻求:

  • 市场数据的时间模式或地理视图?

  • 来自机器日志或传感器数据的程序性见解?

  • 单个产品、多个产品或尚未推出的产品的行为模式相关性?

 

大数据通常与预测能力和推荐引擎有关。但它也是以市场敏感性为指导的运营行动,更深入地了解人与流程之间关系的结构和性质,并定义导致用户定义结果的模式。

最后,定义大数据归结到特定企业将如何使用它。当专家争论企业是否应该专注于数据最小化和智能数据而不是大数据时,专注于利用数据创造业务价值的企业将会成功。要使大数据发挥作用,需要战略设计和深思熟虑的架构,不仅检查当前的数据流和存储库,还考虑特定的业务目标、客户行为环境和长期市场趋势。

想知道Teradata如何帮助您有效地利用数据?