什么是非结构化数据?

非结构化数据是指没有固定组织原则的未经过滤的信息。它通常被称为原始数据。常见示例包括网页日志、XML、JSON、文本文档、图像、视频和音频文件。通过对非结构化数据进行搜索和分析,可以提取有用的信息。多达80%的企业数据是非结构化的。这意味着它是许多人最明显的大数据形式。非结构化数据的大小需要可扩展的分析才能产生见解。由于存储成本较低,大多数但并非所有 数据湖都能找到非结构化数据。

在非结构化数据中,无用数据量大于价值。提取隐藏在此类文件中的价值需要强大的技能和工具。有一个传言说关系数据库不能处理非结构化的数据。Teradata 的统一数据架构从多方面拥抱非结构化数据。Teradata数据库和一些竞争对手都可以存储和处理XML、JSON、Avro和其他形式的非结构化数据。