什么是结构化数据?
了解更多信息
元数据是以结构化、一致的方式描述其他数据的数据,因此可以随着时间的推移收集、存储和分析大量数据。
数据仓存储大数据时需要元数据以便于检索和管理。数据仓使用跨数据源标准化、清洁和一致的结构化数据。元数据可确保此数据的收集和存储的均匀性,以便企业主和数据分析人员能够轻松访问并从数据中获取见解。
元数据的有效管理是可靠和灵活的大数据“生态系统”的重要组成部分,因为它帮助公司更有效地管理其数据资产,并将其提供给数据科学家和其他分析师。
例如,数据库中可能有一个比如联系人之类的对象。您将使用元数据来描述您为此联系人收集的数据,例如Joe Smith(姓名)、ABC 公司(公司)、123-456-7890(电话号码)。这使得搜索数据库以查找符合您的搜索标准的联系人(例如,所有在ABC公司工作的联系人)更加容易。
当您在手机上拍照时,您的移动设备会将元数据连接到照片上(例如,日期和时间、文件大小、图像尺寸)。社交媒体允许您标记照片中的人和位置,从而添加更多的元数据。返回照片存档并按日期、位置或人员搜索照片会很方便。