概述

五大数据技术必须
构建您需要的大数据架构
满足企业对大数据技术的需求是Teradata成立的一个关键原因。事实上,公司名称就来自我们管理TB数据的能力。如今,这个数字已经增长到许多个PB的数据!从前,存储和分析大量数据受到可用硬件的限制。我们创建了Teradata数据库来有效管理大规模数据,实现企业分析、解决技术问题并展示将数据集成到关系模型中的力量。
今天,随着数据仓库每天运行数千万个查询并支持关键任务操作,技术挑战已经远远超出了硬件的范围。为了跟上不断增长的数据量和多样性,企业需要一个大数据架构,以确保数据通过正确的工具流向正确的用户。
大数据架构常见问题
设计您需要的架构通常从提出正确的问题开始:
- 您的大数据策略将如何塑造您的大数据技术需求?换句话说,需要解决哪些业务问题、需要改进的运营、以及利用大数据实现的目标是什么?
- 哪些现有数据源和系统可以“嵌入”集成架构?
- 您如何处理新的数据集(比如传感器数据或来自物联网的数据)?
- 您的方法如何帮助将数据驱动和支持分析的思维转移到业务中心?
- 在调试阶段过后,如何操作或扩展您的大数据和分析计划?
大数据技术必须
在与世界各地数千家企业的工作中,我们确定了构建能够工作的大数据平台的五个关键必须。我们认为,大数据架构必须能:
1. 集成
将数据仓库、数据湖泊和分析统一到单个平台中,可以弥补原始数据源、特定商业智能工具和标准CRM应用程序之间的差距。这大大降低了传统“混合”环境的复杂性,使公司能够摄入非常快速移动的数据集。它还为用户提供跨平台访问数据和分析引擎。
2. 扩展
根据IDC最近的一项调查,56%的受访者表示,如果供应商不提供灵活的IT消费选项,他们将断然拒绝IT基础设施提供商或IT云服务提供商。为了响应我们客户的要求,Teradata开发了Vantage,一个数据分析软件平台,无论在云、混合还是本地,都以任何最适合他们的方式使用。我们知道,客户可能无法预测下个月所需的分析能力规模,更不用说明年了,因此,随着部署策略的转变,我们为他们提供了调整分析工作负载的灵活性。
3. 预测
许多分析师和专家说,今天您的企业收集和管理大数据的能力是一个预知的结论——重要的是您预测和处理大数据的能力。这就是人工智能及其子集学科机器学习的用处。机器学习使计算机能够无需手动编程即可学习,从而能够从预测未来情景的数据中看到规律并构建模型。这对于确定客户购买产品的倾向、优化制造工厂中每台机器的输出或改善您的安全态势非常有用。
当我们开发Vantage时,我们确保该平台将支持各种高级分析功能。例如,机器学习引擎为路径、模式、统计和文本分析提供了100多个预先构建的分析功能,以解决广泛的分析问题。同样,图形引擎提供一组功能,可发现网络中人、产品和流程之间的关系。
4. 可访问
您将通过支持自助分析的技术和政策,减少数据孤岛,提高企业的创新率。理想情况下,您组织内的人员可以访问有效开展工作所需的正确工具和数据,而无需向IT申请权限。这使您的人员能够花更少的时间拼接不同的解决方案,并有更多的时间查找和应用对业务最关键战略问题的答案。
您的技术还应支持用户喜欢的任何语言和工具。有了Vantage,数据科学家和业务分析师也可以使用相同的数据,即使他们使用不同的工具和语言。Vantage集成了客户首选的工具和语言,包括 SQL、R、Python、Tableau、Qlik和Teradata应用中心、Jupyter和RStudio。
5. 开放创新
新兴的先进分析案例和各种数据来源的爆炸性增长,是吸引数据科学家利用各种数据科学技术的有力手段。您的技术应该是全面的,能够解决今天以及未来的业务问题,所以您将需要一个能与将来出现的任何新工具和技术兼容的架构。这就是我们开发Vantage的初衷,将开源和商业分析技术相结合。
支持大数据分析的技术正在迅速变化。为了创建长期、可持续的大数据技术战略,构建集成各种数据流、工具和应用程序的架构至关重要;视业务需要而定可扩展;支持先进的预测分析能力;无论您组织内的每个人担任什么角色,都可以访问;并且可以支持未来必然要发生的开放创新。考虑到这些标准,您将在全球数据经济的持续扩张中具备获得优势的充分条件。