大规模实施预测模型

使用Vantage BYOM解决数据科学操作化难题

2021年9月13日 3 最小阅读
Chris是ACME Bank的顶级数据科学家,负责支持一项关键的企业业务计划,以增加每个客户的银行服务数量。他使用经过验证的开源预测算法,针对一组样本数据创建了多个预测模型。这些模型包括客户的交易行为,更重要的是,包括向客户交叉销售其他银行服务的潜力。他训练并验证了这些模型,并相信,一旦根据生产中的每个客户数据对模型进行评分,这些模型将有效地实现其目标。任务完成了?相反,Chris面临着一个巨大的困境:到目前为止,他所有的模型创建工作都是使用他自己的小型系统完成的,该系统使用有限的样本数据。他无法在同一系统上操作他的模型,因为导出所有生产数据需要很长时间,这些数据很容易成为数亿条记录。更重要的是,系统无法扩展到快速、安全、一致地对各种模型进行评分所需的级别。那么,他怎么做才能不浪费他所有的辛勤工作呢?


Vantage如何提供操作预测模型的能力?

Chris的困境听起来很熟悉吗?许多涉足高级分析的公司目前陷入困境,因为他们无法从其数据科学团队产生的预测模型中获得业务价值。他们正在努力获得答案,这些答案将改变他们的业务,将他们的业务推向一个新的水平。Teradata Vantage的客户也不能幸免,这就是为什么Vantage目前为R / Python分析提供了在Vantage中操作Python / R模型的能力。不过,这只是冰山一角。Teradata现在通过允许自带模型(BYOM)功能扩展了此功能——允许标准模型交换格式(即PMML、ONNX、MLeap)以及专有格式(如H2O MOJO)通过易于使用的新BYOM预测函数在Vantage中评分。新的Vantage BYOM功能允许像Chris这样的数据科学家和数据工程师克服这一常见的困境,并最终实施所有预测模型。

Picture1.pngBYOM预测函数如何工作?

BYOM预测功能提供了Vantage已知的所有优势:可扩展性、易用性和灵活性。虽然数据科学团队可能更喜欢利用外部工具(无论是开源还是商业工具)来创建机器学习模型,但工具和公司流程的限制通常会阻止他们实现实际利用模型的目标。BYOM预测函数通过简单的2步过程实现此目标。首先将预测模型导出为标准模型交换格式(如 PMML),然后将PMML格式的模型导入Vantage。完成此操作后,BYOM Predict函数将使用SQL查询进行实例化,或者如果愿意,则通过Python或R客户端通过Vantage客户端库进行Python(teradataml)或R(tdplyr)进行实例化。您不需要自己编写评分算法;Vantage功能负责这一切。输入数据和生成的预测存储在Vantage中。一旦预测完成,业务部门就可以轻松访问它,更重要的是,可以通过自动化应用程序或一线销售代表进行操作。

实现了哪些业务价值和成果?

BYOM预测功能可在不中断数据科学家当前活动的情况下实现操作化。他们可以继续使用自己喜欢的建模软件和平台,从而实现更快的价值实现。这对组织来说是一个巨大的胜利,因为它不仅实现了业务价值,而且还具有可重复性和可扩展性。Vantage BYOM预测函数能够以其他平台无法比拟的性能方式同时对多个预测模型进行评分。不应忽略这些操作属性,因为该过程不会在生成分数时结束。随着业务成果的实现,对更高级分析模型以及对现有模型的改进的需求将会增加。如果没有Vantage,就很难以大规模和敏捷的方式执行此类迭代。考虑到这些好处,Vantage BYOM对于许多面临与Chris相同的困境的数据科学家来说是一个双赢的解决方案。

随时了解情况

订阅 Teradata 的博客,获取每周向您提供的见解



我同意作为本网站提供商的Teradata天睿公司可能偶尔向我发送Teradata市场沟通电子邮件,其中包含有关产品、数据分析、活动和网络研讨会邀请的信息。我了解我可以随时通过点击我收到的任何电子邮件底部的取消订阅链接取消订阅。

您的隐私很重要。您的个人信息将根据Teradata全球隐私政策收集、存储和处理,您可以通过单击此隐私链接阅读和打印。

从 Teradata 查看更多信息