COVID-19疫情已经扰乱了全球企业,许多组织选择为其员工提供在家工作政策。Teradata是世界上最具道德的公司之一,也在其全球办事处强制执行在家工作,以确保员工的福祉。随着员工继续在家工作,Teradata的流行病应对小组(PRT)将持续监控情况,并将决定何时重新开放全球办事处。为了支持决策,该公司的数据科学家团队开发了一种分析解决方案,用于量化和预测Teradata办事处所在地区的疾病传播速度。在这篇文章中,我们概述了解决方案并描述了核心组件。
可以根据数据的可用性,以城市级别、州级别或国家/地区级别的不同粒度计算区域的强度分数。在下图中,我们显示了地理地图上每个国家/地区的计算分数。这些颜色描绘了该地区COVID-19的强度。
图2 COVID-19强度评分的可视化(仅供参考)
图3 使用物流增长模型的每日案例预测(仅供参考)
图4 COVID-19强度与移动性(仅供参考)
图5 现场决策分析仪表板(仅供参考)
数据管道和RTO仪表板
我们使用约翰霍普金斯大学发布的公开数据开发了分析模型。我们还将谷歌的Mobility和牛津大学的政策数据整合到我们的解决方案中。数据在Teradata Vantage上存储和处理,Tableau和Power BI仪表板连接到Vantage对结果进行可视化,并描述有关COVID-19的最新情况。新冠肺炎疫情强度模型
为了在区域层面量化COVID-19的强度,我们考虑了给定地理区域(城市、州或国家)的几个指标。这些指标包括每百万人的每日病例数、每百万人的每日死亡人数、病例数/死亡人数的增长率以及有效繁殖数(Re)。对于这些指标中的每一个,使用加权和模型计算和组合归一化风险因素,以设计一个介于0和1之间的标准化COVID-19强度评分。该分数全面量化了给定区域中COVID-19的区域强度,其中值越高表示疾病的严重程度越高。下图给出了模型的摘要。每个风险因素的权重和定义sigmoid函数形状的最大阈值都可以在仪表板中完全配置。
.png?origin=fd)
预测建模
我们的工作不仅提供了有关现在的信息,而且还提供了对未来的预测。这些预测有助于估计疫情何时消退。这些估计值是使用基于Logistic Growth函数的已知流行病学模型获得的。它提供了疫情何时消退的大致时间表。预测的快照显示了对几个国家的预测。.png?origin=fd)
谷歌Mobility和全球政策数据
在仪表板中,我们还整合了来自谷歌和牛津大学的数据,以帮助了解公众和政府机构对当前COVID-19情况的反应。谷歌提供的Mobility数据显示了一个地区与基线估计数相比的相对流动性率。基线来自2020年2月观察到的流动率。牛津大学的政策数据总结了不同国家实施的有关学校关闭、工作场所关闭、旅行限制等的政策。将强度模型与流动性和政策数据相结合,可以详细了解疫情以及人群对COVID-19的行为。例如,强度分数与移动率的比较表明,在强度分数较低的区域,移动率通常较高,如下所示:.png?origin=fd)
在RTO决策中使用强度分数
每个Teradata站点都使用强度评分将其分类到不同的风险级别。它有助于确定是否可以重启具体的办公地点。例如,如果强度分数低于0.5的值,则考虑将在地点进行情节返回;此决策阈值是可配置的,可以根据严格程度进行更改。.png?origin=fd)
总体而言,RTO仪表板有助于管理层的决策,并展示了由Teradata Vantage提供支持的高级分析如何帮助组织规划安全返回办公室。
致谢
疫情应对小组(PRT)由Paul Williams(高级副总裁兼首席安全官)领导。RTO分析仪表板由GDC开发,由Sandeep Kumar(全球交付中心副总裁)领导。Sherwin Pelayo(GDC BI Sub-Practice主管)管理整个项目,Muhammad Jawad Khokhar博士(GDC Pakistan数据科学家)领导分析模型的开发,Fitzroy Dy(GDC Philippines高级数据科学家)管理数据源和预处理,Arun Chaudhary(GDC India首席BI顾问)开发了Power BI仪表板。连续 20 年:被公认为数据分析领域的领导者
随时了解情况
订阅 Teradata 的博客,获取每周向您提供的见解