深度学习预测

首页 » 预测 » 此处

深度学习预测(简称“深度预测”)体现了在 Lokad 上一代预测技术基础上取得的重大改进。与传统预测方法相比,深度学习不仅提供了无与伦比的统计准确性,而且提供了概率预测,后者对于供应链和库存至关重要。

Image

拥抱不确定性

公司对预测不断失败感到沮丧不已。虽然期望传统预测方法生成正确的数字,但它们不会。自然而然,未来是不确定的,当某种给定的工具或解决方案未能按预期提供正确的数字时,效益也就无从实现。无论对现有预测模型进行多少微调,也无论进行多少研发来开发更好的模型 - 从传统意义上讲 – 都不能解决这个问题。像安全库存分析之类的方法按理说可以处理不确定性,但在实践中,也不过是后知后觉。 概率预测为探寻未来提供了一种全新的方式 在供应链管理中,成本由极端事件驱动:需求极高会导致缺货和客户受挫;需求极低会导致库存积压,进而造成成本高昂的存货冲销。所有高管皆知,企业应当抱最好的希望,做最坏的准备。当需求达到预期状态时,一切便会顺利进行。不过,核心预测业务挑战并不在于在“容易”的情况下做得好,因为在“容易”的情况下一切进展顺利,即便是考虑粗略的库存平均周转情况也是如此。核心挑战在于处理“严峻”的案例,即破坏您的供应链且让所有人都“抓狂”的情况。

早在 2016 年,Lokad 开发了一种全新的预测方式——概率预测。而后,最近这些预测通过深度学习得到了另一次大幅度的升级。简言之,对需求进行概率预测不仅仅是估计需求,而是评估未来每一种情形出现的概率。估计需要 0(零)个单位的概率,估计需要 1 个单位的概率,估计需要 2 个单位的概率等等......每个需求级别都会进行概率估计,直到概率小到完全可以忽略不计为止。

这些概率预测为探究未来提供了一种全新方式。概率预测不会陷入一厢情愿的视角,即预期会实现预测数字。相反,概率预测会提醒您,一切皆有可能,只不过可能性不一而已。因此,在做最坏准备时,概率预测提供了一种定量平衡风险的有效方式(而传统预测对后者视而不见)。
虽然传统预测方法中对风险分析后知后觉,
但 Lokad 直面这一问题并通过概率预测重点解决这种情形。


从业者的视角

深度学习和概率预测或许听起来令人望而却步、技术性强。不过,如果您是供应链从业者,那么您有可能多年来一直在进行"直观"的概率预测:想一想必须向上或向下修正基本预测的所有情形,因为风险实在是太大了......这正是概率预测所要做的:在面临不确定的未来时适当平衡实际决策。虽然传统预测方法中对风险分析后知后觉,但 Lokad 直面这一问题并通过概率预测重点解决这种情形。

概率预测引擎的数据输出是概率分布。从实际角度看,尽管这些信息非常丰富(毕竟从中可以窥见未来多种可能的情形),但以其原始形式使用也是相当不切实际的。因此,Lokad 提供了一个完整的平台、所有必要的工具和团队支持,以便贵公司将这些概率转化为再订货数量等业务决策。

Lokad 的 Web 应用具有大数据处理能力,您可以用它来创建必要的业务逻辑,进而将这些预测转化为特别适应您业务的决策。这些决策可以调整为契合您特定的供应链限制(例如 MOQ,即最小订货量)、您的经济驱动因素(例如与货架到期日相关的风险)以及您的流程(例如每天早上八点钟前要确定的每日采购订单)。Image
为了让手动解决方案变得可行,无论投入多少周乃至多少个月的时间来专门进行调整,
但总是需要源源不断地进行更多微调

通过人工智能 (AI) 实现自动化

供应链管理常常涉及在多个位置周转产品。传统预测解决方案只要是涉及高级统计模式(如新产品或促销活动),往往就会严重依赖大量手动调整。
不过,Lokad 的经验表明,如果预测解决方案需要微调,那么微调起来就无休无止:为了让手动解决方案变得可行,无论投入多少周乃至多少个月的时间来专门进行调整,但总是需要源源不断地进行更多微调,原因就是产品太多、地点太多和业务在不断变化。

因此,Lokad 的选择是实现预测过程完全自动化:

  • 无需掌握统计知识便可获得预测
  • 无需为不断调整的预测进行任何微调
  • 无需为保持预测与您的业务相一致而进行任何维护

这种自动化离不开俗称的 AI 功能。Lokad通过深度学习预测技术提供这些功能。直观地看,当逐一考量产品时,每个产品可用的信息量通常微不足道,无法进行准确的统计分析。但是,通过考量售出的所有产品之间的相关性,就可以自动调整预测模式,并计算出更好的预测结果,这些预测结果不仅利用某种特定产品本身的数据,还利用了预测视角与之相似的所有产品的数据。

与旧时的方法相反,我们的深度预测引擎可以自行学习从数据中观察出来的奇特点。例如,今天销售 1 个单位的某产品,通常暗示在不久的将来对该产品会有更多的需求(相对于零需求)。然而,有时在维护情况下,它可能意味着截然相反的情况,即售出 1 个单位意味着,不会很快再次售出这样的 1 个单位。

对于具有挑战性的垂直行业(如时装行业),我们的深度学习引擎则利用与产品相关的蛛丝马迹,来考虑所有影响产品发布成功规模的因素。
在 Lokad,预测工作永不停歇。


深度学习预测的起源

Lokad 并未发明深度学习概率预测。但是,对于这些专门针对供应链需求量身定制的统计理论,我们率先进行了生产级实施。深度学习预测是我们的第五代预测技术。

我们的预测引擎 5.0 现在使用 GPU(图形处理单元)网格,而不是仅仅依靠 CPU(中央处理单元)。借助 GPU 能够获得前所未有的处理能力,进而将其转化为出色的预测。

通过这项技术前几次迭代中获得的经验,我们在设计适合各种业务情形的预测引擎方面,已经积累了大量的专业知识。Image

估算概率而不是估算平均值的想法最初就已萌生,但当时我们仍在试着采用经典方法。在经历许多失败后,我们终于意识到经典方法本质上有缺陷,无论进行多少研发工作,都不能修复一种拙劣的统计框架。必须首先修复统计框架本身,预测模型方可派上用武之地。

此外,从数学角度而言,预测引擎的每次迭代都是对先前版本进行“泛化”,每个新一代的预测引擎都能够处理比上一代更多的情形。事实上,近似的正确好过精确的错误。当预测引擎无法生成最适合特定业务情形的预测时,便会出现最为棘手的情况,原因是引擎的表现力不够。又或者,当预测引擎无法处理输入数据时(这对于获得有关任何特定情形的统计洞察极其相关),原因同样是引擎缺乏表现力。

在 Lokad,预测工作永不停歇。尽管我们对概率预测引擎构建的成果引以为豪,但这并非我们努力的终点。与内部部署解决方案不同,升级到新工具本身就是一项挑战,我们的预测引擎一旦推出,Lokad 的客户就会受益匪浅。



有关预测的常见问题


你们在使用哪些预测模式?

我们的深度预测引擎采用基于深度学习原则而构建的单一模型。与传统统计模型不同,这个模型的特征是具有数千万个可训练的参数,比我们以前最复杂的非深度机器学习模型多 1000 倍。深度学习显著优于旧式机器学习方法(随机森林、梯度增强树)。不过值得注意的是,这些旧式机器学习方法已经超越了所有时间序列经典方法(Box-Jenkins、ARIMA、Holt-Winters、指数平滑等)。

你们从预测错误中吸取了哪些经验?

是的。统计训练过程最终会生成深度学习模型——利用 Lokad 可用的一切历史数据。通过称为后验分析的过程来利用历史数据。因此,历史数据越多,此模型从自身错误中吸取经验的机会就越多。

你们的预测引擎是否处理季节性、趋势、周日等因素?

是的,我们的预测引擎处理所有常见的周期性,甚至是准周期性,但其重要性往往被低估。至于代码,深度学习模型密集使用多时间序列方法,来利用在其他产品中观察到的周期性,进而提高任何一种给定产品的预测精度。当然,两种产品可能具有相同的季节性,但并不具有相同的周日模式。我们这种模型能够捕捉这种模式。另外,深度学习的主要优势之一,就是能够恰当捕捉季节性本身的变化性。事实上,一个季节可能会在更早或更晚的时候开始,具体取决于天气等外部变数,而我们在预测中会检测出这些变数并反映出来。

你们需要哪些数据?

若想预测需求,需要提供预测引擎,最起码要提供日常历史需求,若能提供分解的订单历史记录则更好。就历史记录的长短而言,时间越长越好。尽管历史记录不足 2 年就不能检测出季节性,但我们认为提供为期 3 年的历史记录很好,若能提供 5 年的历史记录就更好了。为了预测交付周期,引擎通常要求采购订单包含订单日期和交货日期。指定您的产品或 SKU 属性有助于极大改善预测。此外,提供您的库存水平大大有助于我们为您获得首次意义重大的库存分析。

你们能根据我的 Excel 表进行预测吗?

根据经验,如果您的所有数据都放在一张 Excel 表中,那么我们所能为您做得一般不多,坦白说,其他任何公司也都做不到。电子表格数据可能每周或每月聚合一次,而大部分历史信息最终都会在进行这种聚合后丢失。此外,在这种情况下,您的电子表格也不会包含太多有关适用于您产品的类别和层次结构的信息。虽然我们的预测引擎可以利用您拥有的所有数据,但对一个小样本进行测试并不会产生令人满意的结果。

缺货和促销是如何处理的?

缺货和促销都代表了历史销售的偏差。由于目标是预测需求,不是预测销售额,所以需要将何种偏差纳入考虑范围。对于这些事件,有一种常用但不正确的方式:重写历史记录,以填补空白并截断峰值。但我们不喜欢这种方法,因为它涵盖了将预测结果馈送到预测引擎中,这可能会导致严重的过度拟合问题。相反,对于指示需求紧缩或膨胀的“标志”,我们的预测引擎提供原生支持。

你们预测新产品吗?

是的,我们预测新产品。但要想预测新产品,引擎需要其他“老”产品的发布日期以及发布时的历史需求。此外,我们也建议指定一些产品类别和/或产品层次结构。我们的引擎确实会通过自动检测与新产品相当的“老”产品来预测新产品。然而,由于尚未观察到对新产品的需求,因此预测完全依赖与之相关的属性。

可以调整预测吗?

长达十年之久的统计预测经验告诉我们,调整预测绝对不是好主意。如果需要调整预测,那就表明预测引擎中可能存在需要修复的 bug。如果没有 bug需要修复,并且从统计角度来看,预测完全按预期进行,那么调整预测可能并不能正确解决问题。通常情况下,需要调整体现出需要考虑某种经济驱动因素,而它会影响凌驾于预测之上的风险分析,但不影响预测本身。

你们对于我所属的垂直行业有经验吗?

我们在很多垂直行业都有丰富的经验:时装、新鲜食品、消费品、电子产品、零配件、航空航天、轻工制造、重工制造等等。我们也与各种各样的行业参与者打交道:电子商务企业、批发商、进口商、制造商、经销商、零售连锁店等等。要想了解我们是否拥有垂直行业经验,最简单的方法就是直接与我们取得联系。

你们使用外部数据来优化预测吗?

我们可以使用通常经由第三方公司(例如擅长网络爬虫的公司)获取的具有竞争力的定价数据。另外也可以使用或获取 Web流量数据来丰富历史数据,以便进一步提高统计准确度。实际上,使用外部数据源的最大瓶颈不在于 Lokad 预测引擎(我们的预测引擎相当有能力),而在于建立并维护连接到这些外部数据源的优质数据管道。