首页 »
知识库 » 此处
作者:Joannes Vermorel,上次修订时间:2013 年 8 月在时序预测环境中,
后验分析是指利用既有的历史数据
评估预测方法准确度的过程。这个过程通常会进行迭代,且会针对历史数据中存在的多个日期重复进行。后验分析用于评估预测方法关于未来的预期准确度,对于评估哪种预测模式才是
最准确的预测模式很有用。
后验分析的工作原理
在后验分析过程中,最先是选择历史数据覆盖的时间跨度内的阈值日期列表。在下图中,阈值用 T1、T2、T3、T4 标记。
对于每个阈值,
- 历史数据将在阈值处截断,
- 练习使用预测模式并将其应用于被截断的数据,
- 将预测结果与未截断的原始数据进行比较。
最后要针对所有阈值确定平均预测误差。
平均误差可解读为生成(关于未来的)
真实预测结果时对与这种预测模式相关的误差的估计。
选择适当的阈值组一般要求在相关问题方面具备一定的专业知识。根据经验,增加阈值个数通常会改进该过程对于
过度拟合问题的弹性。
对于存货优化,由于一般涉及到成百上千的 SKU,但只需要选择为数不多的几个阈值,因此如果选用一种更好的预测方法,就可以很有把握地做出选择。
常见错误:学习使用一次后用于执行多次预测
后验分析通常
计算资源相当密集,因为必须针对每个阈值调整新预测模式。我们常常发现从业者只训练使用预测模式一次,并且一般会运用所有范围的历史数据来进行后验分析迭代。他们认为这种方法能大大加快后验分析的速度。
但是,这样的
窍门其实是一种误导,会导致明显的过度拟合问题。实际上,由于预测模式可以使用
未来的数据,所以只要学习阶段中估算发生变化,都将导致预测模式嵌入一些关于
未来的信息。所以,通过后验分析测量的准确度不能反映该种模式的综合能力,而只能反映其
记忆能力。也即,该种模式再现训练数据集中存在的相同状况的能力。
Lokad 的洞察
后验分析是 Lokad
预测技术的核心。我们会针对每个时序使用后验分析,以便选择用于提供最终预测结果的模式。但是,
本文中所呈现的简单后验分析视角并非适合零售业和制造业中存在的所有情形。举个例子,对于新上市的产品,其时序可能太短,所以无法执行任何重要的后验分析。促销和产品上市也要求另外采用专门的方法。