预测准确度(定义与洞察)


首页 » 知识库 » 此处
作者:Joannes Vermorel,2013 年 6 月

在统计学中,预测准确度是指数量表述与该数量的实际(真实)值的接近程度。鉴于表述是关于未来的,所以在预测时一般无法衡量实际值。对于大部分企业,提高预测准确度,将提升企业服务于需求的效率,同时还能降低总体运营成本。

在本文中,我们采用的观点主要与商业和制造业相关,尤其是对于库存优化和需求规划领域。

准确度估算的用途

计算得出的准确度可提供对预期的预测质量的定量估算。 对于库存优化,估算预测准确度具有多种用途:

  • 用于从多种预测模式中选择最适合估算交付需求的模式。
  • 用于计算安全库存(通常假设预测误差呈正态分布)。
  • 确定最需要引起重视的项目的优先级(因为原始统计预测不太可靠)。

在其他环境中,例如战略规划,准确度估算用于支持考量各种不同场景及其相应可能性的假设分析。

聚合对准确度的影响

人们普遍存在一种误解,认为预测模式的品质是推动预测准确度的主要因素,其实不然。

推动准确度值的最重要因素是所预测现象固有的易变性。在商业或制造业中,这种易变性与聚合级别高度相关:

  • 预测的范围越大(例如全国范围内的预测相比对当地的预测),预测越准确。
  • 同上,周期越长(例如每月预测相比每日预测),预测越准确

轶事证据:在 Lokad,我们常常发现准确度结果无所谓“好坏”;准确度是特定于环境的。在预测欧洲某大国第二天的全国耗电量时,误差仅 0.5% 也会被认为相对不太准确;而对于某商店头一天销售新上市的生鲜产品所作出的商店级别的预测,误差在 80% 以下就会被认为是取得了重大成果。

而在指定聚合级别的情况下,预测模式的质量对于所能实现的准确度则发挥首要作用。最后,向前预测的越远,准确度越低。

实证准确度与实际准确度的对比

准确度一词最常用于表示某种物理测量的质量。不巧的是,对于统计预测,这一视角多少有点使人误解。与可以根据替代性方法比较测量结果的物理结构不同,预测的实际准确度针对不具备的数据严格进行衡量。

实际上,一旦有数据可用,总是可以生成非常准确的预测,因为只需要进行数据模拟。 这个问题困扰了统计学家超过一个世纪,直到 20 世纪末 Vapnik-Chervonenkis 理论 (1) 的问世,才找到了令人满意的观点。

预测准确度只能根据可用数据进行实际测量;然而在数据可用时,这些预测就不再是真实的预测,而是对过去的表述,不是对未来的表述。所以,这类测量被称为实证准确度,与实际准确度形成对照。

过度拟合问题可能导致实证准确度与实际准确度之间存在较大差异。实际上,在预测时序时如果小心使用后验分析,是可以缓解大部分过度拟合问题的。

常用的准确度指标

测量预测准确度的指标有很多,常用的指标有:


在实践中,鉴于预测的不准确性,应根据指标反映公司所发生成本的能力来选择更适合的指标。

Lokad 洞察

近似正确好过完全错误。根据我们服务于商业公司或制造业公司的经验,经常发现很多公司鲜少重视准确度指标的选择。

实际上,理想的指标不应当返回以百分比表示的值,而应该返回用美元或欧元表示的货币值,且应准确反映因预测不准确导致效率低下的成本。尽管大部分指标具有对称性(pinball 损失是一个重要的例外),但预测过高和预测过低的风险其实是非对对称的。建议您从这一观点出发:即该指标应较接近经济成本函数(经过仔细建模以适合商业限制),而不是选择原始统计指标。

此外,不要执行任何隐式假定预测精确的规划。在商业中,不确定性是无可避免的,所以应当予以考虑。

参考文献