首页 »
知识库 » 此处
作者:Joannes Vermorel,2016 年 6 月所谓概率预测,即针对未来每种可能的情形指定一个概率。但是,并非所有概率预测值都具有同等准确度,因此就需要利用度量指标来评估不同概率预测的相应准确度。MAE(平均绝对误差)或 MAPE(平均绝对百分比误差)不能直接用于概率预测。而
连续概率排位分数 (CRPS) 则针对概率预测情形对 MAE 进行了广义化。CPRS 是涉及概率预测时使用最广泛的准确度指标之一。
概述
CRPS 最常用于评估两种
概率预测模式的相应准确度。具体而言,该指标可以与
后验分析过程相结合,通过对同一数据集进行多次测量的方式,以使准确度评估保持稳定。
该指标明显不同于 MAE 之类的简单指标,因为它具有非对称的表示:尽管预测值是概率性的,但观测值却是确定的。与
Pinball 损失函数不同,CPRS 不侧重于概率分布的任何特殊点,而是会考虑完整的预测分布。
形式定义
令 $X$ 为随机变量。
令 $F$ 为 $X$ 的累积分布函数 (CDF),例如 $F(y)=\mathbf{P}\left[X \leq y\right]$。
令 $x$ 为观测值,$F$ 为与经验性概率预测相关的 CDF。
$x$ 与 $F$ 之间的 CRPS 定义为:
$$CRPS(F, x) = \int_{-\infty}^{\infty}\Big(F(y)- 𝟙(y - x)\Big)^2dy$$
其中 $𝟙$ 为
亥维塞阶跃函数,表示沿实线分布的阶跃函数
CRPS 使用与观测变量相同的单位来表示。CRPS 广义化了平均绝对误差;实际上,如果预测值具有确定性,那么将还原为平均绝对误差 (MAE)。
Envision 语法
Lokad 的
脚本语言通过
crps()
函数为 CRPS 提供内置支持:
Accuracy = crps(Z, X)
其中
Z
应为一种分布,用于表示概率预测;
X
应为一个数值,用于表示观察到的值。
已知属性
Gneiting 和Raftery (2004) 指出,连续概率排位分数可以等效地表示为:
$$CRPS(F,x) = \mathbf{E}\Big[|X-x|\Big]-\frac{1}{2}\mathbf{E}\Big[|X-X^*|\Big]$$
其中,
- $X$ 和 $X^*$ 为线性随机变量的独立副本,
- $X$ 是与累积分布函数 $F$ 相关的随机变量,
- $\mathbf{E}[X]$ 是 $X$ 的预期值。
数值计算
从数值角度而言,计算 CPRS 的一种简单方法就是将原始整数分解成适当界限内的两个整数,从而简化亥维塞阶跃函数,由此可得出:
$$CRPS(F, x) = \int_{-\infty}^x F(y)^2dy + \int_x^{\infty}\Big(F(y)- 1\Big)^2dy$$
实际上,由于 $F$ 为通过预测模型获取的经验性分布,因此相应的随机变量 $X$ 具有
紧支集,这意味着只有有限数量的点满足 $\mathbf{P}[X = x] \gt 0$。所以,整数可以转变为离散的有限和。
参考
- Gneiting, T. 和 Raftery, A. E. (2004)。严格适当评分规则、预测和评估。西雅图华盛顿大学统计系 463 号报告。