Par Joannès Vermorel, février 2012La régression quantile est un type de régression (c'est-à-dire de prévision) qui introduit
volontairement un biais dans le résultat. Au lieu de rechercher la
moyenne de la variable à prévoir, une régression quantile cherche la
médiane, ainsi que tous les autres quantiles (parfois appelés
centiles ou
percentiles). Les quantiles sont particulièrement
utiles pour l’optimisation des stocks comme méthode directe pour calculer le
point de commande.
Régression est ici synonyme de prévision. Le terme de "régression" met l'accent sur l’approche mathématique, tandis que celui de "prévision" met en avant l’utilisation pratique du résultat.
La notion de régression quantile est un sujet statistique relativement avancé. L’objectif de cet article n’est pas de traiter rigoureusement ce sujet, mais plutôt d'en donner une présentation (relativement) intuitive à l'usage des distributeurs ou des fabricants.
Illustration visuelle des quantiles
Le graphique ci-dessus illustre 3 prévisions distinctes :
- en rouge, des prévisions quantiles à 75%.
- en noir, une prévision moyenne.
- en vert, des prévisions quantiles à 25%.
Visuellement, les quantiles se comportent quasiment comme des intervalles de confiance. Cependant, en pratique, le quantile est uniquement requis pour un seul pourcentage cible.
Quantiles (ou centiles) de la demande future
La prévision classique, et la plus intuitive, est la
prévision moyenne : les
poids respectifs de la sur-prévision et de la sous-prévision doivent être égaux, sinon la prévision est
biaisée (pour être plus précis, elle est
biaisée par rapport à la moyenne).
Même si le fait d'avoir une prévision non biaisée est une propriété souhaitable, cela ne présage en rien de la précision de la prévision. En particulier, une prévision peut être à la fois non biaisée et très imprécise. Le biais renvoie uniquement à la tendance du modèle de prévision à sur-estimer ou sous-estimer le futur.
Une première façon d'affiner cette vision est la
prévision médiane : les
fréquences respectives de la sur-prévision et de la sous-prévision doivent être égales, sinon les prévisions sont
biaisées par rapport à la médiane.
À ce stade, nous avons déjà transformé la notion de prévisions
non biaisées en passant de
poids égaux à
probabilités égales. Ce changement est subtil, mais dans certaines situations, il peut avoir un gros impact numérique.
Illustration : revenu des ménages moyen versus revenu médian aux US
Le
revenu des ménages aux US illustre bien la grande différence entre moyenne et médiane.
Selon l’US Census Bureau, en 2004, le revenu médian des ménages était de 44 389 $, tandis que la même année le revenu moyen était de 60 528 $, soit presque 40% de plus que la médiane.
Cet écart s’explique par les revenus élevés (comparativement) des foyers américains les plus riches, comparés au reste de la population. On retrouvera un écart de ce type entre la moyenne et la médiane dans toutes les distributions non symétriques, typiquement toutes les distributions ne suivant pas une distribution normale.
Généralisation de la médiane
La médiane représente le seuil au niveau duquel la distribution est divisée en probabilités de 50/50. Cependant, il est possible de considérer d’
autres rapports de fréquence. Par exemple, on peut choisir 80/20, ou 90/10, ou tout autre rapport ayant un total de 100%.
Les quantiles représentent une
généralisation de la médiane à un pourcentage donné. Pour τ, une valeur entre 0 et 1, la régression quantile Q(τ) représente le seuil où la probabilité d’observer une valeur inférieure au seuil est exactement de τ.
Prévisions quantiles
Les prévisions classiques et quantiles prennent toutes deux en entrée des
séries temporelles. Les séries temporelles représentent les données en entrée. En plus de ces données, les prévisions
moyennes de séries temporelles nécessitent deux paramètres structurels supplémentaires :
- la période (jour, semaine ou mois).
- l’ horizon, qui est un nombre entier représentant le nombre de périodes à prévoir.
Implicitement, les séries temporelles sont agrégées selon la
période, et l’horizon est choisi suffisamment large pour être utilisé de manière pratique, c'est-à-dire en étant généralement supérieur au
délai de réapprovisionnement.
Les prévisions
moyennes bénéficient d’une propriété très utile : il est
mathématiquement correct de faire la somme des prévisions. Par exemple, si
y1, y2, y3 et
y4 représentent une prévision sur 4 semaines en avant, alors, si nous avons
uniquement besoin de la demande attendue sur les
deux prochaines semaines, on peut additioner
y1+y2.
Cependant,
faire la somme des prévisions quantiles est mathématiquement incorrect, ou plus précisément, la somme des quantiles ne donne pas le quantile de la somme (la somme des segments).
Montrons pourquoi le quantile ne peut pas être additionné. Supposons qu'un joueur joue une pièce d'1 $ aux machines à sous chaque semaine. Supposons que les chances de gagner sont d’1% pour un gain de 50 $ ou de zéro sinon. Si nous examinons le quantile 99% de la récompense attendue, nous obtenons une récompense hebdomadaire de 50 $ pour chaque semaine. Cependant, si nous examinons le quantile 99% sur deux semaines, la récompense attendue est toujours égale à 50 $. En effet, la probabilité de gagner deux fois est seulement de 0,01% (1% multiplié par 1%) ; par conséquent, le quantile 99% reste inchangé. La somme des deux quantiles 99% hebodmadaires donnerait 100 $, mais en réalité, il faut 16 semaines pour accumuler 100 $ de gains pour le quantile 99% (la preuve de ce résultat numérique n’est pas donnée ici, car elle dépasse le cadre de cet article).
Étant donné qu'on ne peut faire la somme des prévisions quantiles, les prévisions quantiles de séries temporelles doivent
reconsidérer la notion même d'agrégation par période. En effet, la production de prévisions quantiles
par période est discutable, parce que ces prévisions
élémentaires ne peuvent pas être combinées pour produire des quantiles corrects sur les segments.
Ainsi, la prévision
quantile de séries temporelles vient avec une structure distincte :
- avec τ le quantile cible, en pourcentage.
- et λ l’ horizon exprimant une durée (typiquement en jours).
Par exemple, si la série temporelle représente les ventes d’un produit A, et que nous avons τ=0,90 et λ=14 jours, alors la prévision quantile (τ, λ) retournera une valeur de la demande ayant exactement 90% de chance d’être supérieure à la demande totale observée pendant 14 jours (et respectivement 10% de chance d’être inférieure à la demande sur ces mêmes 14 jours).
Contrairement aux prévisions classiques, les prévisions quantiles produisent
une et une seule valeur par série temporelle, indépendamment de l’horizon. Dans une certaine mesure, les prévisions quantiles sont plus
agnostiques en termes de période que leurs homologues classiques.
L'approche de Lokad
Au premier abord, les prévisions quantiles semblent un peu plus compliquées que les prévisions classiques. Néanmoins, dans de nombreuses situations réelles, les professionnels finissent par produire d'abord des prévisions
moyennes, avant de les
extrapoler immédiatement en prévisions quantiles, généralement en faisant l'hypothèse que les prévisions suivent une distribution normale. Toutefois, l’étape d'extrapolation représente souvent le maillon le plus fragile du processus, et peut dégrader considérablement le résultat final. La technologie de prévision doit s’adapter aux exigences pratiques, en fournissant des prévisions quantiles natives.
Pour en savoir plus
- Point de commande : comment appliquer les quantiles à l’optimisation des stocks.
- Fonction de perte Pinball : comment mesurer la précision d’une prévision quantile.
- Roger Koenker, Kevin F. Hallock, (2001) Quantile Regression, Journal of Economic Perspectives, 15 (4), 143–156
- Ichiro Takeuchi, Quoc V. Le, Timothy D. Sears, Alexander J. Smola, (2006), Nonparametric Quantile Estimation, Journal of Machine Learning Research 7 1231–1264