Par Maxime Barbier, juin 2021Les séries chronologiques sont les outils mathématiques les plus basiques et les plus polyvalents en business. Tout simplement, une série chronologique consiste en une série de points de données indexée sur le temps. Une série chronologique peut donc tout modeler, de l'évolution des ventes de l'entreprise à celle des prix des produits, que ce soit sur une base annuelle, mensuelle, quotidienne, ou même horaire. Les séries chronologiques sont particulièrement intuitives, ce qui les rend idéales pour la description, la visualisation, le modelage, et enfin la prévision d'un certain nombre de variables.
Statistiques descriptives et séries chronologiques
L'utilisation principale des séries chronologiques est descriptive. Celles-ci peuvent condenser une quantité importante d'informations en un graphique ou un tableau. Cependant, étant donné que les séries chronologiques sont particulièrement intuitives, on a tendance à facilement les simplifier à outrance, ou à mal les interpréter. L'agrégat temporel utilisé au sein des séries chronologiques est une des sources d'erreur. Les mois de notre calendrier sont une façon quelque peu arbitraire de sectionner le temps, et il ne faudrait pas se leurrer en pensant que nos mois sont homogènes d'un point de vue commercial. Le nombre inégal de jours ou de week-ends qui forme un mois peut permettre d'expliquer des phénomènes qui pourraient a priori paraître être des divergences dans les données. D'autres phénomènes permettent de rendre compte de l'aspect cyclique de la variation des données. Par exemple, les jours fériés, comme Noël ou le Black Friday dans certains pays, engendrent systématiquement des pics de vente, tout comme le font les jours de paie en début de mois. Néanmoins, cette tendance cyclique ne convient pas nécessairement à notre calendrier. Des traditions comme le Ramadan ou le Nouvel An chinois engendrent des variations cycliques au sein des données, mais ce cycle n'est ni mensuel ni annuel. De surcroît, il faut se garder de tirer des conclusions hâtives à propos des séries chronologiques ou d'établir des corrélations excessivement simples entre les graphiques. Il est donc important de garder à l'esprit ce qui distingue une variable d'une autre (les ventes du point de vue de la demande ou des bénéfices).
Visualiser les séries chronologiques
Les séries chronologiques sont souvent utilisées pour analyser et visualiser des données, ainsi que pour comparer différentes séries. Cependant, une fois de plus, les écueils de ces graphiques résident dans leur apparente simplicité. Des techniques de cartographie différentes peuvent donc être utilisées pour permettre la meilleure visualisation de données possible. A titre d'exemple, le fait de tracer des lignes pour relier des points de données donne une impression de continuité. Cela peut être utile lorsqu'on cartographie, par exemple, l'évolution horaire des prix du stock.
Cependant, dans le cas de données particulièrement discontinues, un histogramme peut parfois être plus approprié.
Lors de la lecture d'une série chronologique, il faut toujours faire très attention à l'axe X. Certains graphiques se concentrent sur de intervalles de petite valeur afin de souligner la variation des données, le risque étant que ces variations soient surestimées. D'autres phénomènes, comme la croissance exponentielle, sont aussi mal représentés par une échelle linéaire sur l'axe X. On peut alors choisir d'utiliser une échelle logarithmique, où les premiers stades de la croissance peuvent être tout aussi bien perçus que les derniers.
Modélisation et prévisions
Les séries chronologiques sont souvent utilisées pour soutenir des modèles statistiques. Le but de ces modèles est double : expliquer le passé, et prédire l'avenir. Dans une supply chain, prédire la demande à venir est nécessaire pour déterminer les commandes d'achat et de production, et pour minimiser les risques de surstock. Au sein d'une série chronologique, on distingue généralement un niveau primaire, appelé le point de référence, une évolution sur le long terme, appelée la tendance, des variations cycliques et périodiques, appelées saisonnalité, et d'autres variations aléatoires, appelées bruit. Cela nous permet de distinguer les variations de données dues aux cycles réguliers, des variations de données dues à une tendance qui se développe ou s'estompe. Ces motifs fournissent le socle de base pour les prévisions économiques.
Il existe trois types principaux de prévisions, qui servent tous différents objectifs :
- Les prévisions ponctuelles ont pour but de donner la "meilleure" valeur future d'une variable, en fonction d'une métrique d'erreur specifiée. Cela est par exemple le cas pour les prévisions météorologiques, qui prédisent une seule et unique valeur de température pour chaque jour. Une prévision ponctuelle ne vise pas à représenter de manière fidèle l'évolution de cette variable (le lecteur sait parfaitement bien qu'il est probable que la température varie autour de la valeur qui a été prédite), mais représente une indication utile pour le lecteur et une base solide pour ses choix à venir.
- Les prévisions probabilistes fournissent les distributions de probabilité complètes de la valeur future. Les intervalles de confiance sont fréquemment utilisés pour visualiser de telles prévisions. Ces prévisions peuvent par exemple s'avérer utiles à des fins spéculatives.
- Les prévisions génératives font apparaître l'évolution de la variable comme étant "naturelle" ou "plausible", en permettant une certaine quantité de contingence et d'évolution aléatoire. Cette "perspective générative" peut être utile lorsque l'on réalise des simulations.
L'écosystème logiciel autour des séries chronologiques
Aujourd'hui, on utilise de multiples types de logiciels pour prendre en compte les complexités qui sont liées aux séries chronologiques, et pour fournir des modèles et des prévisions qui servent mieux la conception de leur utilisateur. Il est ainsi possible de trouver des bases de données, des outils open-source, et même des langages de programmation qui sont uniquement dédiés aux séries chronologiques. De nombreuses méthodes de prévision ont également été développées. A titre d'exemple, certains logiciels se contentent d'estimer les valeurs futures à l'aide d'une moyenne mobile, tandis que d'autres types de logiciels optent pour un lissage exponentiel, ce qui signifie que le poids des valeurs passées s'amoindri exponentiellement à mesure que ces valeurs s'éloignent dans le temps.
Les séries chronologiques sont par conséquent une abstraction particulièrement polyvalente et un outil statistique de base. Cependant, leur simplicité apparente peut être trompeuse. Un nombre de facteurs peut altérer la façon dont les données sont présentées, ou bien rendre compte des variations qui sont notables au sein des données. Connaître la façon dont les données sont collectées, et être conscient des facteurs susmentionnés, est donc essentiel.