Previsioni con attributi


Home » Risorse »

L'intento di Lokad è quello di fornire previsioni il più accurate possibili. Quando, però, consideriamo un solo prodotto, dobbiamo riconoscere che spesso non ci sono abbastanza dati storici a disposizione per mettere a punto una previsione statistica accurata. Per ovviare al problema, Lokad sfrutta le correlazioni tra articoli diversi per rifinire le previsioni. Ancora una volta, però, le correlazioni possono rivelarsi insufficienti se si basano sulla domanda storica, perché spesso questa si rivela troppo breve o scarsa. Lokad offre quindi la possibilità di rifinire ulteriormente le previsioni con la gerarchia articoli e le categorie articoli. In questa sezione vedremo come utilizzare questi strumenti con il motore di previsione di Lokad.

Sintassi generale

Le categorie e la gerarchia possono essere passate come argomenti per nome al motore di previsione, come mostra l'esempio qui di seguito:

Leadtime = forecast.leadtime(
  category: C1, C2, C3, C4
  hierarchy: H1, H2, H3, H4
  // altri argomenti omessi
  )
Demand = forecast.demand(
  category: C1, C2, C3, C4
  hierarchy: H1, H2, H3, H4
  label: PlainText
  // altri argomenti omessi
  )  

Gli argomenti category (categoria), hierarchy (gerarchia) e label (etichetta) sono opzionali e possono quindi essere omessi. Se si sceglie di utilizzarli, possono essere indicati da 1 fino a 4 vettori.

Perché sono utili alle previsioni

Le categorie e la gerarchia ricoprono un ruolo molto simile nell'ottica della previsione: aiutano, cioè, il motore di previsione a gestire dati storici insufficienti. Infatti, per ogni articolo (1), il numero di osservazioni passate potrebbe essere molto limitato e addirittura non superare qualche osservazione l'anno. In questi casi, le previsioni basate su dati storici limitati potrebbero rivelarsi non abbastanza accurate, a causa della notevole quantità di rumore presente nelle stime.

(1) Il termine articolo può essere riferito a un prodotto, un codice a barre, una SKU, una partita, ecc., a seconda della specifica situazione di business considerata. In effetti, dal punto di vista delle previsioni, il termine articolo può coprire una vasta gamma di oggetti di interesse.

Il motore di previsione di Lokad affronta il problema sfruttando le correlazioni tra articoli diversi. Tuttavia, poiché i dati storici rimangono insufficienti, resta piuttosto difficile correlare i prodotti sulla base unicamente dei valori registrati in passato. Il motore di previsione tenta quindi di sfruttare le relazioni tra i vari articoli basandosi su attributi e proprietà in comune.

Nel settore retail, queste proprietà vengono di solito tracciate attraverso i sistemi PIM (Product Information Management, gestione informazioni prodotti). Lokad è un'applicazione web, quindi non offre funzionalità PIM - anche se i dati elaborati da Lokad sono spesso estratti da strumenti PIM. Le proprietà dei prodotti così raccolte sono interessanti dal punto di vista delle previsioni, perché contengono numerose informazioni utili sul mercato stesso (es. quali sono i segmenti di mercato rilevanti, quali sono i fattori di diversificazione tra gli articoli...).

La gerarchia

Per gerarchia si intende una classificazione gerarchica di tutti gli articoli (un po' come un albero). Il motore di previsione supporta fino a 4 livelli di gerarchia. Se sono presenti più livelli gerarchici, raccomandiamo di inserirli nel motore di previsione per ordine decrescente di importanza, quindi dal livello più alto al più basso della gerarchia. Il motore di previsione supporta una sola gerarchia.

Molte attività utilizzano già una propria gerarchia per l'organizzazione degli articoli. I livelli della gerarchia potrebbero essere, ad esempio, mercato, segmento, famiglia, sottofamiglia, ecc., a seconda della terminologia specifica utilizzata dall'azienda. Per le attività di e-commerce, la gerarchia degli articoli è di solito quella visibile nel menù di navigazione del sito.

Le categorie

Per categorie si intendono i vari gruppi di articoli ritenuti fondamentali per la previsione. Le categorie servono a completare la gerarchia attraverso proprietà trasversali (es. autore nel caso dei libri). A differenza di quanto avviene con la gerarchia, non esistono relazioni specifiche tra le varie categorie: una categoria, quindi, non è subordinata all'altra.

A livello pratico, le categorie possono essere utilizzate per riflettere attributi relativamente diversi degli articoli, come il marchio, il materiale o il colore. Le categorie possono anche essere usate a mo' di gerarchia secondaria. Il motore di previsione supporta fino a 4 attributi di categoria.

Le etichette plain text

Le etichette rappresentano una categorizzazione più ampia degli articoli, ottenuta attraverso le loro descrizioni in plain text. Il motore di previsione dispone infatti di funzionalità di text mining, che supportano i set di dati quando non sono presenti categorie o gerarchie: è vero che, per ottenere previsioni più accurate, categorie e gerarchie identificate manualmente sono preferibili, ma è vero anche che tali informazioni non sono sempre disponibili, e che reinserirle manualmente per migliaia di articoli è decisamente poco pratico.

Il motore di previsione di Lokad è in grado di risolvere anche questo inconveniente, sfruttando la descrizione in plain text degli articoli. Non esistono limiti per la descrizione in plain text: il motore di previsione è però ottimizzato per testi che contengono meno di 20 parole. In linea di massima, i risultati migliori si ottengono con descrizioni di una riga. Nella pratica, abbiamo osservato come le descrizioni in plain text di qualità siano in grado di migliorare l'accuratezza delle previsioni in misura comparabile alle categorie e gerarchie ben definite.

Conoscenza approfondita del mercato

Le categorie e la gerarchia consentono al motore di previsione di acquisire una conoscenza più profonda del mercato. La nostra esperienza ci ha insegnato che quasi tutti gli attributi o caratteristiche considerati rilevanti dagli esperti del settore si rivelano poi rilevanti anche per il motore di previsione. Per ogni set di dati che contenga più di 100 articoli, consigliamo caldamente di includere almeno due attributi (possibilmente due livelli di gerarchia, oppure un livello di gerarchia e una categoria). Queste informazioni consentiranno di ottenere previsioni sensibilmente più accurate.

Sconsigliamo, però, di generare categorie o livelli gerarchici sintetici, come ad esempio stagionalità, volumi di vendita o irregolarità delle vendite. Questi sono infatti attributi che il motore di previsione può recuperare automaticamente dal set di dati storici.