Preparazione dei dati

Quando Lokad prende in carico un'iniziativa di catena logistica quantitativa, l'80% dei nostri sforzi è dedicato alla preparazione dei dati (talvolta chiamata anche pulizia dei dati, pulitura dei dati o pre-elaborazione dei dati). Solitamente, anche i professionisti più esperti del settore faticano a capire la necessità di questo passaggio. Eppure, la nostra esperienza ci ha insegnato che i problemi nei dati sono tra le prime cause del fallimento dell'ottimizzazione logistica, in tutti i settori industriali, dall'alimentare fresco all'aeronautica. Se alcuni insuccessi logistici sono talmente clamorosi da finire sulle prime pagine dei giornali, la maggior parte di essi viene passata sotto silenzio. Analizzare questi insuccessi è però di vitale importanza per far sì che non si ripetano.

Insuccessi provocati dai dati

I progetti di ottimizzazione della catena logistica spesso falliscono. Sulla base delle testimonianze che abbiamo raccolto tra i nostri clienti, abbiamo calcolato che la percentuale di fallimento tra le iniziative di ottimizzazione della catena logistica arriva a superare l'80% nella maggior parte dei settori industriali. Pochi fornitori riconoscerebbero che il fallimento è la norma per i propri clienti.

Un paradosso della moderna catena logistica è che spostare fisicamente le scorte di magazzino da un continente all'altro è meno rischioso che spostare i dati relativi al magazzino da un computer a un altro ad appena un metro di distanza.

Se qualcosa non funziona, né il cliente né il venditore hanno interesse a farlo sapere. Di conseguenza, la maggior parte degli errori viene ignorata e finisce presto nel dimenticatoio. Di tanto in tanto, però, si verificano fallimenti così clamorosi da guadagnarsi le prime pagine dei giornali. Tra questi ricordiamo:


Sebbene non esista una ragione comune per spiegare tutti questi fenomeni, è pur vero che, ogni volta che qualcosa non funziona nei dati, le decisioni prese in materia di catena logistica si concludono con insuccessi clamorosi.

Di solito, però, gli errori sono di minore entità. Chi lavora nella distribuzione è abituato a mantenere una sana mancanza di fiducia nelle cifre prodotte dai nuovissimi sistemi informatici (che pure si presentano come una svolta), affidarsi al buon vecchio Excel e, dopo qualche mese, rinunciare al sistema. In questo modo, l'attività commerciale non ne risente, ma comunque si sprecano tempo ed energie, con un costo opportunità netto.

Interpretare i dati in modo sensato è difficile

I dati storici di un'attività commerciale sono allo stesso tempo ambiziosi e complessi. Queste caratteristiche, spesso controintuitive e difficili da afferrare, tendono a essere poco comprese. Secondo la nostra esperienza, proprio questa mancanza di comprensione rappresenta uno dei principali motivi alla base dei problemi che i dati causano all'ottimizzazione della catena logistica.

Facciamo l'esempio di un semplice storico delle vendite: una tabella elencherà le quantità vendute per prodotto e per giorno negli ultimi anni. Lo storico delle vendite dovrebbe essere quindi in grado di indicare la direzione in cui l'attività si sta muovendo.

In realtà non è così, perché:
  • lo storico può contenere dei pacchetti, ossia gruppi di prodotti venduti insieme ad altri, per cui i prodotti potrebbero diminuire mentre l'attività aumenta;
  • lo storico può contenere resi, che a volte possono costituire una parte consistente delle vendite, per cui l'attività potrebbe sembrare in aumento, ma in realtà non lo è poiché i resi sono più numerosi;
  • lo storico può contenere promozioni, in cui il margine è stato sacrificato pur di svuotare il magazzino, e la domanda generata non è rappresentativa della domanda per gli articoli a prezzo pieno.

Quando poi facciamo riferimento alle quantità giornaliere di una data specifica, la data stessa può rivelarsi ambigua, poiché può corrispondere al giorno in cui:
  • il cliente ha effettuato un ordine;
  • il cliente ha confermato un pre-ordine;
  • il prodotto è stato spedito al cliente;
  • l'ordine è stato inserito nel sistema ERP;
  • l'ordine è stato modificato per l'ultima volta nell'ERP;
  • il pagamento del cliente è stato ricevuto;
  • ecc.

Tutte queste varianti sono corrette, ma ognuna di esse ha implicazioni diverse per l'attività commerciale. Spesso si ha la tentazione di liquidare questi dati come un semplice storico delle vendite: in realtà, con dati di questo tipo, non c'è mai nulla di semplice.

Per di più, le diverse implicazioni moltiplicano i loro effetti quando sono combinate fra loro. Non c'è niente di più rischioso di eccedenze di magazzino generate da vendite calcolate erroneamente al rialzo, insieme a scorte in arrivo calcolate erroneamente al ribasso.

Nel nostro lavoro con Lokad, abbiamo spesso avuto modo di osservare che una buona documentazione dei dati prevede quasi sempre una descrizione di circa una pagina per ogni colonna di ogni tabella. Di solito, però, ci consideriamo fortunati se troviamo anche una sola riga di descrizione per ogni colonna (per campo di dati) all'inizio di un nuovo progetto.

Inoltre, anche quando la documentazione effettivamente c'è, spesso non coglie il punto essenziale: non c'è dubbio che una colonna chiamata OrderDate (data dell'ordine) contenga delle date. È ovvio anche che una colonna chiamata StatusCode (codice stato) contenga una breve lista di codici. La documentazione tecnica si sofferma solitamente sugli aspetti informatici, tralasciando quelli più strettamente connessi all'attività commerciale, ma in realtà sono proprio questi ultimi che contano di più in un'ottica di ottimizzazione.

In informatica esiste un vecchio detto: Garbage In, Garbage Out (spazzatura in ingresso, spazzatura in uscita). Se i dati di input non hanno senso, i risultati non potranno essere diversi. Per questi motivi, quando Lokad prende in carico un progetto relativo a una catena logistica, il primo obiettivo è quello di passare al vaglio tutti i dati e documentare quello che troviamo. Molti clienti si stupiscono della quantità di documentazione che Lokad produce ogni volta che rivede sistemi, dati e processi di un'azienda. In tanti anni, però, non ci è mai capitato di dover rimpiangere una documentazione eccessiva.

Non esiste una struttura identica a un'altra

Una delle domande che ci vengono poste più di frequente durante un'iniziativa dedicata alla catena logistica quantitativa è: L'iniziativa è compatibile con il sistema XYZ?. La risposta in breve è, quasi sempre, ; la risposta più articolata è sì, ma c'è bisogno di un po' di lavoro. Spostare i dati è piuttosto facile: il protocollo per il trasferimento dei file FTP è ormai noto da decenni e anche una connessione Internet modesta è in grado di trasferire una discreta quantità di dati. La vera sfida è dare un'interpretazione sensata dei dati che vengono elaborati. Dal punto di vista di un'azienda, capire quanto il proprio sistema informatico sia flessibile non è sempre facile: anche se a un addetto ai lavori un sistema aziendale potrebbe sembrare piuttosto rigido, in realtà è quasi sempre vero il contrario.

Negli ultimi decenni, i fornitori di software hanno fatto a gara per offrire prodotti con caratteristiche più flessibili e, ormai, i sistemi che bloccano il lavoro entro rigidi confini sono piuttosto rari. La maggior parte di quelli disponibili oggi offre un ampio ventaglio di possibilità per arrivare allo stesso risultato: quindi, anche quando i dati sono originati dallo stesso software, è raro che la preparazione dei dati rimanga uguale. La preparazione dei dati, infatti, dipende in larga misura dalle pratiche e dal workflow messi in atto all'interno delle singole imprese e, anzi, gli stessi dati potrebbero essere interpretati in modo diverso se analizzati da un'altra azienda. A prima vista, queste divergenze potrebbero sembrare di minore entità, ma, in un'ottica di ottimizzazione della catena logistica, esse causano spesso discrepanze notevoli tra la logica dell'ottimizzazione e le esigenze reali dell'azienda.

Senza dati non c'è strategia

La buona notizia è che i computer fanno quello che gli chiedi di fare.
La cattiva notizia è che fanno quello che gli chiedi di fare. Ted Nelson

Molti dirigenti aziendali confidano nel fatto che i dipendenti eseguiranno la loro strategia di business, anche se la strategia in sé non è stata formalizzata o nemmeno messa per iscritto. Tuttavia, l'ottimizzazione delle quantità non si basa su obiettivi impliciti: i numeri prodotti da dati di input riflettono esattamente il quadro numerico che è stato creato. Di conseguenza, i risultati iniziali prodotti dalle soluzioni di ottimizzazione quantitativa tendono a essere sconcertanti, precisi su alcuni aspetti e vaghi su molti altri.

Poiché gli obiettivi aziendali vengono raramente stabiliti con precisione fin dall'inizio, spesso sono proprio i primi risultati prodotti con l'ottimizzazione quantitativa a indicare cosa non va. I fattori da tenere in considerazione possono essere diversi:
  • alcuni clienti sono VIP e richiedono livelli di servizio più elevati;
  • alcuni prodotti stanno diventando obsoleti e comportano un rischio molto più alto per il magazzino;
  • alcuni fornitori applicano quantità minime per gli ordini sia a livello di SKU che di ordine;
  • alcuni magazzini possono essere quasi pieni e richiedere riordini contenuti;
  • ecc.

Rispondere a queste sfide richiede altri dati, ed è a questo punto che le aziende si rendono conto che i dati rilevanti non possono essere trovati da nessun'altra parte se non (forse) tra i tanti fogli Excel sparsi tra i vari uffici. I fogli Excel, poi, sono spesso trattati come se non fossero abbastanza importanti e relegati nelle caselle di posta elettronica.

Di conseguenza, diventa necessario preparare non solo i dati transazionali (come quelli estratti da un sistema ERP), ma anche i dati di alto livello che modellano la strategia di business: a differenza di quanto avviene con i primi, questi ultimi sono spesso ancora poco coerenti a livello aziendale, per cui, non appena ne viene avviata la preparazione, capita di rendersi conto che le strategie di alto livello dell'azienda non hanno molto senso quando sono applicate ad alcuni casi limite.

Per allineare la logica di ottimizzazione con l'attività commerciale, l'approccio più semplice consiste nel riesprimere tutto in euro o dollari (o qualsiasi altra valuta), non perché guardare le cose in prospettiva finanziaria sia l'opzione migliore in sé, ma perché questa è l'unica unità di misura che ci consente di mantenere la stessa coerenza all'interno di tutta l'azienda, pur richiedendo una minima coordinazione tra tutti i reparti. A livello pratico, l'ottica finanziaria può creare delle frizioni se l'azienda non usa indicatori finanziari o, peggio, nessun indicatore.

La documentazione non è mai troppa

L'ingrediente segreto per una buona preparazione dei dati è una buona documentazione. È un ingrediente semplice, ma quasi sempre sottovalutato o liquidato come un compito non importante o non urgente. Eppure, la nostra esperienza con Lokad ci ha insegnato che una buona documentazione dei dati è effettivamente importante e urgente.

In particolare, la documentazione deve spiegare il perché di ogni origine dati e di ogni campo dati. Documentare l'obiettivo dei dati raccolti è essenziale per garantire che questi dati siano elaborati successivamente in modo corretto. Ciò nonostante, troppo spesso, anche quando la documentazione è presente, si limita semplicemente a parafrasare il nome del campo di dati.

Documentazione inefficace
ORDERS.DATE: data associata alla riga dell'ordine.

Documentazione efficace
ORDERS.DATE: data in cui il cliente ha manifestato per la prima volta l'intenzione di acquistare il prodotto; rappresenta il segnale principale della domanda. La data può essere confrontata con ORDERS.DELIVERYDATE per stimare il periodo di tempo trascorso tra l'ordine iniziale e la consegna dal punto di vista del cliente.

Documentare i dati di input non è un'operazione relativa al sistema informatico, ma una risorsa legata all'attività commerciale stessa. Per quanto il reparto informatico possa essere motivato e di sostegno, non potrà quasi mai avere accesso agli aspetti più strettamente commerciali che sono necessari per capire i dati fino in fondo.

Di conseguenza, quando avviamo un progetto per un nuovo cliente, siamo abituati prima di tutto a investire del tempo nella documentazione dei dati, su cui ritorniamo di volta in volta dopo ogni conversazione col cliente (che ci illustra la propria attività così com'è concepita dall'interno). Quello che otteniamo da questo procedimento non sempre è chiaro fin dall'inizio, perché la sua utilità sembra passare in secondo piano rispetto ad altre cose. Con il passare del tempo, però, alcuni dei dettagli più minuziosi riguardo i dati si dimenticano e la documentazione scritta rimane l'unica àncora di salvezza per evitare di ricadere ogni volta negli stessi errori.