Prognosen mit Deep Learning (2018)

Als Teil unseres Hauptzieles, die genauesten Prognosen mithilfe von Technik zu liefern, ist es uns eine Ehre, Ihnen mitteilen zu dürfen, dass die 5. Generation unseres Engines jetzt bei Lokad im Live-Betrieb ist. Dieses Engine bietet die bislang größte Genauigkeitsverbesserung, die wir in einem einzigen Release erreicht haben.

Von probabilistischen Vorhersagen zu Deep Learning

Das Design des Engines stützt sich auf eine relativ neue Sparte des Maschinellen Lernens, nämlich das Deep Learning. Für Lieferketten lassen sich erhebliche Verbesserungen in der Genauigkeit der Prognose in ebenso große Gewinne übersetzen sowie der Bedienung mehrerer Kunden in einem schnelleren Tempo und bei weniger Risiken, was den Bestand betrifft. Vor etwa 18 Monaten stellten wir die 4. Generation unserer Prognosetechnologie vor. Die 4. Generation war die erste, die wahre probabilistische Vorhersagen lieferte. Probabilistische Vorhersagen sind von grundlegender Bedeutung für Lieferketten, da sich die Kosten in den Extrempunkten der Statistiken konzentrieren, wenn der Bedarf unerwartet hoch oder niedrig ist. Im Gegensatz dazu erfassen traditionelle Prognosemethoden – wie etwa tägliche, wöchentliche oder monatliche Prognosen–, die hauptsächlich eine Median- oder Durchschnittsprognose liefern, das Problem nicht. Demzufolge erreichen Unternehmen mit solchen Methoden gewöhnlich keine befriedigenden Ergebnisse. Die 5. Generation leugnet ihre Herkunft nicht; sie stützt sich auf probabilistische Vorhersagen und baut auf die durch die vorangehende Generation gewonnenen Erkenntnisse auf.

Teilweise durch Zufall, stellte sich heraus, dass Deep Learning vom Design her sich stark für probabilistische Vorhersagen eignet. Die Motivation für diese Perspektive war jedoch nicht an Lieferketten gekoppelt. Deep Learning Algorithmen bevorzugen Optimierung auf Grundlage der probabilistischen / Bayes-Perspektive mit Kennzahlen, wie etwa der Kreuzentropie, da diese hohe Gradientenwerte bietet, die sich besonders für die stochastische Gradientenverfahren eignen, der Algorithmus, der Deep Learning ermöglicht.

Im konkreten Fall der Lieferketten deckt die Grundlage des Deep Learning die tatsächlichen Anforderungen der Unternehmen!

Jenseits vom Hype der Künstlichen Intelligenz

Künstliche Intelligenz –betrieben in der Praxis auf Deep Learning– war 2017 das Schlagwort des Jahres. Behauptet wird Gewagtes, Spannendes und, tja, auch Ungenaues. Aus Lokads Perspektive, beobachten wir, dass die Mehrheit dieser KI-Technologien für Unternehmen den Erwartungen nicht gerecht wird. Nur wenige Unternehmen können eine Finanzierung von über einer halben Milliarde US-Dollar, wie Instacart, sichern, um ein erstklassiges Deep Learning Team für die Bewältigung einer Herausforderung im Bereich Lieferkette zusammenzustellen. Mit diesem Release bietet Lokad jeglichen einigermaßen „digitalisierten“ Unternehmen Zugang zu einer Prognosetechnologie auf KI-Niveau. Selbstverständlich stützt sich alles auf historische Supply-Chain-Daten, weshalb diese Lokad zur Verfügung stehen müssen. Jedoch ist für unsere Technologie keine Expertise in Deep Learning erforderlich. Im Gegensatz zu praktisch jeder KI-Technologie für Unternehmen, hängt Lokad nicht von der manuellen Einrichtung von Features ab. Was unsere Kunden betrifft, verläuft das Upgrade von unseren früheren probabilistischen Vorhersagen zu Deep Learning nahtlos. Lokad ist das erste Softwareunternehmen, das eine einsatzfertige KI-Prognosetechnologie bietet, die sowohl für kleine Einmannfirmen aus dem E-Commerce Bereich als auch skalierbar für die größten Supply Chain Netzwerke mit Tausenden Niederlassungen und einer Million Produktreferenzen zugänglich ist.

Das Zeitalter des GPU-Computing

Bis zum Upgrade der Softwaregrundlage, mit dem von der Leistung der GPUs (Grafikprozessoren) profitiert werden konnte, blieb Deep Learning eine Nische. Die GPUs unterscheiden sich deutlich von den CPUs (Prozessoren), auf denen heutzutage immer noch die Mehrheit der Apps laufen, mit nennenswerter Ausnahme von Computerspielen, die sich weiterhin stark auf CPUs als auch auf GPUs stützen. Neben einem kompletten Rewrite unseres Prognose-Engines für diese 5. Generation, hat auch die grundlegende Infrastruktur von Lokad ein umfangreiches Upgrade erfahren. So nutzt Lokads Plattform nun, um unseren Kunden zur Seite zu stehen, GPUs und CPUs. Lokad profitiert jetzt von den GPU-fähigen Computern, die von Microsoft Azure, der Cloud-Computing-Plattform, auf die Lokad aufbaut, gemietet werden können. Die gewaltige Rechenleistung der GPUs steigert nicht nur die Genauigkeit unserer Prognosen, sondern erhöht auch ihr Tempo. Über ein GPU-Netz erhalten wir die Prognosen etwa 3- bis 6-mal schneller bei größeren Datasets(*).

(*) Für ultrakleine Datasets ist unser Prognose-Engine der 5. Generation tatsächlich langsamer und braucht ein paar Minuten mehr, was aber in der Praxis größtenteils zu vernachlässigen ist.

Einführung von Produkten und Aktionen

Unser Prognose-Engine der 5. Generation bietet wesentliche Verbesserungen für schwierige Prognosesituationen, insbesondere für Produkteinführungen und Aktionen. Aus unserer Sicht sind Produkteinführungen, obgleich sie auch sehr schwierig sind, ein Tick einfacher als Prognosen für Aktionen. Die Schwierigkeit liegt an der Qualität der historischen Daten, die für Aktionen im Vergleich zu Produkteinführungen stets niedriger ist. Daten für Aktionen werden mit der Zeit besser, sobald geeignete Qualitätssicherungsprozesse vorhanden sind.

Wir sehen in Deep Learning eine einmalige Gelegenheit für die Modebranche, in der Marken mit Produkteinführungen, die den Vertrieb beherrschen, zu kämpfen haben: hier sind Produkteinführungen nicht die Ausnahme, sondern die Regel. Komplexer wird es noch, umso mehr Farbvarianten und Größen dazukommen, die die Anzahl der SKUs hochtreiben.

Unser Prognose-FAQ

Welches Prognosemodell nutzen Sie?

Unser Deep-Prognose-Engine nutzt ein einzigartiges Modell, dass sich auf Deep Learning-Prinzipien stützt. Im Gegensatz zu klassischen statistischen Modellen, bietet dieses Modell Zigtausende Parameter, die sich trainieren lassen. Dies ergibt tausendfach mehr Parameter als unsere komplexesten Vorgängermodelle für maschinelles Lernen, die sich nicht auf Deep Learning stützten. Deep Learning übertrifft ältere Ansätze für maschinelles Lernen (Random forests, Gradient Boosted Trees) deutlich. Hierzu sollte jedoch erwähnt werden, dass diese älteren Ansätze für maschinelles Lernen bereits alle Klassiker mit Zeitreihen (Box-Jenkins, ARIMA, Holt-Winters, exponentielle Glättung, usw.) übertrafen.

Lernen Sie aus Ihren Prognosefehlern?

Ja. Der statistische Trainingsprozess - aus dem letzten Endes das Deep Learning-Modell entsteht - nutzt alle historischen Daten, die Lokad zur Verfügung stehen. Dabei können historischen Daten über Backtesting zur Nutzung bearbeitet werden. Daher hat das Modell umso mehr Möglichkeiten, aus den eigenen Fehlern zu lernen, umso mehr historische Daten verfügbar sind.

Kann Ihr Prognose-Engine Saisonalität, Trends und Wochentage berücksichtigen?

Ja, der Prognose-Engine kann alle üblichen Zyklizitäten und sogar Quasi-Zyklizitäten, deren Bedeutung oft unterschätzt wird, berücksichtigen. Was den Code betrifft, stützt sich das Deep Learning-Modell auf einen Ansatz mit verschiedenen Zeitreihen zur Berücksichtigung von in anderen Produkten festgestellten Zyklizitäten, um die Prognosegenauigkeit für jegliche Produkte zu erhöhen. Natürlich können zwei Produkte dieselben Saisonalität teilen, aber nicht dasselbe Muster über die verschiedenen Wochentage. Das Modell kann auch diese Muster erfassen. Eines der größten Vorteile von Deep Learning ist die Fähigkeit, die Variabilität der Saisonalität selbst zu erfassen. So kann im Zusammenhang mit externen Variablen, wie etwa dem Wetter, eine Saison früher oder später beginnen. Genau solche Variationen können erkannt und in unseren Prognosen widergespiegelt werden.

Welche Daten benötigen Sie?

Wie auch bei der früheren Generation unserer Prognose-Technologie, benötigt der Prognose-Engine zur Vorhersage des Bedarfs mindestens die tägliche Historie des Bedarfs oder, noch besser, die aufgeschlüsselte Bestellhistorie. Was die Länge der Historie betrifft, ist es umso besser, desto länger sie ist. Wobei unter zwei Jahren keine Saisonabhängigkeit festgestellt werden kann. Daher betrachten wir Historien von drei Jahren als gut und von fünf Jahren als hervorragend. Zur Prognose der Durchlaufzeiten benötigt der Prognose-Engine gewöhnlich die Bestellungen, in denen sowohl das Bestell- als auch das Lieferdatum, vermerkt sind. Außerdem ist es für eine verfeinerte Prognose sehr hilfreich, Produkt- oder SKU-Attribute anzugeben. Zusätzlich ist die Angabe der Bestände nützlich, um eine erste bedeutende Bestandsanalyse zu erstellen.

Können Sie mein Excel-Blatt prognostizieren?

Als Faustregel kann man sagen, dass, wenn Ihre gesamten Daten in eine Excel-Tabelle passen, Sie damit wahrscheinlich nicht viel anfangen können. Tabellendaten sind oft nach Wochen oder Monaten aggregiert, wodurch die meisten historischen Informationen verloren gehen. Außerdem enthält Ihr Excel-Blatt vermutlich auch nicht viel Information über die Kategorien und Hierarchien Ihrer Produkte. Unser Prognose-Engine nutzt alle Daten, die Sie besitzen. Daher liefert ein Test auf Grundlage einer kleinen Auswahl keine zufriedenstellenden Ergebnisse.

Was geschieht bei Fehlbeständen und Aktionen?

Sowohl Fehlbestände, als auch Aktionen, stellen eine Verzerrung in der Absatzhistorie dar. Da das Ziel die Prognose des Bedarfs und nicht die des Absatzes ist, muss diese Verzerrung berücksichtigt werden. Ein häufiger, aber falscher, Ansatz bei solchen Ereignissen ist, die Historie zu überschreiben und dabei die Lücken zu füllen und die Spitzen zu kürzen. Dennoch sind wir keine Freunde dieser Lösung, da der Prognose-Engine mit Prognosen eingespeist wird, was weiterführende Probleme zur Folge haben kann. Stattdessen, unterstützt unser Engine nativ „Flags“, die darauf hinweisen, dass der Bedarf zensiert oder überhöht wurde.

Prognostizieren Sie auch neue Produkte?

Ja! Doch, um Prognosen für neue Produkte zu erstellen, benötigt der Engine das Einführungsdatum der anderen „alten“ Produkte, sowie die Bedarfshistorie zum Zeitpunkt der Einführung. Zusätzlich wird auch die Angabe von Produktkategorien und/oder einer Produkthierarchie empfohlen. Der Engine prognostiziert nämlich neue Produkte durch die automatische Erkennung vergleichbarer „älterer“ Produkte. Doch die Prognose stützt sich gänzlich auf die dem neuen Produkt zugeordneten Attribute, für dessen Bedarf noch keine Beobachtungen vorliegen.

Benutzen Sie externe Daten, um die Prognosen abzustimmen?

Wir können Daten zur konkurrenzorientierten Preisbestimmung über Drittanbieter nutzen, die beispielsweise auf Web-Scraping spezialisiert sind. Zusätzlich können Angaben zum Datenverkehr Ihrer Webseite erworben werden, um die historischen Daten für eine höhere statistische Genauigkeit zu nutzen. In der Praxis ist das größte Hindernis bei der Nutzung externer Datenquellen nicht Lokads Engine - der ziemlich leistungsfähig ist - sondern der Aufbau und die Wartung einer qualitativen Daten-Pipeline zu den externen Datenquellen.