著者Joannes Vermorel、2013年6月推敲統計上、予測の精度とは、
予測された量および実際に観測された(真)の値の近さの度合いとなります。発表される予測は将来に関するものであるため、実際の値は、通常、予測が行われた時点で測定することができません。多くの企業にとって、より正確な予測は全体的な運用コストを削減する一方で、需要への対応する上での有効性を高めます。
ここでは、特に在庫最適化および需要計画分野において、商業および製造業に主に関連した統計的観点をとることにしています。
精度の推定値の利用について
計算された精度は、
予測の期待するクオリティに対する定量的推定を示します。
在庫の最適化の際に、予測精度を推定することで、以下のような目的が達成されます。
- 需要リードを予測するために利用すべきモデルを複数の予測モデルから選択する。
- 予測誤差が一般に正規分布に従うと仮定し、安全在庫 を算出する。
- 未編集の統計的予測が信頼するに十分ではないことから、もっとも注意を払う必要あるアイテムの優先順位をつける。
戦略的計画といった別の状況下においては、精度の推定は個別のシナリオおよびそれぞれの可能性を考慮しており、what-if分析の裏付けとなります。
精度集約化の影響
予測の精度を決定する主要因として予測モデルの品質を解釈するといった誤解が頻繁に見られます。そうではないのです。
精度の価値を決定する最も重要な要因とは、予測された現象の
本質的な不安定さに他なりません。実際には、商業または製造業にて、この不安定さは集計水準と大きく相関性があります。
- 地方予測に対する全国予測に見られるように、対象地域が大きければ、より高い精度が得られます。
- 対象期間についても同様です。日間予測に比べ月間予測の方がより高い精度が得られます。
事例証拠: Lokadにては、良い精度など存在しないことが日常的に見られます。すべては状況によるのです。欧州の大国における翌日の国内電力消費量を予測するにおいて、0.5%の誤差は比較的精度が悪いと見なされます。一方で、初めて市場に導入される生鮮食品の販売初日の店頭予測売上を誤差80%以内に抑えることは、著しい達成と評価されるものなのです。
従って、ひとたび集計レベルが明確となれば、予測モデルの品質こそが達成精度を決定する上で主要な役割を担うことになります。そうして、将来の更に先を見通すことにより、精度は落ちていくのです。
実証精度 vs 実際精度
ある種の物理的な測定の品質に言及する際に
精度という用語が頻繁に使用されます。残念ながら、この観点は統計的予測となると若干誤解を生じさせます。別の方法と比較できる物理的な設定とは異なり、予測の
現実の精度は厳密に
所有していないデータに対して測定しなければならないのです。
実際のところ、データさえ入手できれば、そのデータを模倣するだけで良いのですから、完璧に正確な予測を出すことは可能となります。この問題は
統計学者たちを一世紀以上も困惑させ続けました。漸く十分に納得のいく観点が指し示されるには、20世紀末のVapnik-Chervonenkis理論(1)を待つことになります。
予測の精度は手元にあるデータに対して測定するのみとなります。しかしながら、データが入手された時には、この
予測はもはや真の予測ではないのです。将来の数字ではなく、過去の数字といったものになってしまうのです。従って、この測定は
実際精度に対して
実証精度として言及されます。
過剰適合の問題は実証精度および実際精度の間に顕著な矛盾を齎しかねません。
時系列予測をする際には、慎重にバックテストを実施することでほとんどの過剰適合問題を軽減することができます。
評判の精度測定基準
予測の精度を測定する上で多くの測定基準があります。頻繁に使用される基準には以下のものがあります。T
- MAE (平均絶対誤差)
- MAPE (平均絶対誤差率)
- MSE (平均二乗誤差)
- sMAPE (調整平均絶対誤差率)
- ピンボールロス (クォンタイル予測のMAEの一般化)
実際には、予測の不正確さにより企業が被るコストを受け入れる能力次第によって測定基準を選ぶべきであろうといえます。
Lokadのアプローチ
全く間違っているよりは、だいたい正確である方が良いでしょう。商業および製造業の企業とのお付き合いで、精度測定の選択に対して、余り関心が寄せられていないことが良くあります。
理想的な測定基準はパーセンテージで表わされるリターン価値ではなく、厳密に
予測の不正確さによって齎された非効率コストをも反映させたドルやユーロでのリターンといえるでしょう。特に、最も定評ある測定基準は対称的なものですが(ピンボールロスは顕著な例外)、予測以上となる、或いは予測以下となるリスクは実際のところ非対称です。加工していない統計指標よりは、注意深く事業の制約に合うべくモデル化した経済的コスト機能に近い測定基準を選ぶことをお勧めします。
また、予測が
正確であることを前提とした計画を立てないことは非常に重要です。不確かさは事業では回避できないことであり、それを考慮する必要があります。
参考文献