ホーム »
Salescast » このページ
履歴データ内に存在する相関関係を活用することで、Salescastは、より正確な予測を提供することができます。しかし、履歴が短い場合は、得られる情報がほぼないことから、時系列を比較するだけでは相関関係を検出することは困難となります。従い、Salescastは
タグの概念を導入しています。このタグは、例えば、ファミリー、サブファミリーやカテゴリなどの属性を表すために使用され、相関関係の分析を強化するために活用されます。
タグを使って相関関係を改善
ビジネスの観点から、Salescastは最適化した棚卸資産の決定を下します。しかし、よりテクニカルな観点から言えば、Salescastは
時系列予測を出しているのです。この予測を改善するために、Salescastは広範囲に時系列間の相関関係を活用します。直感的に言えば、それぞれを取り出すと、時系列は単独ではそう多くの情報を有していません(時系列が短すぎたり、不規則であったりすることから)。しかし、複数の時系列を見た場合、季節性など、しっかりとした指標を得ることができるのです。
しかしながら、例えば発売して3ヶ月もたっていない製品など時系列が短く、新製品を既存の製品と相関付ける程のデータはほぼなく、相関プロセスそれ自体が複雑となります。
その場合は、その製品が属するファミリー、カテゴリー、顧客によって同様にみなされている他の特性についての、
a priori(自明的な)知識を活用することは興味深いものです。
タグとは、Salescastがインプットデータセットに、この様な情報を反映させることができることを意図しています。
特定のタグに関連付けられるすべての項目が同じ季節性を共有していることをSalescastが検出したとすれば、直感的には、このタグに関連付けられる新しい項目はすべて、同じ季節パターンに基づいて予測されることとなります。そして、季節パターンは、他の既知の季節性を持つ項目の季節性と関連付けることができるようになるために何ヶ月も
待つ必要なく、直ちに有効となります。
タグとしての項目記述子
具体的に、
タグは
Lokad_Itemsファイル(Salescastの
ファイル形式参照)の中にある接頭辞が
Tagから始まる名前の特殊な列に他ありません。
タグ列は任意の値を含むことができます。同じタグの値に関連付けられたすべての項目は、タグ値自体によって定義された暗黙のグループに属するものとしてSalescastによって扱われます。
The
タグは
a priori(自明的)に分かっている項目(*)の何らかの分類を反映している必要があります。ほとんどの企業は販売または生産された項目を整理順序立てていますが、これこそ
タグとしての優れた候補と言えます。
(*)
Salescastにおける専門用語として、"項目"は単一の時系列に結びついています。事業によっては、商品、SKU、バーコード、などと表されることになります。例えば、カタログをカテゴリー、ファミリー、サブファミリーの三つの階層レベルで分類している小売店を想定してみましょう。この階層はそれぞれ、カテゴリー、ファミリー、サブファミリーとして分類したタグに変換することができます。
また、
タグは、ドメイン固有の属性を表すために使用することができます。例えば、
- 色、サイズ、生地は衣料品小売業者にとって使用可能なタグ。
- 著者、コレクション、フォーマットは書籍小売業者にとって使用可能なタグ。
タグに関するヒント
ここでは、Salescastにおいて、より有効にタグを活用するためのいくつかのヒントに触れます。
期待される季節性を反映させたタグを挿入しない
タグには、項目に対する非季節性な何らかの情報を反映させるべきです。期待される季節性、あるいはトレンドなどといった類似な統計的パターンを反映させたタグを加えたい誘惑にかられるものと思います。しかしながら、実際のところSalescastには真の
特別な情報をもたらしはしないことから、そのようなタグを避けるようにお勧めします。Salescastはそれ自身によって季節的相関性を見出すことができるのです。
タグは複数回使用されるものでなければならない
Salescastにとって有効なタグとは、複数の項目をカバーしているタグとなります。もしも一つのタグが唯一の項目のみに当て嵌まるのであれば、このタグを基にした相関はありません。特に、識別子となると、各項目を唯一識別する特徴となることから、正にタグとしては不適格となります。
6つ以上のタグを導入すべきではない
論理的には、Salescastは100までのタグを扱えます(*)。しかしながら、実際には6つ以上のタグを使用しないことを強くお勧めします。真に情報価値の高いタグを3つ使用することの方が、多くの雑音が介入する10のタグを使用することよりも良いのです。
(*)
タグが100以上もあれば、Salescastはデータを取扱えなくなります。