※この記事は2014年1月に公開された「月で傾向が違っても大丈夫!移動平均法で季節変動か成長か見極める」のリライトです。
サブスクリプションのビジネスモデルを採択した事業の場合、売上を伸ばすためのKPIは契約者(社)数になるはずです。契約シャ数*利用金額=売上になるからですね。
ただし、この利用金額というのが曲者です。料金が2段階で変化する、或いは様々なオプションを付与する料金体系だと、1社(人)あたりの利用金額が微妙に異なります。
そこで売上/契約者シャ数=平均単価を算出して、契約者シャ数*(利用金額≒平均単価)=売上と置き換えている会社が多いかと思います。しかし、この平均単価はダミーとして無理やり作っている数字なのであまり信頼できません。
結果、自然と契約者(社)数と売上に目が行くと思うのですが、季節によってジグザグしていて、事業が伸びているのか、季節要因による変動なのかが分かり辛くなってしまいます。
季節要因を除去して、成長か停滞か見極められないでしょうか。できるんです。そう、移動平均ならね。
そこで今回は「移動平均」を用いて、3STEPで「成長を見極める方法」を披露したいと思います。
STEP0:「移動平均」とは何か?
3STEPを説明する前に、そもそも「移動平均」とは何かを説明します。
簡単に言うと、一定の区間(期間)を定め、範囲をずらしながら平均を算出することで、規則的な変動要素と不規則な変動要素の影響を除き、推移を「平滑」にする手法です。
特に金融や気象などの分野で重宝されています。株をされる方なら「○日移動平均」という言葉にピンと来るのではないでしょうか。
例えば、日単位の時系列なデータがある場合を考えます。
1週間で見てバラつきがありますよね。まずは、この日単位のばらつきを消したい!となると、1週間分の平均値を求めてしまって、以降は1日ずつ範囲をずらしながら平均を求めます。すると1週間の中にある変動要素を取り除くことができます。
データはどの単位で移動平均を求めても問題ありません。(ものすごく厳密に言えば問題が出る場合もあるでしょうが…)
そもそも時系列なデータには、長期的な傾向変動(トレンド)、中期的な循環変動(サイクル)、中短期的な季節変動(シーズン)、不規則変動(ノイズ)の4つの変動が隠れています。
この4つが全て組み合わさったデータが測定されるので、全てをバラバラに分解するのは難しいものの、ある程度分離することができます。その手法の1つが移動平均です。
移動平均は季節変動と不規則変動を取り除いた傾向と循環という比較的長期な時系列データを作成するのに向いていると言われています。
STEP1:「移動平均」で時系列データを「平滑」化する
具体例として、経済産業省が発表している特定サービス産業動態統計調査を用います。
完全なるサブスクリプションモデルとは言えないのですが、フィットネスクラブの会費=場所と機器を借りて自分の好きな回数分だけトレーニングができると考えて、フィットネスビジネスの会費売上/月毎から「成長度」を見てみましょう。
グラフで見ると2010年~2012年まで右肩上がりに見えますが、2011年以降は横ばいにも見えます。月単位で凸凹しているので、ちょっと分かり辛いですね。
移動平均による分析はExcelにアドインされているツールを使います。
[データ]タブを選択後、データ分析を選択してください。そして、いくつかある中から「移動平均」を選択してください。すると、以下のような選択画面が表示されます。
もし、データ分析がなければ、[ファイル]タブのオプションを選択後、[アドイン]-[管理]の設定を選択して、「分析ツール」のチェックを有効にして下さい。ここで説明した内容はExcel2010を指します。それ以前のバージョンの場合、それに沿った選択をして下さい。
入力範囲は、売上高を選択します。(アドインを用いた移動平均の場合、1つの行か列しか選択できないため、便宜上、絵では縦一列にしています)
区間は「12」と選択します。理由は後述します。出力先は、「C2」を選択してください。
それだけ入力すると、あとは[OK]を選択するだけです。すると、D列に移動平均で算出した結果が表示されます。
D13にはC2~C13の平均が、D14にはC3~C14の平均が、D15にはC4~C15の平均が……これが延々と続きます。範囲をずらしながら平均をとっていることがわかります。
年間の値を平均したものを算出して季節要因を排除しているわけです。季節が一巡する年間のスパンで考えると、結果的に稼働・閑古時の変動要素が「平滑」化されるという考えです。
区間で「12」と指定したのは、どのくらいの区間で平均を出すかという意味です。もし、分析対象が日毎の売上で、かつ1週間のスパンで考えれば稼働・閑古時のムラが相殺されるなら、ここには「7」と入れるべきでしょう。
さて、ではその結果ですが、以下の通りになります。
緑線が、移動平均で算出した「平滑化された売上高」の推移です。
こうして見ると、2006年から2009年にかけて急成長していることが解ります。一方で2014年までは緩やかな成長を続け、2015年に大きく売上が減っていることが分かります。
STEP2:平滑化された時系列データから「季節変動」を明らかにする
D列に表示されている値は平滑化された値であり、C列に表示されている値は季節変動を含む実測値です。つまり、C列をD列で割った値が「季節変動値」に当たります。
それを月単位で纏めたヒートマップが以下です。こうして見ると、急成長していた2008年を除くと3月~5月は落ち込みがち、9月~11月は上向きがちだと分かります。
そこで、この値の平均を算出しています。平均の求め方は、大きく上振れしている値を排除するトリム平均を採用します。(トリム平均はフィギュアスケートでも採用されているメジャーな分析手法の1つです。)
トリム平均の結果を足し算すると、「12」をオーバーしてしまいましたので、12か月分の合計が足して12になるように補正しておきます。
1週間(7日間)分の場合は、足して「7」になるようにしましょう。
STEP3:「季節変動」を排除する
STEP1で時系列データを平滑化し、STEP2で季節変動値を明らかにしました。次に、平滑化する前のC列に表示されている季節変動を含む実測値を、季節変動値で割ります。
2007年1月以降の実測値を、STEP2で算出した季節変動値で割ります。その結果である「季節調整済みフィットネスクラブ会費売上高」は以下の通りです。
青線が実測値、灰線が季節変動を排除した「季節調整済み」の値になります。2011年以降の凸凹が、かなり慣らされていることが解るかと思います。
ちなみに元のデータには、
・平成14年1月分、平成18年1月分、平成27年1月分より一部調査対象の追加等を行った
・平成21年1月分、平成22年1月分、平成22年9月分、平成23年1月分、平成24年1月分、平成25年1月分、平成26年1月分、平成27年6月分、平成28年1月分、平成29年1月分より一部数値に変更が生じた
とありますので、この変更と変動がちゃんとマッチしているなぁーと感じております。
というか、連続性が担保できていないので、本来であればここまで厳密に見て良い数字ではないのですが、今回は雰囲気を知ってもらうという意味でこのデータを使いました。
STEP4:平均単価を求めるなら「月ズラシ」も考える
「季節調整済み」売上をベースに平均単価を求めると、季節による影響を除去した平均単価を算出できます。
季節要因による売上単価上昇なのか、事業の成長による平均単価上昇なのか、見極めるのに役立つでしょう。
ただし、単純に契約者(社)数で割ってしまうのは抵抗を覚えます。例えば、以下の図のように導入から3か月目以降は本気出しているけど、その前段の2か月間は本気出せていない事例は多くあります。
このとき、1~2か月目の売上は「誤差」だと割り切ってしまって、t月の季節調整済み売上÷t-1~-2月の契約者(社)数で割ってしまうのも1つの方法です。
つまり、1カ月~2か月前の契約者(社)数で平均単価を求めるのです。
結局のところ、平均単価は実態を表しているようでいないので、律儀に当月で割るよりも、変動幅が小さい方を採択したほうが良いに決まっています。
この方法を取ると、上図のような段階的なサブスクリプションを採択している場合はより当て嵌まりが良くなる場合があります。
ちなみに当て嵌まりとは、Nか月分の平均単価の標準偏差が小さくなっているか?という観点です。
ただし「当て嵌まり」を良くすることが目的の場合に限るかもしれません。
例えば「現状の売上をベースに将来の売上予想を作成せよ!」といったミッションの際に、契約者(社)数も平均単価もXのままだとやりづらくなるので、どちらかを精緻な実数に置き換えたい場合などは有効でしょう。
まとめ
今回、紹介させていただいた内容は、主に「移動平均」「季節変動」「季節変動の排除」がメインでした。
エクセルを用いれば10分で分析は可能です。皆様もぜひお試しください!!