分析

分析
サブスクリプションなビジネスにおける成長と停滞を見極める方法としての移動平均
※この記事は2014年1月に公開された「月で傾向が違っても大丈夫!移動平均法で季節変動か成長か見極める」のリライトです。   サブスクリプションのビジネスモデルを採択した事業の場合、売上を伸ばすためのKPIは契約者(社)数になるはずです。契約シャ数*利用金額=売上になるからですね。 ただし、この利用金額というのが曲者です。料金が2段階で変化する、或いは様々なオプションを付与する料金体系だと、1社(人)あたりの利用金額が微妙に異なります。 そこで売上/契約者シャ数=平均単価を算出して、契約者シャ数*(利用金額≒平均単価)=売上と置き換えている会社が多いかと思います。しかし、この平均単価はダミーとして無理やり作っている数字なのであまり信頼できません。 結果、自然と契約者(社)数と売上に目が行くと思うのですが、季節によってジグザグしていて、事業が伸びているのか、季節要因による変動なのかが分かり辛くなってしまいます。   季節要因を除去して、成長か停滞か見極められないでしょうか。できるんです。そう、移動平均ならね。 そこで今回は「移動平均」を用いて、3STEPで「成長を見極める方法」を披露したいと思います。   STEP0:「移動平均」とは何か? 3STEPを説明する前に、そもそも「移動平均」とは何かを説明します。 簡単に言うと、一定の区間(期間)を定め、範囲をずらしながら平均を算出することで、規則的な変動要素と不規則な変動要素の影響を除き、推移を「平滑」にする手法です。 特に金融や気象などの分野で重宝されています。株をされる方なら「○日移動平均」という言葉にピンと来るのではないでしょうか。 例えば、日単位の時系列なデータがある場合を考えます。 1週間で見てバラつきがありますよね。まずは、この日単位のばらつきを消したい!となると、1週間分の平均値を求めてしまって、以降は1日ずつ範囲をずらしながら平均を求めます。すると1週間の中にある変動要素を取り除くことができます。 7日間移動平均のイメージ例 データはどの単位で移動平均を求めても問題ありません。(ものすごく厳密に言えば問題が出る場合もあるでしょうが…) そもそも時系列なデータには、長期的な傾向変動(トレンド)、中期的な循環変動(サイクル)、中短期的な季節変動(シーズン)、不規則変動(ノイズ)の4つの変動が隠れています。 この4つが全て組み合わさったデータが測定されるので、全てをバラバラに分解するのは難しいものの、ある程度分離することができます。その手法の1つが移動平均です。 移動平均は季節変動と不規則変動を取り除いた傾向と循環という比較的長期な時系列データを作成するのに向いていると言われています。   STEP1:「移動平均」で時系列データを「平滑」化する 具体例として、経済産業省が発表している特定サービス産業動態統計調査を用います。 完全なるサブスクリプションモデルとは言えないのですが、フィットネスクラブの会費=場所と機器を借りて自分の好きな回数分だけトレーニングができると考えて、フィットネスビジネスの会費売上/月毎から「成長度」を見てみましょう。 グラフで見ると2010年~2012年まで右肩上がりに見えますが、2011年以降は横ばいにも見えます。月単位で凸凹しているので、ちょっと分かり辛いですね。   移動平均による分析はExcelにアドインされているツールを使います。 [データ]タブを選択後、データ分析を選択してください。そして、いくつかある中から「移動平均」を選択してください。すると、以下のような選択画面が表示されます。 もし、データ分析がなければ、[ファイル]タブのオプションを選択後、[アドイン]-[管理]の設定を選択して、「分析ツール」のチェックを有効にして下さい。ここで説明した内容はExcel2010を指します。それ以前のバージョンの場合、それに沿った選択をして下さい。 入力範囲は、売上高を選択します。(アドインを用いた移動平均の場合、1つの行か列しか選択できないため、便宜上、絵では縦一列にしています) 区間は「12」と選択します。理由は後述します。出力先は、「C2」を選択してください。 それだけ入力すると、あとは[OK]を選択するだけです。すると、D列に移動平均で算出した結果が表示されます。 D13にはC2~C13の平均が、D14にはC3~C14の平均が、D15にはC4~C15の平均が……これが延々と続きます。範囲をずらしながら平均をとっていることがわかります。 年間の値を平均したものを算出して季節要因を排除しているわけです。季節が一巡する年間のスパンで考えると、結果的に稼働・閑古時の変動要素が「平滑」化されるという考えです。 区間で「12」と指定したのは、どのくらいの区間で平均を出すかという意味です。もし、分析対象が日毎の売上で、かつ1週間のスパンで考えれば稼働・閑古時のムラが相殺されるなら、ここには「7」と入れるべきでしょう。   さて、ではその結果ですが、以下の通りになります。 緑線が、移動平均で算出した「平滑化された売上高」の推移です。 こうして見ると、2006年から2009年にかけて急成長していることが解ります。一方で2014年までは緩やかな成長を続け、2015年に大きく売上が減っていることが分かります。...
2017.05.25
分析
今年はキタサンブラック!有馬記念2016の1位を予想する!
マーケティングメトリックス研究所をご覧の皆様、1年ぶりの登場です。 電通ダイレクトフォース・戦略コンサルティング部の小松と申します。   昨年記事(重回帰分析を使って有馬記念の1位馬を予想する!)にて有馬記念の予想をしたところ、日頃の行いが良いせいか見事的中。本年もオファーを受けた次第でございます。 正直、ギャンブルの鉄則である勝ち逃げをしてやろうかとも思っていましたが…笑。   重回帰分析で馬券は当たるのか? 正直、重回帰分析で馬券を当てるのはなかなか難しいかと思います。 ますは、昨年の分析を振り返ってみたいと思います。 昨年の有馬記念:予想と結果 1、2着は的中しましたが他はどうだったでしょうか? 黄色く塗りつぶしている馬は、予想と着順が大きく外れた馬です。 16分の10の的中率。これは低いと見るか、高いと見るか…。   3着に来たキタサンブラック、4着に来たマリアライトの予想は大きく外しています。 3歳でデータの少なかったキタサンブラック、上り馬(急に強くなった馬)で数字が悪く出たマリアライト、といった感じですか。 1番人気ゴールドシップ、2番人気ラブリーデイ、3番人気リアファルあたりを切れたのは良かったです。   まずは今年も同じようにやってみる 今年も同様に重回帰分析しました。 例によって、各馬の実績表から必要項目を抜出します。 そして、決まった手順に基づいて重回帰分析を行います。 これを出走全16頭分実施します。出てきた係数をまとめたものがこれ。 この数値に、斤量・距離・前半600mのタイム、ラスト600mのタイムの4つを掛け合わせれば、各馬の予想タイムが出てきます。 今年は去年と違い、マルターズアポジーという逃げ馬がおりますので、前半600mとラスト600mはその馬が逃げたときの平均タイムを使ってみます。 前半が35秒5、ラストが35秒2と出ました。 これを、先ほどの係数に掛け合わせます。どん! 今年の予想…? なな、なんと、大穴ヤマカツエースが、従来のレコードタイム2分29秒5を大きく上回るタイムで走る、と出てしまいました。 なんとな~く、こんなことになるのではないかと思っていたことが現実になってしまいました。 どういうことか?説明します。   重回帰分析の問題点 この算出法は、簡単に言ってしまえば過去の実績から斤量・距離・前半/後半のタイムの係数を割り出すというもの。 この方法の穴は、短距離レースを多く走っている馬に良い数字が出やすいということ。 例えると、ウサイン・ボルトの100m走のタイムからフルマラソン42.195kmのタイムを割り出そうとしているようなもの。   試しに、稀代の短距離王・サクラバクシンオーのタイムで同じことをやってみると「2分26秒8」という結果になりました。 従来のレコードタイムよりも3秒近く早いタイムが出てしまいます。  ...
2016.12.20
分析
重回帰分析を使って有馬記念の1位馬を予想する!
マーケティングメトリックス研究所をご覧の皆様、はじめまして。 電通ダイレクトフォース・戦略コンサルティング部の小松と申します。   前回記事(ピザvsチキン!12月パーティ需要はどちらが高いか指数で明らかにする)を寄稿した小川より紹介を受け、マメ研に参加することとなりました。 よろしくお願い致します。   主な業務はダイレクトマーケティングの戦略プランナー、といったところですが、今回はもう一つの顔である「日本一競馬が好きな広告マン」として記事を書きたいと思います。   統計学で馬券は当たるのか? 昨今は統計学という学問がバズワードのように広がり、この業界でも学習する人が増えてきました。私も、広告やサイトの分析を行っているうちに自然と興味を持ち、勉強し始めました。 その成果をお見せしたいものの、こちらに寄稿されている方たちからみたらまだまだ若輩者。ということで、広告よりも得意な競馬をネタにして、何とか恰好を付けたいと思います。   折しも季節は冬。競馬ファンでない方でも馬券を買うことが多い有馬記念の時期ですね。 今年の有馬記念の結末を、統計学で占ってみましょう。 アプローチの仕方は、 レースの走破タイムを予測する そのタイムで走破できそうな馬を炙り出す と、しました。果たして、満足のいく結果は出るでしょうか?   今年の有馬記念の走破タイムを算出してみよう まずは有馬記念の走破タイムの予測からです。 有馬記念は、中山競馬場の内回り2,500mというコースで行われます。 その年のグランプリを決めるレースをこんなトリッキーなコースでやるなんてウンヌンカンヌン…と言い出すと、毎週連載をいただいたとしても来年の有馬記念までかかりそうなので割愛します。 算出は、エクセルで「重回帰分析」を行います。過去に同じコースで行われた337レースをサンプルとします。 元データ。実績のリストです。   目的変数を「タイム(秒)」、説明変数を「馬場」「頭数」「前半3ハロン(600m)のタイム」「上がり3ハロンのタイム」の4つとしました。 馬場については、良・稍重・重・不良の4つそれぞれの平均タイムを出し、その差異を指数としています。   こういった表から、特定条件にあてはまる項目の平均値を出したい場合はAverageifという関数が便利です。他にも合計値を出すsumif、個数を出すcountif等の関数もありますので、覚えておくと作業が捗ります。 イメージ例。   また、中山2,500mはラップタイムの公式計測を「前半500m」としています。ですので、前半3ハロンのタイムは「前半500mのタイム×1.2」で算出しました。 当然、騎手の腕やレース途中の展開・アクシデントによりタイムが左右されることは重々承知ですが、数値化できないものは一旦除外します。 このデータを使って重回帰分析をしてみましょう。 分析までの流れ。   結果は以下の通りです。 まずは決定係数を確認。  ...
2015.12.21
分析
本当に痩せてるの?重回帰分析でダイエットの成功を予測する
今回は、Excelで簡単に重回帰分析を行う方法を紹介します。   元々がぽっちゃり体型の松本は、夏からダイエットを始めていました。ぽっちゃりの領域を超えて、もはやデブだからです。 1日3食のうち1食を怪しげなダイエット食品に置き換え、ジムでジョギングをして、たまに誘惑に負けてラーメンに逃げる。こうして松本は、およそ1ヶ月で約6キロ減のダイエットに成功しました。 このまま行けば、松本は何日後に体重を60キロ台に落とすことができるでしょうか。運動の回数をどれくらい増やし、ラーメンの誘惑に何度勝てば、もっと早く痩せられるか、予測してみたいものです。 そんなことが簡単にできるのでしょうか。できるんです。そう、回帰分析ならね。   「回帰分析」とは何か? 簡単に言うと、回帰分析とは「xがyに影響を与えたか?を分析する」ことです。 例えば、xを「気温」、yを「ソフトクリームの売上」だとすると、「気温がソフトクリームの売上にどれくらい影響を与えたか?(気温1度上がる毎に売上はどれくらい上がるのか?)」を知る方法が回帰分析になります。 以前、相関関係について紹介しましたが、回帰分析は相関の考え方を取り入れています。相関が強いもの同士だと影響は強く現れるし、相関が無いもの同士だと影響は殆ど現れません。 回帰分析と聞くと、単回帰分析とか重回帰分析とか色々聞きますが、xが1つなら単回帰、xが2つ以上なら重回帰と呼ぶだけです。   単回帰分析と重回帰分析の考え方の違い yを目的変数、xを説明変数と言います。 yにxが矢印を指しているので、yという目的に対してxがどれほど説明できるか(影響しているか)という絵が頭に浮かべば、回帰分析の大枠は理解できたと言っても過言ではありません。 単回帰分析は直接効果、重回帰分析は間接効果まで含めた分析と表現すれば、イメージしやすいでしょうか。   回帰分析を実施するとき、注意すべき2つの点があります。   1つは、xとyの因果関係を理解してから分析を始める点です。 回帰分析は数列を計算式に基づいて分析するだけで、文脈を判断するわけではありません。したがって、先ほどの「気温」と「ソフトクリームの売上」の例で言うと、「ソフトクリームの売上が気温に影響を与えたか?」を分析することもできます。 論理的に考えればあり得ない話ですが、それを判断するのは数式ではありません。人間です。 したがって、何が目的変数なのか、そして目的変数に影響を与えていると考えられる説明変数は何かを事前に整理してから、分析を始めましょう。   もう1つは多重共線性(いわゆるマルチコ)なのですが、これは分析を終えてから説明したいと思います。   回帰分析で見るべきは係数、P値、重決定R2(補正R2) 松本のダイエットの成果を確認してみましょう。 体重、体脂肪率、ラーメンを食べに行った日(0/1で表現)、ジムでジョギングをしたkmそれぞれの結果は以下の通りとなりました。   体重、体脂肪の推移 上の表をグラフ化 約86キロから始まり、一気に痩せた後は油断しまくって、悪戦苦闘してようやく80キロを切りました。 数字の正当性を担保するために、毎日7時台に計測をするという心構えだけは確保していたのですが、それだけでした。 なんとなく「ラーメン」が悪さをしていることがわかるのですが、それを明確にするために、体重の折れ線グラフを、(前日の体重)マイナス(今日の体重)で表現し直します。その結果は次の通りです。   前日との体重差分。前日にラーメンを食べると必ず太る。(当たり前) ラーメンを食べた次の日の体重は、間違いなく激増していることがわかりました。また、ジムでジョギングをした次の日の体重は、わずかながらも減っていることがわかりました。  ...
2015.12.15
分析
発生確率が低くても大丈夫!ポアソン分布でマーケティングを博打にしない
最近の趣味は、漫画喫茶で何時間もマンガを読み耽ることです。ちょっとした自慢は、二晩で島耕作の課長から会長までの人生を一気通貫で読んだことです。 小さい頃からマガジン派だったので、最初は「神様の言うとおり」「サイコメトラー」「進撃の巨人」「アルスラーン戦記」「金田一少年の事件簿」を読んでいました。 最近はジャンプ系に手を伸ばし始めています。「友情」「努力」「勝利」。基本コンセプトがしっかりしているので読んでいて飽きません。 「暗殺教室」のような突拍子もない設定であっても、コンセプトが明確ならば応用は可能という証明がされたことは記憶に新しいですね。 圧倒的に不利な状況で、全員がもうダメだと諦めていても、主人公だけは「まだまだ解らない、チャンスはある」と前を向きます。 その姿に私は感化され、時に涙を流すこともあります。マンガは常に勇気と希望を与えてくれます。 ただし、それに感化され過ぎて、絶望的に不利な状況で、四方八方手を尽くして何もやりようが無いとき、いきなり「まだまだ解らない、とにかく頑張ろうぜ」と根性論をぶつ人は、ちょっと苦手です。 大学生の頃、文化祭にポップコーンを出店したのですが、残暑厳しい夏空の下で水分を必要とする食べ物を誰が好き好んで買うのか、というマーケティング思想が抜け落ちていたため、目眩を起こすような在庫を抱えてしまいました。 どうやって売るか。水分とセットで販売する?でも今更水を買えばさらに赤字膨らむぞ。2個セットなら安くする?値段は問題じゃないだろ。メンバー間で険悪な空気が流れたとき、飛び出したのが前述した根性論だったのです。 結局、顧客層を10代後半女子と40代オバサマに「集中」して、「ポップコーンを食べること」に対価が発生するのではなく、「ジャニーズ系とEXILEのようなイカツイ系の二枚看板が食べ物を食べさせてくれる経験」に対価を発生させることで 300円を安いと思わせることにして、何とか赤字だけは防ぎました。 悔やまれるのは、出足の伸びが悪いと解っていながら、「まだまだ解らないよ」という声に賛同してしまったことです。 始まってあまり時間は経っていない。まだ入場者も多くない。そんな「甘い囁き」に私は負けてしまいました。 でも、もし早い決断が下せていたら。ホストやん!という男子からのバッシングも浴びず、翌年出店禁止というペナルティが課されることも無かったはずです。 では、そんなことが簡単にできるのでしょうか。できるんです。そう、ポアソン分布ならね。 「ポアソン分布」とは何か? 簡単に言うと、ポアソン分布とは「ある期間に平均してλ回起こる現象が、ある期間にちょうどκ回起きる確率の分布」です。数学者であるシメオン・ドニ・ポアソンが1838年に確率論と共に発表したのが始まりです。   最初にポアソン分布が実用されたのは、統計学者であるボルトキーヴィッチによってでした。 彼はプロイセン陸軍の騎兵連隊のべ200部隊で、1875年から1894年の間に「馬に蹴られた死亡した兵士の数」を調べました。 彼はこの事象の平均値がλ=0.61(人)であることを確認すると、発生する確率がポアソン分布に近似していることを発見し、さらにこの先にどれぐらいの確率で馬に蹴られて兵士が死亡するか予測してみせたのでした。   全く偶然に起きている(ように見える)目の前の事象が、実は数学的に「発生する確率」を表現できるとしたら、とても凄いことだと思いませんか? ポップコーン販売の事例に当て嵌めてみましょう。 ポップコーンは最初の10分で3個しか売れませんでした。ですが、本来は1時間で60個売れる算段を立てて在庫を調達していたのです。つまり、10分で10個です。 このペースが今後も続きそうだと仮定した場合、次の10分で10個売れる確率はどれくらいあるでしょう? 本来であれば小難しい計算式を用いるべきでしょうが、エクセルのPOISSON関数で直ぐに出せます。第1引数にはkを、第2引数にはλを挿入します。第3引数は累積で算出するか否かを意味しますので、今回は0を挿入します。 今回の場合、第1引数には「0,1,2,3…nの整数」(想定販売個数)、第2引数には「3」(平均販売個数)、第3引数には「0」を代入します。 その結果は、以下の通りです。図の右端に、出力結果はエクセルでどのように表現するかを付け足しています。   ポップコーンが売れる個数が0個の確率は約5%、1個の確率は約15%、2個の確率は約22%…なんと、10個も売れる確率は約0.1%です。つまりポップコーンを販売している1000個のパラレルワールドがあったとして、そのうち1つの世界でしか成功しないのです。 この結果をもとに、メンバーに共有していたら「何とかなる」という甘い声も遮って、直ぐに方針転換を図れたでしょう。 ポアソン分布の前提 ポアソン分布が現れる例は「ある交差点で1時間に起こる事故の件数」「1ページの文章を入力する時に打ち間違いを起こす回数」「馬に蹴られて死亡する回数」など、発生する確率が低く、かつそれが偶然に発生する事象が対象になります。 このことから、「少数の法則」とも呼ばれます。 またポアソン分布は、過去の結果を元に、それが未来で起こる確率を求める計算式ですから、定常性(事象の起こる確率)と独立性(未来で起こる確率は、それ以前に起きた事象の回数や起こり方に無関係)が担保される必要があります。 過去の影響を受けない未来など考えられませんが、事象そのものが起こる確率は常にランダムでありながらある期間において一定であるほど、ポアソン分布は有効だと考えられています。 ポップコーンの例で言うと、販売の努力の成果からポップコーンを購入する気持ちが変わってしまうと、定常性や独立性が担保されているとは言えません。 したがってWEBマーケティングに活用するとしても、アトリビューションが大人気の昨今としては、なかなか独立性が担保し辛いところです。 しかし、ダイレクトレスポンス系のマーケティングにおける「予測」としては十分に通用するのではないでしょうか?或いはマーケティングを始めた初日、翌日のCV数を予測するのに活用できるのではないでしょうか?...
2014.04.23
分析
データ量が膨大でも大丈夫!基本統計量で「全体」を10秒で把握する
まずは、あるECサイトがリスティング広告を出稿した結果を見比べて下さい。 掛かったコストも、クリックも、獲得したCV件数も全く一緒で、NS0-504 計上された売上のみ異なります。どちらのキャンペーンが結果は良かったかと問われると、間違いなく「Y」になります。 では、どちらに「改善の施し様」があるでしょう。 「G」でしょうか? いいえ、残念ながら、これだけでは解りません。キャンペーンは、NS0-502 無数にあるキーワードと広告で構成されています。この数字は、全てを合算したに過ぎません。 キーワードと広告単位で、CV件数を獲得していないもの、CPAが高いもの、CPCが高いもの等に分類する必要があるでしょう。 しかし、その洗い出しにどれくらいの時間を要するでしょうか。Excel形式で出力した後、全体の数字を見て、何がボトルネックか把握して、何度もエクセルをソートして……。 ずんの飯尾和樹のように現実逃避して、平日の昼間からゴロゴロしながら「あ~あ、中身を全く精査しなくても何となく全体が把握できて、どちらから手を付ければ良いか解らないかなぁ」と呟きたくもなります。 では、そんなことが簡単にできるのでしょうか。できるんです。そう、基本統計量ならね。 「基本統計量」とは何か? 簡単に言うと、基本統計量とは「集団(データ)全体を調べて、特徴・傾向を把握する手法」です。全体を俯瞰し、大まかな形を掴むために最適な解析手法なのです。 基本統計量は、代表値と散布度の2つで構成されます。代表値は「集団の真ん中」を、散布度は「集団の差異(バラつき)」を、たった1つの数値で表現します。 リスティングのおおよそがロングテールだと言われていますが、基本統計量を使えば、獲得した結果の中心が解るだけでなく、どれくらい長い「テール」が続くのかが読めるようになります。 詳細な説明をするより、実際に「基本統計量」を触ってみましょう! 以下の図は、媒体「G」「Y」の広告毎のクリック数になります(同じ広告が、違う媒体に掲載されていたとします)。本当は十数万あることも珍しくないのでしょうが、解り易くするためにそれぞれ10件に絞っています。この数字をもとに進めて行くことにします。 基本統計量はExcelにアドインされているツールで、結果を出すことができます。 [データ]タブを選択後、データ分析を選択してください。そして、いくつかある中から「基本統計量」を選択してください。すると、以下のような選択画面が表示されます。 もし、データ分析がなければ、[ファイル]タブのオプションを選択後、[アドイン]-[管理]の設定を選択して、「分析ツール」のチェックを有効にして下さい。 ここで説明した内容はExcel2010を指します。それ以前のバージョンの場合、それに沿った選択をして下さい。 入力範囲は、「対象としたい集団(データ)」を選択します。そして、下側の「統計情報」のみチェックボックスにチェックを入れて下さい。 それだけ入力すると、あとは[OK]を選択するだけです。すると、新規ワークシートに結果が表示されます。ちなみに、媒体Gの基本統計量は以下の通りになりました。 平均や合計などの聞いたことがある単語が並ぶ一方で、分散や標準誤差、尖度、歪度などの聞き馴染みのない単語も並んでいます。 この全てについて把握しておく必要はありません。「平均」「中央値」「標準偏差」「尖度」「歪度」だけで十分です。 代表値から見る「真ん中」はどのあたり?~平均と中央値~ 「平均」から説明します。 平均は、皆さんが日常で最も使われている「解析手法」だと思います。「データを足し合わせ、データ数で割った値」を指します。 媒体「G」も媒体「Y」もクリック数の平均は「6」です。ExcelのAVERAGE関数を用いれば答えが表示されます。 次に、「中央値」です。 中央値は、「データを数値の大きい(小さい)順番に並べたとき、ちょうど真ん中に位置する値」を指します。ちなみに、データ数が偶数の場合は、中央の2つのデータの平均をとります。 媒体「G」のクリック数の中央値は「4.5」、媒体「Y」は「5.5」です。ExcelのMEDIAN関数を用いれば答えが表示されます。 ところで、平均も中央値も「真ん中を見つける解析手法」ながら、何故かかい離していることが解ります。 その理由は簡単で、データの中に異常に大きい(小さい)データがあるとき、「平均」はそのデータの影響を受けて、大きく(小さく)なってしまうからです。 つまり、平均とは「やじろべえ」の支点のようなものなのです。力点が大きくなるほど、支点はそちらへ寄らなければ、全体のバランスを取ることはできません。一方で中央値とは、支点も力点も無く、ただ単純にデータを並べて、真ん中を指しているのみです。 実際、媒体「G」は平均が「6」ながら、中央値は「4.5」に下がりました。これは広告Hが21クリックと異常に大きいデータだからだと言えます。 代表値から見える「差異」 「標準偏差」から説明します。 標準偏差は、「平均値からの離れ方を平均化した値」を指します。 媒体「G」のクリック数の標準偏差は「5.20」、媒体「Y」は「2.10」です。ExcelのSTDEVP関数を用いれば答えが表示されます。 この「標準偏差」は、あらゆる解析手法の公式に適用され非常に重要なため、もう少し詳しく解説します。 そもそも、個々のデータから平均を引いた値を「偏差」と言います。例えば、上記10件のクリック数の偏差は以下の通りです。 この数値を使えば数値の差異(バラつき)を上手く表現できそうですよね。しかし、単純に足し合わせるだけでは何がどう逆立ちしても「0」になってしまうので意味を成しません。つまり、プラス・マイナスの打ち消しが起きないような工夫が必要なのです。...
2014.03.04
分析
広告効果測定の全数データ「エビスINDEX」を語る!(1)
[豊澤] 忙しいのに呼び出して悪かったね。今日はどうしても見て欲しいことがあったので、アドテク女子こと加嶋さんに来て貰いました。 [加嶋] 凄く面白いデータが見れらるとお伺いしたのですが、一体何が見られるんですか? [豊澤] 以前、アドエビス業種別統計シリーズと題して、アカウントを特定しない、また個人を特定しない統計情報として不動産とECのデータを公表していたと思うんだ。今回、独立行政法人産業技術総合研究所との共同研究により、さらに業態を増やして「エビスINDEX」という名前で公表することができるようになったんだ!まずは、さっそくこのグラフを観て欲しい。 [加嶋] これは…もしかして、エビスの全アカウント分のクリック数ですか? [豊澤] その通り。2012年6月1日から2013年5月31日まで、過去1年間分のクリック数を折れ線グラフで表現してみたんだ。このグラフを見れば、WEB広告の盛り上がり具合が一目で解ると思う。 [加嶋] やっぱり、年末年始はクリック数が下がるんですね。 あ、それにお盆の時期も。他には・・・休日はクリック数が下がって、平日はクリック数が上がっているように見えます。パソコンやスマホの接触時間と連動性があるかもしれません。 こうやって数字を前に、要因を考えるのって面白いですね! [豊澤] 週次の動きと季節性の動き、2つの動きがあるようだね。季節性の動きで言えば、例えばクリスマスの時期だと24日頃にピークが来るのでなく、むしろその頃には落ち込んでいる。 20日頃にピークが来ているのが解るよね。つまり、人間が意識して行動し始めるのが10日~5日前だというのが解る。業種には拠るにしろ、この期間がクリスマス商戦のかきいれ時という1つの仮説が生まれるよね。 [加嶋] 年末年始のクリック数が少ないのは理解できるんですけど、平日より休日の方がクリック数は少ないというのは意外でした。想像していたものと違いますね。 [豊澤] もちろん業種毎に細かく見れば、平日より休日のクリック数が多い場合もあると思う。 けど、それらを合算して俯瞰して見てみれば、平日のほうがクリック数は多いというのが1つの真実なんだ。 [加嶋] ところで、ここからいったい何が解るのでしょう? 確かに興味深いですけど、面白いデータかと言われると、ちょっと……。 [豊澤] 良い質問だね!(笑)こうしたグラフを、単純にクリック数の合計として見るのではなく、統計的な観点で見ることがとても大切なことだと思うんだ。 少し個人的な話になるんだけれど、僕は前職ではファンドマネージャーという仕事をしていたんだ。簡単に言うと、お客様から預けて頂いたお金を運用して利益を上げていく職業だね。 資産運用の世界では、一般的な見方とはちょっと違った大事な視点があるんだ。 個人で投資しているとお金が増えて得したか、減って損したかが、ほぼ全てだよね?もちろん得したい訳なんだけど(笑)、これは「絶対リターン」と呼ばれる視点なんだ。 もう一方で、「相対リターン」という視点がある。例えばあるファンドを買ったとして、パフォーマンスが5%だったとしよう。でも市場全体は+10%だったとしたら? [加嶋] うーん……実質は、マイナスということですか? [豊澤] 正解だよ。確かに絶対リターンでみて+5%は儲かっているけど、市場全体が+10%の伸びなら相対リターンは▲5%、その運用は上手じゃないってことになる。そのファンドを買う代わりに市場全体の動きに連動するファンド(所謂、パッシブファンド)を買った方がよかったとなる。 つまり運用の結果を市場全体の動きと比較して、それを上回る利益を出すことを相対リターンの追求と呼ぶんだ。絶対リターン、相対リターンの視点はどちらもとても大事で、目的によって使い分ける必要があると言える。 お客様から預けて頂いたお金を元手に、約束した範囲内で最大限のパフォーマンスを発揮し続けるというフレームは、ネット広告の運用と同じだと僕は感じている。 その意味で、殆どのマーケッターが相対リターンの視点を持たず、絶対リターンの視点だけで広告を評価していることに、凄く違和感があったんだ。 [加嶋] 確かに、他社さんってどうなんですか?と聞かれます。今まで自アカウント内での比較しかできなかったけれど、このデータが公表されることで、ベンチマークというもう1つの見方が生まれるということですよね? [豊澤] その通りだよ! [加嶋] じゃあ、今回発表された数字より結果が低ければ、運用が上手くいっていないということなんですね。 [豊澤] それは短絡的過ぎる見方だし、そういう見方を研究所としては望んでいないな。 エビスINDEXはあくまで「総合的に把握できる指標」なんだ。 例えば、日経平均株価のパフォーマンスを下回っている企業は全て悪い企業だと断定できないだろう?広告運用の形態によっては、週次、月次で見た方が良い場合もあると思う。 週毎の騰落率で見た方が良い場合もあるよね。 じゃあ、さっそく業種毎のデータを見ていこう。今回は、CVRを用意したよ。 CVRはクリック数とCV件数で成り立つ計算式だけど、クリック数はインプレッション数という母数に左右される部分がある。だから、CVRだけを見るのではなくクリック数なども見て、総合的に判断した結果、10業種の統計データを提供できることになった。 その全てをここで発表することはできないので、それは資料請求をして頂ければ提供するとして、今回はデータの見方も含めて、幾つかの業種をピックアップしよう。 業種に応じて効いている施策は違う [豊澤] 今回発表するCVRは、メディアタイプ経由のCV、その何れもが直接コンバージョンになっている。 メディアタイプはリスティング、DSP・アドネットワーク、アフィリエイト、メルマガ、純広告の5種類だ。アドエビスは「全てのネット広告の効果を測定」できることが強みだから、メルマガまで含めて分析できるのは面白いよね。 CVについては、資料請求、お試し購入、問い合わせなど色んな種類があると思うけど、いったん全てを合算した値になっている。今後はCV別のタイプ別にも発表する予定だよ。 さて、さっそく見て欲しいのは「情報サービス」業(n=169)だ。...
2013.07.23
分析
ダイレクト・マーケティングにおけるバナーimpの影響と広告効果
バナーのimpが生む消費者への影響について、具体事例を特別寄稿いただきました。【株式会社アドウェイズ マーケティングDiv.菊地様より】 一般的に分析・見解の複雑さ、その膨大なデータ量から、公開可能な事例は少ないので、とても参考となる結果となっています。 ※実際は数ページに及ぶ分析結果となっていますが、今回はわかりやすい一部分をピックアップして公開させていただきます。 マーケティングメトリックス研究所では、共同研究や寄稿記事を募集中です。 ご興味おありの方は、是非お問い合わせください。 はじめに アトリビューションというキャッチーな言葉と共に、第三者配信アドサーバが隆盛を迎えつつあり、海外事例を中心に、様々なデータが巷に溢れています。しかしながら、バナーimpの影響力がフリークエンシーや接触するユーザー層毎にどのように変化するかという視点で記述されたデータは少ないです。そのため、ここでは接触広告によりユーザー層をセグメントし、フリークエンシーマネジメントを絡めた形でバナー配信の影響力について検証しました。 題材として、PCブラウザでの女性向けECを用いた、ダイレクトマーケティングを代表する大きな市場における各広告とバナーimp特性の関係を明確化し、最も効果的な配信方法を探ります。 検証方法と目的 バナー配信を検証するに当たり、特にユーザー単位で見ているDSP(Demand Side Platform)などを複数配信している場合は配信の重複が起きることが前提となり、特にリターゲティング配信が含まれている場合は重複のオンパレードになります。それを全て補足できない限り、フリークエンシーマネジメントは成立しません。そのため、第三者配信アドサーバを用いて全ての広告を補足する方法で実験しました。あるユーザーの広告接触とimpをフューチャーし、その相関性を検証します。 各種条件 対象ジャンル ECサイト 対象広告 各種ディスプレイ広告、各種リスティング広告、各種アフィリエイト広告、各種純広告 対象デバイス PC 実験期間 約1カ月 対象クリック 約80,000 対象CV 約4,500 対象バナーimp 約1,700万(ノンリターゲ:約1,000万 / リターゲ:約700万) ※ノンリターゲはオーディエンスターゲティング、キーワードマッチなど (検証01)バナーimpとユーザー流入の相関性について あるユーザーに対してバナーにより初期接触した影響を検証するため、全体のCVに占めるimpのみのCVの割合と、推定されるユーザー動向を下図にまとめます。   バナーimpのみでCVしたユーザー動向推定図 広告によるトラッキング漏れ、もしくは、今回の実験以前からマーク付されていたユーザー等は割合が小さいため無視する前提とした場合、上図のようなユーザー動向が推察できます。ノンリターゲバナーからクリックなしでリターゲバナー配信へ切り替わる場合は自然流入によりマークがついていると想定されることから、バナーのimpで一定割合の自然流入を促すことが可能という仮説が成立します。 また、これらのCVを含む、バナーimpのみでCVへ至ったユーザーはnon-retargeバナーが初期接触でCVした全体の54.9%を占めました。つまり、オーディエンスターゲティング、キーワードマッチ配信等、ある程度オーディエンスが絞れたターゲティング配信をしている場合、接触したユーザーのimpで自然流入を促すことが結論を導けます。 これらのことは、各ディスプレイサービスにてPCC(Post click conversion)のみを着目していると、実際には促したCVの45%しか反映できていないかもしれないという仮説を導き、少なくとも何らかのターゲティング配信に関してはPVC(Post...
2013.03.14
分析
検索クエリのトレンドを、リスティング広告に活用する方法
リスティング広告では、何千もの膨大なキーワードが登録されているアカウントはよくありますが、実際にキーワードを作るとなると、大変な作業となります。キーワード生成ツールを利用する、もしくは思いつくがままに作成する手法がありますが、その他にも、「効果のあるキーワード」を検索クエリから導き出す手法があります。 基本的な話となりますが、検索クエリとは、検索エンジンでユーザーが入力した単語、もしくは複数語となります。検索ボックスに文字列を入力して検索をした結果となるため、例えば「キャットフード」を部分一致で出稿している場合、「猫ごはん」という同じ意味をもつ別キーワードが検索クエリとして検出されることもありますし、他のワードと組み合わせられた複数語、「キャットフード ダイエット」が検出されることもあります。 リスティング広告の媒体管理画面から、このような検索クエリを一覧で抽出することができますので、部分一致で登録されている広告の検索クエリから、下記のような改善を行うことが可能となります。 ・完全一致として登録すると、より効率が良いであろうワードを見つける ・サイトとの関連ないワードを除外ワードとして登録する 例えば、「キャットフード」の部分一致の検索クエリから、「キャットフード 成分」など他のワードと組み合わせて検索された、成果の出ていないワードや、組み合わせて検索された際に成果がでているワード「天然 キャットフード」を見つけることができます。 検索クエリ クリック CV 改善案 キャットフード 15 1 キャットフード 成分 38 0 クリックが多いがCVがないため、除外ワードとして登録 天然 キャットフード 16 2 成果が上がっているワードを完全一致で登録 上記例であげさせていただいた改善案を実施することにより、リスティング広告の効率を上げていくことができます。 ただし、リスティング広告の運用では、キーワードの登録だけではなく、広告文の作成や、ランディングページの最適化、また予算の調整など多くの作業をこなさなければなりません。したがって、キーワード最適化にフォーカスして定期的に時間を取ることは難しく、検索クエリの最適化についてはキーワードを作成(Plan)し、それを出稿(Do)するまでにとどまっているケースが多くなっております。 時間にさえ余裕があれば、リスティング広告の検索クエリだけではなく、自然検索での流入があった検索クエリについてさらに踏み込んで分析し、より広い範囲で最適化を進めることができます。 リスティング広告とSEO流入の結果を比較する 例えば、「アドエビスPetShop」というペット用品サイトの広告とSEO流入のデータを、検索クエリ別に同一テーブルで表示すると、下記のような結果となります。 検索エンジン 検索ワード 広告 SEO 傾向 クリック CV 流入 回数 CV Google AD EBiSの猫缶 30...
2012.12.03
分析
アドエビス業種別統計シリーズ第一弾 -不動産編-
WEBマーケティングって、様々な数値を計測できるのに、意外と閉鎖的だとは思いませんか? 「結局ウチのCVRって良いの?悪いの?」なんて、わからなくなってしまうことも多々ありますよね。 そこで、累計5000アカウントを超える導入実績をもつ「広告効果測定システム アドエビス」の統計データをまとめ、悩めるマーケターの皆様に少しでも参考にして頂けるようなデータをお届けしようと企画しました。 今後、数回に分けて、業種別の統計データをお送りしたいと思います。 但し、ご存じのとおり、マーケティングは様々な要素が絡み合って成り立つものであり、当然、本分析のデータをそのまま比較することができるわけではありません。 また、どのメディアが良い悪いと評価するものでもありません。あくまでも参考値レベルでしかなく、この記事をきっかけに「データって面白そう!」「自分達でも数字を触ってみよう!」と少しでも思って頂けることを目的としております。 計測仕様 2012年8月のペイドメディアを対象としたデータを、メディアタイプ別に分析。 以下の5種類に分類。 ※本データはあくまでも統計データであり、各メディアのデータを保障・評価・位置づけるものではありません。 ※本データの流入クリックスルーCVを対象としております。 ※本データのCVは直接コンバージョンとなります。 各社どんなメディアを出しているのか? やはりリスティング広告は全てのクライアントで実施されていました。 個人的な感覚値としても、リターゲティングの勢いは各社とても加速していますね。 ポータルサイトが約4割というのも、不動産業界ならではのことかもしれません。   流入貢献度の比率はどうなっているか? 利用しているメディアタイプ別に、サイトへ流入してきている貢献度をまとめました。やはり役割の違いが数字に出てきており、検索連動とターゲティングがそれぞれ4割ほどを占め、そのあとにノンターゲ・リターゲティングと続いています。 ここで言えることは多ければ良いというわけではなく、メディア毎の役割を理解し、適切なプランニングをおこなうことが重要と言うことです。 例えば、リターゲティングの比率が異常に高かったりする場合は、リスト再設計やフリークエンシーキャップの見直しによって費用対効果を高められる可能性があります。   コンバージョンの貢献度はどうなっているか? 流入貢献度の次はコンバージョンの貢献度になります。 メディアタイプ毎に貢献比率を出したところ、流入の貢献度と少し差が出てきました。 リターゲティングの流入貢献度が約6%に対し、コンバージョンの貢献度は約12%まで増えています。 これはクリックベースの直接効果(CVの直前にクリックされた広告)のため、一概に「リターゲティングは効果が良い」とは言えませんが、メディア毎の役割として、皆さんのメディアプランの参考として頂ける結果かと思います。   まとめ 広告手法 出稿確率 順位 流入貢献比率 順位 CV貢献比率 順位 検索連動型広告 100% 1...
2012.09.28