今さら人に聞けない「相関関係」と「因果関係」の違い

【文責】 松本 健太郎
アドエビス開発ユニット所属 マーケティングメトリックス研究所 主任研究員

パーマをあてました。

どうやら中部地方から東では「パーマをかける」と言うようですが、関西発の研究所ですので「パーマをあてる」と表現させて下さい・・・方言の話はどうでもいいです。私がパーマをあてた話です。

理由は単純明快、モテたかったからです。

世の中のイケメンどもを見渡して下さい。まず間違いなくパーマです。

私の中での「イケメン・ゴレンジャイ」は水嶋ヒロ、渡部豪太、綾野剛、ダルビッシュ有、岡田将生なのですが、みんなパーマもしくは天パです。

29歳、独身貴族、これといった特徴も無し。これはパーマでもあてるしかない!と思い立ち、さっそく美容院に行きました。

それが、どうですか。何も変わらない。あげく副社長の福田には「遠くから見るとスキマスイッチの大橋卓彌に見えたけど、間近で見たら何これ、ヤバいな」と言われる始末。

おかしい。何かが違う。私は親友に相談しました。パーマをあてたのにモテない、と。親友は言いました。

「イケメンはだいたいパーマかもしれんけど、パーマあてた人全てがイケメンではない。昔の笑福亭鶴瓶、パンチ佐藤もパーマや。お前、因果関係と相関関係を取り間違えてるぞ」

その時、私の目が点になりました。

因果関係とは?相関関係とは?

人に言えない話ですが、私は因果関係と相関関係の意味を詳しく理解できていません。そこで、私が陥った誤謬は誰もが陥るのか、そもそもこの2つの違いは何なのかについて調べてみました。

因果とは、もともとは「原因と結果」を意味するサンスクリット語の漢訳です。総じて、因果関係とは2つ以上のものの間に原因と結果の関係があると言い切れる関係を意味しています。

例えば、気温が上がると、以下の図のようにエアコンの売れ行きは伸びるそうです。気温が上がるという現象が原因で、エアコンが売れるという結果が導かれるわけです。暑いからですね。原因と結果が明確です。

 

 

他にも、暑いと喉が渇く。空気が乾燥すると風邪をひきやすくなる。早く走ると息が上がる・・・色々と思い浮かびます。

ちなみに、この原因と結果の関係は絶対に一方通行です。原因→結果でしか成り立ちません。エアコンが売れるという原因で、気温が上がるという結果は、どう考えても導かれません。地球温暖化の遠因の1つに、エアコンを含めたCO2の排出があるのかもしれませんが、それは因果関係ではなくバタフライ効果でしょう。

相関関係とは、一方の値が変化すれば、他方の値も変化するという、2つの値の関連性を意味しています。

例えば、数式で言うならばY=XやY=X−2など、基本的に直線として描けるものです。一番解りやすいのは、中学数学で習った一次関数のグラフでしょう。

ちなみに、一方のデータがどの程度他方のデータに連動しているかは「相関係数」として表せます。相関係数をrとした場合は「-1≦r≦1」の範囲で収まります。1もしくは-1に近付くほど「強い相関」であり、0に近付くほど「弱い相関(あるいは無相関)」となります。

以下の図のように、1あるいは-1に近付くほど、直線になっていることが解るかと思います。相関が強くなるほど、綺麗な直線となるのです。

 

つまり、因果と相関は似て非なるものなのです。因果は理由が明確な1本のストーリー、相関は2本のストーリーの関係性を表していると言えます。

これは相関関係?因果関係?

私の脳みそでは「イケメン」と「パーマ」は完全なる因果関係でした。パーマをあてているならば、結果としてイケメンだと思っていました。

「昔の笑福亭鶴瓶もパーマだった」という親友の突っ込みは、僕の知るデータ量が少なく、恣意的だったとすら言えます。自分に都合の良い事実のみに目を向ける確証バイアスがかかっていました。「イケメン」と「パーマ」の相関関係も怪しいものです。

ちなみに、強い相関関係が表れたとしても、注意が必要なケースとして以下の3つがあげられるそうです。

1.単なる偶然
冬になるにつれ気温は下がる。時を同じくして、大阪府のひったくり件数が減少している。この2つは強い相関でしょうが、単なる偶然です。犯罪を抑止するために、気温がもっと低下することを期待することは間違っています。

2.疑似相関
2つの事象には因果関係がないのに、見えない「要因」によって因果関係があるかのように推測されることを疑似相関と言います。これは、見えなかった「要因」である第三の原因変数を導入することで生み出されます。例えば調査の結果、年収と起床時間に強い相関があったとします。しかし、よく調べてみると年齢が高くなるにつれ起床時間も早くなり、年収もあがっていました。実際は年収と年齢、年齢と起床時間こそ相関関係だったのです。

3.理由を1つのみだと決めつけるリスク
例えば、安い&旨い&良い接客だから売れるのに、安いことのみを売れている理由と決めつけるリスクを指します。

私の場合は、2と3に当て嵌まっていたことが解ります。

本当は「パーマ」と「イケメン」ではなく、「パーマ」と「オシャレ」が正しい直接相関かもしれません。「イケメン」は筋の通った目鼻立ちや、小顔、目の大きさなど様々な要素で構成されるのに、パーマのみに着目していました。

ところで、この記事を読まれている皆さんは、私のような勘違いをしたことはありませんか?

マーケティングにおける効果測定は、「使ったコストに対する成果を把握する」という意味において、相関を日常茶飯事に利用するはずです。なぜなら、それはコストと成果という2つの要素の相関を把握することで、より低いコストで高い成果をあげることができるからです。

私たちWEBマーケッターは、こうすれば確実に売れる!という因果関係を探して、日々、複数のストーリーを組み合わせた相関関係の実験を繰り返しているのかもしれません。

ですから、相関と、そうかんたんに縁が切れるはずもありません。

ということは、マーケッターという職業は私と同じような勘違いに陥り易いと思うのです。

例えば、「資料請求のボタンのサイズを1.5倍にすることで、CVRも1.5倍になりました」というケース。

 

因果関係は、もちろんありませんよね。あらゆるWEBサイトにおいて、この現象は起きません。

では、相関関係はどうでしょうか。—単なる偶然とは言えないでしょうか。たまたまCVRが上がっただけかもしれません。

疑似相関の可能性はないでしょうか。ボタンのサイズと、CVRの間に、隠されたもう1本のストーリーはないでしょうか。CVRが上がった理由をボタンのサイズのみに求めていないでしょうか。流入数は、再訪度合いは、訪問者の質は、前回と同じでしょうか。

相関があるようで、実際は前述したような注意点に引っ掛かる可能性がある場合もあるのが数字の世界です。数字だけに着目せず、数字を日本語に翻訳することが、私たちWEBマーケッターに課せられた使命なのかもしれません

ビッグデータと相関関係の親和性、そしてプライベートDMP

ところで、2013年の流行語大賞にもノミネートされた「ビッグデータ」の世界においては、因果より相関が大事だという論調が強いと言われています。

例えば、「イケメン」と「パーマ」の関係について考えてみましょう。

「昔の笑福亭鶴瓶もパーマだった」と言いますが、全人口70億人分の顔を採取し、顔のパーツを分解して「イケメン度」を点数化する一方で、パーマか否かを確認し「イケメン」と「パーマ」の相関関係を算出した場合、そこに強い相関関係があれば「なぜかは解らないけど、全人類を対象にしたら、やっぱりイケメンとパーマに相関はあるっぽい。松本、慌てずもうちょっと待て」と言えます。

理由は解りませんが、結論がそう出ているなら、そうなのだ、これでいいのだ。ということです。何せ、標本の数が違います。人類全てを対象にしているのですから。

「ビッグデータ」が何を変えるか。それは、今までハードの関係で一部抜粋や群体として抽出したデータに対する分析が、全データを対象に分析できる、ということです。WEBマーケッターが、虫の目、鳥の目、魚の目だけでなく、今まで気付けなかったストーリーに気付ける「神の目」を持つことになったと言えます

もちろん、神の目だけでは「なぜ?」という本質を突き止められないので、残りの「3つの目」も重要です。あくまで「第4の目」が誕生したに。すぎません。

親和性が高そうなのは、例えばプライベートDMPではないかと私は考えます。

プライベートDMPは、企業が自社の膨大なデータのみ格納することを目的としています。しかし役割は増大し、やがて世界中のあらゆるマーケティング施策を収集し、自社のマーケティング施策との相関関係を提示できる「神の目」機能も誕生するかもしれません

# 越えなければならないハードルは幾つか思い浮かびますが。

それにしても、因果と相関って奥深いですね。普段から知った顔をしていると後々痛い目に合うことに気付いたので記事にしてみました。

【参考文献】
それ、根拠あるの?と言わせないデータ・統計分析ができる本/日本実業出版社
ビッグデータの正体 情報の産業革命が世界のすべてを変える/講談社
統計学が最強の学問である/ダイヤモンド社

マーケティングメトリックス研究所では、共同研究や寄稿記事を募集中です。
ご興味のある方は、是非、お問い合わせください。

Written by