相関関係と因果関係

データ分析の基本は「1つの変数がどのように変化するか」に加え、「2つの変数の間にどのような関係があるか」を見いだす事である。「相関関係」と「因果関係」について確認しながら、その種類について整理することで正しい分析について考えた。
相関関係、因果関係
相関関係とは
相関関係とは、変数の一方が変化するにつれ、他の変数が同時に変化する関係。(記号:A↔B)
因果関係とは
因果関係とは、一方の変数が他方の変数の変化を引き起こす、原因と結果の関係。(記号:A→B)
相関関係ではどちらが原因で結果が不明で、時間的にどちらが先行するかはわからない。因果関係に置いては原因が結果に先行する。
AとBに相関関係があるときの因果関係の予想
AがBの直接原因(記号:A→B)
例)台風でリンゴの収穫量が半減した。
BがAの直接原因(記号:A←B)
例)ダイエット食品を食べる人ほど肥満度が高い。
AとBが相互に影響(記号:A⇄B)
例)肌を掻きすぎるとアトピー性皮膚炎が進行する。
AがBに間接原因(記号:A→C→B、またはA↔C→B、またはA→C↔D→B など)
例)コーヒーを飲むと心臓病のリスクが高くなる(砂糖の影響?)。
AもBも第三変数の結果(記号:C→AかつC→B)
例)ジャンクフードばかり食べると非行行動に走りやすい(家庭環境?)、家庭にある灰皿の数が多いと肺がんになりやすい(喫煙習慣?)。
上記以外の関係
- 上記の組み合わせ
- 上記5つの組み合わせの場合。
- 循環因果(計測出来ない)
- 「風が吹けば桶屋が儲かる」のように複数の原因と結果が連なる場合。
- 単なる偶然、見せかけの相関
- たまたま関係があるように見える場合。特に変数の1つに「時間」を使用する場合に見いだしやすい。
- そもそもデータや調査方法に問題がある
- 意図的に改変されたデータや、統計学的に十分ではないサンプル数の調査など。
まとめ
データを分析し、相関関係から因果関係を特定、問題解決に取り組むことはよくある。2つの事象の因果関係が単純な「A→B」タイプでは無かった場合は、実践した問題解決の手段に効果が無かったり、逆に問題を深刻化させてしまう可能性もある。
参考
記事のデータ
文責 | |
---|---|
公開日 | 2015年4月21日 |
カテゴリー | |
タグ | おすすめ/分析/情報を整理する/概念/構造化 |
関連する記事 |