統計を疑うための5つのキーワード

仕事や日常生活でものごとを決める際、判断の材料となる統計データ。中には意図せず、あるいは意図的に正しくない内容になってしまっているものがある。統計データの正しさをどのように見分けるか、統計を疑うための5つのキーワードについてまとめた。「統計でウソをつく法 数式を使わない統計学入門」から抜粋して加筆。
統計やデータがゆがむ状況
統計やデータは次のような状況のもとで正しくなくなることがある。
データの収集時
- 回答者の利益に関わる
- たとえば人口調査を行った時、徴兵や納税を目的とした場合は人口は少なくなり、補償や支給を目的とした場合の調査では人口が多くなる。
- 回答者のプライバシーに関わる
- たとえば収入を調査する場合には、収入の多い人が積極的に答える傾向がある。また、文化的に恥ずかしいと思う内容の質問には正確に答えないことが多い。
- 回答者が偏っている
- たとえば固定電話を対象にした戸別アンケートでは、携帯電話しか持っていない若年層が対象外となってしまう。
- サンプル数が少ない
- 統計として有効なサンプル数を得ていない場合。例えば世論調査等では2,000人程度のサンプル数が必要である。
- 質問者の違い
- たとえば質問者が男性か女性かによって、得られる回答の傾向が変化する場合がある。
データの分析時
- 平均の種類
- たとえば収入のように、その分布が正規曲線を描かないデータの場合には、算術平均を判断基準にするよりも最頻値を判断基準とした方が良い場合がある。
- 割合の合計
- 複数回答が可能なアンケートであるにもかかわらず、各回答の割合を合計してしまう場合。
- 意味の無いわずかな差を取り上げる
- たとえばダイエット商品の効能を示すのに一ヶ月に300gの体重減少で「体重が減少した」と判断する。
- 絶対値ではなくトレンドを取り上げる
- たとえば掃除機の吸引力を示す場合、吸引力が強い事を謳うか、使用中に吸引力が変化しない事を謳うかによって得られる結論が異なる。
データの表現時
- 比較するデータや基準が違う
- 自社の新商品を他社の旧商品と比較するなど。
- 絵グラフである
- 棒グラフを絵グラフに置き換えると、高さだけではなく幅も同じ比率で大きくなるので、差が強調される。
- グラフの一部分だけを使う
- 変化が少ない場合、グラフの一部を切り取り拡大表示する事で変化が大きいように見せる。
統計を疑うための5つのキーワード
上記のように統計データが正しく示されていない可能性があるとき、それを見抜くために気をつけるべきポイントをまとめた。
- 情報源
- 調査方法
- 情報不足
- すり替え
- 有意性
情報源
誰がその統計を出しているのか。
- その統計から得られる結論が誰にとって都合が良いのか
- いわゆる「OKネーム(その分野の権威)」が、データの一部だけでは無く全面的に支持しているか
調査方法
どのようにその統計を出したか。
- サンプル数は十分か
- データの集め方に信頼が置けるか
- 統計方法や測定方法が明確か
- データ間に相関関係があるか
情報不足
その統計が信頼出来るだけの情報を提示しているか。
- 比較する適切なデータがあるか
- どの平均値(算術平均、中央値、最頻値)を使っているか
- 省かれているデータがないか
すり替え
その統計と結論との間で何らかのすり替えが行われていないか。
- 原因と結果が入れ替えられていないか
- こじつけではないか
- 言葉が置き換えられていないか
有意性
「統計データである」ということが感覚を麻痺させていないか。
- 数字が正確すぎないか
- トレンドの予測が妥当であるか
参考
記事のデータ
文責 | |
---|---|
公開日 | 2015年3月23日 |
カテゴリー | |
タグ | 分析/情報を集める/文献調査 |
関連する記事 |