読書メモ
因果関係を確認する3つのチェックポイント
1.まったくの偶然 これが結構あるって。
例。ニコラス・ケイジの映画出演本数とプール溺死者数(!)
2.「第三の変数(交絡因子)」はないか
かつて「ワインを飲むと→長生きする」というデータがあったのは、「ワインを飲めるくらい経済的に余裕がある→長生きする」ということではないか、という話をどこかで見たな・・・
3.逆の因果関係はないか
例えば地域の警察官と犯罪件数のグラフを作ると 「警察官が多い地区は犯罪が多くなる」と一見見えるが実は 「犯罪が多いところに警察官が多く配置される」というだけだったり
これら3つが無いことを確認するには 「反事実」を考える・・・ってことだけど、実験室での実験とか、二重盲見によるランダム化比較試験とかでなく、「反事実」を考えて「事実」と比較するというのがよくわからない・・・
エビデンスレベル
高い
↑
|メタアナリシス
|ランダム化比較試験
|自然実験と疑似実験
|回帰分析
|単なるエピソード(これはこの本には書いていない)
↓
低い
で、私のやってることなんか、ほんとエピソードに過ぎないもんなあ・・・
「観察された差が偶然の産物である確率」が5%以下である時に「統計的に有意である」と言う。
コインを投げて表が出る確率で考える。
1回 50%(0.5)
2回 25%(0.5×0.5=0.25)
3回 12.5%(0.5×0.5×0.5=0.125)
4回 6.25%(0.5×0.5×0.5×0.5=0.0625)
5回 3.125%(0.5×0.5×0.5×0.5×0.5=0.03125)
つまり偶然の産物である確率が、コインを投げて表が連続して4回出るのと5回出るのとの間くらいの確率。これは確かに「少ない」と思えるから、結果として「偶然では無い」と考えていいのではないか、という話になる。
なお、メタボ健診と死亡率について、「メタボ健診に似た健診」を行ったデンマークでランダム化比較試験をした結果は「因果関係無し」
ランダム化比較試験をするにはたいへんお金がかかるが、間違った政策を続けるよりは安上がり。
なお、ランド医療保険実験というのがあり、自己負担率の割合が高くなれば医療費は減る、という結果が出ている。そして「自己負担率が高くなっても『貧困層以外は』健康状態は変わらない」という結果がでている。
ただし「所得が低く健康状態の悪い人に限ってみると、自己負担割合の増加は健康状態を悪化させる」
なるほど。
後者を忘れないようにしないといけないよな。
あと、私の仕事で興味があるのが
「偏差値の高い大学に行けば収入は上がるのか」
という問い。アメリカの大学についての調査なので、実は偏差値ではなく「SAT(大学進学適正試験)」の結果を利用している。
その結果だけを書くと
「偏差値の高い大学に行くということは、すべての学生にとって自身の将来の収入を最大化する選択というわけではない」
「その大学に行けば、誰もが将来の収入を高められるというような唯一無二の大学など存在しない」
そして元カールトン・カレッジの学長スティーブン・ルイスが大学ランキングについて質問された時の回答
「問題は、どこが最高の大学か、ということではない。問題は、誰にとって最高の大学か、なのだ」
ご本には巻末に参考文献(論文)の一覧が出てきます。