| 「メタボ健診を受けていれば健康になれる」「テレビを見せると子どもの学力が下がる」「偏差値の高い大学に行けば収入は上がる」はなぜ間違いなのか?世界中の経済学者がこぞって用いる最新手法「因果推論」を数式なしで徹底的にわかりやすく解説――. |
人間の脳は,物語を紡がずにはいられない.AのあとにBが起きれば,そこに因果の糸を見出そうとする認知の傾向は根強い.「アイスクリームの売上が伸びると,水難事故が増える」.そのデータを目にした瞬間,「食後の水泳は危険」という物語が反射的に脳内に立ち上がる.背後にあるのは「気温の上昇」という第三の変数(交絡因子)であり,二者のあいだに存在するのは因果ではなく相関に過ぎない.
現実には,倫理的・制度的理由から意図的な実験が不可能な場面のほうが圧倒的に多い.そこで,方法論的な出発点として置かれるのが,反事実の概念である.真の因果を証明するためには,もし別の選択をしていたら,どうなっていたか――現実には観測不可能な対称世界――を想定しなければならない.対象をランダムに割り付けることで未知の交絡因子の影響を均質化し,純粋な介入効果だけを抽出する論理は,今日の医学臨床試験からウェブサービスのA/Bテストに至るまで,意思決定の基盤インフラとして定着している.
専門家の間にのみ流通してきた因果推論という難解なパラダイムを,数式も用いず,論理的かつ平易な言語で一般読者へと開く.本書の核心部(第三章〜第七章)は,観察データのみが手元にある世界において,いかにして因果を炙り出すかという手法群の解説に充てられる.自然実験,差の差分析,操作変数法,回帰不連続デザインと展開される手法は,それぞれが異なる仮定に基づきながらも,世界のどこかで偶発的に生じた自然のランダム性を掘り当てるという共通の論理に貫かれている.
手法的展開の末尾,終章(第八章)では古典的な回帰分析が置かれる.因果推論の構造を先に提示し,最も汎用的な分析手法を最後に補足する入門書として自然な積み上げ構成であるが,同時に,大量のデータから相関的傾向を抽出する回帰分析は強力であっても因果推論に適した設計の代替にはなりえないという文脈でも読める.サンプルサイズがいかに膨大であろうとも,そこに因果の構造が組み込まれていなければ,巨大な相関関係の集積に過ぎない.ビッグデータは相関の発見には適しているが,因果の証明には適していない.本書の指摘は,データサイエンスの潮流に対する冷静な批判であろう.
++++++++++++++++++++++++++++++
原題: 原因と結果の経済学―データから真実を見抜く思考法
著者: 中室牧子,津川友介
ISBN: 447803947X
© 2017 ダイヤモンド社
