2022.04.08

データから因果関係を導く！〜ルービン？パール？全部のせ〜

こんにちは。次世代システム研究室のY. O.です。

過去数度にわたって、統計的因果推論やその派生テーマについてブログを書いてきました。

FirebaseのA/B Testing・Personalizationはビジネスでどれほど活用できるのだろうか

そこで改めて、統計的因果推論の全体像を体系立って知りたい、というのが今回のテーマです。
調査を終えて、ちょっと調べただけではその体系を知ることができないな、というのが正直な感想です。まとまりきっていない部分もありますが、前半に体系論、後半に実例を用意していますので、同じ悩みを抱えている方の少しでも助けになればと思います。

因果推論の全体像

そもそもなぜ因果推論なのか

“因果と相関は違う”、と統計学の基礎講義を受けた学生だけでなく、ビジネス界隈でも基礎知識として浸透してきている気がします。また、ビジネス×統計学（この領域をデータサイエンスと呼んだりしますが）、が非常にパワフルだと認められてきています。
いま一度、基礎統計学では何を目的にしていたのかを振り返ってみましょう。“the object of statistical methods is the reduction of data” (R. A. Fisher, 1922)と、統計理論・情報理論に貢献したフィッシャーは述べており、引用の周囲とあわせて翻訳すると“データから、必要な情報・できれば情報の全てを集約・削減して表現すること、が統計学である”と言っています。
さて、ここで気がつくのは、基礎統計学では“因果”については全く触れていないということです。ですがビジネスシーンを思い浮かべてみると、基礎統計学の手法によりデータを集約表現した後は、なにかアクションを取りたくなり、そうなってくると、基礎統計学を拡張して、データに潜む“因果”を解析対象とする必要があります。