統計的因果探索 chapter1~3
1章 統計的因果推論
統計的因果推論
とは、相関があるだけでなく、実際に変化した時に、目的変数がどうなるかを推測する- この書籍では、統計的因果推論の一種である
統計的因果探索
を解説
- この書籍では、統計的因果推論の一種である
相関はあくまで、データから読み取れる結果でしかなく、因果関係は考慮していない
i.e. - チョコの消費量が多いと、ノーベル賞受賞者が多い =>相関 - チョコの消費量を増やしたときにノーベル賞受賞者数がどうなるか =>因果関係
- 因果関係は、
因果グラフ
で表す- ノード
- 観測変数&未観測変数
- 有向エッジ
- 因果関係の有無
- エッジに因果関係の強さといったラベルは存在しない
- エッジの向きで、原因=>結果
- 因果関係の有無
- ノード
- 矢印の間に挟まれるノードを
共通原因
と呼ぶ- 共通原因のうち、未観測なものを
未観測共通変数
と呼ぶ
- 共通原因のうち、未観測なものを
因果関係はないが、相関がある場合、
擬似相関
と呼ぶ未観測、観測変数の値より、ある変数の値が生成される工程を
生成過程
と呼ぶ- x, yからzが生成されている際、z=f(x, y, e)で表され、eは
誤差関数
と呼ばれ、バイアスのような役割をする- 未観測変数とバイアスは、なんらかの確率分布に従うと考え、確率変数で表す
- x, yからzが生成されている際、z=f(x, y, e)で表され、eは
相関係数では、因果関係の大きさを測ることはできない
2章 統計的因果推論の基礎
統計的因果推論
は因果グラフが既知の場合の手法
反事実モデル
- 個体レベルの因果
- 個体に対して二種類以上の試行を行い、因果関係があるかを実験
- この個体が属する集合が存在した場合、その集合全体に、個体の因果関係が同様に適用可能かはわからない
- 集団レベルの因果
- 集団に対して二種類以上の試行を行い、集団の何割がどのような結果になるか観測
構造方程式モデルによるデータ生成過程の記述
- 構造方程式
- データの生成過程を定式化
- yというデータが生成される過程は以下
- xは観測変数
- xもyと同様に未観測の誤差変数から生成されていると考えられる
- eは未観測変数&誤差変数
- x, yの誤差変数らは独立とは限らない
- xは観測変数
y=f(x, e)
- yは
内生変数
- 構造方程式によって記述される変数
- いくつかの変数で説明される変数
- 誤差変数eは
外生変数
- 構造方程式において、生成手順が語られない変数
構造的因果モデル
反事実モデルと構造方程式を組み合わせたモデル
- 集団レベルの因果構造方程式モデルによって記述
介入
により、ある変数に対して、任意の定数を代入- 集団に対する試行を、モデルを作成する人間が指定
- i.e.) 薬を飲む、飲まないetc.
- x=cという介入
do(x=c)
をした時、yの確率分布はp(y|do(x=c))
で表される
- 介入後の分布が介入前と異なる場合, 介入した変数xとyの間に因果関係があると言える
- 個体レベルも同様に介入によってどう値が変化するかで分析可能
- 因果効果の大きさの定量化
平均因果効果
で因果効果の大きさを定量化- 二種類の介入を行った分布の期待値の差
- 出来事の説明
- 観測された結果より, 過去に何があったかを
説明
- 潜在反応モデルにより深い考察が可能
- 観測された結果より, 過去に何があったかを
ランダム化実験
- 変数の値を, 個人ごとにランダムな値に
- 未観測変数を独立に
- 時系列的に捉えることで, 未観測共通原因をなくす
- 未観測変数を独立に
3章 統計的因果探索の基礎
統計的因果探索
は因果グラフが未知の場合の手法
現実問題として取り扱う場合、統計的因果探索して因果グラフの推測を行ったのちに、統計的因果推論により、その因果関係の大きさなどを推測することも多々ある
本書では、ランダム化実験を行わず、いくつかの制約を設けることで因果グラフを推測する手法を取り扱う
統計的因果探索
- 統計的因果探索は観測されたデータx, yより, 因果グラフを推測する問題
識別可能性
- 因果グラフが識別可能であるかどうか(=観測データから因果グラフが一意に定まるかどうか
- 因果グラフの構造が異なれば、観測変数の分布が必ず異なる場合、識別可能
- 仮定によって、因果グラフの候補群の数を減らすことが可能
- 誤差変数が独立である仮定
- 非巡回グラフである仮定
- 非巡回を仮定することで、先祖、親、子孫などの概念を導入可能
- 平均因果効果
- {x1, ..., xn}の因果グラフがある場合、x1とxkの因果効果は
- x1からxkとの有向エッジがある場合、直接効果をcalc
- x1からxkまで、どこかノード (中間変数)を経由したエッジが存在する場合、message passingの要領で、間接効果をcalc
- 直接、間接効果の和が、
平均総合効果
- {x1, ..., xn}の因果グラフがある場合、x1とxkの因果効果は
ノンパラメトリック
- 二種類の仮定を置く
因果的マルコフ条件
を導入- 変数それぞれを親に当たる変数で条件付けするとその非子孫の変数と独立になる(親、先祖を含む
忠実性
を導入- 因果グラフを見ると従属なはずなのに、実際には独立ということがないように
- 独立性は、因果グラフの構造からのみ表されるという仮定
- (おそらく二変数に着目して)、同じ条件付き独立性を有する因果グラフを持つモデルの集合を
マルコフ同値類
と呼ぶ - ノンパラメトリックな手法では、マルコフ同値類への絞り込み等を行うことは可能だが、一意に因果グラフを特定できない
- 制約に基づくアプローチ
- 条件付き独立性を試薬として、それを満たすような因果グラフを探索
- スコアに基づくアプローチ
- マルコフ同値類ごとにスコアを出し、良いものを選択
- 制約に基づくアプローチ
パラメトリック
- ノンパラメトリックと比較して、識別可能性は向上しない
- ノンパラメトリックと同様に、
マルコフ同値類
内の全ての期待値を計算し、最小or最大の値によって評価- 少なくとも、期待値が正なので因果関係がありそう等
セミパラメトリック
- 誤差変数の分布に、非正規分布を仮定することで、識別可能性が向上するらしい