ひらめの日常

日常のメモをつらつらと

【因果推論】バックドア基準とフロントドア基準

バックドア基準とフロントドア基準

こちらの第3章後半です

バックドア基準

何をしたいか

DAGで表現された因果モデルにおいて、任意の2変数の因果関係を知りたいとする。この時、どの変数集合を条件付けすれば因果関係を知ることができるかが重要になる。バックドア基準を使うことで、どの集合について条件付けすべきかを知ることができる

2変数 XY の因果関係を知りたいとする。条件付けする集合を Z とする。

どのように Z を選べば良いだろうかを考える。すると、以下の条件を満たす Z を選んでくるのが良いとわかる。

  • XY の間の擬似パスを全てブロックする
    • X に入ってくる矢印はブロックしたい。なぜなら、これは X からの因果関係に寄与していないが、XY を従属にしている可能性があるから。
  • X から Y への有向道はブロックしない
    • X の子孫についても条件付けしない。なぜなら、 X の子孫から Y に向かって影響を及ぼしている可能性があるため。これをブロックしてしまうと、本来なら X から Y に向かっていた因果関係までがブロックされてしまうかもしれない。
  • 新しい擬似パスを作成しない
    • これは、条件付けする前は独立だったのに、条件付けによって従属になってしまうケースを避けることと同義。つまり、XY の間に新たに道を開くような合流点について条件付けしないということ。

バックドア基準の定義

上記を満たすような集合 Z は、以下に示すバックドア基準を満たしていれば良い。

  • Z に含まれるいかなるノードも X の子孫ではなく、
  • XY の間で X に向かう有向道全てを Z がブロックするとき、
  • この時、ZX, Y についてバックドア基準を満たすという。

Zバックドア基準を満たす時、XY に及ぼす因果効果は以下で得ることができる。

{
P(Y=y|do(X=x)) = \sum_{z}P(Y=y |X=x, Z=z)P(Z=z)
}

具体例

以下のようなグラフを考える。

f:id:thescript1210:20211226121619p:plain:w500
  • X: 新薬を使用するかどうか
  • Y: 回復したかどうか
  • W: 体重
  • Z: 測定されない変数(社会経済的状況など)

ここで薬がどれだけ回復に影響があるかを調べたいとする。つまり X から Y への因果関係を知りたい。この例では、W で条件付けをすればバックドア基準を満たすことがわかる。

  • WX の子孫ではない。
  • WX\leftarrow Z \rightarrow W \rightarrow Y をブロックしている。

よって調整化公式を使い、以下で新薬を使用したかどうかの確率を得ることができる。

{
P(Y=y|do(X=x)) = \sum_{w}P(Y=y|X=x, W=w)P(W=w)
}

フロントドア基準

何をしたいかと具体例

バックドア基準を満たさないグラフでも、因果関係を計算できる方法がある。そのうちの一つがフロントドア基準である。

以下のようなグラフを考える。

f:id:thescript1210:20211226121710p:plain:w500
  • U: 観測されない交絡因子。今回は遺伝子型とする
  • X: 喫煙しているか否か
  • Z: タール蓄積があるかどうか
  • Y: 肺がんかどうか

このグラフで X から Y への因果関係を知りたいとする。この時、U は観測できず、ZX \leftarrow U \rightarrow Y をブロックしていないのでバックドア基準を満たさない。

まず XY に及ぼす効果は以下で表される。

{
P(Y=y | do(X=x)) = \sum_{z} P(Y=y|do(Z=z))P(Z=z|do(X=x))
}

気持ちとしてはこんな感じ。

  • Zz に固定された時に Y に及ぼす効果は P(Y=y|do(Z=z)) で表される
  • その z が生じるのは、Xx に固定された時の効果 P(Z=z|do(X=x)) で表される
  • よって、X からの効果に注目するのであれば、全ての Z に関して総和を取れば良い。

次に、XZ に及ぼす効果は計算できる。

{
P(Z=z|do(X=x)) = P(Z=z|X=x)
}

さらに、ZY に及ぼす効果も計算できる。なぜなら、X について条件付けすることで Y への道をブロックできるから。

{
P(Y=y|do(Z=z)) = \sum_{x}P(Y=y|Z=z, X=x)P(X=x)
}

これら二つより、XY に及ぼす効果は do オペレータなしで以下のようのに表すことができる。

{
\begin{eqnarray}
P(Y=y | do(X=x)) &=& \sum_{z} P(Y=y|do(Z=z))P(Z=z|do(X=x)) \\
&=& \sum_{z}\sum_{x '} P(Y=y|Z=z, X=x ')P(X=x ') P(Z=z|X=x)
\end{eqnarray}
}

この式は フロントドア公式 と呼ばれる。

フロントドア基準の定義

変数の集合 Z が以下の条件を満たすとき、Z は2変数 X, Y についてフロントドア基準を満たすという。

  • ZX から Y への有向道を全てブロックする
  • X から Z へのバックドアパスは存在しない
  • Z から Y への全てのバックドアX によってブロックされている

Z がフロントドア基準を満たすとき、XY に及ぼす因果効果は以下で得ることができる。

{
P(y|do(x)) = \sum_{z}P(z|x) \sum_{x'} P(y|x', z)P(x')
}