1.5 图模型_因果推断导论-QQ阅读男生都市网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

1.5 图模型

1.5.1 有向无环图

图G={V,E}由节点（或变量）集V={V₁,V₂,…,V_N}和边集E组成，其中N为节点个数，如图1-2所示。在图G中，对于任意的节点对V_i,V_j∈V(i≠j)由一条有向边V_i→V_j（或V_i←V_j）或者一条无向边V_i－V_j连接。边集E是图G中节点之间的边的集合。如果集合E中所有的边都是无向边，则称G是一个无向图（Undirected Graph），如图1-2a所示。如果E中所有的边都是有向边，则称G是一个有向图（Directed Graph），如图1-2b和图1-2c所示。一条从节点V_i到另一节点V_j的路径p是由从V_i开始到V_j为止、依次有边相连、中间无重复节点的有向边或无向边组成的，如图1-2a中的路径A－C－E－Q和图1-2b中的路径A→C→E←Q。如果路径p上所有边的方向都是朝向V_j，即V_i→V_k→…→V_j，则称路径p是从V_i到V_j的有向路径，其中V_i是V_j在图G中的祖先节点（Ancestor），而V_j是V_i的子孙（或后代）节点（Descendant）。例如，图1-2c中的有向路径A→C→E→Q，其中A和C是Q的祖先节点，而Q是A和C的子孙节点。V_i→V_j表示V_i是V_j在图G中的父节点（Parent），而V_j是V_i的孩子节点（Child），例如，图1-2c中的A是C的父节点，C是A的孩子节点。一条从V_i到V_j以及再从V_j到V_i的有向路径称为一个有向环，例如，图1-2b中的E→F→Q→E是一个有向环。一个没有环的有向图称为有向无环图，例如，图1-2c是一个有向无环图。有向无环图是因果关系表示的最重要的图模型。如果赋予有向无环图中的有向边因果语义，即如果存在有向边V_i→V_j，则称V_i是V_j的直接原因，V_j是V_i的直接结果，那么有向无环图被称为因果图或因果结构。

图1-2 三种图模型

有向无环图由三种基本结构组成：链结构（Chain）、叉结构（Fork）、对撞结构（V-结构，V-Structure）（在第4章详细介绍），如图1-3所示。

图1-3 有向无环图中的三种基本结构

在一个有向无环图中，如果变量V_i和V_j之间存在一条单向路径，如V_i→Q→V_j或V_i←Q←V_j，这种类型的结构被称为链结构。叉结构为V_i←Q→V_j且Q是V_i和V_j的父节点或共同原因。如果Q是V_i和V_j的共同孩子节点且V_i和V_j之间无有向边连接，即V_i→Q←V_j，该结构被称为对撞结构（或V-结构），节点Q被称为对撞节点。基于这三种基本结构，下面我们介绍有向无环图中的重要概念：d-分离。

定义1-1 阻断路径（Blocked Path） 在有向无环图G中，如果以下两个条件满足任意一个，则节点V_i与V_j之间的一条路径p被条件集Z（可能为空集）阻断：

（1）路径p中存在链结构V_i→Q→V_j或叉结构V_i←Q→V_j，且Q在Z中；

（2）路径p中存在对撞结构V_i→Q←V_j，Q且Q的子孙节点都不在Z中。

在图1-4中，路径B→S←X是一个对撞结构，S是对撞节点，根据定义1-1，由于S不能出现在条件集Z中，因此，条件集Z为空集时，这条路径被Z阻断。B←Y→X是叉结构，X和B之间的路径被Y阻断，条件集Z为{Y}。路径Y→B→S和路径Y→X→S分别被B和X阻断。由于路径Y→X→N←S中有对撞结构，当条件集Z={X}、Z={X,N}或Z为空集时，该路径被Z阻断。

图1-4 有向无环图与d-分离示例

定义1-2 d-分离（有向分割，Directed Separation） 如果两个节点V_i与V_j之间的所有路径都被集合Z阻断，则V_i与V_j被集合Z“d-分离”。

如果V_i与V_j之间存在一条路径没有被集合Z阻断，那么V_i与V_j被“d-连接”（d-Connection）。d-分离体现了数据中变量之间的条件独立与条件依赖关系，同时它蕴含着图结构背后的数据生成机制，因此d-分离是有向无环图中最重要的概念之一。

在图1-4中，X和B之间共有三条路径：（1）B←Y→X；（2）B→S←X；（3）B→S→N←X。根据定义1-1，当条件集Z={Y}时，路径B←Y→X被Z阻断；当条件集Z为空集时，路径B→S←X被Z阻断。由于路径B→S→N←X中有对撞结构，当条件集Z={S}、Z={S,N}或Z为空集时，该路径被Z阻断。由于三条路径中有两条路径包含对撞结构，因此，综合这三条路径的条件集信息，X和B被Y“d-分离”。B和N之间共有四条路径：（1）B←Y→X→S→N，当Z为集合{S,X,Y}中任意不为空集的子集时，该路径被阻断；（2）B←Y→X→N，当Z为集合{X,Y}中任意不为空的子集时，该路径被阻断；（3）B→S→N，当Z={S}时，该路径被阻断；（4）B→S←X→N，当Z={X}、Z={}或Z={X,S}时，该路径被阻断。根据定义1-1，综合这四路径的条件集信息，条件集{S,X}阻断了B和N之间所有四条路径，因此，B和N被集合{S,X}“d-分离”。

1.5.2 最大祖先图

当观测变量集V中没有隐变量时，我们一般称V满足因果充分性假设，见定义1-3。

定义1-3 因果充分性（Causal Sufficiency） 当观测变量集V中任意两个或多个变量的直接原因都存在V中时，则V满足因果充分性假设。

如果观测变量集不具有因果充分性，那么这个变量集中含有未观测到的变量，即存在隐变量。当观测数据中出现未观测到的隐变量时，有向无环图将难以有效表示这些隐变量。例如，图1-5a是一个由四个可观测变量{A,B,C,H}和一个不可观测变量（隐变量）L构成的因果图。根据d-分离，图1-5a涉及了三种依赖关系：A⊥H｜B、A⊥H｜C和﹁A⊥H｜{B,C}。其中⊥表示条件独立，｜表示条件依赖。显而易见，这三种依赖关系无法使用一个有向无环图表示。

图1-5 具有隐变量的有向无环图和最大祖先图

Richardson等提出了最大祖先图（Maximal Ancestral Graph，MAG）模型[8]。最大祖先图在有隐变量的情况下具有表示观测变量之间关系的能力。引入了最大祖先图的概念后，我们可以用图1-5b来表示图1-5a中存在的条件依赖关系。在介绍最大祖先图之前，我们先介绍混合图（Mixed Graph）和祖先图（Ancestral Graph）的概念。

定义1-4 混合图 混合图由三种基本类型的边组成：有向边（→或←）、双向边（↔）和无向边（－）。

例如，图1-6为定义在变量集V={A,B,C,H,E,F}上的混合图。如果两个变量之间存在一条边，则称这两个变量是邻接的。在混合图中，一条路径是指不同顶点{V₁,V₂,…,V_k}的一个序列，对于任意0＜i＜k，V_i和V_i+₁是邻接的。如果给定一条路径，0＜i＜k，都有V_i→V_i+₁，则称这条路径为有向路径。在图1-6中，{A,H,E,F}就是一条路径，而{A,H,B}是一条有向路径。

图1-6 混合图

在混合图中，如果存在V_i→V_j，则V_i是V_j的父节点，V_j是V_i的孩子节点；如果存在V_i↔V_j，则V_i是V_j的配偶节点，V_j也是V_i的配偶节点；如果存在V_i-V_j，则V_i是V_j的邻居节点，V_j也是V_i的邻居节点；如果存在一条从V_i指向V_j的有向路径，则V_i是V_j的祖先节点。在图1-6中，H是B、E的父节点，C是E的配偶节点，F是E的邻居节点，A是E的祖先节点。

令An(V_i)表示V_i的祖先节点集合，如果混合图中V_j→V_i和V_i∈An(V_j)同时存在，则混合图中存在一个有向环。在图1-6中，满足B→A且A∈An(B)，所以该混合图中存在一个有向环。如果混合图中V_j↔V_i和V_i∈An(V_j)同时存在，则混合图中存在一个几乎有向环（Almost Directed Cycle）。在图1-6中，满足E↔C且C∈An(E)，所以该混合图中存在一个几乎有向环。

定义1-5 祖先图 如果一个混合图满足下列条件，则该混合图被称为祖先图：

（1）混合图中不存在有向环；

（2）混合图中不存在几乎有向环；

（3）对于任意的无向边V_i-V_j，V_i和V_j在混合图中不存在父节点和配偶节点。

在祖先图中，V_i→V_j表示V_i是V_j的一个原因（或祖先），而V_j不是V_i的一个原因（或祖先）。V_i↔V_j表示V_i不是V_j的一个原因，而V_j也不是V_i的一个原因，V_i和V_j之间存在一个隐变量。如图1-7所示，在图1-7a中不存在有向环，不存在几乎有向环，也不存在无向边，所以该图是一个祖先图，而在图1-7b中存在H↔F且F∈An(H)这个几乎有向环，因此该图是一个非祖先图。

图1-7 祖先图与非祖先图

定义1-6 对撞节点和非对撞节点（Collider and Non-Collider） 在祖先图中，给定一条路径π和节点V_i，如果π存在*→V_i←*，其中*表示任意的边缘标记＞或-，则称V_i为对撞节点；否则称V_i为非对撞节点。

在祖先图中，三元组V_i→V_j←V_k、V_i↔V_j↔V_k、V_i↔V_j←V_k和V_i→V_j↔V_k中V_j都是对撞节点。例如在图1-5b中，A→B↔C、B↔C←H中B和C都是对撞节点。

定义1-7 对撞结构或V-结构 在祖先图中，给定三元组{V_i,V_j,V_k}，如果V_i和V_j是邻接的，V_j和V_k是邻接的，但是V_i和V_k不是邻接的，则称该三元组构成非封闭的三元组。在一个非封闭的三元组{V_i,V_j,V_k}中，如果V_j是对撞节点且∃Z⊆V\{V_i,V_j,V_k}满足V_i⊥V_k|Z且﹁V_i⊥V_k|{Z∪V_j}，则三元组{V_i,V_j,V_k}构成V-结构。

类似于DAG中的d-分离，祖先图通过一种称为m-分离的图形标准来表示变量之间的条件独立关系。

定义1-8 m-分离（m-Separation） 在祖先图中，给定一条路径π，如果条件集Z满足如下两个条件之一，则π被Z阻断：

（1）π中存在一条子路径{V_i,V_j,V_k}，V_j是一个非对撞节点且V_j∈Z；

（2）π中存在V_i*→V_j←*V_k，V_j∉Z且Z中不存在V_j的子孙节点。

在祖先图中，节点V_i和V_j被变量集Z⊆V\{V_i,V_j}m-分离，当且仅当V_i和V_j之间的所有路径都被Z阻断。

定义1-9 最大祖先图（Maximal Ancestral Graph，MAG） 如果一个祖先图G满足条件：对于图中每对不邻接的节点X和Y存在一个集合Z，使得X和Y在Z上是m-分离的，则称该祖先图G为最大祖先图。

在最大祖先图中，每对不邻接的节点都对应一个条件独立性关系。由定义1-9可知，并不是所有祖先图都是最大祖先图。

例如，在图1-8a中，节点B和H不邻接，但并不存在一个变量集合Z，使得B节点和H节点在Z上是m-分离的，所以它不是一个最大祖先图。如果在节点B和H之间添加一条双向边↔使得节点B和H邻接，得到图1-8b，此时图中所有节点都是邻接的，因此该图是最大祖先图。如果添加单向边B→H，虽然所有节点也是相邻的，但是同时存在F↔H和F∈An(H)构成了一个几乎有向环，此时该图是一个非祖先图。同理，如果添加B←H，则存在E↔B和E∈An(B)，也构成了一个几乎有向环，此时该图也是一个非祖先图。

图1-8 祖先图与最大祖先图

众所周知，满足同样条件独立性和具有相同对撞结构的DAG对应同一个马尔可夫等价类。同理，隐变量和观测变量的独立性关系可能与多个MAG一致。MAG的等价类由部分祖先图表示。

定义1-10 部分祖先图（Partial Ancestral Graph，PAG） 在一个PAG中，一条边的两端可能有三种类型端点：

（1）不变箭头，记为“＞”，表示等价类中的所有MAG在该端点处有一个箭头；

（2）不变尾部，记为“-”，表示等价类中的所有MAG在该端点处都有一个尾部；

（3）可变端点，记为“o”，表示等价类中的某些MAG在该端点处有箭头，而其他MAG在该端点处有一个尾部。

在PAG中，边“o→”表示等价类中的MAG在该位置可能有→或↔的边；边“o-o”表示等价类中的MAG在该位置有一条→、←、↔或-的边；边“-”表示是在所有等价的MAG中该边的方向是“-”。如图1-9c所示，部分祖先图中存在边Qo→S，那么它的等价类中的所有MAG在该位置可以有Q→S和Q↔S的边，同理，图1-9c中存在边Io-oS，那么它的等价类中的所有MAG在该位置可以有I→S、I←S、I-S和I↔S的边。图1-9c中存在边H-L，那么它的等价类中的所有MAG在该位置都应该存在边H-L，因此，图1-9a和图1-9b都是部分祖先图1-9c的等价类最大祖先图。

图1-9 等价类最大祖先图和部分祖先图

本周热推：

财税RPA：财税智能化转型实战人形机器人（原书第2版）AI效率手册：从ChatGPT开启高效能实战AI大模型 AIGC提示词美学定义