因果推断导论
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.5 图模型

1.5.1 有向无环图

G={V,E}由节点(或变量)集V={V1,V2,…,VN}和边集E组成,其中N为节点个数,如图1-2所示。在图G中,对于任意的节点对Vi,VjV(i≠j)由一条有向边ViVj(或ViVj)或者一条无向边Vi-Vj连接。边集E是图G中节点之间的边的集合。如果集合E中所有的边都是无向边,则称G是一个无向图(Undirected Graph),如图1-2a所示。如果E中所有的边都是有向边,则称G是一个有向图(Directed Graph),如图1-2b和图1-2c所示。一条从节点Vi到另一节点Vj的路径p是由从Vi开始到Vj为止、依次有边相连、中间无重复节点的有向边或无向边组成的,如图1-2a中的路径A-C-E-Q和图1-2b中的路径ACEQ。如果路径p上所有边的方向都是朝向Vj,即ViVk→…→Vj,则称路径p是从ViVj的有向路径,其中ViVj在图G中的祖先节点(Ancestor),而VjVi的子孙(或后代)节点(Descendant)。例如,图1-2c中的有向路径ACEQ,其中ACQ的祖先节点,而QAC的子孙节点。ViVj表示ViVj在图G中的父节点(Parent),而VjVi的孩子节点(Child),例如,图1-2c中的AC的父节点,CA的孩子节点。一条从ViVj以及再从VjVi的有向路径称为一个有向环,例如,图1-2b中的EFQE是一个有向环。一个没有环的有向图称为有向无环图,例如,图1-2c是一个有向无环图。有向无环图是因果关系表示的最重要的图模型。如果赋予有向无环图中的有向边因果语义,即如果存在有向边ViVj,则称ViVj的直接原因,VjVi的直接结果,那么有向无环图被称为因果图或因果结构。

图1-2 三种图模型

有向无环图由三种基本结构组成:链结构(Chain)、叉结构(Fork)、对撞结构(V-结构,V-Structure)(在第4章详细介绍),如图1-3所示。

图1-3 有向无环图中的三种基本结构

在一个有向无环图中,如果变量ViVj之间存在一条单向路径,如ViQVjViQVj,这种类型的结构被称为链结构。叉结构为ViQVjQViVj的父节点或共同原因。如果QViVj的共同孩子节点且ViVj之间无有向边连接,即ViQVj,该结构被称为对撞结构(或V-结构),节点Q被称为对撞节点。基于这三种基本结构,下面我们介绍有向无环图中的重要概念:d-分离。

定义1-1 阻断路径(Blocked Path) 在有向无环图G中,如果以下两个条件满足任意一个,则节点ViVj之间的一条路径p被条件集Z(可能为空集)阻断:

(1)路径p中存在链结构ViQVj或叉结构ViQVj,且QZ中;

(2)路径p中存在对撞结构ViQVjQQ的子孙节点都不在Z中。

在图1-4中,路径BSX是一个对撞结构,S是对撞节点,根据定义1-1,由于S不能出现在条件集Z中,因此,条件集Z为空集时,这条路径被Z阻断。BYX是叉结构,XB之间的路径被Y阻断,条件集Z为{Y}。路径YBS和路径YXS分别被BX阻断。由于路径YXNS中有对撞结构,当条件集Z={X}、Z={X,N}或Z为空集时,该路径被Z阻断。

图1-4 有向无环图与d-分离示例

定义1-2 d-分离(有向分割,Directed Separation) 如果两个节点ViVj之间的所有路径都被集合Z阻断,则ViVj被集合Z“d-分离”。

如果ViVj之间存在一条路径没有被集合Z阻断,那么ViVj被“d-连接”(d-Connection)。d-分离体现了数据中变量之间的条件独立与条件依赖关系,同时它蕴含着图结构背后的数据生成机制,因此d-分离是有向无环图中最重要的概念之一。

在图1-4中,XB之间共有三条路径:(1)BYX;(2)BSX;(3)BSNX。根据定义1-1,当条件集Z={Y}时,路径BYXZ阻断;当条件集Z为空集时,路径BSXZ阻断。由于路径BSNX中有对撞结构,当条件集Z={S}、Z={S,N}或Z为空集时,该路径被Z阻断。由于三条路径中有两条路径包含对撞结构,因此,综合这三条路径的条件集信息,XBY“d-分离”。BN之间共有四条路径:(1)BYXSN,当Z为集合{S,X,Y}中任意不为空集的子集时,该路径被阻断;(2)BYXN,当Z为集合{X,Y}中任意不为空的子集时,该路径被阻断;(3)BSN,当Z={S}时,该路径被阻断;(4)BSXN,当Z={X}、Z={}或Z={X,S}时,该路径被阻断。根据定义1-1,综合这四路径的条件集信息,条件集{S,X}阻断了BN之间所有四条路径,因此,BN被集合{S,X}“d-分离”。

1.5.2 最大祖先图

当观测变量集V中没有隐变量时,我们一般称V满足因果充分性假设,见定义1-3。

定义1-3 因果充分性(Causal Sufficiency) 当观测变量集V中任意两个或多个变量的直接原因都存在V中时,则V满足因果充分性假设。

如果观测变量集不具有因果充分性,那么这个变量集中含有未观测到的变量,即存在隐变量。当观测数据中出现未观测到的隐变量时,有向无环图将难以有效表示这些隐变量。例如,图1-5a是一个由四个可观测变量{A,B,C,H}和一个不可观测变量(隐变量)L构成的因果图。根据d-分离,图1-5a涉及了三种依赖关系:AHBAHC和﹁AH|{B,C}。其中⊥表示条件独立,|表示条件依赖。显而易见,这三种依赖关系无法使用一个有向无环图表示。

图1-5 具有隐变量的有向无环图和最大祖先图

Richardson等提出了最大祖先图(Maximal Ancestral Graph,MAG)模型[8]。最大祖先图在有隐变量的情况下具有表示观测变量之间关系的能力。引入了最大祖先图的概念后,我们可以用图1-5b来表示图1-5a中存在的条件依赖关系。在介绍最大祖先图之前,我们先介绍混合图(Mixed Graph)和祖先图(Ancestral Graph)的概念。

定义1-4 混合图 混合图由三种基本类型的边组成:有向边(→或←)、双向边(↔)和无向边(-)。

例如,图1-6为定义在变量集V={A,B,C,H,E,F}上的混合图。如果两个变量之间存在一条边,则称这两个变量是邻接的。在混合图中,一条路径是指不同顶点{V1,V2,…,Vk}的一个序列,对于任意0<ikViVi+1是邻接的。如果给定一条路径,0<ik,都有ViVi+1,则称这条路径为有向路径。在图1-6中,{A,H,E,F}就是一条路径,而{A,H,B}是一条有向路径。

图1-6 混合图

在混合图中,如果存在ViVj,则ViVj的父节点,VjVi的孩子节点;如果存在ViVj,则ViVj的配偶节点,Vj也是Vi的配偶节点;如果存在Vi-Vj,则ViVj的邻居节点,Vj也是Vi的邻居节点;如果存在一条从Vi指向Vj的有向路径,则ViVj的祖先节点。在图1-6中,HBE的父节点,CE的配偶节点,FE的邻居节点,AE的祖先节点。

An(Vi)表示Vi的祖先节点集合,如果混合图中VjViViAn(Vj)同时存在,则混合图中存在一个有向环。在图1-6中,满足BAAAn(B),所以该混合图中存在一个有向环。如果混合图中VjViViAn(Vj)同时存在,则混合图中存在一个几乎有向环(Almost Directed Cycle)。在图1-6中,满足ECCAn(E),所以该混合图中存在一个几乎有向环。

定义1-5 祖先图 如果一个混合图满足下列条件,则该混合图被称为祖先图:

(1)混合图中不存在有向环;

(2)混合图中不存在几乎有向环;

(3)对于任意的无向边Vi-VjViVj在混合图中不存在父节点和配偶节点。

在祖先图中,ViVj表示ViVj的一个原因(或祖先),而Vj不是Vi的一个原因(或祖先)。ViVj表示Vi不是Vj的一个原因,而Vj也不是Vi的一个原因,ViVj之间存在一个隐变量。如图1-7所示,在图1-7a中不存在有向环,不存在几乎有向环,也不存在无向边,所以该图是一个祖先图,而在图1-7b中存在HFFAn(H)这个几乎有向环,因此该图是一个非祖先图。

图1-7 祖先图与非祖先图

定义1-6 对撞节点和非对撞节点(Collider and Non-Collider) 在祖先图中,给定一条路径π和节点Vi,如果π存在*→Vi←*,其中*表示任意的边缘标记>或-,则称Vi对撞节点;否则称Vi非对撞节点

在祖先图中,三元组ViVjVkViVjVkViVjVkViVjVkVj都是对撞节点。例如在图1-5b中,ABCBCHBC都是对撞节点

定义1-7 对撞结构或V-结构 在祖先图中,给定三元组{Vi,Vj,Vk},如果ViVj是邻接的,VjVk是邻接的,但是ViVk不是邻接的,则称该三元组构成非封闭的三元组。在一个非封闭的三元组{Vi,Vj,Vk}中,如果Vj是对撞节点且∃ZV\{Vi,Vj,Vk}满足ViVk|Z且﹁ViVk|{ZVj},则三元组{Vi,Vj,Vk}构成V-结构。

类似于DAG中的d-分离,祖先图通过一种称为m-分离的图形标准来表示变量之间的条件独立关系。

定义1-8 m-分离(m-Separation) 在祖先图中,给定一条路径π,如果条件集Z满足如下两个条件之一,则πZ阻断:

(1)π中存在一条子路径{Vi,Vj,Vk},Vj是一个非对撞节点且VjZ

(2)π中存在Vi*→Vj←*VkVjZZ中不存在Vj的子孙节点。

在祖先图中,节点ViVj被变量集ZV\{Vi,Vj}m-分离,当且仅当ViVj之间的所有路径都被Z阻断。

定义1-9 最大祖先图(Maximal Ancestral Graph,MAG) 如果一个祖先图G满足条件:对于图中每对不邻接的节点XY存在一个集合Z,使得XYZ上是m-分离的,则称该祖先图G为最大祖先图。

在最大祖先图中,每对不邻接的节点都对应一个条件独立性关系。由定义1-9可知,并不是所有祖先图都是最大祖先图。

例如,在图1-8a中,节点BH不邻接,但并不存在一个变量集合Z,使得B节点和H节点在Z上是m-分离的,所以它不是一个最大祖先图。如果在节点BH之间添加一条双向边↔使得节点BH邻接,得到图1-8b,此时图中所有节点都是邻接的,因此该图是最大祖先图。如果添加单向边BH,虽然所有节点也是相邻的,但是同时存在FHFAn(H)构成了一个几乎有向环,此时该图是一个非祖先图。同理,如果添加BH,则存在EBEAn(B),也构成了一个几乎有向环,此时该图也是一个非祖先图。

图1-8 祖先图与最大祖先图

众所周知,满足同样条件独立性和具有相同对撞结构的DAG对应同一个马尔可夫等价类。同理,隐变量和观测变量的独立性关系可能与多个MAG一致。MAG的等价类由部分祖先图表示。

定义1-10 部分祖先图(Partial Ancestral Graph,PAG) 在一个PAG中,一条边的两端可能有三种类型端点:

(1)不变箭头,记为“>”,表示等价类中的所有MAG在该端点处有一个箭头;

(2)不变尾部,记为“-”,表示等价类中的所有MAG在该端点处都有一个尾部;

(3)可变端点,记为“o”,表示等价类中的某些MAG在该端点处有箭头,而其他MAG在该端点处有一个尾部。

在PAG中,边“o→”表示等价类中的MAG在该位置可能有→或↔的边;边“o-o”表示等价类中的MAG在该位置有一条→、←、↔或-的边;边“-”表示是在所有等价的MAG中该边的方向是“-”。如图1-9c所示,部分祖先图中存在边Qo→S,那么它的等价类中的所有MAG在该位置可以有QSQS的边,同理,图1-9c中存在边Io-oS,那么它的等价类中的所有MAG在该位置可以有ISISI-SIS的边。图1-9c中存在边H-L,那么它的等价类中的所有MAG在该位置都应该存在边H-L,因此,图1-9a和图1-9b都是部分祖先图1-9c的等价类最大祖先图。

图1-9 等价类最大祖先图和部分祖先图