巴拉巴西网络科学
上QQ阅读APP看书,第一时间看更新

1.7 二分网络

二分网络(或二分图)是这样一种网络:其节点可以分成两个不相交的节点集合U和V,使得每个链接都连接着一个U中的节点和一个V中的节点。换句话说,如果我们把集合U中的节点涂成绿色,把集合V中的节点涂成紫色,则每个链接连接着颜色不同的两个节点(图1-9)。

图1-9 二分网络

一个二分网络包含两个节点集合U和V。集合U中的节点只和集合V中的节点直接相连。因此,集合U的节点之间不存在直接链接,集合V的节点之间同样也不存在直接链接。如图所示,任意二分网络都可以生成两个映射网络。其中一个映射网络映射到节点集合U上,如果U中的两个节点在二分网络中有链接指向V中同样的节点,则这两个节点在该映射网络中彼此相连。另一个映射网络映射到节点集合V上,如果V中的两个节点在二分网络中有链接指向U中同样的节点,则这两个节点在该映射网络中彼此相连。

对于每个二分网络,我们可以生成两个映射网络。第一个映射网络中,节点集合是U,如果U中的两个节点都有链接指向V中的同一个节点,则它们在该映射网络中有链接相连。与之类似,第二个映射网络对应着节点集合V上的一个网络(图1-9)。

网络科学研究中,我们会碰到很多二分网络。一个著名的例子是好莱坞电影演员网络,其中一个节点集合对应着电影(记为U),另一个节点集合对应着演员(记为V)。如果某个演员出演了某部电影,则二者之间有一个链接。该二分网络的一个映射网络是演员网络——出演过同一部电影的两个演员之间彼此相连(表1-1中列出的演员网络)。另一个映射网络是电影网络——至少有一个演员相同的两部电影彼此相连。

医药领域也有一个明显的二分网络:人类疾病网络。基因和疾病构成该二分网络的节点,链接刻画基因和疾病之间的因果关系(图1-10)。最后,我们还可以定义多分网络,例如由食谱、原料、成分构成的三分网络(图1-11)。

图1-10 人类疾病网络

(a)人类疾病网络的一个映射网络是基因网络:节点是基因,如果两个基因和同一种疾病相关,则它们在该映射网络中彼此相连。

(b)人类疾病网络是一个二分网络,包括疾病(记为U)和基因(记为V)两类节点。如果某个基因的突变导致了某种疾病,则它们对应的两个节点之间彼此相连[4]

(c)人类疾病网络的第二个映射是疾病网络:节点是疾病,如果两种疾病和同样的基因相关——由同样的基因突变造成,则它们在该映射网络中彼此相连。图a~c展示的是人类疾病网络的一个子集——和癌症相关的子集。

(d)完整的人类疾病网络包含1283种疾病和1777个疾病基因[1]。详细的人类疾病网络参见在线资源1.2

在线资源1.2 人类疾病网络

在这里可下载人类疾病网络的高分辨率版本[1],或者使用《纽约时报》构建的在线接口浏览该网络。

扫描二维码下载“湛庐阅读”App,回复书名,下载人类疾病网络的高分辨率版本。

图1-11 三分网络

(a)“食谱-原料-成分”三分网络的构造方式:第一个节点集合是食谱,例如马沙拉鸡(Chicken Marsala);第二个节点集合对应食谱的原料(例如,做马沙拉鸡所需的面粉、鼠尾草、鸡、白酒、黄油等原料);第三个节点集合表示成分——体现原料味道的化学成分。

(b)原料网络是图a所示三分网络的一个映射网络。每个节点表示一种原料,节点颜色表示食物的类别,节点大小表示原料的流行程度。如果两种原料有许多相同的成分,则它们对应的节点彼此相连。链接的粗细表示两种原料共同拥有的成分数目多少[11]