上QQ阅读APP看书,第一时间看更新
第一节 单倍型图
一、连锁不平衡和单倍型
连锁不平衡(linkage disequilibrium,LD)是等位基因在不同位点之间的非随机关联。通俗地讲,如果在两个单核苷酸多态性(single nucleotide polymorphism,SNP)位点之间存在连锁不平衡(如在两个基因座包含等位基因Aa和Bb),那么在人群中AB单倍型的频率偏离了它的预期频率(即人群中A等位基因和B等位基因频率的乘积)。通常连锁不平衡的强度随着遗传距离的增加而下降。有多种方法可以测量LD。其中r 2是用来测量两对等位基因之间的相关性最有用的方法。不同人群基因组中的LD存在较大差异。而在关联研究中要详尽地检测每个SNP既不可能,也不可取。此时,单倍型研究可以减少关联研究中基因分型的工作量,提供比单个SNP更为丰富的信息量,并且有助于低频率变异(最小等位基因频率<10%)信息的利用。所谓单倍型,是指位于一条染色体特定区域、相互关联、倾向于以整体模式遗传给后代的SNPs组合。
二、连锁不平衡的基因组结构
研究表明,部分人类基因组可通过常见SNPs之间的高度连锁不平衡划分为成块的序列,这些由连锁不平衡形成的序列有时与重组热点相对应。由于同区域的SNPs存在着强大的连锁不平衡,所以用于制图时,很多信息将是多余的。连锁不平衡区域还具有很低的单倍型多样性。例如,在Daly的两个连锁不平衡模块中的一个,两个单倍型占观察的染色体的96%。根据这些结果,我们在关联研究中可以用标签SNPs来表示某一模块中的常见单倍型。初步制图时,可以在LD的模块中定位有功能意义的变异和确定能够表示常见单倍型的SNPs集。这使标记方法更为经济,且可以分析大量数据。
标签SNPs的选择至关重要,需要确保在连锁不平衡的特定区域中的大多数的常见变异是可以被解释的。标签方法比以往的仅仅基于SNP距离的单倍型图谱更强大。
对人体基因组连锁不平衡模型的深入研究有可能揭示更多结构上的变异。尽管存在很明显的复杂性,标签依然能够有效地用来描述常见单倍型,甚至在连锁不平衡的区块缺失的情况下也是有效的(图2-1)。
图2-1 单倍型标签SNPs的说明
三、有功能意义的变异的频率
人类基因组单倍型图在识别那些对基因表现型仅有微量作用的罕见变异时是不能奏效的。常见疾病的常见变异(CDCV)假说指出,导致疾病易感性的变异的诸多基因成分是在人群中发生频率由低到高程度不等的变异所致。然而,在医学界对常见疾病的常见变异假说的有效性也存在着相当大的分歧。不管常见病易感性案例的真实性如何,有一点是很明确的:常见变异在药物反应方面起了很大作用。因此,相比其在常见疾病易感性的作用,基因在不同的药物反应中关联性影响更加突出。表2-1列出了心血管药物反应方面的常见变异的例子。
表2-1 与心血管药物反应有关或与心血管功能改变有关的常见变异以及发生频率(在显性基因等位片段的发生频率)
续表