酵母转录激活因子与DNA分子识别的研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 蛋白质与DNA分子识别研究的意义

蛋白质、核酸和糖是涉及生命活动本质的三类生物大分子,是维持生命机体正常运转的最重要的物质基础。核酸是遗传信息的携带者,为生命的外在形式提供了建设蓝图。而蛋白质则承担着各种各样复杂的生理功能,例如促进生物体内新陈代谢的催化作用、预防疾病的抗体、在体内起各种调节作用的激素、担负体内呼吸或运输的载体、接受并转换外界信号的受体,以及构成躯体的结构蛋白等。从整体上维持生物机体新陈代谢活动的进行。

细胞遵循化学规律,在细胞中完成具体功能的则是各种各样的蛋白质分子。蛋白质可以被看成一种分子机器,可以精确地实现特定的功能,例如血红蛋白的输氧功能、酶的专一性催化作用、抗体的特异性结合功能等等。这些功能的实现常常涉及蛋白质与各种生物大分子及生物小分子之间的分子识别作用。以基因的表达和调控为例,在生物体内,这是一个复杂的过程,首先涉及蛋白质对核酸的分子识别。

分子识别,是指生物大分子之间,以及生物大分子(受体)与配体之间的一种专一性的、非共价键相互作用的可逆结合。在两个分子的结合部位之间,其构象要能够相嵌互补,形成相当大的接触面积,或经过构象变化达到这一目的;并且两个分子的结合部位各有相应的化学基团,相互之间能产生足够的结合力,使两个分子结合起来[2]

1.1.1 蛋白质与DNA分子识别的规律

蛋白质与脱氧核糖核酸(即DNA)的分子识别可分为“一般识别”和“特异识别”。一般识别是由DNA分子和蛋白质分子的空间结构部件的维度和对称性的相容性决定的,表现为7Å(1Å=10-10m)重复距离和双重对称轴之间的相互识别。根据DNA和蛋白质二级结构中存在的7Å重复距离和双重对称轴的基本结构部件可有三种一般识别的结构模型:α螺旋与DNA之间的相互识别;反平行β片层与DNA之间的相互识别;伸展的多肽链与DNA之间的相互识别[3]

特异识别的基本因素是氢键的形成和立体接触效应,后者主要取决于胸腺嘧啶甲基的分布。蛋白质的α螺旋可识别并结合DNA的大沟,而反平行的β片层可识别DNA的小沟。

目前蛋白质晶体结构数据库(PDB)里已有200多个蛋白质-DNA复合物的晶体结构。系统分析这些结构表明,自由态DNA的构象及其与蛋白质形成复合物后的构象,以及蛋白质的构象在与DNA结合前后发生了很大的变化。B型DNA的构象变化由相对平滑的弯曲变形到显著弯曲直至碱基堆积作用的破坏[4~6],蛋白质的构象变化主要包括结构域或亚基四级结构的变化[7,8]、无规的loop区或N端残基的有序化[9,10],以及由自由态的伸展构象到α螺旋的形成[11~16]等。蛋白质与DNA分子识别的这种构象变化是基因信息传递、表达和调控的分子基础,导致构象发生变化的作用力主要有以下几种:

① 核酸分子中磷酸基团与带正电荷氨基酸残基侧链基团之间的静电作用;

② 核酸分子中的磷酸基团、糖基、碱基与蛋白质分子中亲水氨基酸侧链之间的氢键作用;

③ 芳香族氨基酸残基侧链基团与碱基之间的堆积作用;

④ 碱基与蛋白质中非极性氨基酸残基侧链之间的疏水作用;

⑤ 范德华力作用等。

1.1.2 蛋白质与DNA分子识别的意义

研究蛋白质与DNA分子识别的主要目标是研究基因调控的机制。核酸由两条互补的多聚核苷酸组成,两条链上的碱基主要借助氢键互相配对,使DNA分子形成稳定的右手双螺旋结构。细胞中大多数DNA以B型右手双螺旋结构存在,碱基对跨越两条包含脱氧核糖-磷酸骨架的链而沿螺旋呈阶梯形排布,由此不对称分布形成B型DNA的两个基本区:大沟与小沟。

以不同形式存在的DNA所表现的功能也不同,这种不同的DNA功能主要是通过识别具有一定的序列、并且固定在某个作用位点上的DNA结合蛋白来调控的。这种蛋白质称为序列特异性DNA结合蛋白。DNA结合蛋白主要是通过氢键在大沟中与DNA产生特异性结合的,伴随着蛋白质的结合,不仅蛋白质的构象发生较大变化,DNA的双螺旋结构也会发生较大程度的弯曲变形,DNA的弯曲变形加强了蛋白质与DNA之间的相互作用。

DNA结合蛋白在DNA的复制、重组、链裂解、基因转录等生命过程中起着极为关键的作用,与细胞周期中染色体的一系列变化有关,正是由于这些序列特异性的DNA结合蛋白的调控作用才产生了基因表达的组织特异性和细胞周期特异性等现象。因此,对蛋白质与DNA相互识别、相互作用的分子机制等问题深入细致地进行研究,对认识结构与功能的关系,揭示生命的奥秘,以及诊断和控制遗传性疾病都有着重要的意义。而且认识蛋白质与DNA分子识别的规律对于改造天然DNA的结合特异性、设计与特定DNA位点特异性结合的全新蛋白质分子也具有重要的理论和实践意义[17~25]

1.1.3 DNA结合蛋白的结构域类型

DNA结合蛋白与DNA结合的方式取决于结合结构域的类型。迄今为止,已经知道DNA结合蛋白和DNA的结合主要有以下几种具有显著特征的结构类型:

(1)螺旋-转折-螺旋结构域(helix-turn-helix,HTH)[26,27]

HTH结构域约含20个氨基酸残基,两股α螺旋(螺旋2和螺旋3)以120°的转角连接。第三个螺旋(螺旋1)起稳定HTH构象的作用。螺旋3与DNA大沟特异性结合,它称为识别螺旋。它或者通过水分子直接使氨基酸残基的侧链基团与碱基形成氢键,或者与DNA骨架的磷酸基团形成氢键。这种结构域通常以二聚体的双重对称轴与具有回文结构的DNA位点特异性结合,使复合物中二聚体的双重对称轴与DNA回文序列的双重对称轴相容。

大多数原核生物基因转录的调节蛋白属于这种类型,例如:λ阻遏蛋白、λCro蛋白、代谢降解物激活蛋白(CAP)、Hin重组酶(Hin recombinase或invertase)、Lac阻遏蛋白等。真核细胞中,控制果蝇早期发育的同源异形结构域(homeodomian)中也发现了HTH构象。

(2)β折叠片结构域[28~30]

目前已经发现两类蛋白通过β折叠片结构域与DNA相互作用。一类是大肠杆菌MetJ阻遏蛋白和沙门氏菌噬菌体P22的Arc阻遏蛋白等,在这种结构域中,反平行排列的β片层由两个单体N末端的β片层反平行对称排列形成,位于DNA大沟之中。每个单体C末端含两股α螺旋片段,它的作用是稳定二聚体,形成一个核心区,使β结构域嵌入大沟的核心区。肽链的其他残基结合DNA分子骨架的磷酸基团,有助于蛋白质-DNA复合物的稳定。另一类的代表是细菌中的HU蛋白,其β结构域是由单体本身C端1/3肽链部分以突环的方式形成的。

(3)锌指结构域(zinc finger,ZF)[31]

Miller等人发现非洲爪蟾转录因子TFⅢA分子中存在连续九次重复的保守序列,每个重复序列的空间结构中有一个锌离子,锌离子与His和Cys以配价键结合[32]。这种空间结构称为锌指结构域。含锌指的蛋白质具有以下保守序列:OXCX2-4CX3OX5OX2HX3-4HX2-6,根据锌指的组成和结构不同,锌指结构域可以分为不同的类型:C2/H2型锌指结构域、C2/C2型锌指结构域、C6型锌指结构域、CC/HC型锌指结构域、锌带(Zn ribbon)型锌指结构域。

(4)螺旋-连接-螺旋结构域(helix-loop-helix,HLH)[33]

免疫球蛋白基因的增强子结合蛋白E12、E47及Myo、N-myc、C-myc等的DNA结合区中都存在两股两亲性α螺旋,由长短不同的肽链loop连接,N末端区内含有保守的碱性和极性氨基酸。α螺旋中的一些疏水性氨基酸分布在螺旋的一侧,两亲性螺旋是二聚体形成和结合DNA的必要条件。

螺旋-连接-螺旋结构域通常与亮氨酸拉链结构域连接,构成碱性区-螺旋-连接-螺旋-拉链(basic-helix-loop-helix-zipper,bHLH-ZIP)型结构域。这种结构域可分为两个部分,碱性区-螺旋1(basic-helix 1)和螺旋2-拉链区(helix2-zipper)。前者是DNA的识别区域,后者是二聚体形成的结构域,两部分由环状肽段连接起来。

近年来发现的调节蛋白C/EBP、GCN4和核转化蛋白Fos、Jun中的“亮氨酸”型结构域也是DNA结合蛋白中的一种典型的结构域。其中具有“亮氨酸”型结构域的GCN4蛋白结构简单、功能独特,成为研究的热点。