生命通史
上QQ阅读APP看书,第一时间看更新

第十一节
蛋白质的“路牌”

真核细胞中各种细胞器的出现使得细胞中的生理功能有巨大的提升。不同的细胞功能在不同的细胞器中进行,不仅避免了互相干扰,效率也大大提高。例如细胞核可以按需要合成所需要的mRNA并对其进行加工,在内含子被剪切掉还“穿靴戴帽”以后,才被“释放”到细胞质中指导蛋白质的合成。线粒体是细胞的“动力工厂”,燃料分子在这里被彻底氧化,变成二氧化碳和水,被释放出来的能量则被用来合成ATP。叶绿体是进行光合作用,合成有机物的地方。而溶酶体是细胞的“胃”和“回收中心”。不过这种状况也带来一个问题:这些细胞器所需要的蛋白质是如何找到自己的“工作场所”的?原核细胞的内部是不分区间的,里面的分子可以在整个细胞里面跑来跑去。真核细胞的内部分区间后,如果没有专门的机制让各种蛋白质找到各自的“家门”,就会造成混乱。例如细胞核中的组蛋白跑到不需要组蛋白的线粒体中去,线粒体里面的蛋白质跑到叶绿体中去,那岂不乱套?可是细胞里面又没交通警察来指挥蛋白质分子往哪里走,蛋白质分子怎么能够找到自己的路呢?

为了让蛋白质“各得其所”,真核细胞发展出多种复杂的机制来引导不同细胞器的蛋白质只去自己的目的地。机制虽然复杂,总的原则是让这些蛋白质携带上自己的“路牌”,以便让“有关单位”认识和放入。蛋白质分子到达自己的目的地主要通过两条通路:通过细胞质运动和通过膜包裹的小囊运输。在前一节中,我们已经简要介绍了蛋白质被送往溶酶体、细胞表面以及分泌到细胞外的途径,在这一节中,我们将系统地介绍蛋白质到达自己工作场所的机制。

目的地是细胞核、线粒体和叶绿体的蛋白质是走细胞质这条路的。这些蛋白质被游离在细胞质中的核糖体合成,然后被释放到细胞质中。这些蛋白质合成后不会经过进一步的修饰(例如加上糖基或去掉一些氨基酸),但是常常在其他蛋白质的“护送”下,移动到所要去的细胞器。这些蛋白质本身所带的信号(一些特殊的氨基酸序列)决定它们由哪些蛋白质护送到该去的细胞器中去。

细胞核

细胞核不合成任何蛋白质,所以细胞核里面的蛋白质都是在细胞质中合成,再进入细胞核的,包括与DNA结合的组蛋白、在核膜内面形成网状结构的核纤层蛋白(lamin)、参与细胞核中各种结构形成的核质蛋白(nucleoplasmin)等。细胞核由两层膜包裹,所以物质进出细胞核是通过横穿两层核膜的核孔(nuclear pore)这个通道进行的。核孔是由三十多种蛋白质,数百个蛋白质分子组成的环状通道,外径约129纳米,内径几纳米,可以让小分子自由通过,但是许多蛋白质要进入细胞核就需要“路牌”,或“通行证”。

这个“路牌”,就是蛋白质分子氨基端(即蛋白质被合成时开始的那一端,带有氨基酸的自由氨基)上一串特殊的氨基酸序列。这个序列可以是7个氨基酸残基的序列,中间有5个连续的带正电的氨基酸残基,例如脯-赖-赖-赖-精-赖-缬(其中带正电的氨基酸名称用粗体字表示,“氨酸”两个字省略),也可以是两组由两个带正电的氨基酸残基组成序列,中间被10个其他氨基酸残基隔开,例如--天冬-谷-缬-天冬-甘-苏-天冬-谷-缬-丙----丝。改变这些带正电的氨基酸,例如用不带正电的氨基酸代替,蛋白质就会留在细胞质中,不再进入细胞核。反之,如果把这些信号序列引入到本来是位于细胞质中的蛋白质序列中去,例如丙酮酸激酶,这个蛋白质就会被转运到细胞核中去,说明这些序列的确是蛋白质进入细胞核的“入核信号”,或“路牌”。

仅从这些氨基酸序列,还不容易看出这些信号的意义。但是如果我们看一下这些序列的空间结构,它们的特点就变得明显了。蛋白质分子中氨基酸之间相互连接的肽键是由氨基和羧基之间脱去一个水分子形成的,结构是—CO—NH—。其中的氧原子带一些负电,氮原子上面的氢原子带一些正电。如果肽链能够卷曲成为一个螺旋管,一个这样的氧原子就可以和后面(羧基端方向)第三个肽键上的氢原子之间形成氢键。这样形成的螺线管结构叫做 α 螺旋,其中每3.6个氨基酸单位旋转一圈(参看图2-5)。每个氨基酸残基的侧链向外伸出,好像狼牙棒上的“牙齿”。了解了α-螺旋的结构,上面说的蛋白质进入细胞核的“路牌”的结构就清楚了。连续5个带正电的氨基酸的侧链会在 α-螺旋外部形成一个带正电的螺旋,是一个很明显的空间特征。而被10个氨基酸单位隔开的正电氨基酸组在 α-螺旋中就是排列在螺旋同一侧的两处正电区域,因为11个氨基酸差不多正好转3圈。这就好像圆柱的同一侧有两个相隔不远的正电区域,也是一个明显的空间信号(图3-28左)。

图3-28 蛋白质进入细胞核的过程。左图显示进核信号的空间结构

光有“路牌”还不够,还要有能够认识这个路牌的机制。这是由一种叫做输入蛋白-α(importin- α)来实现的。输入蛋白-α 能够识别蛋白质分子上的“入核信号”并且与之结合。接着,输入蛋白-α 和输入蛋白-β(importin-β)结合,输入蛋白-β又会被核孔上的蛋白质“认识”,这样要进入细胞核的蛋白质就在输入蛋白-α和-β的“护送”下,经过核孔进入细胞核。到细胞核里面以后,一种叫做RanGTP(结合了GTP的Ran)的蛋白质结合于输入蛋白-α和-β上,使它们离开被输入的蛋白质,这个蛋白质就被释放到细胞核里面了。在蛋白质进入细胞核以后,构成“路牌”的氨基酸序列仍然是蛋白质的一部分,不会被除掉。

和RanGTP结合的输入蛋白-α和输入蛋白-β在CAS 蛋白(cellular apoptosis susceptibility protein)的帮助下返回细胞质,在那里RanGTP把其中的GTP水解为GDP,使输入蛋白-α和-β与Ran蛋白分开。输入蛋白-α和-β又可以结合新的蛋白质分子并将其输入到细胞核中去。RanGDP在得到高能磷酸键变回RanGTP后,又回到细胞核中解离更多的输入蛋白-α和-β。虽然输入蛋白-α和-β护送蛋白质通过核孔进入细胞核时不需要额外提供能量,但是RanGTP/RanGDP在运送输入蛋白-α和-β回细胞质的循环中要消耗两个分子的GTP,所以整个运输过程还是需要能量的。通过这种机制,每对输入蛋白每秒钟可以输送约1000个蛋白质分子进入细胞核。这个速度虽然快得令人难以想象,但是看一下细胞里面分子激烈运动的情形(见第二章第十四节,喧闹中的秩序),这个效率就可以理解了。

线粒体

线粒体含有大约1000种蛋白质,其中99%为这些蛋白质编码的基因都已经转移到细胞核的DNA里面去,所以这些基因的产物(蛋白质)也就必须先在细胞质中合成,再输送到线粒体里面去。而线粒体是由两层膜包裹的,这些膜也不像细胞核的膜那样上面有孔,否则为合成ATP所需要的跨膜氢离子浓度梯度就会散失。因此,在细胞质中合成的蛋白质要进入线粒体,就必须穿过两层完整的膜,才能到达线粒体的内腔,即基质(matrix),这就需要这两层膜上都有让蛋白质穿过的通道,蛋白质自身也必须有某种“路牌”,才能被线粒体识别和接纳。这个进入线粒体的“路牌”,就是在蛋白质的氨基端上另外加上的15~55个氨基酸单位长的信号肽。这些信号肽含有不连续的带正电的氨基酸残基,例如赖氨酸和精氨酸,它们之间被亲脂的氨基酸残基隔开。这样的信号肽形成 α-螺旋时,带正电的氨基酸侧链都排列在螺旋的同一侧,而亲脂的侧链排列在螺旋的另一侧(图3-29左下)。这种“双重性质”的信号段也是一个很容易辨认的目标。为了使这个空间性质尽可能地明显,这个信号段里不含有带负电的谷氨酸和天冬酰胺。

图3-29 蛋白质进入线粒体路线图。上图显示蛋白分子进入线粒体基质的过程,下图显示蛋白进入线粒体外膜的过程

线粒体的外膜上含有专门的蛋白质输入通道,叫做外膜通道(TOM)。TOM由多个蛋白亚基组成,能够识别输入蛋白质的“路牌”并让其通过。与核孔内径有数个纳米,可以让已经卷曲的蛋白质进入不同,这些线粒体通道非常狭窄,不能够让已经卷曲成三维结构的蛋白质通过,所以要进入线粒体的蛋白质只能在未卷曲的状态下像一根绳子那样穿过通道。但是这样一来,蛋白质的亲脂区段就会暴露出来,容易彼此交缠形成沉淀。为了防止这种情况,这些蛋白质在进入线粒体之前,先要和一种伴侣蛋白(chaperone)结合,掩盖其亲脂的部分,使肽链保持伸展状态而不因交缠而沉淀。由于温度升高时,蛋白质也容易变性沉淀(一个极端例子是把鸡蛋煮熟时的蛋白变性),这些伴侣蛋白可以起到防止其他蛋白质变性沉淀的作用,增加细胞的生存能力,所以这些蛋白也被称为热激蛋白(heat shock protein,简称Hsp)。保护要进入线粒体的蛋白质,并且将它们护送至线粒体的伴侣蛋白就是热激蛋白Hsp70,其中的数字70是指蛋白质的相对分子质量,以千为单位,所以Hsp70的相对分子质量是70000。蛋白质在细胞质中合成后,它就立即与其结合,再向线粒体移动,从TOM进入线粒体。

线粒体的内膜上也有让蛋白质进入的通道,叫内膜通道(TIM),TIM也由多个蛋白亚基组成,输入蛋白质也只能以伸展的肽链的方式通过TIM。在一般情况下,线粒体的内膜和外膜是被膜际空间(intermembrane space)分开的。为了提高蛋白质进入线粒体内部的效率,内膜和外膜在一些地方彼此靠近接触,位于外膜和内膜上的蛋白质转运通道TOM和TIM可以彼此接触和相互作用。这样蛋白质在经过外膜通道后,可以立即再穿越内膜通道,进入基质(图3-29上)。

蛋白质进入基质后,肽链仍然处于伸展状态,因而是不稳定的。它们需立即结合在另一个Hsp70分子上,以防止交缠沉淀。Hsp70接着把肽链转移给Hsp60。Hsp60是一个由14个蛋白亚基组成的圆筒形结构,将肽链装在圆筒内。这14个亚基都结合有ATP分子,ATP的水解提供能量使肽链脱离Hsp60并且卷曲成三维结构。位于基质中的一种蛋白酶把信号肽从蛋白质分子上切掉,蛋白质进入线粒体基质的过程就算是完成了。位于基质中的蛋白质,例如醇脱氢酶,就是这样进入的。

从这个过程可以看出,蛋白质进入线粒体基质和进入细胞核有相似之处,即都在细胞质中合成,都有伴侣蛋白护送至目的地,都要跨越两层膜,都有自己的“路牌”,即位于氨基端信号区段。不同的是,蛋白质进入细胞核是在卷曲的状态下,而进入线粒体的蛋白质必须在伸展的状况下;伴随蛋白质进入细胞核的输入蛋白-α 和-β结合的作用仅仅是“引路”,而伴随蛋白质进入线粒体的Hsp70则是稳定未折叠的结构,防止它交缠沉淀;进入细胞核的蛋白质信号区段不被切掉,而进入线粒体的蛋白质信号肽是要被切掉的。

进入线粒体的蛋白质不都是进入基质的。有的要进入线粒体外膜,有的要进入两层膜之间,有的要进入内膜。这些蛋白质也都有各自的“路牌”。进入线粒体外膜的蛋白质在其跨膜区段也有专门的信号,在通过位于外膜上的TOM进入到两膜之间后,再通过小蛋白分子的帮助,通过外膜上的分类组装复合物(sorting and assemblymachinary,简称SAM)插入到外膜中去(图3-29下)。进入内膜的蛋白质在其跨膜区段有进入内膜的信号,包括一连串亲脂的氨基酸残基。进入到两层膜之间后,在一些小蛋白分子的帮助下通过内膜上另一个TIM插入内膜,这些亲脂氨基酸组成的区段就是蛋白质穿越内膜的部分。进入两层膜之间的蛋白质有富含半胱氨酸残基的信号段,进入两层膜之间后结合于膜间装配复合物(mitochondrial intermambrane spaceimport and assembly,简称MIA),然后就停留在那里。因此蛋白质进入线粒体的不同部位是一个非常复杂的过程,牵涉到几十种蛋白质,而且去每个目的地都有自己特殊的“路牌”。

叶绿体

和线粒体类似,叶绿体也是被吞入的原核细胞(蓝细菌)演变成的细胞器,它的大部分基因也被转移到寄主细胞的细胞核中,所以这些被细胞核DNA编码的叶绿体蛋白质也必须先在细胞质中合成,再被转移到叶绿体中。

和线粒体的蛋白质穿膜类似,要进入叶绿体的基质(stroma)区域也必须穿过两层膜,即叶绿体的外膜和内膜。穿过两层膜的地方也是这两层膜能够彼此接触的点,在这里位于外膜上的转运通道——叶绿体外膜转运通道(TOC)和位于内膜上的转运通道——叶绿体内膜转运通道(TIC)能够互相作用,快速将蛋白质连续转运到基质中去。与线粒体内外膜的转运通道TOM和TIM相似,TOC和TIC也由多个蛋白亚基组成。

进入叶绿体基质的蛋白质也必须以链伸展的形式通过膜上的转运通道,所以它们在细胞质中被合成以后,并不卷曲成最后的三维结构,而是和伴侣蛋白Hsp70结合,在这些蛋白质的陪伴下向叶绿体移动,并且被膜上的转运通道识别,再被转移到叶绿体内的基质中去。

要进入叶绿体基质的蛋白质在其氨基端也有附加的信号肽,在进入基质后信号肽也被剪除。信号肽的长度为30个到100多个氨基酸残基不等,而且不同蛋白质的信号肽彼此不同。迄今为止,科学家还没有能够找出这些信号肽的共同特点(图3-30)。

图3-30 肽链进入叶绿体基质的机制

和线粒体类似,进入叶绿体的蛋白质除了进入基质外,还有叶绿体的其他地方,例如叶绿体的外膜、内膜、两膜之间。除此之外,叶绿体还有类囊体(thylakoid),即位于基质内,由膜包裹的囊状物,是进行光合作用的地方,有些进入基质的蛋白质还要进入类囊体的膜和类囊体的腔(lumen)。所以进入叶绿体的蛋白质的去向比线粒体里面要多,更需要不同的信号和识别机制。例如进入类囊体的蛋白质除了在氨基端有附加的进入基质的信号肽外,还含有进入类囊体腔的信号肽。这些蛋白质在进入基质后,进入基质的信号肽被切除,进入类囊体腔的信号肽就成为新的氨基端,指导蛋白链通过内囊体膜进入类囊体腔。

叶绿体上负责识别“路牌”和转运蛋白质的转移通道在所有进行光合作用的真核生物中都是相同的:在叶绿体的外膜上是Toc75,在叶绿体内膜上是Tic20、Tic22、Tic110。如果不同生物中的叶绿体是各自形成的,这些基因转入细胞核的蛋白质的转运机制不会如此相同。这些蛋白质的基因,除了Tic110以外,都可以在蓝细菌中找到,说明蓝细菌有把光合作用所需要的蛋白质转运到类囊体膜(thylakoid membrane)的机制,也说明叶绿体的确是从蓝细菌衍生而来的。而Tic110是蓝菌被真核细胞吞进后才出现的基因,为所有的叶绿体所共有。

真核细胞里面的蛋白质要到达目的地,除了通过细胞质外,还有另外一条道路,那就是进入细胞内的膜系统,在那里被修饰后,被膜包裹成小囊泡输送到目的地。小囊运输这种方式的出现,主要是因为真核细胞有三大类蛋白带有糖基,都需要在内质网和高尔基体的腔内糖基化。进入内质网和高尔基体的腔内的蛋白质,它们的转运必须通过小囊运输。

蛋白质进入内质网的“路牌”

由于在蛋白质分子上添加糖基的酶都位于内质网和高尔基体内,要被糖基化的蛋白质必须先进入内质网的腔内,或者插入内质网的膜,使部分肽链位于内质网腔内。为此,这些蛋白质都具有进入内质网的“路牌”——一段位于蛋白质氨基端上的信号肽。这段信号肽含有一串亲脂的氨基酸残基,前面带有一个或几个带正电的氨基酸残基。在这段信号肽被核糖体合成并且伸出核糖体之外时,被细胞质中的信号识别颗粒(signal recognition particle,简称SRP)识别并且与之结合。这时蛋白合成暂时减缓,让SRP带着核糖体在内质网膜上寻找SRP受体。一旦SRP与内质网膜上的受体结合,已经合成的信号肽就会进入内质网膜上的蛋白转运通道。这时蛋白质的合成过程恢复,新合成的肽链一边合成一边从蛋白转运通道进入内质网腔内。信号肽会被腔内的信号肽酶切掉,所以信号肽不是蛋白质最终的组成部分,类似于进入线粒体和叶绿体的信号肽。(图3-31)。

图3-31 蛋白质进入内质网腔的过程

在蛋白质被转运到内质网腔内的过程中,腔内的糖基转移酶就会在肽链上寻找加糖基的信号,例如往天冬酰胺残基上加糖链的“天冬—X—丝或苏”(DXS/T)信号。一旦信号被找到,糖链就会被加到肽链上,而不等到整个蛋白质分子都被转运完毕。在肽链被转运过膜的过程中,进入腔内的肽链部分就开始卷曲折叠。被卷曲到蛋白质分子内部的“天冬—X—丝或苏”信号就不再能够被识别,所以不是所有的“天冬—X—丝或苏”信号都会导致糖基化,只有那些暴露在蛋白质分子表面的“天冬—X—丝或苏”信号才会导致糖基化。在高尔基体中,这个糖链再以各种形式被修饰,去掉一些单糖或加上更多的单糖,就要看该细胞的高尔基体中所含的糖链修饰酶的种类。O-糖基化没有事先合成好的糖链被加到蛋白质分子上,而是每次加减一个糖分子,其识别信号目前还不清楚。

合成这些蛋白质的核糖体是附着在内质网膜上的,使这部分的内质网膜显得粗糙,称为糙面内质网,而合成经由细胞质转运的蛋白质的核糖体是游离在细胞质中的。这种现象使人怀疑这两种核糖体是否有什么不同。其实这两种核糖体之间并无区别。核糖体是否附在内质网膜上,取决于被合成的蛋白质是否有进入内质网的信号肽。如果有,在蛋白质合成开始后,信号肽就会通过SRP把核糖体带到内质网膜上。所以信号肽不但能够决定自己进入内质网,还能通过能够识别这个信号的SRP“指挥”核糖体附着在内质网膜上,把蛋白质合成-蛋白质跨膜转运结合成为一个过程。

糖化的蛋白质的“路牌”

如前所述,进入内质网的蛋白质有三大类,分别是进入溶酶体的蛋白、去细胞膜的蛋白以及分泌到细胞外的蛋白。它们使用共同的“路牌”进入内质网被糖基化,那么它们后来不同的去向又是如何被决定的呢?这也是由蛋白质自身携带的信号决定的。

进入内质网腔的蛋白要被转运出去,首先要保证它们不被留在内质网内。但是有些蛋白的最终目的地就是内质网腔,例如给进入内质网腔的蛋白质加上糖基的酶就需要在内质网腔中工作。这些留在内质网腔里面的蛋白质都有一个在那里工作的“工作证”,那就是蛋白质中由4个氨基酸残基组成的序列“赖-天冬-谷-亮”(用氨基酸的单个字母表示就是KDEL)。有这个“工作证”的蛋白质会留在内质网腔内。没有这个“工作证”的蛋白会被转运出去。

这些蛋白质没有在内质网中的“工作证”,在糖基化后被送到高尔基体中去。如前所述,这些蛋白质在高尔基体内会被做一个“记号”,这就是在糖链中甘露糖的第6位碳原子上加上一个磷酸根。形成的“6-磷酸甘露糖”,这就是进入溶酶体的“路牌”。它被位于高尔基体膜上的“6-磷酸甘露糖受体”识别,将它们与膜联系在一起。这些蛋白质随后聚集在反面高尔基体膜的一个小区域内,这部分膜再突起分裂出去形成输送小囊,运送至溶酶体。小囊的膜与溶酶体的膜融合,就把这些蛋白质释放到溶酶体腔里了。

插入内质网膜,但是停留在膜上的蛋白质除了氨基端的信号肽外,在后面还有由另一连串亲脂氨基酸残基组成的区段。这就是一个“停止转运”的信号,肽链转运到这里就会停止,让蛋白质成为插入膜上的蛋白,再通过小囊运输和与细胞膜融合,进入细胞膜。

有些蛋白质既没有留在内质网中的“路牌”,又没有去溶酶体的“路牌”。这些蛋白质即使被糖基化了,糖链上面也有甘露糖单位,这些甘露糖也不会被磷酸化,所以不会去溶酶体。这些蛋白质分子就被高尔基体“打包”,由小囊运输到细胞膜,小囊的膜与细胞膜融合,这些蛋白质就被释放到细胞外,成为细胞分泌的蛋白质。