DNA含有所有蛋白质分子结构的信息,每种蛋白质在DNA分子中也都有为自己编码的区段。为了有选择性地只生产某些蛋白质,而不生产另一些蛋白质,DNA为每个蛋白的编码区段都装上“开关”,只有当开关开启时,这部分编码区段才被转录为mRNA。
这个“开关”,就是一些起控制作用的DNA序列,通常位于编码序列的前方(5'方向)。它们能够结合一些蛋白质分子,决定这部分的编码区段是否被转录,例如,序列GGGCGGG能够结合一种叫SP1的蛋白质,序列AGTCACT又能够结合一种叫AP1的蛋白质。控制序列一般含有多个蛋白结合点,这些被结合的蛋白质彼此协同,共同决定RNA聚合酶是否能结合到这段DNA上,开始转录。
这些具有调控功能的蛋白质由于与转录过程有关,被称为转录因子,上面说的SP1和AP1都是转录因子。有的转录因子可以使转录过程开始,相当于把基因“打开”,叫作激活因子;有的转录因子能阻止转录过程的开始,相当于把基因“关闭”,叫作阻遏因子。含有转录因子结合点的DNA区段控制转录过程是否启动,叫作启动子。为不同的蛋白质编码的DNA区段有不同的启动子,结合不同的转录因子,这些为蛋白质编码的DNA序列就可以选择性地被转录了。
编码区段加上它的“开关”,即启动子区段,就组成一个基因,所以基因就是带有开关的、为蛋白质编码的DNA区段。基因的“开关”被打开时,基因编码的蛋白质能被合成,叫作这个基因的表达,意思是基因中的信息被释放出来,被实现了。基因的开关被关闭,编码的蛋白质不能被合成,叫作基因的沉默。
在原核生物中,常常是几个功能相关的基因彼此相连,共用一个启动子,这样启动子就可以同时表达一组功能相关的基因。这种由一个启动子控制几个基因的DNA结构叫作操纵子,大肠杆菌的乳糖操纵子就是基因表达随食物种类变化的好例子。
大肠杆菌最喜欢的食物是葡萄糖,但它也能食用乳糖。大肠杆菌中有三个和利用乳糖有关的基因,它们依次相连,共用一个启动子,组成乳糖操纵子。在没有乳糖的情况下,一个阻遏因子结合在转录开始的地方(DNA序列为TGGAATTGTGAGCGGATAACAATT,即阻遏序列),阻止RNA聚合酶的工作,这样利用乳糖的蛋白质就不能被合成,以免浪费资源去生产用不到的蛋白质。在有乳糖的情况下,乳糖变成的异乳糖能结合在阻遏因子上。异乳糖的结合使阻遏因子的形状改变,不能再结合在DNA上,这样RNA聚合酶就可以结合在DNA上面,开始转录,进而生产利用乳糖的蛋白质。当环境中乳糖消失时,阻遏因子又可以再结合在阻遏序列上,阻止利用乳糖的基因表达(图2-10)。
基因调控机制的建立,是原核生物的伟大发明,地球上的生物因此才能根据需要合成自己需要的蛋白质分子,对外界环境的变化做出反应。
图2-10 大肠杆菌的乳糖操纵子