购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

二、基因的概念与结构

随着现代生物学的不断发展,人们意识到生药学的发展迫切需要在基因、蛋白质等生物分子水平来阐释诸多问题,如道地药材形成的分子机制、濒危中药资源的遗传多样性保护等。基因的研究极大地推进了分子生物学技术在生药学领域的应用。

(一)基因的概念

1953年,Waston和Crick提出DNA双螺旋结构以后,人们对基因的本质有了进一步的认识,即基因是具有遗传效应的DNA片段。1955年S.本泽发现在一个基因内部的许多位点上可以发生突变,并且可以在这些位点之间发生交换,从而说明一个基因是一个功能单位。另外,一个基因可以包括许多突变单位(突变子)和许多重组单位(重组子),因此它并不是一个突变单位和一个交换单位。在RNA病毒发现后,对基因的存在方式有了更深入的认识,发现其不仅只存在于DNA上,还存在于RNA上。

在现代生物学中,基因(gene)是指携带有遗传信息的DNA或RNA序列,是控制性状的基本遗传单位。基因通过其表达产物RNA和蛋白质来执行各种生命活动,从而控制着生物个体的性状。

(二)基因的结构

基因是由成百上千个核苷酸对组成的,大致可以分为编码区和非编码区两个不同的区段。在基因表达过程中,不同区段所起的作用并不相同。编码区中储存着遗传信息,可以指导蛋白质的合成。非编码区一般为起调控作用的DNA序列。原核生物的基因是连续的,其中,能转录为相应的信使RNA(mRNA)进而指导蛋白质合成的序列称为编码区(coding region);编码区之外不能转录为信使RNA的序列称为非编码区(noncoding region)。编码区的侧翼存在5′端非翻译区(5′ untranslated region,5"UTR)和3′端非翻译区(3′ untranslated region,3′UTR),这些序列往往具有调控功能。

真核生物的基因其结构更为复杂(图2-2)。真核生物的编码区是不连续的,包括外显子(exon)和内含子(intron)。非编码区包括:位于编码区上游的前导区,相当于mRNA 5′末端非编码区;位于编码区下游的尾部区,相当于mRNA 3′末端非编码区;以及包括启动子和增强子等的调控区。

图2-2 真核生物的基因结构

在编码区内能编码蛋白质的序列(外显子)被不能编码蛋白质的序列(内含子)分隔开来,成为一种不连续的形式,称为断裂基因(split gene),也就是说能够在成熟mRNA分子中保留的序列在结构基因中是不连续的。这一点是真核细胞与原核细胞基因的本质区别。

1.外显子与内含子 参与编码蛋白质的序列称为外显子,是基因表达为多肽链的部分;非编码序列称为内含子。每个外显子和内含子的交界处都有一段高度保守序列(consensus sequence),内含子5′末端多数以GT开始,3′末端多数以AG结束,称为GT-AG法则,是普遍存在于真核基因中RNA剪接的识别位点。

2.调控区域 侧翼顺序(flanking sequence)是指在第一个外显子和最末一个外显子的外侧的一段不被翻译的非编码区,侧翼顺序具有基因调控的功能,主要包括启动子、增强子、终止子等。

(1)启动子 启动子(promoter)是基因结构中位于编码区上游的核苷酸序列,称为上游启动子,不被转录。也有一些启动子的DNA序列位于转录起始位点的下游(如tRNA、5s rRNA基因启动子),称为下游启动子,能够被转录。启动子能够被RNA聚合酶准确地识别,作为RNA聚合酶结合位点,同时也是转录的起始点,能够调节控制遗传信息的表达。启动子包括下列几种不同的序列。

①TATA框:TATA框(TATA box)是构成真核生物启动子的元件之一,其一致序列为5′-TATAATAAT-3′,位于基因转录起始点上游30~50bp处,基本是由A-T碱基对所组成,能够精确地决定基因转录的起始。在转录起始的过程中,转录因子先与TATA框牢固结合,形成稳定的复合物,再与RNA聚合酶结合,才能开始转录。

②CAAT框:CAAT框(CAAT box)是真核生物基因常有的启动子元件,其一致序列为5′-GGGTCAATCT-3′,CAAT框位于转录起始点上游80~100p处,可能也是RNA聚合酶的一个结合位点,控制着转录起始的频率。

③GC框:GC框(CC box)通常具有两个拷贝,位于CAAT框的两侧,由5′-GGGCGG-3′组成,GC框是一个转录调节区,具有激活转录的功能。

(2)增强子 增强子(enhancer)位于真核基因转录起始点的上游或下游,它不能启动一个基因的转录,但是具有增强转录的作用。增强子序列能够通过与特异性细胞因子结合对转录的进行起到促进作用。通常情况下,由于不同细胞核与增强子结合的特异性细胞因子不同,所以增强子具有组织特异性。

增强子具有下列特点。

①远距离效应:增强子一般位于基因上游100~300bp处,但是能够对远处启动子的转录起到增强的作用,有时即使相距几个kb以上也能发挥作用。

②无方向性:增强子无论位于靶基因的上游、下游或内部都能够发挥增强转录的作用。

③顺式调节:增强子只调节位于同一染色体上的靶基因,而对其他染色体上的基因没有作用。

④无物种和基因特异性:增强子可以连接到异源基因上发挥作用。

⑤具有组织特异性:SV40的增强子在3T3细胞中比多瘤病毒的增强子要弱,但在HeLa细胞中SV40的增强子比多瘤病毒的要强5倍。

⑥有相位性:增强子的作用与DNA的构象有关。

(3)终止子 终止子(terminator)是位于基因末端非编码区的一段特定核苷酸序列,具有特殊的碱基排列顺序,能够阻碍RNA聚合酶的移动,并且能使RNA聚合酶从DNA模板链上脱离下来,终止转录。终止子的共同序列特征是在转录终止点之前有一段7~20bp的回文序列,回文序列的两个重复区域分别由几个不重复碱基对组成的节段隔开。回文序列的对称轴一般距转录终止位点16~24bp。在回文顺序的下游有6~8个A-T对,因此,这段终止子转录后形成的RNA具有发夹结构,并具有与A互补的一串U,因为A-U之间氢键结合较弱,因而RNA/DNA杂交部分易于拆开,这样对转录物从DNA模板上释放出来是有利的,也可使RNA聚合酶从DNA上解离下来,实现转录的终止。

(4)沉默子 沉默子(silencer)是一段能够与多个转录因子结合、阻遏基因转录的DNA序列,沉默子与增强子对DNA转录的加强作用相反,沉默子DNA序列与阻遏蛋白结合后,会阻碍RNA聚合酶转录DNA序列,进而阻碍RNA翻译为蛋白质的过程,因此,沉默子可以阻碍基因的表达。

(5)绝缘子 绝缘子(insulator)是指限制启动子与增强子或沉默子联系的一段DNA序列,绝缘子又称为隔离子,是指在基因组内建立独立的转录活性结构域的边界DNA序列。绝缘子的调控是通过阻断其他调控元件对基因的活化效应或失活效应发生作用。绝缘子的抑制作用具有“极性”的特点,即只抑制处于绝缘子所在边界另一侧的增强子或沉默子,而对处于同一染色质结构域内的增强子或沉默子没有作用。 bhg9pqaPUHtyLtF7liDHRacafZ57qCKW0U0Qf3MMwYorPvv/LU15uZD3kO9V5zEo

点击中间区域
呼出菜单
上一章
目录
下一章
×