横看成岭侧成峰,
远近高低各不同。
不识庐山真面目,
只缘身在此山中。
——苏轼《题西林壁》
人类的基因组庞大而纷繁复杂,可能发生的变异也是各种各样。
我们之前说了,可以将人类基因组看作一部庞大的天书,它其中所含的碱基ATCG就是这部天书的字符。测序就可以看作对这些字符的逐字校对。大体来讲字符的改变包括以下几种类型:
(1)单个字符发生变化:如A变为T,或C变为A等。
如果天书中某个关键字符出现错误,可能会改变天书的内容,因而引起严重错误。但是,绝大多数情况下,个别字符的改变可能并不影响天书整体的意思。
(2)少量字符的增减:如缺失一两个碱基的移码突变,又或者是缺失了三个碱基的整码突变。
一般来说,移码突变因为改变了氨基酸翻译结果,使得从移码位点以后的内容全部发生变化,因此往往会引起比较严重的后果。而整码突变仅改变某个氨基酸的组成,如果该氨基酸不处于关键区域或者将氨基酸替换成了比较类似属性的氨基酸就可能对后续功能的影响略小。
(3)短句子的删除或增加。
测序也可以检查出短句的删除或增加,但是如果出现大量的增加和删减,如同书中出现了大段落的增减乃至于整个章节的增删,测序就不是一种好的方法了。
拷贝数变异指基因组区段的插入、缺失或重复。一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。测序这种逐字校对式的检测对于基因亚显微水平的检测并不具优势,在这个水平上常用的检测方法有以下几种:
(1)基因芯片。
适用于大于50kb的拷贝数变异。
基因芯片(又称DNA芯片、生物芯片),通过微加工技术,将数以万计乃至百万计的特定序列的DNA片段(基因探针),有规律地排列固定于2平方厘米的硅片、玻片等支持物上,构成的一个二维DNA探针阵列,然后与标记的样品分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息。
基因芯片工作流程
基因芯片结果示意图
(2)多重连接探针扩增技术(multiplex ligation-dependent probe amplification,MLPA)。
MLPA是近几年发展起来的一种针对待检特定DNA的序列进行定性和半定量分析的新技术。该技术高效、特异,在一次反应中可以检测45个核苷酸序列拷贝数的改变,目前已经应用于多个领域、多种疾病的研究。可检测的变异包括:染色体亚端粒的基因重排、染色体的非整倍性改变以及单核苷酸的多态性(SNP)和点突变。不过该检测方法不适用于检测未知的区域和点突变类型。
(3)定量PCR(即时聚合酶链锁反应,Real-time Polymerase Chain Reaction,Real-time PCR,即时PCR)。
使用该方法可以用来检测特定基因或片段的重复或缺失,具有快速、准确和高灵敏的特点。但是它和MLPA类似,也是用于已知区域或基因的缺失重复状况,常和基因芯片配合使用。
(4)片段分析。
人类基因组中有一些特殊的存在,称之为三核苷酸重复序列,指三个不同的碱基为一个单位重复排列而形成的DNA序列,如CAG\CTG、GAA\TTC等三核苷酸重复序列。这些三核苷重复序列可以出现不明原因的扩增,从而累及所在或周围基因的正常表达或正常的生物活性。三核苷酸重复拷贝数在正常情况下有一定的变异范围,而扩展时就表现为疾病,这种突变不稳定,其拷贝数与病情正相关,这种突变叫做动态突变。
脆性X综合征中,由于其FMR-1基因CGG重复过度扩增,导致不正常的甲基化(methylation),进而无法顺利产生FMR-1基因所对应的蛋白(FMRP)。正常情况下,FMR1基因很稳定地由亲代传给子代。此症患者的FMR1(Fragile-X mental retardation)基因出现三核苷酸CGG重复次数有异常扩增的现象。
*当FMR-1基因CGG数低于54时,它们会稳定地传承给子代;
*前突变(pre-mutation):若在55~200之间,则谓之前突变,其本身并无症状,但在经由女性下传其子女时,可能会进一步扩增CGG;
*全突变(full-mutation):即CGG大于200,甚至数千次之多,而导致子女罹患此症。
动态突变的检测需要用一种特殊的检测方法——片段分析来进行。该方法是通过对由PCR过程所产生的,数目不等的核苷酸构成的大小不等的DNA片段,利用其大小或者标记荧光的差异进行分析的方法。
我们知道,一个生物机体的每一个细胞都来源于受精卵,所以,机体内不同类型细胞的基因型是完全一样的,然而它们的表型是各不相同的。这是由于不同类型细胞之间存在着基因表达模式的差异。也就是说,决定机体各种细胞类型差异的不是基因本身,而是基因表达模式。通过细胞分裂来传递和稳定地维持具有组织和细胞特异性的基因表达模式(比如保证肝细胞分裂产生的细胞都是肝细胞),对于整个机体的结构和功能协调至关重要。
近年来的研究表明,基因表达模式在细胞世代之间的可遗传性所依赖的并不是DNA序列信息,而是另有两类决定基因表达模式的信息标记,一是DNA分子上特定碱基的结构修饰,二是染色质构型重塑。这些不涉及DNA序列改变的可遗传变化称为表观遗传修饰。表观遗传学则是研究通过有丝分裂或减数分裂来传递这种表观遗传现象的一门新兴的遗传学分支。
与基因突变一样,表观遗传修饰的异常也会引起细胞、组织、器官乃至整个机体的结构和功能改变,甚至导致疾病的发生。现在已经知道,许多心脑血管疾病和代谢性疾病、神经性疾病、多种恶性肿瘤,以及发育异常和老年性疾病的发生、发展都与表观遗传修饰的异常密切相关。近年来国内外一系列重要的相关研究正在使表观遗传学成为医学遗传学的一个重要组成部分。
其中DNA甲基化是这些表观遗传修饰的一种重要方式。
DNA甲基化是一种动态的DNA共价修饰。它广泛存在于基因组中的转录抑制区,起到抑制基因表达的作用。如果人体某个区域甲基化异常也可引起疾病。DNA甲基化的检测方法也多种多样。基因组整体水平甲基化分析法如高效液相色谱柱(HPLC)及相关方法和高效毛细管电泳法(High-performance Capillary Electrophoresis,HPCE)等,也有针对特定的候选基因(Candidate Gene)甲基化分析如直接测序法、甲基化特异性的PCR、甲基化敏感性单核苷酸引物延伸(Ms-SnuPE)、结合重亚硫酸盐的限制性内切酶法(COBRA)等。
人类基因组这部天书纷繁复杂,奥秘无穷,这就需要多种检测工具和多学科联合来探索它。可以说,目前我们已经找到了解密之门和各种解锁的钥匙,相信随着各种技术的不断发展,我们对自身的理解将达到一个前所未有的精准的高度。
小知识
移码突变(frameshift mutation):在正常的DNA分子中,1对或少数几对邻接的核苷酸的增加或减少,造成这一位置之后的一系列编码发生移位错误的改变,这种现象称移码突变。移码突变所造成的DNA损伤一般远远大于点突变。DNA分子所发生的永久性改变称为DNA突变。DNA分子上如果插入或者缺失一个以上碱基的变化,则称为插入突变或者缺失突变。碱基的插入或者缺失会引起蛋白质读码框的改变,因此也被称为移码突变。
整码突变(codon mutation):又称密码子的插入或缺失,指在DNA链中增加或减少的碱基对为一个或几个密码子,此时基因产物多肽链中会增加或减少一个或几个氨基酸,而此部位之后的氨基酸序列无改变。