购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第三节
测序技术

核酸是生物遗传信息传递、表达及调控的储存者和传递者,DNA的碱基序列决定其表达与功能,序列的改变意味着生物学含义的改变,因此核酸序列分析是现代分子生物学的一项重要技术,分析基因的结构、功能及其相互关系在疾病的分子诊断中具有重要作用。从1977年第一代测序开始,经过30多年的发展,的发展,测序技术经历了三代;以双脱氧链终止法、化学降解法为基础的测序技术称为第一代测序技术,具有准确性高、速度慢、成本高的特点,故只适于少量序列测定;第二代测序技术包括合成法测序和连接法测序,具有操作简单、速度快、成本低、高通量的优点,正逐步趋于成熟,现已被广泛应用于临床试验;最近几年出现的第三代测序技术以单分子测序为特点,其中的SMRT单分子实时合成测序技术和纳米孔单分子测序技术最为热门。

一、第一代测序技术

(一)双脱氧链终止法

双脱氧链终止法也称Sanger法,Sanger等在1977年利用DNA聚合酶,以脱氧核苷三磷酸(dNTP)为底物,其中一种dNTP用放射性核素标记,以单链或双链DNA为模板,在四组相互独立的反应体系中加入不同的2′,3′-双脱氧核苷三磷酸终止链反应,根据碱基互补配对原则,在测序引物的引导下合成四组有序列梯度的互补DNA链,通过变性聚丙烯凝胶电泳分离,经放射自显影检测后识别待测DNA互补序列。

(二)化学降解法

化学降解法是将待测DNA片段的5′端磷酸基进行放射性标记,再将其分为四组,分别使用不同的试剂对不同的碱基进行特异性剪切,使断裂只随机发生在特定位点,从而得到长度不一的标记DNA片段,然后采用变性聚丙烯凝胶电泳分离,经放射自显影确定各片段末端碱基,即可测定目的DNA序列。因其操作繁琐,逐渐被Sanger法取代。

二、新一代测序技术

第一代测序技术的主要特点是测序读长可达1 000bp,准确性高达99.999%,但其测序成本高、通量低等方面的缺点,影响了大规模的应用。因此第一代测序技术并不是最理想的测序方法。经过不断的技术开发和改进,新一代测序(next generation sequencing,NGS)技术出现了,随着不断研发和更新,NGS又分为第二代和第三代测序,其方法的思路是边合成边测序,具有很高的测序通量。

(一)第二代测序技术

第二代测序技术,主要包括GS FLX测序平台、Solexa Genome Analyzer测序平台和Solid测序平台。

1.GS

FLX平台(454测序技术)是利用焦磷酸测序原理,依靠生物发光检测DNA序列。测序时循环向PTP板中顺次加入T、A、C、G四种碱基,如果加入的dNTP与DNA发生碱基互补配对,可释放出焦磷酸,焦磷酸在各种酶的催化作用下发生级联反应产生光信号,通过检测光信号即可测定目的DNA序列。454测序技术的测序片段比较长,高质量的读长(read)能达到400bp。

2.Solexa法

“DNA簇”和“可逆性末端终结”是Solexa法的核心专利技术,其原理是在DNA片段两端加上序列已知的通用接头构建测序文库,然后将文库加载到测定芯片上,文库两端的已知序列与芯片基底上的寡链序列互补,每条文库片段都经过桥式PCR扩增形成一个簇,碱基延伸过程中,每个循环反应只能延伸一个正确互补的碱基,根据4种不同的荧光信号确认碱基种类,保证最终的核酸序列质量,经过多个循环后,完整读取核酸序列。Solexa测序性价比较高,成本低。

3.Solid测序技术

是由ABI公司开发的以四色标记的寡核苷酸连续合成为基础,对单拷贝DNA进行大规模扩增和高通量并行测序。Solid测序的准确度高,原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前第二代测序技术中准确度最高的。

(二)第三代测序技术

纳米孔单分子测序技术的出现,被称为第三代测序技术,核心理念是以单分子为目标的边合成边测序,实现了对每一条DNA分子的单独测序。与前两代相比,最大的特点就是单分子测序,测序过程无须进行PCR扩增。

1.SMRT平台

DNA聚合酶和模板结合,4色荧光标记4种碱基(即是dNTP),在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。同时这个DNA聚合酶是实现超长读长的关键之一,读长主要和酶的活性保持有关,它主要受激光对其造成的损伤所影响。其测序速度很快,每秒约10个dNTP。

2.Ion Torrent6平台

该技术使用了一种布满小孔的高密度半导体芯片,一个小孔就是一个测序反应池。当DNA聚合酶把核苷酸聚合到延伸中的DNA链上时,会释放出一个氢离子,反应池中的pH发生改变,位于池下的离子感受器感受到H + 信号,H + 信号再直接转化为数字信号,从而读出DNA序列,是一种基于半导体芯片的新一代测序技术。

三、标本要求

(一)标本采集、接收、保存与运输

1.标本采集
(1)血液标本:

采集新鲜血液2~3ml于EDTA抗凝管中颠倒混匀,用封口膜密封管口,于-20℃冻存。

(2)组织标本:

手术新鲜组织大小约1cm×0.5cm×0.5cm 2~3块/穿刺组织长度 1~1.5cm,2~3条,置于冷冻管内,冷冻于-20℃。

(3)核酸标本:

核酸主条带清晰无杂质,核酸总量大于3µg,体积大于10µl。

2.标本的接收

对于实验室接收的标本需核对标本和申请单的信息是否相符,并登记编号。对于信息不符、凝血等影响检测结果的不合格标本需重新送检。

3.标本保存与运输

对于血液或组织于-20℃冻存后直接采用干冰运输,待提取RNA的标本需在抽取后24h内分离出有核细胞并加入TRIzol,置-20℃保存后采用干冰运输送检。

(二)质量控制

1.核酸的提取

保证提取标本所得DNA或RNA的纯度和浓度。

2.检测报告单的规范

包括检测申请单中的基本信息、实验方法、标注引物参照序列、检验结果的报告、报告单签名和实验室信息。

3.检测试剂的质量控制

保证所用试剂的质量和储藏方法合格,并在有效期内使用。

4.实验仪器的质量控制

测定时仪器状态在许可条件下,定期校正仪器并按周期进行保养和维护。

四、结果分析与解读

通过核酸测序技术得到的大量数据,需要利用生物信息学的方法和软件进一步处理分析。全基因组测序是将测序序列与参考基因组序列进行比对以发现不同个体或群体的差异,如单核苷酸多态性(SNP)、拷贝数变异(CNV)、插入缺失(insertion-deletion,InDel)等。分析内容包括:

1.原始数据预处理

通过过滤、质量控制、统计获得有效的读段。

2.数据比对及结果统计

将预处理的读段与参考基因组序列进行比对分析,得到标本基因组的一致性序列,统计单碱基的覆盖深度。

3.SNP、InDel及结构变异检测

通过SAMtools等工具并结合测序质量、深度、重复性等因素进一步筛选可得到全基因组中的可信度高的SNP、InDel及CNV,并利用Annovar进行注释。

4.直系同源分析

利用直系同源基因簇数据库(cluster of orthologous groups,COG)将功能相似的蛋白质进行聚类并按功能分类,再将上述得到的突变序列与COG数据库进行比对,可得到突变位点在COG数据库中的功能标识。

5.基因本体富集分析(GO)

通过已获得的GO注释数据表推断出突变基因涉及的功能相关信息。

6.信号通路分析

经信号通路显著性富集能确定目的基因参与的最主要的生化代谢和信号转导途径。

五、临床应用

1.基因组测序

包括全基因组测序技术(whole-genome sequencing,WGS)和全外显子测序技术(whole exome sequencing,WES)主要用于基因点突变、插入、缺失、拷贝数变异及基因组结构变异的检测,如慢性髓细胞性白血病(CML)、急性早幼粒细胞白血病(acute promyelocytic leukemia,APL)、原发性骨髓纤维化(primary myelofibrosis,PMF)等。通过基因组测序发现 PRPS1 基因突变是急性淋巴细胞白血病(ALL)耐药和复发的重要原因。基因突变的检测在急性髓细胞性白血病(AML)、遗传易感性髓系肿瘤、骨髓增殖性肿瘤(MPN)的诊断中具有关键性的作用,也是各类血液肿瘤预后判断的重要依据。

2.RNA测序

包括转录组测序、非编码RNA测序和小RNA测序,主要通过比较RNA水平的基因表达差异来推断信号通路的改变,并可用于药物靶点的筛选,AML中 DHH - RHEBL1 的突变率高达40%,另有报道烟酰胺磷酸核糖转移酶(nicotinamide phosphoribosyl transferase,NAMPT)可能作为有效的急性淋巴细胞白血病治疗靶点。

3.DNA甲基化测序

主要检测DNA的甲基化,目前在血液系统的恶性肿瘤治疗中已有多个去甲基化的药物进入了临床试验并取得了初步成效。

六、结果影响因素

(一)标本采集常见影响因素

1.血液采集时不能使用肝素管,避免肝素对核酸提取的影响。

2.标本量要足够,细胞数量级大于10 8 ,组织要尽量去除结缔组织等,并于-20℃干冰运输。

(二)DNA测序常见影响因素

1.DNA模板纯度

DNA模板不纯会影响测序结果,出现很多重叠峰及N端,以致无法判读序列。

2.测序引物

测序引物长度与特异性及 T m 值有关,引物 T m 值在50~60℃为宜。

3.测序的反应条件

测序反应循环条件须根据模板和引物的不同而调整。

(三)转录组测序常见的影响因素

1.RNA降解

解会影响建库和测序质量。

2.RNA模板量

RNA起始量过低会影响建库和测序质量,可通过增加PCR循环数解决。

3.转录组基因丰度的影响

转录组基因丰度差异较大会影响基因检测的分辨率,低度的基因可能被高丰度的基因掩盖。

(吴巧萍) CIU7By1V68vt8lT6WgNpahwC44G+KZ4Wu/Th+w8iYPChSuRXGtQRSzutT4SpdrkT

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开