上QQ阅读APP看书,第一时间看更新
第三节 分子遗传学研究常用技术
一、聚合酶链式反应
聚合酶链式反应(polymerase chain reaction,PCR)技术于1983年由美国科学家Kary B Mullis提出,是一种体外DNA扩增技术。利用PCR技术可以在很短的时间内将组织、血液、细胞等来源的目的基因DNA片段指数倍扩增。
PCR反应基本原理与DNA天然复制过程相类似,以待扩增的DNA片段为模板,引入一对与模板DNA 3′末端互补的寡核苷酸片段引物,在DNA聚合酶的作用下,引物进行互补链的延伸,经过多次反复循环使模板DNA得到扩增。
PCR反应体系五要素:模板DNA;特异性引物(16~30bp的寡核苷酸);DNA聚合酶;底物(四种脱氧核苷三磷酸,dNTP);Mg 2+(DNA聚合酶激活剂)。
PCR反应基本步骤包括变性-退火-延伸三步,在一个循环过程中,变性阶段模板DNA在94℃左右双链解离成为单链,随后温度降至引物最适温度,引物与变性后的单链DNA互补配对,引物-模板结合物在DNA聚合酶的作用下按半保留复制原理合成一条与模板DNA互补的新链,新链又可作为下次循环的模板,经过多次循环反应,模板DNA片段呈指数增加(图2-3)。
选择合适的引物是PCR反应特异性的关键,引物不合适将导致非特异性扩增,PCR扩增产物在琼脂糖凝胶电泳结果中可出现引物二聚体杂带,扩增条带弱或无条带等情况(图2-4)。
引物设计的一般原则:①长度,一般为15~30bp,20bp左右最佳,长度不要超过38bp;②退火温度(Tm值),正反引物间Tm值差异一般在2℃~5℃,小于20bp的引物Tm=4×(G+C)+2×(A+T);③ GC含量,应控制在40%~60%之间,上下游引物的GC含量不要相差太大;④避免引物之间或引物内部形成二聚体;⑤引物3′端避免出现3个以上连续碱基G或C。
二、核酸序列测定方法
(一)一代测序(Sanger测序)
图2-3 聚合酶链式反应扩增原理示意图
图2-4 PCR产物琼脂糖凝胶电泳胶图
即直接测序法。1977年Frederick Sanger和Walter Gilbert等人发明了双脱氧链末端终止法的DNA测序技术,该技术在随后的几十年里成为最常用的基因测序技术。双脱氧链末端终止法又称为Sanger法,其原理是DNA模板在含有DNA聚合酶、引物、4种dNTP的反应体系中进行复制,在每一轮测序反应的引物延伸步骤中,按一定比例随机引入已被4种不同颜色荧光分别标记的双脱氧核苷三磷酸(ddATP、ddTTP、ddGTP、ddCTP),由于ddNTP缺少延伸过程所需要的3′-OH基团,当ddNTP聚合到链末端时DNA链停止延长。如此,反应体系中形成长短不一的以ddNTP为3′端的DNA片段。反应停止后,不同长度的DNA片段通过凝胶电泳进行分离,在通过毛细管时4种荧光基团被激光激发,发出不同颜色的荧光并被测序仪检测系统识别,便可获得检测片段的碱基排列顺序(图2-5)。
图2-5 Sanger测序原理示意图
Sanger测序法的主要特点是测序读长可达1 000bp,准确性高达99.999%,测序结果直观便于分析,适用于遗传性视神经病变这类致病基因单一的疾病或对小样本量数据进行基因突变检测。但其测序成本高,通量低等方面的缺点限制了该测序技术的大规模应用,对于具有高度遗传异质性的疾病,候选基因数量较多,难以实现大样本量的测序。另外,Sanger测序不能检测拷贝数异常这类基因突变。
(二)二代测序
随着基因检测技术平台不断开发和改进,基因检测技术得到了迅猛发展。到2005年,以通量大、时间短、精确度高和信息量丰富为优点的二代测序(nextgeneration sequencing,NGS)技术应运而生,极大地提高了基因检测的检出率,并扩展了遗传性疾病在基因水平的研究范围。二代测序的技术平台主要包括Roche-454测序平台、Illumina-Solexa/Hiseq测序平台和ABI-Solid测序平台。
1.Roche-454测序技术
Roche 454测序平台是基于焦磷酸测序法的高通量基因组测序系统,依靠生物发光对DNA序列进行检测,其测序主要包括以下步骤:构建DNA文库(300~800bp单链DNA片段,连接特异性接头)→乳化PCR(特异性接头与水油包裹的磁珠结合)→PCR扩增DNA-磁珠结合物→焦磷酸法测序。
Roche 454测序技术的优点在于每个测序反应独立进行,降低了测序偏差,且其测序片段较长,平均读长可达400bp。但该测序平台也存在一个主要的缺点,即待测片段含有PolyA序列时无法准确判读,可能造成测序结果引入插入/缺失的错误。
2.Illumina-Solexa/Hiseq测序技术
Illumina-Solexa/Hiseq是目前应用量最大的二代测序平台,该技术以边合成边测序(sequencing by synthesis,SBS)的方式完成检测,其主要测序步骤如下:构建DNA文库(300~800bp单链DNA片段,连接特异性接头)→桥式PCR扩增(在流动槽flowcell中进行扩增如图2-6所示,扩增产物为双链桥式DNA片段如图2-7所示)→测序(边合成边测序)。
Illumina-Solexa/Hiseq测序技术每次只添加一个dNTP,解决了无法准确判断同聚物长度(如含有PolyA序列)的问题。但该测序平台的不足在于分析片段较短,测序最大读长为200~300bp,随着读长增加,错误率也会相应上升,目前该平台的错误率在1%~1.5%之间。
3.Solid测序技术
该测序平台构建DNA文库和乳化PCR的方法与Roche-454技术类似,但使用的磁珠更小,仅1μm。反应在一块有多个格子(tile)的玻片上进行,与Roche-454系统相比,每张玻片上可容纳更高密度的磁珠,提高了测序通量。
图2-6 flowcell示意图
图2-7 桥式PCR扩增反应示意图
Solid测序的独特之处在于使用连接酶代替了以往测序时的DNA聚合酶。连接反应所用底物是8个碱基荧光探针混合物,反应过程中,探针按照碱基互补原则与模板DNA配对连接,并引发该位点的荧光信号。Solid测序技术读长为50~75bp,精确度高达99.94%,更适用于基因组重测序和SNP检测。
(三)二代测序技术的应用
与一代测序技术相比,二代测序技术更适用于多基因大样本量的基因突变检测。根据测序范围不同,二代测序技术应用主要包括目标区域捕获测序、外显子组测序和全基因组测序。
1.目标区域捕获测序
目标区域捕获测序(targeted-exome sequencing,TES)是针对感兴趣的基因组区域设计探针,在固相(芯片)或液相(磁珠)体系中对片段化的基因组DNA进行杂交,将目标区域DNA富集后进行高通量测序的技术手段。由于目标区域捕获测序的检测区域相对于外显子组或全基因组明显缩小,检测覆盖度更深,数据准确性更高,可获得较高的突变检出率,同时测序成本更低,特别适用于特定基因或区域的突变研究。
2.全外显子组测序
外显子组包含了细胞内所有基因的编码核苷酸序列,人类外显子组序列约占全部基因组序列的1%,但外显子组区域的致病突变数量占全基因组的比例高达85%。全外显子组测序(whole-exome sequencing,WES)是针对外显子区域设计探针,在固相(芯片)或液相(磁珠)体系中对全外显子组区域的DNA进行杂交并富集后进行高通量测序的技术方法。WES可以检测基因组DNA上所有编码区域,较TES检测范围更广,但仍无法覆盖启动子区、增强子区等位置的信息。该检测方法多应用于挖掘单基因遗传病的新致病基因。
3.全基因组测序
全基因组测序(whole-genome sequencing,WGS)范围覆盖了整个基因组DNA序列,目前,人类全基因组序列已经确定,全基因组测序技术在研究疾病遗传基础和产前诊断方面得到广泛应用。
二代测序技术受检测范围或特殊结构区域序列本身以及不同突变类型的影响,捕获深度和覆盖度会有偏差,比如高GC含量区域或含有较长重复序列的区域,捕获深度会相应降低。NGS可以检测拷贝数异常,但受捕获深度和拷贝数异常量的影响,也会有检测遗漏的情况。尽管有二代测序技术的出现,但Sanger测序对于致病基因明确且数量有限的单基因遗传病的基因突变检测是非常经济、高效的。目前为止,Sanger测序仍然是基因检测的金标准,也是二代测序检测后进行突变位点确认及家系共分离验证的主要方法。
(四)拷贝数异常检测方法 1.多重连接探针扩增技术
多重连接探针扩增技术(multiplex ligationdependent probe amplification,MLPA)于2002年由Schouten等首先提出,可对DNA序列进行定性和半定量分析。MLPA技术原理包括探针和目的序列DNA进行杂交,每个MLPA探针包括两个含有引物序列和特异性序列的荧光标记的寡核苷酸片段,两个寡核苷酸片段都与目的序列进行杂交,之后通过连接酶连接两部分探针(图2-8)。连接反应具有高度特异性,只有当两个探针都与目的序列完全杂交,连接酶才能将两段探针连接成一条完整的核酸单链,每个连接产物长度都是唯一的,范围在130~480bp。连接反应完成后,通用引物对连接产物进行扩增,扩增产物通过毛细管电泳分离并收集相应探针的扩增峰。如果目的序列存在缺失/插入突变,对应区域的探针扩增峰便会降低或增加,因此可以根据扩增峰的变化判断目的序列是否存在拷贝数异常(图2-9)。
图2-8 MLPA探针结构示意图
MLPA技术优势包括:通过选择不同特异性序列探针即可检测多种基因;其次其为多重反应,一次反应中可以检测50个核苷酸序列拷贝数的改变,且可以同时检测多个样本;可以检测单一外显子的缺失/插入突变。
MLPA技术用于检测目的基因的缺失或重复,但不能检测未知的点突变及染色体的平衡易位。
2.实时荧光定量PCR
实时荧光定量PCR(quantitative real-time PCR)是在PCR反应体系中加入荧光基团,利用荧光信号积累实时监测PCR扩增过程,通过标准曲线对未知DNA模板进行定量分析的方法。对整个反应过程进行实时、连续的监测并分析扩增过程中产生的荧光信号,随着反应时间的推移,根据监测的荧光信号可以绘制成一条曲线(图2-10)。数据分析过程首先需要在扩增反应的指数期设定一个荧光信号的阈值(threshold),并记录每个反应管内的荧光信号到达设定阈值所需要的循环数,即Ct值(cycle threshold,循环阈值)。研究表明,每个模板的Ct值与该模板的起始拷贝数的对数存在线性关系,起始拷贝数越多,Ct值越小。利用已知起始拷贝数的正常对照可以绘制出标准曲线,只要获得待测样品的Ct值,即可根据标准曲线计算出该样品的起始拷贝数。
图2-9 MLPA反应示意图
图2-10 实时荧光定量PCR扩增曲线示意图
(五)核酸提取技术
获得结构完整、纯度高的DNA对于后续聚合酶链式反应(PCR)实验和基因测序至关重要。经典的核酸提取方法为酚氯仿抽提法,其基本步骤包括裂解红细胞-裂解白细胞-沉淀DNA-清洗DNA-DNA溶解-保存。在临床科研工作中通常能够采集到的血液标本量较少,在无法获得血液样本时,可通过口腔黏膜擦拭获取DNA。目前市场上已有多种核酸提取试剂盒,使用核酸提取试剂盒可快速高效的获得高质量DNA,并可直接用于PCR、Southern杂交以及其他相关实验。
三、人类基因突变及疾病相关数据库
1.常用核酸序列及生物学信息数据库
GenBank数据库(https://www.ncbi.nlm.nih.gov/genbank/)、UCSC基因组数据库(http://genome.ucsc.edu/)、MITOMAP线粒体基因数据库(https://www.mitomap.org//MITOMAP)、OMIM人类孟德尔遗传在线(http://www.omim.org/)、dbSNP人类核苷酸多态性数据库(https://www.ncbi.nlm.nih.gov/SNP/)。
2.基因突变致病性分析平台
SIFT(http://sift.jcvi.org/)根据氨基酸序列保守性和替换类型预测突变的致病性。PolyPhen2(http://genetics.bwh.harvard.edu/pph2/)依据预建蛋白质序列多重对比、蛋白质结构和功能属性等原则预测突变对蛋白质的影响。Mutation Taster(http://www.mutationtaster.org/)通过对SNP的进化分析评估引起蛋白质功能影响的非同义突变致病性。
3.可变剪接预测平台
Human Splicing Finder(http://www.umd.be/HSF/)、NetGene2(http://www.cbs.dtu.dk/services/NetGene2/)、BDGP(http://www.fruitfly.org/seq_tools/splice.html)。