上QQ阅读APP看书,第一时间看更新
第二节 基因测序原理方法与应用
核酸(nucleic acid)是生命体遗传信息的主要载体。1953年,Watson和Crick关于DNA双螺旋结构的发现表明,几乎所有基因的三维结构基本一致,腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)(RNA中为A、C、G、T)4种碱基数量和排列顺序的变化造就了生命体的多样性。因此DNA和RNA序列被称为遗传密码,这个序列也决定着蛋白质的氨基酸序列,是分析基因结构、功能及其相互关系的基础,也是临床疾病分子诊断最精确的判定依据。基因测序技术正是解读这些生命密码的基本手段。
在生物学上,测序(sequencing)是指确定线性生物大分子(如蛋白质、核酸)一级结构的过程。其中核酸测序(特别是DNA测序)由于生物学意义重大,获得的信息含量极其丰富,成本低廉,因而发展最快,应用最广。基因测序技术发展至今,经历了三代演变,每一代测序技术都各有优劣,彼此之间互为补充。
一、测序技术发展历程与趋势
1977年,Sanger和Gilbert分别提出双脱氧链终止法(dideoxy chain-termination method/Sanger sequencing)和化学降解法(chemical degradation method/Maxam-Gilbert method),标志着第一代测序技术的诞生。由于对核酸测序技术做出的重大贡献,Sanger和Gilbert以及发现DNA重组技术的Berg分享了1980年的诺贝尔化学奖。此后,基因测序技术经历了几十年的快速发展,在此期间出现了两次技术上的飞跃:第一次飞跃是Sanger测序技术实现了大规模测序的自动化,科学家利用该技术完成了“人类基因组计划(Human Genome Project,HGP)”等重大科学研究项目;第二次飞跃是自2005年以来,以Roche 454、Illumina GA/HiSeq、Life SOLID/Ion Torrent为代表的二代测序技术(next-generation sequencing,NGS)的出现,使得基因组测序通量快速增加,测序成本极大降低。2008年至今,随着物理、化学、材料和生命科学的不断发展和融合,以PacBio RS、Oxford NanoPore、Helicos Biosciences为代表的,以单分子测序和长读长为标志的三代测序技术应运而生,其显著特点在于省去了二代测序技术模板扩增的步骤。整个测序技术主要发展历程见图2-7。
图2-7 基因测序技术的发展历程
虽然测序技术呈现出层出不穷的发展态势,发展速度已经远远超越了半导体信息技术进步的速度,将生命科学研究带入了基因组学时代,但就目前的研究现状而言,在通往理想和完美测序技术的道路上,有如下亟待解决的关键问题:① 对人类基因组测序的能力已经大大超过解读遗传变异的能力。全世界每年产出超过15PB的数据量,数据冗余对分析方法和结果解读提出了严峻的挑战。② 距离完整解读全基因组序列信息还有很远的距离。现阶段最主要的测序数据为短读长的二代测序数据,序列组装存在难度;三代测序虽能提供长读长测序结果,但受限于较高的测序成本与测序错误率,仍旧难以在短时间内解决该问题。③ DNA表观修饰,如甲基化、羟甲基化和糖羟甲基化的重要性已无需赘述,然而现有的测序技术仅能通过特殊方法间接检测,准确性与时效性均有提升空间。④ RNA序列仅能通过DNA序列测定技术来间接获得,显然,RNA分子中上百种化学修饰也无法通过测序技术直接获得。
测序技术的更新方兴未艾,未来的测序技术一定会向着更精准、更高通量和更廉价的方向前进。不同代次的测序技术依然会长期共存、共同发展,力求通过各自的性能优势互补不足。随着人类探求生命奥秘需求的不断增加和研究工作的不断深入,新的测序原理和技术也将不断产生,以满足不同学科领域的应用需求,而这一切依赖于也同样驱动着今后更多相关技术的发展和进步。
二、一代测序技术
(一)一代测序技术原理
1.Maxam-Gilbert DNA化学降解测序法
Maxam-Gilbert DNA化学降解测序法是1977年由A.M.Maxam和W.Gilbert首先建立的DNA片段序列测定方法 [1]。其原理为:将一个DNA片段的5′端磷酸基团标记放射性同位素,再分别采用不同的化学方法修饰进而裂解特定碱基,从而产生一系列长度不一而5′端被标记的DNA片段,这些以特定碱基结尾的片段群通过凝胶电泳分离,再经放射性自显影,确定各片段末端碱基,从而得出目的DNA的碱基序列。
该测序方法不需要进行酶催化反应,因此不会产生由于酶催化反应而带来的误差,对未经克隆的DNA片段可以直接测序。化学降解测序法特别适用于测定含有如5-甲基腺嘌呤,或者GC含量较高的DNA片段,以及短链的寡核苷酸片段的序列。
2.Sanger双脱氧链终止法
1975年,Sanger和Coulson一起提出加减测序法。利用该技术完成了第一个基因组——噬菌体phi X长度为1 745 386个碱基序列的测序工作。基于加减测序法,Sanger和Coulson在测序系统中引入双脱氧核苷三磷酸(dideoxy nucleoside triphosphate,ddNTP)作为链终止剂,在1977年建立了双脱氧链末端终止测序法,又称Sanger测序法或者酶法。
其原理为利用大肠埃希菌DNA聚合酶Ⅰ,以单链DNA为模板,并以与模板预先结合的寡聚核苷酸为引物,根据碱基配对原则将脱氧核苷三磷酸(dNTP)底物的5′-磷酸基团与引物的3′-OH 末端生成 3′,5′-磷酸二酯键。通过这种磷酸二酯键的不断形成,新的互补DNA得以从5′→3′延伸。Sanger引入了双脱氧核苷三磷酸(ddNTP)作为链终止剂。ddNTP比普通的dNTP在 3′位置缺少一个羟基(2′,3′-ddNTP)(图2-8),可以通过其5′-三磷酸基团掺入到正在延伸的DNA链中,但由于缺少3′-OH,不能同后续的dNTP形成3′,5′-磷酸二酯键。因此,DNA链不再延伸,终止于这个异常的ddNTP处。在4组独立的酶反应体系中,在4种dNTP混合底物中分别加入4种ddNTP中的一种后,链的持续延伸将与随机发生却十分特异的链终止展开竞争,在掺入ddNTP的位置链延伸终止。结果产生4组分别终止于模板链的每一个A、每一个C、每一个G和每一个T位置上的一系列长度的核苷酸链。通过高分辨率变性聚丙烯酰胺凝胶电泳,从放射自显影胶片上直接读出DNA上的核苷酸顺序。
图2-8 脱氧核苷三磷酸和双脱氧核苷三磷酸分子结构
荧光标记的ddNTP,荧光信号接收器和计算机信号分析系统替代放射自显影技术,打开了DNA测序自动化的大门。多色荧光标记实现了4个测序反应在一个泳道中同时进行,从而避免了不同泳道间由于迁移速率差异的影响,提高了测序的准确性,同时也大大减少了测序的工作量。荧光标记ddNTP法的出现使荧光标记和终止过程合二为一,实现了在同一反应管中同时进行4个测序反应并完成电泳,并且消除了测序过程中聚合酶暂停的现象。荧光信号检测系统和计算机信号处理系统的出现使得同时快速分析多个样本成为可能,大大降低了测序时间和人力消耗。
1986年,美国应用生物系统公司(Applied Biosystems,ABI)发布了首台自动测序仪ABI Prism 370A,每天可读取1 000个碱基,该机器依然沿用了板凝胶作为电泳的基质。1995年,ABI公司推出第一台单道毛细管电泳测序仪ABI Prism 310,采用毛细管电泳技术取代传统的聚丙烯酰胺平板电泳,应用该公司专利的四色荧光染料标记的ddNTP (标记终止物法),通过单引物PCR测序反应,生成相差1个碱基的3′末端为4种不同荧光染料的单链DNA混合物,在一根毛细管内电泳。由于分子大小不同,在毛细管电泳中的迁移率也不同,当其通过毛细管读数窗口段时,激光检测器窗口中的电荷耦合器件(charge-coupled device,CCD)摄影机检测器就可对荧光分子逐个进行检测,激发的荧光经光栅分光,以区分代表不同碱基信息的不同颜色的荧光,并在CCD摄影机上同步成像,分析软件可自动将不同荧光转变为DNA序列,从而达到DNA测序的目的(图2-9)。
图2-9 双脱氧链终止法测序原理
此后,ABI公司相继推出了多种型号测序仪,其中现在商业化主流的产品为3500型和3730型,以及最新推出的SeqStudio型。ABI推出的自动化测序仪具有DNA测序和多重PCR扩增片段长度分析功能,因此除了进行基因片段序列组成分析外,还可进行微卫星位点基因分型、杂合性缺失(LOH)分析、多重探针连接扩增(MLPA)产物长度分析、多重PCR扩增产物定性分析等,以及应用于基因新突变鉴定、1~100个单核苷酸多态或突变位点同时分型、1~200多个基因片段拷贝数同时检测、HLA分型、法医学上的亲子和个体鉴定、微生物与病毒的分型与鉴定等。
(二)一代测序在基因检测中的应用
Sanger测序作为目前测序技术的金标准,仍是临床、科研领域不可或缺的技术,它结果可靠,读长较长(可达 1 000bp),但是其测序成本高,通量和检测灵敏度低,不适合含量<5%的突变的检测。目前主要应用于少数基因的突变筛查(含cDNA测序),少量基因突变位点的检测,验证二代测序中发现的基因突变位点,少量基因CpG岛甲基化测序。
1.基因突变筛查与鉴定
在对已知基因突变的检测中,Sanger测序法主要针对突变所在序列的两侧设计PCR扩增引物,利用该引物进行PCR扩增后直接测序,通过查看测序图形中突变位点所在位置的序列组成就可确定突变的类型。当目标基因编码区外显子数目不多(例如所需测序片段数目<50个)时,对于该基因临床应用的突变筛查可优先考虑Sanger测序,设计多对PCR扩增引物覆盖目标基因启动子区、编码区以及剪切点,扩增产物直接测序,测序文件可以通过突变分析软件与参考序列比较鉴定突变位点。如果对于部分样本通过基因组DNA启动子区、编码区以及剪切点的测序不能发现突变的情况,而表达该基因的组织RNA可获得,可以通过RNA反转录后获得cDNA、设计cDNA扩增引物覆盖所有编码cDNA序列、扩增产物直接测序并分析可获得基因内缺失或重复突变,以及影响正常剪切的内含子突变位点和编码区同义突变位点等。对于已知基因突变位点的检测或者测序片段数量不多的目标基因突变筛查,由于成本可控、测序周期短,而且准确性高无需其他方法验证,Sanger测序在临床应用的基因突变检测中有较好的应用前景。
检测灵敏度低是Sanger测序的不足,Sanger测序通常只能检测出占全部等位基因20%以上的突变,因此在选择Sanger测序法用于基因突变检测时需要评估目标样本中突变等位基因可能的比例范围。对于生殖细胞遗传突变的检测,Sanger测序比较适用,但对于肿瘤组织体细胞突变的检测,为了达到良好的检出效果,在进行DNA抽提前,尽可能剔除非肿瘤组织,以减少肿瘤旁正常组织DNA的影响从而导致检测灵敏度下降。
目前该技术已应用于肿瘤诊断、病情监测、预后和治疗等临床实践中。如 TP53基因、 BRCA1/ BRCA2基因、 APC基因的突变检测分析,可用于早期发现某些肿瘤(如乳腺癌、结肠癌)的易感人群,对这些人群采取必要的生活方式调整、早期诊断及其他干预措施,从而达到预防医学治未病的效果。Sanger测序也可以助力癌症患者个性化用药,对肿瘤靶向治疗药物相关基因的突变位点进行检测。如第一款聚腺苷二磷酸核糖聚合酶(poly ADP-ribose polymerase,PARP)抑制剂奥拉帕利(olaparib)的伴随性诊断试剂Analysis CDx就是基于Sanger测序的方法对患者 BRCA1和 BRCA2的基因突变进行评估 [2]。此外,对于 KRAS、 EGFR、 BRAF、 PIK3CA等基因突变的检测也可用于吉非替尼、甲磺酸奥希替尼、西妥昔单抗等药物的伴随诊断。
2.目标基因CpG岛甲基化测序
DNA甲基化是一种表观修饰,存在于大多数真核生物中,它在不改变DNA序列的情况下,通过改变基因的表达,从而对个体的生长、发育以及基因组的稳定性起到重要的调控作用,并且这种修饰在细胞增殖的过程中可以稳定传递。大量研究表明,DNA异常甲基化与肿瘤的发生、发展、细胞癌变有着密切的联系,所以肿瘤相关基因的甲基化水平分析是肿瘤致病机制研究以及临床应用的重要方向之一。CpG双核苷酸在人类基因组中的分布很不均一,在很多基因的启动子区和第一外显子区常出现CpG富集区域,该区域被称为CpG岛。CpG岛是甲基化调控的重要区域。DNA甲基化一般发生在CpG双核苷酸中胞嘧啶的5位碳原子。重亚硫酸盐测序是检测目标基因CpG岛甲基化变化的常用技术,其原理是通过对基因组DNA进行重亚硫酸盐处理,非甲基化的胞嘧啶被脱氨基而转变成尿嘧啶,在随后的PCR反应中尿嘧啶转变成胸腺嘧啶,而甲基化的胞嘧啶不能被脱氨基,在反应完成时被保留。设计能够同时扩增甲基化和非甲基化序列的引物,对重亚硫酸盐处理产物进行PCR扩增,直接进行Sanger测序,通过对测序结果分析可以获得每个CpG的甲基化状态和水平。对于甲基化水平>20%以上的CpG岛,该方法实验结果准确性高,是甲基化检测的金标准。
三、二代测序技术
(一)二代测序技术原理介绍
二代测序(next-generation sequencing,NGS)较传统的一代测序技术(Sanger测序)相比,最大的不同在于其使用了边合成边测序(sequencing by synthesis,SBS)技术,大幅增加了测序通量并降低了测序成本,具有划时代的意义,成为了目前市场主流的测序技术。Roche(454)、Illumina(Solexa)、ABI(SOLiD)为代表的二代测序技术自诞生以来,引发了测序技术快速的发展和激烈的竞争,二代测序仪不断推陈出新。不同平台、不同仪器使用的技术原理间会有一些差别,这里以经典的Illumina测序平台(Hiseq X Ten之前的机型)为代表,介绍其测序技术原理。
传统Illumina测序技术主要分以下3个步骤:
(1)文库构建:
针对实际的检测需求,通过各种方式、方法将目标检测区域构建为两端包含P5、P7接头的Illumina文库。每个样本添加有特异性的标签序列(index),用于测序后区分样本。
(2)簇生成:
簇生成通过桥式PCR实现。传统Illumina测序平台的流动池(flowcell)随机分布着2种寡核苷酸序列(P5′和P7′),可与文库的P5和P7互补结合。之后以文库为模板,进行互补链延伸。延伸完成后洗去原始文库,形成固定在流动池表面的DNA分子。该分子再次与流动池表面的寡核苷酸匹配,形成拱桥状,再次进行合成。通过多轮循环,单一文库DNA分子形成一个由相同序列DNA分子组成的DNA簇,从而满足后续检测信号要求(图 2-10)。
(3)边合成边测序:
Illumina测序技术采用可逆阻断技术实现边合成边测序。使用带有特异荧光标记的、3′端经化学修饰可逆阻断的4种dNTP,每次反应延伸一个碱基后,进行荧光激发,收集信号,读取碱基;再加入试剂,淬灭荧光信号并去除3′端保护基团,从而暴露出3′末端进行下一轮反应,检测下一个碱基(图2-10)。
图2-10 标准的Illumina测序原理流程图
由于Illumina测序时对碱基的修饰和切割会存在不完全的情况,随着测序反应的进行,测序读长不断增加,测序质量会逐渐下降,因此单端测序无法测到很长的读长。因此Illumina测序采用双端测序技术(paired-end,PE),在第一端测序完成后,进行标签序列测序,之后再从另一端进行测序,从而使得单一片段能够获得较长的碱基序列,利于后续数据分析。
(二)二代测序技术在基因检测中的应用
二代测序技术由于其技术的先进性,大幅提高了检测通量,降低了检测成本,在基因检测中的应用非常广泛。在很多方面逐渐替代了传统检测方式,并不断有新的应用出现。这里主要介绍与妇科肿瘤相关的一些应用。
1.二代测序在遗传性肿瘤中的应用
遗传性肿瘤由可遗传的胚系基因突变所致,除个别单基因遗传性肿瘤外,肿瘤的遗传性与一般遗传病不同,其子代只是继承了肿瘤的易感性。家系中患特定肿瘤的风险将远高于正常人群,且具有发病年龄早、多发或双侧原发病变等特点。通过二代测序可以同时检出基因的单核苷酸突变和拷贝数变异,一次实验也能够同时检测大量基因,根据检测结果可以分析肿瘤发生风险并及时进行干预。这里以 BRAC1/BRAC2基因相关的遗传性乳腺癌和卵巢癌为代表进行说明。
遗传因素在乳腺癌和卵巢癌的发生中极为重要,10%以上的卵巢癌由可遗传的单基因突变导致。目前研究已发现2个与其密切相关的基因,即 BRCA1和 BRCA2。据统计, BRCA1和 BRCA2突变携带者到70岁时,乳腺癌的累积发病率分别可达65%和45%,卵巢癌的累积发病率分别达39%和11% [3]。
目前已有很多实验室和公司将 BRCA1和 BRCA2加入二代测序多基因的检测列表,直接使用外周血样本进行遗传突变筛查,并根据检测结果提供肿瘤的治疗建议和风险管理。例如对携带有已知的癌症致病基因或易感基因突变的未患病个体,可选择预防性手术、物理或化学预防策略等降低风险的方案。
2.二代测序在肿瘤靶向用药和药物代谢中的应用
个体化用药是个体化医疗中很重要的一部分。同一种药物,即使使用相同的剂量,不同个体在疗效和安全性上仍会表现出很大的差异。相同种类的癌症,其遗传背景不同,对相同药物的疗效可能会有显著差异;同样地,也会有不同种类的癌症,但带有相同的突变,使用同一种药物可能都很有效,即“同病异治与异病同治”。肿瘤治疗药物价格相对较高,无效的治疗可能对患者造成巨大的经济损失。有些个体药物代谢相关基因存在遗传变异,可能会对一些药物产生严重的不良反应。故通过二代测序,检测肿瘤靶向治疗及药物代谢的相关基因,可以有效指导用药和预后判断。
以卵巢癌治疗为例,对 BRCA突变的卵巢癌患者,可以采用PARP抑制剂进行治疗。 BRCA1和 BRCA2基因具备修复DNA损伤能力,携带 BRCA1和 BRCA2突变的肿瘤细胞因为化疗或其他因素产生DNA损伤时,缺乏依赖 BRCA基因的修复能力,需要通过PARP进行修复。PARP抑制剂抑制了PARP的活性,使得肿瘤细胞无法有效进行DNA损伤修复,导致染色体不稳定、细胞周期停滞和细胞凋亡,从而达到抗癌的作用,这一原理被称为协同致死(synthetic lethality) [4]。PARP抑制剂是第一种基于该原理,并获得批准用于临床的抗癌药物。对于非 BRCA基因突变型的卵巢癌,肿瘤细胞具有依赖 BRCA基因的DNA损伤修复功能,PARP抑制剂的治疗效果不显著或者无效,故PARP抑制剂的使用依赖于基因检测的伴随性诊断产品。2016年,配套PARP抑制剂药物(rucaparib)的多基因检测试剂盒,作为首个基于二代测序技术的伴随性诊断产品获得FDA批准,并已写入NCCN指南,指导 BRCA突变携带者卵巢癌的诊疗。
3.二代测序在表观遗传检测中的应用
基因的表观遗传改变在很多肿瘤的发生、发展中起到了很重要的作用。其中DNA甲基化是目前研究最透彻的表观遗传学标记。一般情况下,基因启动子区CpG岛高甲基化与基因沉默有关,而低甲基化与基因活化有关。大量研究表明,抑癌基因的启动子区高甲基化导致失活以及原癌基因启动子区低甲基化导致活化,是很多肿瘤发生的原因,已经成为了一些肿瘤早期诊断的分子标志物。传统甲基化检测位点往往仅能检测少数CpG位点,且定量灵敏度不高。而二代测序可以一次性检测大量CpG位点,并达到单碱基分辨率。对于后续进一步研究并应用于临床,有很大的应用前景。
4.二代测序在转录组检测中的应用
在癌症的发展过程中,细胞内的基因表达模式一般都会发生显著变化。对基因表达水平进行定量,可以有助于从分子水平进行肿瘤分型,从而指导治疗和预后。二代测序可以高通量地进行转录组测序,目前已大量应用于科研,随着研究的进一步深入和技术的发展,转录组测序应用于临床检测的前景也很广阔。
有研究表明,根据雌二醇受体(estradiol receptor,ER)的表达情况,可将乳腺癌在分子水平上分为ER阳性和ER阴性2种不同的类型 [5,6]。也有研究根据乳腺癌患者基因表达模式分析,得到由70个基因组成的预后指数,用于更准确地预测预后情况 [7]。根据这些基因表达检测开发的检测试剂盒也获得了FDA批准。
5.二代测序在检测病原微生物中的应用
近期,有大量研究表示,微生物群落微环境对于一些种类的肿瘤发生、发展起到了很重要的作用,而部分病原微生物是一些癌症的主要病因。二代测序在微生物群落结构检测、病原微生物鉴定、分型等多方面,都有一定的优势。
人乳头瘤病毒(human papilloma virus,HPV)是宫颈癌发生的主要病因之一。HPV有大量不同的分型,通过二代测序,可以鉴别其中的致癌高危型,从而有效指导后续治疗和风险管理。
6.二代测序在肿瘤液体活检中的应用
很多肿瘤,如卵巢癌,由于早期症状不显著,缺少有效的筛查和早期诊断的方法,往往发现时已是晚期。循环肿瘤DNA(circulating tumor DNA,ctDNA)是来源于肿瘤细胞的、以游离状态循环于肿瘤患者血液中的DNA。ctDNA作为液体活检的重要指标之一,是当前全球肿瘤研究的热点。ctDNA检测具有取材方便、无创、可以多次检测、实时追踪肿瘤治疗进展等多项优势。通过二代高深度测序,可以有效检测肿瘤细胞的基因突变、拷贝数变异、甲基化水平等肿瘤细胞的分子信息。除了用于诊断和预后之外,检测ctDNA也可以作为监测肿瘤进展和肿瘤对靶向药物是否起效的有效方法。尽管目前大部分的ctDNA检测还缺少足够的临床数据证明其有效性和实用性,基于二代测序的ctDNA检测仍是未来很重要的一个发展方向。
四、三代测序技术
三代测序技术泛指那些在测序过程中不需进行DNA扩增,直接对单条DNA分子进行测序的技术,其通常具有测序实时、周期短、读长长、文库构建简单等特点 [8]。自2003年斯坦福大学生物工程系Stephen Quake教授成功演示第一个单分子DNA测序实验以来,该技术进展迅猛。目前主流的Pacific Biosciences平台与Oxford NanoPore平台均已能够实现在10%~15%测序错误率的基础上进行平均长度达10~20kb的超长读长测序。借助长读长优势,三代测序技术在基因组 de novo测序、基因组结构变异、全长转录组测序、全长16S rDNA测序等二代测序技术因读长短而难以胜任的科研领域大放异彩,也为未来基于基因检测的临床诊断提供了更有力的工具。
(一)实验原理
截至目前,市场上三代测序平台主要由Pacific Biosciences与Oxford NanoPore公司开发,此外,Helicos Biosciences公司也曾开发出商品化的测序仪Helioscope,其因读长过短(<200bp)、仪器成本过高等原因不被市场认可。
1.Pacific Biosciences
Pacific Biosciences(PacBio)是一家成立于2004年的美国公司,采用基于零级波导技术(zero-mode waveguide technology,ZMW)的单分子实时测序(singlemolecule real-time sequencing,SMRT)技术直接对DNA分子进行测序。ZMW实质上是制备在玻璃-铝材料板上的一些直径在纳米级的微孔,数量高达十万到百万,该配件称为SMRT Cell。在测序过程中,DNA首先被片段化为平均10kb长度的片段,经末端补齐,加A后,在两端连接上茎环结构的测序接头(SMRTbell adapter),获得测序模板(SMRTbell template);测序引物退火,DNA聚合酶特异性识别并结合测序接头后,聚合酶分子-DNA复合物被添加到SMRT Cell上,且每个ZMW 微孔最多容纳一个酶分子-DNA复合物分子,当加入标记不同荧光的4种dNTP为底物后,DNA合成随即启动。在DNA合成过程中,当某种dNTP被聚合酶添加进DNA时,标记在磷酸基团上的荧光基团被切割释放,激发出的荧光脉冲被测序仪检测;计算机根据检测到的荧光脉冲信号的先后顺序实现实时的单分子测序(图2-11)。因SMRTbell template呈环状,因此测序可沿着正链—负链—正链……的顺序一直进行,从而实现对测序模板的多次测序,测序精确度也因此提高。此外,当模板上的碱基修饰状态(如甲基化修饰)不同时,核苷酸被添加时所产生的荧光脉冲信号也会存在区别,因而可凭借此特点实时对碱基修饰进行检测。目前,PacBio共发布两台测序仪——PacBio RS Ⅱ及PacBio Sequel,后者单次运行能够获得5G~10G原始测序数据,是前者的7倍。PacBio于2015年实现人全基因组测序 [9]。
图2-11 SMRT测序原理示意图
ZMW结构(左);荧光核苷酸合成时产生荧光脉冲(右)
2.Oxford NanoPore
Oxford NanoPore于2005年成立于英国牛津,致力于使用纳米孔技术进行单分子测序。核心技术在于一种特殊的纳米孔,本质是固定在脂质膜介质上,孔径结构的跨膜蛋白。膜两侧加有电位差,电子可以通过纳米孔形成电流,当单链DNA分子通过纳米孔时,不同的碱基会引起不同的电流变化,电信号被芯片上的传感器实施记录后,由计算机最终根据电流变化的频谱特征进行碱基判别,实现实时单分子DNA测序(图2-12)。和PacBio类似,当模板上的碱基存在甲基化修饰,其通过纳米孔时所形成的特异性电流变化特征也可被用于甲基化的检出。具体实验过程中,片段化的DNA两端连接上接头后,motor蛋白特异性结合在测序接头上,将DNA分子引导至纳米孔,并解链双链DNA,其结构仅允许单链DNA分子通过纳米孔。根据接头类型,可分为1D、2D和1D 2测序,分别对应单向测序(仅正链或负链,1D)与双向测序(检测正链和负链2D和1D 2) [10]。NanoPore于2018年实现人全基因组测序。
图2-12 NanoPore测序原理示意图
Oxford NanoPore发布有3款平台,分别为MinION、GridION X5和PromethION,其中MinION和GridION X5使用相同的流动池,单张流动池可提供至多512个纳米孔,MinION为单通道,GridION X5为5通道并行系统,单通道运行48小时可获得10G~20G测序数据。PromethION为高通量仪器,使用面积更大的流动池,提供至多3 000个纳米孔,且支持48张流动池并行测序,48小时可获得Tb级别的测序数据量。
(二)三代测序的临床应用
三代测序技术作为最新的DNA测序技术,有通量高、读长长、测序实时的特点,可有效应用于基因检测。如上述提到的 BRAC1/BRAC2的突变检测在NanoPore [11]与PacBio平台均已实现。但现阶段,三代测序因单碱基测序错误率过高,需多次测序校正保证单位点的测序精度,这无疑限制了三代测序在SNV突变检出中的应用。然而,三代测序长读长的特点能够在检测SNV时,同时有效检测SV,如倒位、易位造成的基因融合,基因扩增/缺失等拷贝数变异,这些变异与肿瘤密切相关:如 PER3基因18号外显子中一段54bp重复序列的高重复次数预示着高的乳腺癌风险 [12]; HRAS1基因小卫星区域的VNTR变异与散发性卵巢癌间存在关联 [13];在一项高分化浆液性卵巢癌(high-grade serous carcinoma,HG-SC)中,超过20%的卵巢癌患者携带有 CDKN2D- WDFY2融合突变,融合位点发生在 CDKN2D基因的1号内含子与 WDFY2的2号内含子之间 [14]。相较于SNV,可用于临床检测的SV类型突变要少得多,很大程度可归因为缺乏精准的SV检测方法。随着三代测序技术的发展,这一问题正逐渐缓解。如Liang Gong等人使用NanoPore对乳腺癌模型HCC1187进行了全基因组测序,并使用Picky软件进行SV检测。实验共检出34 100个SV,并且使用PCR对其中超过200个SV进行验证发现,有多条reads支持的SV,正确率高达100%,即使只有单条read支持,SV的正确率也可达到79%。与短读长的Illumina测序结果分析比较,NanoPore检出的SV中有93%~95%为Illumina技术无法检出,展现了三代测序技术在SV检出的绝对优势 [15]。
临床诊断中,通常仅需检测少量位点,特点是低数据量高频次,所以单次运行产出高通量数据的测序策略一般并不适用。但NanoPore纳米孔技术不需要复杂的拍照系统以及各种蠕动泵设备,因此测序仪成本较低且可以做到非常小巧。以单通道的MinION为例,重量不足100g,可直接连接笔记本电脑使用,大幅降低了测序实验对环境的苛刻要求,可在实验室以外,甚至户外进行,非常适用于医疗卫生建设滞后,急需高水平检测设备的偏远地区和不发达地区。纳米孔测序速度极快,达到单个纳米孔每秒450个碱基,但由于纳米孔的数量限制,因此在获得高通量数据时并无显著优势,但这同样也赋予了纳米孔进行低通量测序时良好的时效性。近期,Oxford NanoPore推出了适用于临床诊断的、通量更小的Flongle,以及全自动样本制备工作站VolTRAX,使一键式测序成为可能。实验操作简单,测序灵活,数据实时获得,这让纳米孔测序技术在医疗、健康领域具有极大的应用潜力。
五、单细胞测序技术
人体是由几十万亿个细胞构成的,这些细胞和谐共存又相互影响。在特殊情况下,个别细胞的变异可能不断发生,最终导致其所在器官的恶变和肿瘤的形成。瘤内异质性(intratumor heterogeneity)是许多肿瘤的重要特征之一,许多肿瘤由肿瘤细胞、肿瘤干细胞(cancer stem cell,CSC)、循环肿瘤细胞(circulating tumor cell,CTC)等不同细胞类型构成 [16],同时不同肿瘤细胞也存在遗传层面(如DNA、RNA)和表观遗传层面(如甲基化、染色质构象、组蛋白修饰等)的差异。肿瘤内部的细胞组成和结构在肿瘤发展过程中不断变化,例如在肿瘤治疗过程中,选择的压力会导致主要的细胞克隆被药物抑制或杀死,而其他克隆会取而代之并导致肿瘤复发。不同肿瘤细胞所处的微环境(microenvironment)进一步增加了肿瘤的复杂性,体现在肿瘤原发灶和转移灶以及不同患者的肿瘤的差异上。
传统的将肿瘤作为一个整体进行研究的策略,得到的是大量高度异质性细胞平均化的结果,然而,对于如此复杂的肿瘤,有必要借助更加精细的手段在单细胞水平上进行研究。单细胞测序技术的发展,提供了描绘更高分辨率的肿瘤内部结构的有效手段,在研究肿瘤内部异质性、追踪细胞谱系变化、发现稀少肿瘤细胞亚群等方面具有不可替代的优势。下文将介绍单细胞技术的基本原理和在肿瘤研究方面的应用。
(一)单细胞测序技术原理介绍
单细胞测序,顾名思义就是通过测序获得每个细胞各自的遗传或表观遗传信息。与传统的基因检测研究手段相比,单细胞测序在技术上的难点主要是单细胞分离和单细胞核酸扩增。
1.单细胞分离
单细胞测序的首要步骤是通过表型或者细胞表面标志物从细胞群体中分离特定类型的单细胞,常用的分离技术包括FACS分选、显微操控(micro-manipulation)、微流控芯片(microfluidics systems)、激光捕获显微切割(laser capture microdissection,LCM)等 [17,18](图2-13A);其中微流控芯片按照单细胞分离原理的不同,又可以分为基于阀(valvebased)、油包水液滴(droplet-based)以及微孔(nanowell)等不同种类 [19]。
除上述分离方法外,直接将含有多种细胞类型的肿瘤样本制备成单细胞悬液,借助更高通量的手段对肿瘤整体结构进行全面的研究,这一研究思路在肿瘤免疫微环境的研究中已经得到广泛运用,而近年来10x Genomic [20]、BD Rhapsod Single-Cell Analysis System等商品化仪器也提高了研究的便利性。
2.单细胞核酸扩增
在通常情况下,一个肿瘤细胞中所含有的DNA约为 6~12pg,RNA为 10~50pg(其中mRNA比例为1%~5%),远远不能满足高通量测序构建测序文库所需的核酸量,需要有效的方法对核酸进行扩增。针对不同的研究目的,已经发展了多种扩增方法(图2-13B)。
图2-13 单细胞测序技术介绍
首先,基因组DNA的扩增方法已经有超过十年的研究历史了,其主要的挑战在于扩增的同时,需要尽量减少扩增偏倚(bias,局部过度或者缺乏扩增)、假阳性率(false-positive rate,聚合酶错配产生的突变)、基因组信息缺失(基因组覆盖度(coverage)低或者等位基因缺失(allelic dropout),产生假阴性(false-negative)以及嵌合体(chimaeras)等情况。目前主要的基因组DNA扩增方法主要有以下几种:① 基于随机引物PCR扩增,如DOP-PCR [21];② 基于phi29 DNA聚合酶的等温扩增,即MDA(multiple displacement amplification) [22];③ 在上述两种方法基础上改进的多次退火环状循环扩增技术(multiple annealing and looping-based amplification cycles,MALBAC) [23]、PicoPLEX等方法。
上述经过扩增的基因组DNA通过构建特定类型的测序文库,可实现对单细胞全基因组、外显子组以及靶向测序等不同方面的研究。针对肿瘤单细胞测序,研究所关注的变异类型是选择具体扩增方法的重要参考,比如对于拷贝数变异检测,MALBAC更加适合,而单碱基突变检测则优先选择假阳性率较低的MDA扩增。另外,对于单细胞扩增,来源于环境的微量DNA也会被同步扩增;而缩小反应体系,例如用体积只有纳升的微流控芯片代替传统的微升级别的反应体系,可以明显减少污染DNA,同时也可以降低MDA扩增的偏倚 [17]。
在转录组研究方面,mRNA扩增方法种类较多,主要原理为:① 使用poly(dT)引物对mRNA进行反转录;② 利用加A尾方法(如Tang protocol [24]、QuartzSeq [25])或者基于反转录酶的链转换特性(template-switching,如SmartSeq [26,27]、STRT-Seq [28])引入通用序列用于cDNA第二链合成或者直接进行扩增;③ 通过PCR或者体外转录( in vitro transcription,IVT,如CEL-seq [29]、MARS-seq [30])进行扩增。
上述方法中,SmartSeq(以及改进的SmartSeq2)扩增得到全长的cDNA产物,针对可变剪切、新转录本、融合基因等特定研究更加合适。在反转录时引入唯一分子标签(unique molecular identifiers,UMIs) [31,32],通过去除具有相同UMIs和相同转录本序列的测序reads,排除PCR重复(duplication)对表达定量的影响,UMIs可以在STRT-Seq、CEL-Seq、MARS-Seq等扩增方法中应用 [18,33]。同时通过multiplexing技术引入细胞识别标签,可以实现细胞的混合建库,大大提高研究通量和效率,如结合了油包水液滴分离单细胞以及单细胞、单分子标记技术的10x Genomic 单细胞微流控研究平台已经将单细胞转录组研究通量从传统的几十、几百提升到几千、上万的水平。
常用的几种单细胞扩增技术的优缺点和应用总结如表2-2所示。近几年来,新的单细胞测序技术层出不穷,例如研究单细胞染色质可接近性的scATAC-seq [34],研究单细胞多组学如G&T-Seq [35]、DR-Seq [36]、scCOOL-Seq [37]等。可以预见,随着技术手段的不断丰富和成熟,对肿瘤单细胞进行表观和多组学层面的研究也将成为未来的研究热点。
表2-2 常用单细胞扩增技术的优缺点和应用
(二)单细胞测序技术在肿瘤基因检测上的应用
基于技术的发展和成熟,单细胞测序在肿瘤、尤其是妇科肿瘤基础研究方面得到了较为广泛的应用,同时在临床的诊断和预后判断等方面,也表现出良好的发展前景。
1.原发肿瘤克隆多样性与进化研究
基于基因变异的复杂性随着时间累加的假设,可以利用系统发育学的方法,构建变异发生的相对时序。2011年,Navin等人 [38]最早利用这一思路对2例三阴性(ER -/PR -/HER2 -)乳腺癌样本进行单细胞核测序,通过对上百个单细胞拷贝数的检测和分析,发现了进化时序上拷贝数变异呈现间断性暴发(punctuated burst)式出现,随后不断增殖并在肿瘤中稳定存在。这一结果不同于早先提出的变异随时间逐渐积累的模式。
针对血液类肿瘤,常采用单细胞靶向测序来绘制细胞谱系变化。如对儿童急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)的研究中,首先通过全外显子测序鉴定群体(bulk) DNA中的突变位点后,对6例样本的1 400多个单细胞进行MDA扩增和200~300个位点靶向测序,绘制了不同患者肿瘤细胞的克隆结构 [39]。
2.循环肿瘤细胞研究
循环肿瘤细胞(circulating tumor cell,CTC)产生于原发肿瘤,可以通过全身血液循环到达远端组织诱发肿瘤转移 [40]。在一项针对乳腺癌的开创性研究中,通过Cell Search系统对上皮细胞表面蛋白EpCAM阳性和免疫细胞表面受体CD45阴性的CTC细胞进行计数,结果表明在7.5ml全血中高CTC的乳腺癌患者,其5年生存率显著更低 [41]。在这项研究的基础上,在更多的肿瘤类型中开展了CTC数目和预后相关性的研究 [42]。目前,Cell Search系统已经通过美国FDA批准用于CTC细胞计数。同时,针对处于上皮-间质转化(epithelial-mesenchymal transition,EMT)的肿瘤细胞表面蛋白表达降低,导致基于EpCAM富集CTC的方法出现假阴性的情况,对CTC分离也有了相应的改进方法 [43]。
3.单细胞测序技术在临床上的应用展望
高通量测序技术的发展推动了肿瘤遗传学的进展,并且为临床诊断和用药提供指导。我们有理由相信,单细胞测序技术将会在肿瘤临床风险预测、早期发现、个性化治疗、实时监测和预后判断方面发挥越来越重要的作用 [44]。
通过单细胞测序技术,可以实现在肿瘤细胞变异的早期实现高灵敏度检测,同时便于对处于前恶性组织(pre-malignant tissue)的少量样本量进行检测。例如,浆液性卵巢癌(serous epithelial ovarian cancer)的诊断通常是在癌症进展后期,并且伴随较差的预后,而针对阴道分泌物的单细胞基因组测序,有可能成为一种早期检测的手段。
肿瘤基因组学研究的结果表明,同种肿瘤类型在不同个体中的差异也是很大的。对于许多肿瘤类型,目前临床上会首先对患者进行基因检测并分组,再进行针对性的治疗,更进一步,可以将肿瘤内部异质性作为个性化治疗的另一个重要参考内容。在临床上应用单细胞测序不仅可以加深对肿瘤异质性的了解、提供异质性量化的指标,同时可以获得化疗药物对不同细胞亚群作用效果的信息。这种异质性的检测可以通过对肿瘤多区域的细针吸取活检(fine-needle aspiration,FNA)方式进行,少量的活检样本可以通过单细胞扩增的方法获得足够的用于检测的核酸量。
肿瘤耐药导致的复发是临床治疗效果不佳的重要原因之一,在这种情况下,对药物选择压力下产生的耐药性肿瘤细胞实时监测可以及时调整治疗方案,获得更好的治疗效果。例如,从非侵入性的液体活检样本中分离CTC,并进行单细胞基因组或者转录组测序,可以作为追踪肿瘤复发的手段。尽管CTC可以在多大程度上反映肿瘤复发的特征仍是目前需要深入研究的问题,然而目前在前列腺癌中的研究已经取得了可喜的结果。研究表明在部分前列腺癌患者CTC中可以检测到雄激素受体(androgen receptor,AR)一种可变剪切形式 AR- V7的表达,同时 AR- V7的表达与患者对雄激素受体拮抗剂如恩杂鲁胺(enzalutamide)和阿比特龙(abiraterone)的耐药性相关 [45],但这类患者对紫杉醇(paclitaxel)类药物的反应要好于雄激素受体拮抗剂 [46],预示CTC中 AR- V7的表达可以作为临床监测的标志物,指导用药方案的制订。
综上所述,随着单细胞技术的发展成熟,运用该技术获得了包括妇科肿瘤在内的越来越多临床肿瘤样本更精细、更高分辨率的遗传变异信息,并逐渐在临床上发挥作用。可以预见,单细胞技术的相关应用将在临床上指导妇科肿瘤早期发现、个体化治疗、实时监测和预后判断等方面发挥越来越重要的作用。
六、总结
肿瘤本身就是一种基因病,在广泛的内在和外在选择压力下进化,肿瘤细胞的基因在不断地发生突变,肿瘤组织是动态变化的,每个时期所检测出来的基因组可能都有发生变化,目前相关的知识和数据均处在摸索和积累阶段,仍然需要不断的临床实践和研究投入。
高通量DNA测序技术在过去十年中的发展和商业化显著推进了癌症研究、诊断和治疗。随着测序技术的持续进步和数据分析能力的持续提高,会有更多癌症类型的基因组状况将被揭示。一个关键的挑战是,开发出廉价稳定的系统,可以系统地、高通量地检测突变以及其他序列变异,这种系统的广泛使用将提供癌症发生和发展以及转移中许多的基因信息,也就可以推动诊断、预后与治疗方法的发展。测序技术将在理解癌症的遗传基础和机制方面发挥越来越重要的作用,引领更好的疾病预防、检测和临床干预。
(方 欧)
参考文献
[1]Maxam AM,Gilbert W.A new method for sequencing DNA.Proceedings of the National Academy of Sciences,1977,74(2):560-564.
[2]Kim G,Ison G,McKee AE,et al.FDA approval summary:olaparib monotherapy in patients with deleterious germline BRCA-mutated advanced ovarian cancer treated with three or more lines of chemotherapy.Clinical Cancer Research,2015,21(19):4257-4261.
[3]Antoniou A,Pharoah PDP,Narod S,et al.Average risks of breast and ovarian cancer associated with BRCA1 or BRCA2 mutations detected in case series unselected for family history:a combined analysis of 22 studies.The American Journal of Human Genetics,2003,72(5):1117-1130.
[4]Fong PC,Boss DS,Yap TA,et al.Inhibition of poly( ADP-ribose) polymerase in tumors from BRCA mutation carriers.New England Journal of Medicine,2009,361(2):123-134.
[5]Perou CM,Sørlie T,Eisen MB,et al.Molecular portraits of human breast tumours.Nature,2000,406(6797):747.
[6]Sørlie T,Perou CM,Tibshirani R,et al.Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications.Proceedings of the National Academy of Sciences,2001,98(19):10869-10874.
[7]Van’t Veer LJ,Dai H,Van De Vijver MJ,et al.Gene expression profiling predicts clinical outcome of breast cancer.Nature,2002,415(6871):530.
[8]Heather JM,Chain B.The sequence of sequencers:the history of sequencing DNA.Genomics,2016,107(1):1-8.
[9]Chaisson MJP,Huddleston J,Dennis MY,et al.Resolving the complexity of the human genome using singlemolecule sequencing.Nature,2015,517(7536):608.
[10]Hill FR,Monachino E,van Oijen AM.The more the merrier:high-throughput single-molecule techniques.Biochemical Society Transactions,2017,45(3):759-769.
[11]Gabrieli T,Sharim H,Fridman D,et al.Selective nanopore sequencing of human BRCA1 by Cas9-assisted targeting of chromosome segments( CATCH).Nucleic Acids Research,2018,46(14):e87-e87.
[12]Zhu Y,Brown HN,Zhang Y,et al.Period3 structural variation:a circadian biomarker associated with breast cancer in young women.Cancer Epidemiology and Prevention Biomarkers,2005,14(1):268-270.
[13]Weitzel JN,Ding S,Larson GP,et al.The HRAS1 minisatellite locus and risk of ovarian cancer.Cancer Research,2000,60(2):259-261.
[14]Jing Y,Zhang Y,Zhu H,et al.Hybrid sequencing-based personal full-length transcriptomic analysis implicates proteostatic stress in metastatic ovarian cancer.Oncogene,2019,38(16):3047-3060.
[15]Gong L,Wong CH,Cheng WC,et al.Picky comprehensively detects high-resolution structural variants in nanopore long reads.Nature Methods,2018,15(6):455-460.
[16]Navin NE.Cancer genomics:one cell at a time.Genome Biology,2014,15(8):452.
[17]Gawad C,Koh W,Quake SR.Single-cell genome sequencing:current state of the science.Nature Reviews Genetics,2016,17(3):175.
[18]Kolodziejczyk AA,Kim JK,Svensson V,et al.The technology and biology of single-cell RNA sequencing.Molecular Cell,2015,58(4):610-620.
[19]Prakadan SM,Shalek AK,Weitz DA.Scaling by shrinking:empowering single-cell“ omics” with microfluidic devices.Nature Reviews Genetics,2017,18(6):345.
[20]Zheng GXY,Terry JM,Belgrader P,et al.Massively parallel digital transcriptional profiling of single cells.Nature Communications,2017,8:14049.
[21]Carter NP,Bebb CE,Nordenskjo M,et al.Degenerate oligonucleotide-primed PCR:general amplification of target DNA by a single degenerate primer.Genomics,1992,13(3):718-725.
[22]Dean FB,Nelson JR,Giesler TL,et al.Rapid amplification of plasmid and phage DNA using phi29 DNA polymerase and multiply-primed rolling circle amplification.Genome Research,2001,11(6):1095-1099.
[23]Zong C,Lu S,Chapman AR,et al.Genome-wide detection of single-nucleotide and copy-number variations of a single human cell.Science,2012,338(6114):1622-1626.
[24]Tang F,Barbacioru C,Wang Y,et al.mRNA-Seq whole-transcriptome analysis of a single cell.Nature Methods,2009,6(5):377.
[25]Sasagawa Y,Nikaido I,Hayashi T,et al.Quartz-Seq:a highly reproducible and sensitive single-cell RNA sequencing method,reveals non-genetic gene-expression heterogeneity.Genome Biology,2013,14(4):3097.
[26]Ramsköld D,Luo S,Wang YC,et al.Full-length mRNA-seq from single-cell levels of RNA and individual circulating tumor cells.Nature Biotechnology,2012,30(8):777.
[27]Picelli S,Björklund ÅK,Faridani OR,et al.Smart-seq2 for sensitive full-length transcriptome profiling in single cells.Nature Methods,2013,10(11):1096.
[28]Islam S,Kjällquist U,Moliner A,et al.Characterization of the single-cell transcriptional landscape by highly multiplex RNA-seq.Genome Research,2011,21(7):1160-1167.
[29]Hashimshony T,Wagner F,Sher N,et al.CEL-Seq:single-cell RNA-Seq by multiplexed linear amplification.Cell Reports,2012,2(3):666-673.
[30]Jaitin DA,Kenigsberg E,Keren-Shaul H,et al.Massively parallel single-cell RNA-seq for marker-free decomposition of tissues into cell types.Science,2014,343(6172):776-779.
[31]Islam S,Zeisel A,Joost S,et al.Quantitative single-cell RNA-seq with unique molecular identifiers.Nature Methods,2014,11(2):163.
[32]Kivioja T,Vähärautio A,Karlsson K,et al.Counting absolute numbers of molecules using unique molecular identifiers.Nature Methods,2012,9(1):72.
[33]Ziegenhain C,Vieth B,Parekh S,et al.Comparative analysis of single-cell RNA sequencing methods.Molecular Cell,2017,65(4):631-643.
[34]Cusanovich DA,Daza R,Adey A,et al.Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing.Science,2015,348(6237):910-914.
[35]Macaulay IC,Haerty W,Kumar P,et al.G&T-seq:parallel sequencing of single-cell genomes and transcriptomes.Nature Methods,2015,12(6):519.
[36]Dey SS,Kester L,Spanjaard B,et al.Integrated genome and transcriptome sequencing of the same cell.Nature Biotechnology,2015,33(3):285.
[37]Li L,Guo F,Gao Y,et al.Single-cell multi-omics sequencing of human early embryos.Nature Cell Biology,2018,20(7):847.
[38]Navin N,Kendall J,Troge J,et al.Tumour evolution inferred by single-cell sequencing.Nature,2011,472(7341):90.
[39]Gawad C,Koh W,Quake SR.Dissecting the clonal origins of childhood acute lymphoblastic leukemia by single-cell genomics.Proceedings of the National Academy of Sciences,2014,111(50):17947-17952.
[40]Valastyan S,Weinberg RA.Tumor metastasis:molecular insights and evolving paradigms.Cell,2011,147(2):275-292.
[41]Cristofanilli M,Budd GT,Ellis MJ,et al.Circulating tumor cells,disease progression,and survival in metastatic breast cancer.New England Journal of Medicine,2004,351(8):781-791.
[42]Allard WJ,Matera J,Miller MC,et al.Tumor cells circulate in the peripheral blood of all major carcinomas but not in healthy subjects or patients with nonmalignant diseases.Clinical Cancer Research,2004,10(20):6897-6904.
[43]Ozkumur E,Shah AM,Ciciliano J C,et al.Inertial focusing for tumor antigen-dependent and-independent sorting of rare circulating tumor cells.Science Translational Medicine,2013,5(179):179ra47-179ra47.
[44]Baslan T,Hicks J.Unravelling biology and shifting paradigms in cancer with single-cell sequencing.Nature Reviews Cancer,2017,17(9):557.
[45]Antonarakis ES,Lu C,Wang H,et al.AR-V7 and resistance to enzalutamide and abiraterone in prostate cancer.New England Journal of Medicine,2014,371(11):1028-1038.
[46]Scher HI,Lu D,Schreiber NA,et al.Association of AR-V7 on circulating tumor cells as a treatment-specific biomarker with outcomes and survival in castration-resistant prostate cancer.JAMA Oncology,2016,2(11):1441-1449.