实用妇科肿瘤遗传学
上QQ阅读APP看书,第一时间看更新

基础理论篇

第一章 肿瘤遗传学基础

第一节 肿瘤与遗传学概述

提起肿瘤,人们总是觉得很恐惧。确实,肿瘤严重危害人类健康,是人类死亡的第二大因素,因为发病凶险,常常发现时就到了晚期,因此不少人谈癌色变。随着现代科技,特别是生物医药技术的发展,肿瘤的预防、早期诊断、治疗和预后均取得了显著的进步,肿瘤已经不再是一种无法治疗的疾病,不仅可以通过健康的生活方式有效预防,而且还可以通过包括基因检测在内的各种检测技术进行早期诊断、精准诊断,进而实现精准医疗。
一、什么是肿瘤
肿瘤的发病从本质上来讲是由肿瘤细胞的特性所决定的。肿瘤细胞又称为癌细胞,癌细胞和机体的多种正常细胞一起形成了肿瘤。与正常细胞相比,癌细胞之间失去了接触抑制,细胞的黏附性减少,细胞核增大,而且不均一、不规则,细胞周期加速,不断分裂和生长,失去了接触抑制等控制,这些癌细胞还容易变形,向四周浸润,甚至穿透组织基底膜,向远端扩散和转移。
癌细胞的特性与“巨蟹(cancer)”的含义非常相似,因此癌症的英文名称为cancer。如此凶恶的癌细胞是由自身的正常细胞,一步步逐渐发展过来,癌细胞是机体长期进化的产物。人体的每一个细胞均由受精卵发育分化而来,不同细胞具有不同的分化功能,它们的细胞核和基因组基本上是一样的,但是不同细胞的转录表达是不一样的,细胞的形态和功能也就不一样,细胞的分化受到机体的精确调控,有着预定的程序,不同细胞分化方向不同,各司其职,共同维护机体的生长发育和新陈代谢的统一性。但是细胞在生长的过程中,总是会受到来自内外各种有害环境因素的影响。虽然机体已经为了避免环境有害因素的伤害,设置了一道又一道的防线,但是仍然不能避免各种DNA突变,极大部分DNA突变会被机体的DNA损伤修复系统所修复,但仍有极少数有害突变在细胞中保留下来。在保留下来的DNA突变中,有很少数的癌基因和抑癌基因的突变能够加速细胞的生长,使细胞周期的监控受损,细胞能够抵抗凋亡,逃脱免疫细胞的监控,这样肿瘤细胞的种子就种下了。经过机体免疫系统达尔文进化的选择,这些肿瘤细胞逐渐发展起来,能够忍受缺氧的环境并适应环境营养的缺乏,积极重新建立血管,保障营养供应,招募机体的其他正常细胞,逐渐发展成为一个脱离机体控制的肿瘤组织。在肿瘤组织形成的过程中,肿瘤组织的环境进一步恶化,产生了很多遗传异常,鉴于肿瘤细胞生长加速和失去接触抑制,有限的资源无法满足更多的肿瘤细胞的无限生长,因此肿瘤细胞的代谢偏向糖酵解,能够产生肿瘤组织发生和发展的多种原料,用于肿瘤发育。在肿瘤中发生了内皮细胞类型向间充质类型的转换(epithelial-mesenchymal transition,EMT),肿瘤细胞就能够逐渐突破基底膜,发生浸润,再进一步就能够沿着血管、淋巴管等,随着血液流动而发生转移,肿瘤细胞的种子可以在机体的其他地方“安营扎寨”,又一次形成肿瘤组织,这样星星点点的肿瘤组织就形成了一个肿瘤帝国。人体的肿瘤组织细胞尽管具有较强的异质性,但基本上都由一个肿瘤细胞克隆发育和演化而来。
肿瘤的发展历程从炎症开始,经历增生、赘生、化生、癌变、浸润和转移这些阶段,“万病炎为首”,这是外因,而内在原因始于基因突变。
癌是进化的产物,“物竞天择、适者生存”的法则要求细胞不断进化。人体是一个小世界,肿瘤细胞是机体这个世界进化的产物,也是机体的摧毁者。任何进化的基础源于DNA突变,这些具有适应性的突变逃脱机体免疫系统的控制就可能造成癌症的发生,因此癌症是进化的产物,是一个失控的达尔文进化过程。从种系进化的角度已经阐明了癌细胞是单克隆起源,并且大多数细胞在进化过程中被淘汰(由于代谢、能量获取、免疫防御等因素),极少数的细胞获得了额外的选择优势,主导了接下来癌细胞形成亚群的进化发展。从一个良性肿瘤发展到恶性转移性肿瘤的每一步也都是自然选择的结果。癌细胞或癌干细胞通过自然选择不断演化,有利于癌细胞生存和增殖的变化是促进癌症增殖的原动力。癌细胞具有发展成癌症的潜力,但在杀死部分癌细胞的同时也会进一步带来选择压力,促使新的突变发生,辅助癌症的发生和发展。
二、肿瘤的特征分析
关于肿瘤的特征,科学家有过很多描述,而且在不断更新和补充增加。人类认识肿瘤可以追溯至公元前,起先是从宏观形态学、组织水平认识,近200年来人类对癌症的认识逐步深入,深入到细胞水平,再进一步到了分子水平,只有在分子水平和细胞水平的结合,才能真正揭开肿瘤细胞神秘的面纱。
2000年,Hanahan和Weinberg在 Cell杂志上总结了肿瘤细胞6个基本特征:自我满足的生长信号、对拮抗生长信号的不敏感、逃避凋亡、潜在的无限复制能力、持续的血管生成、组织浸润和转移。2011年,他们又在 Cell上对原有综述进行了升级(称为新归纳的肿瘤基本特征),一方面简述了肿瘤学中10年来的热点和进展,包括细胞自噬、肿瘤干细胞、肿瘤微环境等,并在之前6个基本特征基础上新增了4个特征,分别为:避免免疫摧毁、促进肿瘤的炎症、 细胞能量代谢异常、基因组不稳定与突变。
早期归纳的自我满足的生长信号、对拮抗生长信号的不敏感、逃避凋亡、潜在的无限复制能力表明肿瘤细胞生长的优势。持续的血管生成则说明肿瘤细胞能够获取机体更多的营养,肿瘤的组织浸润和转移说明肿瘤的恶性生长,也是肿瘤不断生长的需要。避免免疫摧毁是肿瘤细胞能够存活下来的必要条件,促进肿瘤的炎症说明了炎症在肿瘤发生和发展中的重要性,炎症也是其他多种疾病的共同诱因。细胞能量代谢异常虽然在20世纪很早就被Weinberg提出,然而其重要性在近些年才不断加深,肿瘤细胞喜欢通过糖酵解途径获取能量这一特点已被利用作为治疗肿瘤的靶点。基因组不稳定与突变这一特征虽然排在最后,但从遗传学角度来看,这是最为重要、最为基本的一个特征。基因组的不稳定除了涉及遗传以外,还与表观遗传异常有关,不稳定的基因组在恶劣的环境下能够有更多的变异,有更多的进化速度。肿瘤与其他遗传病或慢性疾病不一样,肿瘤细胞的突变属于肿瘤组织所特有的,大多数是体细胞突变,而机体的正常细胞则没有任何变异,至多是组织表达发生了变化。
从细胞角度来看癌细胞,其最为基本的细胞学特征是持续不断生长。从遗传学角度看,癌细胞不断变异,这应该是来自基因组的不稳定性,它产生了遗传的多样性,并在进化中加速这些性状的获得。从环境因素来看,炎症作为环境诱导因素可以诱导细胞恶性生长的标志性特征。环境,特别是微环境对肿瘤组织发生和发展很重要,应倍加重视,肿瘤组织中存在正常细胞以及伪正常细胞,肿瘤不只是癌细胞组成的组织,它们是由多种不同类型的细胞组成的复合体,这些细胞之间存在相互作用,被肿瘤细胞招募来的正常细胞,以主要参与者的身份形成肿瘤相关基质,对于肿瘤的发展和表达也发挥作用。
癌细胞的这些特征不是孤立的,不少特征之间有相互关系,我们重点关心与肿瘤遗传学相关的一些特征,例如基因组的不稳定性,以及各种特性背后的遗传学因素。基因组不稳定性对于其他特征而言,也是非常重要的,是其他特征的遗传学基础。从进化角度看,遗传变异是肿瘤进化的基础,而肿瘤细胞环境能够有利于各种基因突变的选择和积累。而癌细胞善于利用和展示这些特征,将这些特征统一在癌细胞建立的细胞学和遗传学之中。
三、肿瘤的进化
肿瘤细胞在逆境中发生、发展,百折不挠,具有极强的适应性和应变能力,最终发展壮大。肿瘤是细胞水平上生物进化的体现,是生物本性的体现,是适应性进化选择的结果。
肿瘤进化是细胞进化,细胞是其基本单位。突变是进化的物质基础,肿瘤的形成源于基因突变。因此,只要有人类存在,有突变存在,人类进化的历程中就会有肿瘤产生。
人体的细胞分化是机体细胞编程的结果,是正常的生命过程,但是肿瘤细胞是违背这个安排,或者不执行这个宿命的安排,为了自由而特立独行。为了自由,肿瘤细胞不断地演化,虽然貌似取得了自由,不受机体的控制,也能够更好地发展,然而肿瘤的进化只能在机体内部发展,肿瘤自身最后不能避免的是灭亡,或者被手术清除,或者被杀灭,或者与机体共同死亡。
四、肿瘤发生和发展的环境因素
肿瘤是一种比较特殊的多基因疾病,肿瘤的发生和发展不仅与遗传基因有关,还受到多种环境因素的影响,物理(X 射线、紫外线)、化学(吸烟、饮酒)和生物(病毒、生物毒素)环境因素的暴露均会启动和加快癌症的发生和发展。
大量的流行病学分析,吸烟与肺癌、乳腺癌、前列腺癌、胃癌、胰腺癌和食管癌等多种肿瘤相关。饮酒也和肝癌、食管癌和结直肠癌等多种肿瘤有关,放射线和紫外线等与皮肤癌、肺癌、头颈部肿瘤等相关,病毒感染会促进肝癌、鼻咽癌、宫颈癌和血液肿瘤等多种肿瘤发生,而过度饮食和肥胖也会增加不少肿瘤的风险。我们的生活环境,如空气、水、食品中会存在各种各样的有害因素,会增加不同肿瘤的风险。
人体不可能在绝对安全的系统中生活,总会面临各种环境的暴露,如何能够适应这些环境的变化非常重要。生命虽然脆弱,但也已经在地球上生活了几十亿年了,我们时常赞美生命的坚韧与顽强,生命长期进化出来了多种多样、精美细致的机体解毒和修复系统。机体对于这些环境因素并不是没有防御能力,生物体有多种代谢酶如Ⅰ相代谢酶和Ⅱ相代谢酶,特别是肝脏中的多种细胞色素等代谢酶能够化解机体暴露的有害毒素,机体会启动各种DNA损伤修复系统,针对各种环境因素造成的不同DNA损伤进行有效修复。例如人吸烟后,核苷酸切除修复(nucleotide excision repair,NER)复合物在接收到DNA损伤信号后就能够启动核苷酸修复途径修复吸烟产生苯并芘诱导的DNA损伤。如果代谢酶缺陷,DNA损伤修复酶缺陷,在同样的环境因素暴露下,就会增加患癌风险,比较容易得肿瘤。因此,肿瘤也与多种遗传基因有关,不少基因的变异会增加癌症的风险性,也有一些基因变异会降低癌症的风险,但是每个基因的作用均比较微弱,多个基因变异的作用可以叠加。环境因素可以与基因交互作用,例如吸烟会大大增加DNA损伤修复基因缺陷人的肺癌患病风险,饮酒会增加抗氧化基因缺陷的人患肝癌和食管癌等肿瘤风险。
环境的不同,对癌细胞的进化也不一样,不同的环境因素可以诱导出不同类型的肿瘤,有些环境因素可以形成多种肿瘤。环境因素诱导的DNA突变也有不同,有些具有环境特征谱,根据基因突变类型,可以推测机体的环境暴露情况。
环境在肿瘤的发生和发展中均在发挥作用,有些是起始阶段,在肿瘤的发展阶段中也一样会促进肿瘤的发展,包括影响免疫调节、慢性炎症、血管生长等因素。有些时候,由于接触了一些有害环境因素后不久就检查出了肿瘤,虽然这个肿瘤的种子很早就在机体内萌发了,但是后来的环境暴露促进了肿瘤的生长,这一点很关键。
五、肿瘤研究与遗传学的关系
肿瘤可以从多种角度去研究,从病理学、流行病学、药物学和临床医学等学科,也可以从细胞学、生物化学、生理学、发育生物学和进化生物学等学科角度进行研究,遗传学是研究肿瘤的本质和关键因素的基础学科。
遗传学不仅仅研究生物传宗接代中的遗传与变异规律,而且可以揭示生物各种性状背后本质的决定因素,生命特性和活动规律的本质,阐明基因与表型的关系。肿瘤作为生物的一种疾病,也是一种病理性状,肿瘤遗传学就是要从基因的角度研究肿瘤是如何形成的,什么样的基因变异会导致肿瘤的发生和发展,环境因素是如何与基因相互作用启动肿瘤发生又如何促进肿瘤发展的。
肿瘤遗传学不排除要研究遗传性肿瘤,研究具有家族聚集史的肿瘤是如何遗传的,这与遗传病寻找相关基因一样,寻找遗传性肿瘤的相关基因。肿瘤虽然也是遗传病,但又不是普通的遗传病,是一种特殊的体细胞遗传病,发现肿瘤遗传基因的研究方法和策略十分重要,可以通过经典的遗传病基因克隆策略,也可以从功能和表型角度去筛选和鉴定肿瘤基因。
癌症研究的重心也从器官、组织、细胞深入到分子水平,并从单个基因入手,拓展到对多个基因进行研究、研究基因调控网络,从基因组医学、整合医学和精准医学方面试图实现人类对癌症的早期防治和个体化靶向治疗。遗传让人能够更加明白癌症基因变异的来龙去脉,以及癌症的分子机制,并为癌症的治疗和药物开发提供依据。
从应用角度来讲,既然基因在肿瘤发生和发展中发挥了重要作用,以肿瘤易感基因研究基因相关性是尤其合理的。如何看待在此基础上建立的肿瘤的遗传风险评估模型?如何利用基因检测和伴随诊断为肿瘤的精准医疗服务? 肿瘤遗传学研究目前存在哪些热点?这些问题都十分重要。
六、肿瘤发生的遗传因素
在肿瘤的流行病学研究中,我们看到不同人群的高发肿瘤谱不一样,虽然有可能与饮食等环境因素有关,但不可避免与人群遗传结构有差异。例如肝癌是亚洲人高发肿瘤,而乳腺癌、前列腺癌在西方人群中就远高于亚洲人群,即便是亚洲人移民到欧美,那些亚洲人容易罹患的癌症也还是不变。在同一国家同一种族,由于不同地区人群遗传结构的差异以及环境暴露和饮食结构的不同,不同地区也存在癌症谱的差异,如我国广东、广西地区高发鼻咽癌,而食管癌高发区在河北磁县、河南林县和江苏泰州。在同一地区,有些家庭中一些肿瘤相对集中,而在另一些家庭中就少见或罕见肿瘤,这些差异如果排除了环境因素的影响,一定可以分析出遗传因素在其中所起到的作用。
(一)遗传性肿瘤源于胚系基因突变
同时我们还注意到,在有些遗传性的肿瘤中,父母患癌症,子女患者的概率呈现孟德尔遗传规律,这主要是因为某些基因的变异会极大地提高癌症的患病可能。如来自胚系细胞的 RB基因突变会导致视网膜母细胞瘤, BRAC1/BRAC2的突变会导致乳腺癌和卵巢癌的发生, MSH2等基因的突变会导致结直肠癌。这类遗传性肿瘤类似于单基因遗传病,但是也不完全是由单基因决定的,同时会受到环境因素及体内其他基因的作用,存在外显不全的情况,例如含有 BRAC1/BRAC2基因突变的个体也不是百分百地患有乳腺癌,也要受到其他基因变异和环境因素的影响。遗传性肿瘤不仅仅具有家族性聚集,而且一般发病较早,往往是双侧发病。例如视网膜母细胞瘤在儿童时期就会发病,家族性乳腺癌和卵巢癌往往双侧发病,这类遗传性肿瘤是可以通过基因检测和遗传咨询,进行肿瘤的早期预防和治疗,也可以进行进一步的基因检测指导下的试管婴儿和产前诊断,避免带有致癌基因的下一代的产生。
在肿瘤中,由于高外显率基因(high-penetrance gene,HPG)突变导致的常染色体显性遗传肿瘤比例大约为5%~10%,具有肿瘤家族史的肿瘤发生大约占10%~15%。大部分癌症是和基因与环境因素相互作用有关,每个基因的作用弱一些,大多数肿瘤的发生是随机的。
(二)大部分肿瘤形成的遗传变异是体细胞突变
肿瘤的遗传学研究与其他疾病的遗传学研究有很大不同。常见的复杂性疾病,只要不是肿瘤,疾病的组织和细胞只有其基因表达谱发生改变,每个细胞本身的基因组并不改变,基因表达的异常是可逆的,通过药物等外在因素可以调控其恢复到正常,这些疾病的遗传易感性是来自机体每一个细胞。对单基因遗传病(非遗传性肿瘤)而言,在受精卵起每个胚系来源的细胞就有基因变异,由于基因突变会导致遗传病的发生,但是这些细胞中的基因变异基本上是稳定的,也不会发生恶性转化。而肿瘤的发生有一个显著的特征就是体细胞突变,无论来源于胚系的基因突变是否存在,后天发育形成的体细胞会随机突变,而且这些突变一直在细胞中不断积累和变化,肿瘤组织发生基因表达变化是不可逆的,肿瘤细胞的基因突变是无法恢复到正常的,因此,我个人将肿瘤发展比作是“不归路”。而其他疾病理论上由于基因没有连续不断的复杂突变,后天发生的改变总是可以逆转的,从这个角度讲,高血压和糖尿病等疾病的遗传变化和表观遗传变化是可以统一在一起的。
最早认识肿瘤是在器官、组织和细胞学层面,特别是癌细胞可以观察到不少细胞学行为和特征,但是其中的机制不甚清楚,肿瘤的研究深入到基因层面是一个重要进步,只有从遗传基因的角度认识癌细胞,才能豁然开朗,基因突变和基因组不稳定性从基因角度解释了癌细胞为什么会善于变化,从基因角度开展癌症的研究是上升到一个新的重要阶段。
肿瘤体细胞的突变是大量的、随机的,然而我们经常能够检测到肿瘤基因突变的热点,如 EGFRKRAS基因的突变似乎并不随机,这两者看起来似乎矛盾,其实也很好理解。肿瘤突变绝大部分会被细胞内的DNA损伤修复系统修复,只有基因突变较多,DNA修复不彻底,少数突变在细胞中保留下来,而这些少数突变细胞又会在随后的传代过程中经历生长优势的考验和选择,只有利于细胞生长加速、凋亡抑制以及能够免疫逃避的基因突变才能被保留下来,而且会显示其生长优势,逐渐扩大,经过一系列基因突变的积累,细胞生长优势的加大,最后形成克隆。我们能够看到的基因突变是经历过多重选择的,并不是原来的突变谱。尽管如此,不同的环境因素以及自身的内环境不同,不同的肿瘤组织产生的基因突变谱也不一样,通过基因突变特征谱的分析也能够追寻机体所接受的环境暴露因素,通过对循环肿瘤DNA突变和表观遗传的分析也能分析一些肿瘤组织溯源的特性。
在肿瘤细胞检测到的大量突变中,只有少数突变在肿瘤的形成和发展中发挥作用,我们将这类突变称为驱动突变,这些是关键的突变,对于这些突变的检测不仅有利于基因功能研究的深入,有利于分析肿瘤的分子分型诊断和治疗,特别是靶向用药,对于预后也有指导意义。对于这些突变的研究还有利于药靶的筛选和鉴定,新药的研发等。由于肿瘤基因组不稳定,肿瘤细胞的异质性强,因此肿瘤细胞含有大量的基因突变,这些突变并不一定有重要意义,只是伴随而来,面对大量的突变要认识其内在的重要驱动突变是在基因组时代需要不断研究和深入挖掘的。现在发现,只要肿瘤细胞的突变较多,我们称为肿瘤突变负荷(tumor mutation burden,TMB)较大,就更加容易引导机体免疫反应,适用于免疫治疗,这里就不必再细分突变类型。当然,肿瘤细胞各类突变的增加,反映了机体DNA损伤修复能力,特别是DNA错配修复(mismatch repair,MMR)能力的缺陷,对于治疗而言就有相应的药物可以选择。
七、癌基因与抑癌基因
讲到肿瘤,特别是肿瘤遗传学,癌基因与抑癌基因是十分重要的。细胞是一个生长平衡的系统,如果生长失衡,将会衰老凋亡,或者恶性增殖、向癌细胞转化。细胞内存在两类基因,一类是促进细胞生长的基因,另一类是抑制细胞生长的基因,前者被称为原癌基因,而后者称为抑癌基因。这两类基因是从细胞生长相关功能的角度进行定义的,涉及多种功能类型,是一种广泛的命名,其实大多数这类基因结构和类型均不一样。
癌基因与抑癌基因虽然与癌症有关,但是在普通正常细胞中也有,也发挥重要作用,只是这两类基因在正常细胞和癌细胞中的作用和平衡不同。癌基因最早是在病毒中发现的,以为肿瘤是由病毒带来,促进细胞的恶性转化,然而后面的发现让人大吃一惊,人和动物体内本来就有癌基因,在正常情况下发挥作用,我们称为原癌基因。原癌基因编码的蛋白质包括:生长因子、生长因子受体、胞内信号转导蛋白、转录因子、细胞周期蛋白等。如果在一些情况下,包括基因突变和病毒作用,原癌基因表达增加,称为原癌基因激活,原癌基因激活的方式很多,除了基因突变之外,还包括插入激活、染色体重排形成融合基因的激活、选择性剪切的激活等。病毒中原癌基因其实是来源于动物和人体细胞的。抑癌基因是一类控制细胞生长的基因,对正常细胞的增殖起负调控作用,监控细胞的正常生长分裂,抑制细胞的恶性转化。当这些基因的失活或缺失,会导致细胞非正常分裂,正常细胞有可能转化为肿瘤细胞。 Rb基因是第一个克隆的肿瘤抑制基因,最早在视网膜母细胞瘤中发现,1971年Knudson在患者体细胞中发现 Rb基因的两个拷贝都出现了功能丧失型突变。常见的抑癌基因除了 Rb以外,还有著名的 P53PTENP21APCBRAC1/BRAC2MLHMSHVHL 等。一般情况下,需要两个抑癌基因等位基因均突变或丢失或失活才不发挥作用,抑癌作用才消失,这个被称为抑癌基因的二次打击。抑癌基因的突变不仅仅局限于基因点突变,也包括缺失和DNA甲基化,一个抑癌基因突变之后,另外一个正常拷贝的抑癌基因缺失(丢失),称为杂合性缺失(loss of heterozygosity,LOH),这也是鉴定抑癌基因的一种方法。而相对于抑癌基因的二次打击,原癌基因的激活只要一个等位基因被激活就足够了。
谈到癌基因,一定会想到早年癌基因的发现源于病毒研究,病毒感染与肿瘤高度相关,不少肿瘤就是源于病毒的感染。前面说起的肝癌、鼻咽癌和宫颈癌等癌症就与病毒感染有关,病毒感染还能够增加一些肿瘤的风险。一部分病毒感染人体是由于激活机体的原癌基因,这主要是一些RNA病毒,如早期发现的动物肉瘤病毒能够激活 RAS基因或者携带了 RAS癌基因。而另外一部分病毒则是拮抗体内的抑癌基因,这些往往是DNA病毒,这类病毒的蛋白主要通过与抑癌基因的蛋白产物结合,使之失活而发挥作用,即减弱抑癌基因的功能。例如:SV40病毒的T抗原,人乳头瘤病毒(human papillomavirus,HPV)的E6、E7,腺病毒的E1A、E1B。
病毒与细胞恶性转化相互得益,病毒的进化总是超越人类进化的速度,人类总会被各种病毒所困扰,由于病毒在长期进化中所形成的基因非常高效,其中一部分基因的作用往往具有生长优势或促使宿主的基因具有更好的生长作用。如果这些基因在细胞中发挥所用,很可能相互得益,病毒的基因组通过细胞的快速生长而得到更好的传递,这也是为什么一些病毒会成为肿瘤罪魁祸首的原因之一。
综上所述,癌细胞通常是原癌基因激活,而抑癌基因失活,导致平衡破坏,细胞恶性生长。生命的神奇在于平衡,癌基因和抑癌基因在机体中也处于平衡状态,肿瘤的发生和发展均是这些平衡被打破的结果。
八、如何发现肿瘤相关基因
前面已经提到,肿瘤细胞中存在大量的基因突变,遗传性肿瘤中也存在胚系突变,只有少数变异才是影响肿瘤发生和发展的关键,才对肿瘤治疗有指导意义。如何去鉴定那些重要的基因变异呢?除了遗传变异以外,细胞中的表观遗传异常又如何去识别和分析呢?
在遗传学研究思想和策略指导下,目前已经发展了多种研究肿瘤相关基因的策略。包括对所有遗传病通用的连锁互换分析的思路,可以用于寻找遗传性肿瘤的致病基因,包括 RbBRCA1等基因就是这样发现的,核心是要有肿瘤患者的家系,通过连锁分析将基因定位在染色体某些区段,然后再进一步精细分析,寻找候选基因,进行DNA序列比对,找到基因突变后再进行更多方面的确认和功能验证。此前由于测序技术的局限,癌症致病基因定位相对简单,而真正找到确定的致病基因还是很不容易的,现在随着二代测序(next generation sequencing,NGS)技术的发展,全基因组测序或全外显子组测序已经能够用于比对癌症患者和正常对照的基因序列,比较容易将致病基因找到。
肿瘤细胞常常伴随染色体的异常,特别是一些染色体易位导致融合基因的形成,而这些融合基因往往与肿瘤的发生有关,最早发现的慢性粒细胞白血病就是由于9号和22号染色体的易位形成了费城染色体导致 BCR- ABL融合基因酪氨酸激酶活性提高,进一步发展为白血病。因此,细胞遗传学的异常也是发现肿瘤相关基因的一种策略,白血病中多种类型均涉及不少染色体的重排,具有致癌作用的融合基因的形成。近年来发现,前列腺癌、肺癌、脑胶质瘤等实体瘤中也存在不少染色体易位导致的癌基因激活,为肿瘤的致病基因发现提供了较好的线索。
肿瘤细胞和正常细胞相比有不少差异,通过比对肿瘤组织和癌旁组织的基因组差异、基因表达差异、蛋白质组差异可以在不同层面上寻找肿瘤的致病原因。比较癌细胞与正常细胞的差异,理论上是找结果而非病因,但是肿瘤发生和发展中致病基因有可能一直在发挥作用。原因与结果之间并非简单因果,完全可能互为因果,寻找差异也完全可行,实际上这些策略是完全切实可行的,而且很容易入手,找到有差异的基因后,进一步开展功能和机制研究就可以有的放矢,聚焦目标了,大量的肿瘤相关基因就这样被发现了。基因组的比对最为根本,内容也很丰富,包括基因的突变、大小片段的缺失、插入、倒位、重排易位以及染色体水平上的表观遗传学修饰,如DNA甲基化等。转录组的差异首先是基因转录量的差异,其次是选择性剪切的差异,融合基因的检测,还包括RNA的编辑、RNA的修饰等。蛋白质组的分析更加聚焦,虽然会缺少了非编码RNA的信息,但是编码蛋白质的功能和作用更加直接,此外比较蛋白质组的各种修饰(磷酸化、乙酰化等)对于其功能比较更加重要。在进行差异比较的时候,不仅要比较肿瘤组织和癌旁组织的差异,还要重视比较各种临床表型的差异,各种治疗反应的差异(短期疗效、长期疗效、毒副作用等),比较总生存期、无病生存期和疾病进展的差异,只有这些信息比较全面了,各种相关基因才能被一一发现。
在差异比较中,一般倾向选择差异比较大的基因进行研究,虽然这种方法行之有效,其实这种策略逻辑上也有漏洞。关键的重要基因往往在上游,发号施令,而且这些重要号令基因往往要有备份,或许这些基因在表达水平上的差异就不那么显著,因此这些关键基因或许还没有发现。
对于肿瘤相关基因的寻找还有一种策略是关联研究,通过分析基因的多态性、基因表达量等各种状态,在大样本群体中进行比较基因在癌症个体和正常个体中的差异,从而筛选和鉴定肿瘤的相关基因。这些基因可以是癌症易感基因,也可以是癌症发展相关基因,还可以是肿瘤治疗疗效和毒副作用相关基因,肿瘤预防的相关基因。这个方面的基因研究核心在于样本的选择,需要开展大规模的样本对照研究,更需要在前瞻性队列研究中进行验证。
在基因层面,早期的肿瘤易感基因筛查是根据科学假说,选择候选基因开展关联研究,但样本有限、基因有限,有些先入为主,研究结果难以重复,假阳性也不能排除。此后一方面不断扩大样本,研究的基因也不断增加,最后是所有基因及其主要遗传标签位点单核苷酸多态性(single nucleotide polymorphism,SNP)位点全部囊括其中,开展全基因组关联研究(genome-wide association study,GWAS),将筛选肿瘤相关基因的研究推向了一个新的高度。关联策略研究得到的基因是在群体遗传学基础上统计分析的差异结果,虽然有统计学意义,但事实上,基因多态性的作用并不大,需要多个基因多态性的组合才比较明显。由于起初GWAS研究选择的SNP频率较高,而忽略了一些低频遗传变异的作用,这些遗传变异虽然罕见,但是作用很可能较大,有些甚至可以与单基因遗传病致病基因作用相比。全基因组测序将会加快这方面基因的发现。
进入了基因组时代,信息爆炸,大量的数据需要过滤、需要深挖。肿瘤基因的研究不仅需要各种实验研究,还离不开生物信息学分析,通过生物大数据的分析比较,筛选出候选基因进一步用于功能研究,进一步开展基因作用的分子机制探究。生物信息学与功能机制的实验研究需要相互帮助,协同发力,才能事半功倍地找到癌症致病基因。在信息时代,关联结果如果经过了大数据的检验,哪怕机制不是很明确,也是很重要的。
九、肿瘤基因突变与遗传咨询
肿瘤遗传学和基因组学研究是当今肿瘤研究的热点,美国在2015年启动了精准医学计划,而将癌症列为“重中之重”,希望能借助精准医学,更加接近于治愈癌症。
国际上对于各种癌细胞基因突变的意义已经进行了归纳总结,不论是体细胞突变还是胚系突变,通过一些网站均可以查询,国内外的肿瘤学会和相关组织也纷纷推出自己的基因突变与癌症诊疗相关的专家共识和指南。国家卫生健康委员会也就肿瘤治疗的药物遗传学发布过指导意见(原国家卫生与计划生育委员会《肿瘤个体化治疗检测技术指南(试行)》,2015)。美国、欧洲各国和我国相关部门也审批了一些指导用药和分子分型的基因检测(伴随诊断),肿瘤的个性化用药已经在临床上广泛应用。
美国国家综合癌症网络(National Comprehensive Cancer Network,NCCN)指南将与癌症相关的遗传变异分为胚系突变和体细胞突变。针对胚系的遗传变异(癌症易感基因),进行遗传性肿瘤风险评估,针对未发病进行精准预防管理,对已经患病的进行精准医疗和预后分析。对于体细胞突变(致癌基因),利用基因功能及致病机制研究结果,开展肿瘤的早期诊断、精准治疗和精准康复。美国医学遗传学与基因组学学会(The American College of Medical Genetics and Genomics,ACMG)建议在进行全外显子组测序时,在发现了一些癌症HPG突变信息后必须告知于受检者,其中肿瘤易感基因占25个。
癌症基因检测可根据临床表型选择候选单基因检测(主要是高外显率易感基因),也可以选择基因panel检测(包含中、低外显率易感基因),也可以选择全外显子组检测(可以发现新的易感基因),甚至还可以采用全基因组检测(发现新的易感基因及其他遗传变异),除了建议测序以外,全基因组的SNP芯片也可以检测到低风险的遗传易感基因。
基因检测的选择需要考虑到基因分析有效性、临床有效性、临床实用性和伦理法律及社会影响。
虽然此前美国FDA批准了一些基于胚系基因变异药物遗传学试剂盒和靶向基因突变的伴随诊断试剂盒,在较长一段时间内,虽然NGS作为一种技术在临床研究中发挥重要的作用,其用于临床肿瘤检测和靶向用药属于各个临床实验室自建项目。2017年底,美国食品药品监督管理局(Food and Drug Administration,FDA)和中国食品药品监督管理局(China Food and Drug Administration,CFDA)先后批准了基于NGS肿瘤多基因检测试剂盒, EGFR/ALK/BRAF/KRAS基因突变用于相关药物的伴随诊断,从此肿瘤基因检测进入了NGS新时代,此后多个相关的肿瘤基因检测试剂盒也获得批准。
肿瘤基因检测可以选择外周血进行胚系突变检测,也可选择肿瘤组织进行体细胞变异检测,液体活检由于取材方便,而成为肿瘤基因检测的热点。基因检测虽然方法众多:基于聚合酶链式反应(polymerase chain reaction,PCR)的基因检测最为基础;而一代测序最为经典,属于基因突变检测的金标准;数字PCR检测已知基因低频突变最为灵敏;NGS在肿瘤基因变异检测中最为强大,而且在不断发展。但是无论如何,这些方法均不能互相替代,各有其优点。
基因检测不再是难点,检测的价格越来越低,也越来越方便,而基因的解读和遗传咨询越来越重要。遗传咨询是指导基因检测和临床治疗的桥梁,沟通患者和医疗人员的桥梁。遗传咨询不仅需要遗传学知识,更加离不开基础和临床医学知识,还要系统学习沟通技巧,学习相关伦理和法规。由于人的大脑的局限性,不可能将各种遗传变异以及不断发展的遗传变异与肿瘤的复杂关系全部了然于胸,只能学习和掌握各种原则,学会数据库的检索与分析,通过典型的临床案例的学习和分析,从整体上进行判断,利用遗传咨询的知识帮助我们理解和判读基因检测报告。人工智能将会在遗传咨询中得到广泛应用,甚至可以在网络上取代人工的遗传咨询。
(卢大儒)