上QQ阅读APP看书,第一时间看更新
第三章 心血管疾病的分子生物学基础
分子生物学和遗传学是当今心血管科学和医学的坚实基础。在过去的20年中,分子生物学与遗传学的概念渗透到医学的各个领域,其原理现已成为医学院校课程的基石。分子遗传学方法已经在医师和科学家的实验室中被常规用于检验心血管疾病的各种假说。医师可以通过一系列分子和遗传学方法来指导对心血管病患者的诊断和治疗。现在许多治疗性药物都是使用重组DNA技术制造的。
人们对心血管疾病遗传学基础的认识也取得了诸多重要的突破。基于对单基因疾病(即使是少见病)机制的认识,使我们对常见心血管病发病机制有了更深入的了解。随着人类基因组计划测序工作的完成,心血管疾病基因组的发现步伐加快。目前尚难预料这些发现会给心血管病患者的诊治带来何种影响。
一、细胞生物学原理和细胞周期
有生命的机体均由细胞组成,所有的细胞均来自先前已经存在的细胞。细胞又分出各种不同功能结构。原核生物(例如细菌)含有以单层或多层膜为边界的单个细胞结构。根据真核生物(如哺乳动物细胞)的定义,每个真核细胞都含有一个细胞核,核内含有遗传物质,胞浆围绕核周,其外为浆膜所包裹,形成细胞的边界。胞浆中尚散布其他各种功能结构,均借助膜将其与胞浆分开。要研究细胞内的遗传学指令是如何执行的,就必须了解各种功能结构的特性,它们是如何运作,从而形成具有不同性质的区域。
哺乳动物的细胞是一种不同功能区域高度分化的结构。外膜称为细胞膜,是一种双层脂膜,能隔绝水性环境(如细胞外液)。细胞膜上镶嵌着一类跨膜蛋白,称为受体。受体具有能识别来自细胞膜外某些配体的结合位点,两者结合常可触发受体蛋白的变化。通过受体蛋白构型改变或是整个蛋白移动到细胞内部,这种变化信息被转导到胞浆表面,进而又会引发细胞内的其他改变,是为应答环境的一种方式。这类关系称为信号转导。
细胞内含有膜性网络。膜性片段形成内质网(ER)和高尔基器。ER由连续的膜性结构高度折叠而成,起自核外膜。ER可分为两种,它们是同一膜性结构的不同部分;粗面ER表面有核糖体(这些小颗粒与蛋白合成有关),而光面ER则没有。高尔基器由分散的囊泡堆叠而成。蛋白质在ER修饰后进入高尔基器接受进一步修饰后被释出。ER和高尔基器的一个主要功能是通过识别蛋白质的固有序列,根据它们的目的地对它们进行归类。这种指导蛋白质到达它们最终目的地的过程称为蛋白质的分拣或运输。线粒体是胞浆中专门产生能量的细胞器。它通过氧化糖或脂肪等含碳化合物产生能量,并以三磷酸腺苷的形式储藏起来。溶酶体是由膜包围而成的结构,内含水解酶,后者对胞内蛋白质进行进一步加工。细胞的外形是由细胞骨架(一些在细胞内纵横延伸的蛋白纤维网络)决定的。蛋白纤维可分三类,即肌动蛋白肌丝、微管和中间丝。
细胞核最重要的特征在于它内含遗传物质。它由于染色质的原因而呈颗粒状外观,可以很容易地通过一些染色加以识别。在细胞分裂间期,染色质呈密度均一的结构。细胞分裂时,染色质呈现为一定数量的线状物,称为染色体。除了那些已到达最终、成熟至特化阶段的细胞(终末分化),所有细胞的一个共同特性就是它们具有分裂的能力。细胞在分裂的过程中会发生许多结构改变,细胞膜和细胞骨架均发生广泛的重组。此时细胞内形成一种称为纺锤体的新结构,其功能是使染色体分配到子代细胞中。上述这些改变的结果是该细胞原先的许多活动——基因的表达,蛋白质的合成、分泌、细胞的转运均被中断。
细胞周期是指从分裂形成的新生细胞释放直到其以后再自身分裂成两个子代细胞之间的过程。细胞周期由两部分组成:一个占时较长的中间期(interphase),代表细胞进行合成活动和复制亚细胞组分的过程,此期可见分散的细胞核功能结构,内含致密的染色质团块。有丝分裂期占时较短,此期内真正完成分裂为两个子代细胞的过程。有丝分裂期内,细胞的内在结构被纺锤体所代替,各染色体明显可见。通过一系列有丝分裂而成的细胞称为体细胞,它们组成了有机体。在胚胎发育过程中,许多或大部分的体细胞都经历了细胞周期。而在成年机体中,许多细胞都已分化到顶而不再分裂。它们维持在一种静止状态,无DNA合成,相当于永久的中间期。
有丝分裂使细胞的染色体得以重现。每个子代细胞在开始它的生命旅程时都含有来自每一染色体的双份复制品。这些复制品称为同源染色体。这些染色体合称为整套的二倍体,每套有2n个染色体成员。间期时,生长中的细胞复制其染色体物质。有丝分裂开始时,每个染色体纵向分裂为两份复制品,称为姐妹染色单体。细胞此时含有4n个染色体,组成2n对姐妹染色单体。有丝分裂过程包括四个时期:前期、中期、后期和末期,最终以胞质分裂告终。母细胞分裂为两个含有相同的整套的染色体的子代细胞,成对的两个染色体分别来自父母双方。每个时期由着丝粒(染色体中央的缩窄区)的特殊移动为标志。这些移动是成对染色体分离进入子细胞和细胞分裂的主要内容。
临近有丝分裂前,双链染色体的断裂或其他DNA损伤是由一系列的细胞周期核查点来修复的。在正常情况下,细胞DNA得到修复,细胞完成有丝分裂。DNA未得到修复的细胞则发生凋亡,或称程序化细胞死亡。上述机制使得拥有完整的染色体DNA的细胞不断分裂。如果细胞分裂逃脱了核查点的控制,存在DNA双链断裂或其他形式DNA损伤的细胞就会不受控制地分裂,并转移到机体内的其他位置,癌肿遂得以发生。
细胞周期核查点控制的关键蛋白是细胞周期蛋白(cyclins)和细胞周期蛋白依赖性激酶(CDKs)。CDK是全酶复合体,包含细胞周期蛋白调节亚基和CDK催化亚基。细胞周期的四个不同时期均受细胞周期蛋白-CDK复合物的调节:Gap 1或G1期,DNA复制期或S期,Gap 2或G2期,以及有丝分裂期或M期。G1期限制点的控制由两种CDK调节:细胞周期蛋白D以及细胞周期蛋白E依赖性激酶。D型细胞周期蛋白(D1,D2和D3)联合与另两种酶CDK4和CDK6相互作用,早在G1期产生至少六种组织特异性全酶。细胞周期蛋白E与另一种酶CDK2一起加入一个复合体,并与细胞周期蛋白D依赖性激酶协同作用,完成G1晚期对视网膜母细胞瘤抑制蛋白(Rb)的磷酸化,从而通过G1-S核查点,进入S期。
细胞周期蛋白CDK的内源性抑制因子称为细胞周期蛋白依赖性激酶抑制因子或CKI。CKI在整个G1期内均有表达,抑制细胞周期蛋白CDK复合物的磷酸化和激活,导致G1期停顿。CKI阻止细胞通过G1期核查点、抑制有丝分裂,导致细胞生长停止。依据CKI的结构和目标CDK的不同将它们分为两个族。CIP/KIP蛋白是改变细胞周期蛋白D、E和A依赖性激酶活性的广谱抑制因子,这个家族包括P21(Cip1)、P27(KiP7)和P57(KiP20)上述三者的氨基末端均含有特征性的序列,能结合细胞周期蛋白及CDK的底物。P21(Cip1)是转录因子和肿瘤抑制基因P53的下游效应因子,导致DNA损伤的修复和(或)促进细胞凋亡。p27(KiP7)是正常及病变组织中细胞增殖的强效抑制因子,同时也是组织损伤、炎症及创伤修复过程中的关键调节因子。INK4(CDK4的抑制因子)蛋白家族包括INK4A(p16)、INK4B(p15)、INK4C(p18)和INK4D(P19)17。这些CKL含有多个锚蛋白重复序列,除CDK4及CDK6外不与其他CDK结合,且能特异性地抑制CDK4和CDK6的催化亚基。INK蛋白在肿瘤的生长和发育生物学中均是重要的调节因子,但是它们在心血管疾病中所起的作用较小。
心脏或血管的损伤会引发重构的过程,这是正常机体的一种适应机制,或是在疾病病理生理状况下的一种适应异常表现。作为对生理性刺激的反应,血管中层的平滑肌细胞(VSMC)增殖并迁移到内膜,形成多层血管损伤或新生内膜。在正常情况下,上述过程具有自限性,能使血管损伤得到良好的愈合,并维持管腔的血流量。但在某些血管疾病中,VSMC过度增殖,使得血管出现病理损伤,继而产生临床症状。这些疾病通常都以系统性或局限性的炎症为特征,后者会加重VSMC的增殖反应。CIP/KIP型的CKI是脉管系统中调节组织重构的重要因子。P27(Kip1)在VSMC与动脉内皮细胞中呈结构性表达,并且在血管损伤或上述两类细胞暴露于丝裂原时下调。在大量增殖后,VSMC会合成并分泌细胞外基质分子,后者将信号转导至VSMC及内皮细胞,从而诱导出P27(Kip1)和P21(Cip1),抑制细胞周期蛋白E-CDK2。CIP/KIP型CKI的表达能阻滞细胞周期,抑制细胞分裂。P27(Kip1)同时也是组织炎症反应的重要调节因子,它通过影响T淋巴细胞的增殖起作用。在脉管系统中,P27(KiP7)通过它对细胞增殖、炎症反应及骨髓祖细胞的作用调节血管的修复。P27(Kip7)基因缺失的小鼠表现为包括心脏和血管在内的多脏器上皮细胞和中胚层细胞的良性过度增生。
P21(Cip1)是心脏、骨骼、皮肤和肾脏的生长和分化中必需的因子,并使得细胞易发生凋亡。这种CKI能通过P53依赖性和非P53依赖性的方式起作用。对于心脏,P21(Cip1)以非p53依赖性的方式表达于心肌细胞中;P21(Cip1)在肌细胞中的过度表达会导致肥厚的发生(细胞肥大)。
大多数人类肿瘤细胞都保持了改变p53或Rb功能的突变,这可以是通过上述基因序列的直接突变,也可以是通过阻滞它们正常功能的上位目标基因突变。Rb通过阻止细胞进入S期限制细胞增殖。其机制是阻断E2F转录因子,使后者不能激活DNA复制及核苷酸代谢所需的基因。50%的人类肿瘤中都存在p53突变。这种蛋白在DNA损伤、缺氧和癌基因激活等细胞应激应答过程中积聚。P53启动一个转录程序,后者会触发细胞周期阻滞或细胞凋亡。当受到p53激活时,P21(Cip1)可导致肿瘤细胞或其他细胞的凋亡。
细胞周期是细胞分裂的主要调节器。DNA复制和胞质分裂都依赖于细胞周期的正常运行。其次,细胞周期蛋白、CDKs、CKIs是肿瘤发生、组织炎症反应及创伤修复过程中的重要调节因子。
二、遗传密码:DNA、RNA和蛋白质
(一)DNA
脱氧核糖核酸(DNA)是人类生命的基石。它的双螺旋结构看似简单,但是这个结构的编码规则规定了机体内所有细胞的形式和功能。DNA是由两条多聚核苷酸长链顺时针盘绕而成的连续双螺旋结构。交替的脱氧核糖-磷酸基团组成双螺旋的主链,而磷酸基团在一个戊糖环的第五个碳和下一个戊糖环的第三个碳间形成5',3'磷酸二酯键。双螺旋内头碰头的碱基与糖基相连,并与该链的中心轴垂直。核苷酸的顺序决定了基因蛋白质产物的最终序列。碱基只有四种:腺嘌呤、鸟嘌呤(A与G),胞嘧啶、胸腺嘧啶(C和T)。在双螺旋装配的过程中,嘌呤只能与嘧啶配对,反之亦然。每对碱基对(bp)即为缠绕的DNA分子阶梯中的一个台阶,DNA大分子的长度可达数百万个碱基对。DNA的两条链之间化学极性相反,是由互补的碱基对间形成氢键而结合的。一条链是5'到3'方向,另一条链则是3'到5'方向。识别特殊DNA序列的酶也识别核苷酸链的极性,一种酶是从相反的两个方向来阅读两条链上的核苷酸序列的。由于螺旋骨架的结构是不变的,负责DNA复制、裂解及修复链损伤的酶可在沿DNA长链的任何一处起作用。
A-T和G-C配对的一个重要结果就是双螺旋中一条链上核苷酸的序列决定了另一条互补链上的核苷酸序列。无论是对于DNA复制进入子细胞,受损DNA的修复,或是作为RNA转录的模板时,这一基本的配对原则对遗传物质的储存、修复和传递都是至关重要的。
染色体是由DNA双螺旋链盘绕核蛋白而构成的紧密而清晰的结构。每个染色体的长度和碱基对的构成都不同。人类细胞核中含有23对不同的染色体,它们都有特定的长度和碱基对序列。一个细胞内所有染色体DNA序列的总和(约3×10 9)就称为基因组。同一有机体内所有细胞的基因组所携带的信息都是相同的,且这些信息在同种生物的不同个体间变化很小。事实上,人类,即智人的基因组约有99%都是相同的。
在细胞分裂时,被称为聚合酶的生物酶解开每个染色体中的DNA螺旋,并分别复制两条单链的全长。因此,每个子细胞所继承的双链DNA分子都包含一条旧链和一条新链。继而,每条链都能复制出一条与原来的模板完全相同的新链。这种高保真性的DNA复制对于基因信息的准确传递是必需的。这个过程中产生的错误是基因突变的常见来源之一,会在细胞分裂之后而被继承下去。
基因是转录过程中用做复制模板的部分碱基序列,因此也是遗传的DNA信息的基本单位。基因在染色体携带的所有DNA中只占很小一部分。染色体中只有1%~2%的碱基对编码蛋白质,而蛋白编码序列的完整补充还有待建立。人类基因组中目前已明确的基因有30 000个。一个基因中的蛋白编码信息并不是连续的,而是由数个称为外显子的不连续信息包编码的。这些外显子之间长度可变的DNA序列则称为内含子。内含子的功能尚属未知。它们可能含有大量的调节信息,控制近30 000个蛋白编码基因的表达,以及其他的种种功能性元素,如非蛋白编码基因及染色体动力学的决定序列。而我们对于基因组中近一半的高度重复序列和其余的非编码、非重复DNA所知更少。
(二)RNA
遗传信息表达的第一步是转录,也就是把细胞核内的遗传信息转移到蛋白质合成的地点——胞质内。在这个过程中,从DNA到RNA的转录需要在核内表达一个基因模板,称为信使RNA(mRNA)。特异性的RNA聚合酶复制DNA双链中的一股(非编码链),从而产生与非编码链互补而与编码链完全相同的序列。RNA的结构与DNA略有不同。RNA碱基中的尿嘧啶代替了DNA中的胸腺嘧啶,而DNA糖磷酸基团中的脱氧核糖则由RNA中的核糖取代。与较稳定的脱氧核糖相比,核糖使得RNA分子更易降解;这使得RNA能更快地对细胞内信号转导的改变做出反应,并能更迅速地转移到胞质中进行蛋白合成。
(三)从基因到蛋白质
基因转换成蛋白质的过程包括两个主要的步骤:细胞核内从DNA到RNA的转录,以及细胞质内从RNA到蛋白质的翻译。这是一个受到高度调控的复杂过程。核内转录的第一步是将DNA分子中的基因序列复制为mRNA。单链RNA的两端都受到修饰。在5'端多出一种称为帽子的核苷酸结构,它使核糖体能与RNA结合,从而提高翻译的效率。在3'端,核苷酸能识别位于非编码区内富含A/T的序列,并剪切掉下游模板中约20bP的序列。有一种酶在新近被剪切的3'末端加上一段腺苷的序列,从而形成多聚腺嘌呤(PolyA)尾,它能稳定转录物的结构。接下去,转录物通过剪接去除内含子序列。剪接是一个高度调控的过程,未经剪接的转录物高度不稳定的,并会很快从胞内清除。剪接是基因表达中一个重要的控制点。这个过程必须是完全精确的,因为只要是剪接点的核苷酸多了一个或者少了一个,之后RNA翻译过程中的三位密码子读码框架就会乱套。RNA剪接的意义目前还不完全清楚,但是考虑到内含子序列的巨大总长度以及转录物没有切除内含子之前无法离开细胞核的事实,RNA剪接在基因表达的调控中必然具有重要的意义。
mRNA一旦转运到胞质中,就能为翻译或蛋白质合成提供模板。翻译是在核糖体内发生的,它是一种大分子复合体,就像是一条装配线。核糖体阅读mRNA的核苷酸序列,并将它翻译为氨基酸序列;也就是说,含有四种碱基的mRNA密码被翻译成20种氨基酸所组成的蛋白质。这种遗传密码子转换为氨基酸的过程中需要一个适配分子来解码mRNA,这种分子称为转运RNA(tRNA)。每个tRNA使用一个独特的三碱基序列或称反密码子与mRNA的密码子互补识别。核糖体酶起到连接相邻氨基酸的作用,将氨基酸从tRNA适配器中释放出来,并加入逐渐延长的氨基酸链中。氨基酸的顺序是由相应mRNA模板上的密码子顺序决定的。mRNA的翻译是信息从核内的DNA转化为独特的蛋白质结构过程中的最后一步。
由于遗传密码在各个物种中都是相同的,人类的基因序列可被移植到细菌、酵母菌或昆虫细胞中,并可被忠实地复制,继而解码为RNA和蛋白质。上述原理是DNA重组技术的基础,这种技术可用来制造研究和治疗用的重组蛋白质(例如组织纤溶酶原激活物)。
基因表达的过程需要多个步骤的精确调控。一个细胞在某段特定时间内只表达少数的基因。有一系列的基因在大部分细胞中都是持续表达的,因而被通俗地称为“看家基因”。这些基因在细胞复制、能量产生和存活机制中是必需的。另一类基因是以系特异性的方式表达的,例如在某类细胞中表达。这些基因对于细胞特异性的功能是必需的,例如收缩功能。系特异性基因的精确调节决定了特定细胞的独特身份和功能。还有一类基因是在应答环境刺激时表达的。这一系列的控制机制产生了基因表达的复杂动力模式,从而使得机体能对内外环境中的信号作出应答。
三、细胞生物学的原理和技术
20世纪70年代,为了满足生化分析对足量DNA的需要,产生了重组DNA技术。这种方法是指在周边的DNA中利用限制性内切酶(序列特异性的核酸内切酶)剪切下一个序列。接下来就能根据需要将这个序列插入到能复制它的载体中,制造出成千上万个拷贝(见下文)。重组DNA技术的成功对过去30年中分子生物学的大部分进展都起到了加速作用。这类技术中有很多都已成为科研实验室的常用技术。这些方法现在常规用于分析基因的结构、表达和组成;细胞控制基因表达的调控途径;以及发现新基因和新的治疗方法。这些进展已经改变了医学研究的面貌。基因工程是指通过添加新基因的方式改造有机体,从而使其拥有我们想要的特质。这在很多实验室中都已成为常规实践的一部分。我们现在用重组DNA技术大量生产治疗用的蛋白质产品,例如重组组织纤溶酶原激活物。由于我们具备了操纵人类基因组的能力,也为新的诊断技术和治疗方法的发展提供了可能性。但是,分子生物学的技术,与DNA的本身结构相似,都具有惊人的单纯性。我们在这里只描述基本的方法,目的是为深入回顾这项技术的操作方法做准备。
(一)DNA克隆
分子克隆使我们能够在细菌细胞内生产某一DNA序列或基因的成千上万个拷贝。首先将一个DNA片段插入克隆载体。最常用的载体是被称为质粒的小分子环状DNA,以及名为噬菌体的细菌病毒。这些载体同时含有使得细菌细胞复制目标DNA序列的遗传信息。在插入DNA序列后,质粒或噬菌体载体就被导入细菌细胞。随着细菌的培养,载体包含的DNA序列在一个细胞内就可复制几百个拷贝,从而生产出与原始DNA序列完全相同的多倍克隆。接下来就可以从细菌培养基中收获载体,此时的工具就是插入DNA序列到载体中时所用的限制性内切酶。
分子生物学家所用的限制性内切酶来源于细菌。它们在细菌中起到分子剪刀的作用,能在可预测的位点剪切DNA分子。每种限制性内切酶都能识别特异的核苷酸序列。这些能被识别的位点随机分布于任何有机体的DNA序列上。它们含有名为回文序列的短对称序列,即在双螺旋的两条链上方向相反的重复核苷酸序列。例如,从大肠埃希菌中提取的酶EcoRI就能识别DNA双链中的GAATTC序列,并在GA和AG的连接点切割核酸分子。大多数限制酶都以不对称的方式切割它们所识别的回文序列,从而在切口的两边各留下一个单链的突出端。这些黏性末端具有独特的互补序列,因此可将人类的DNA片段与拥有互补末端的其他来源的DNA相连。一个酶反应就能形成带有平滑接口的连续双链DNA。上述原理可用于构建各种各样的DNA重排,并应用于基因克隆、培养基因敲除小鼠、重组DNA治疗等多种目的。
(二)印迹技术
印迹是一种依据DNA、RNA或蛋白质的分子量进行分子识别的工具。DNA的分析称为southern blot(DNA印迹),RNA识别则是northern blot(RNA印迹),蛋白质分离则称为western blot(蛋白质印迹)。印迹技术的原理是很简单的。首先将待分析分子的混合物进行胶体电泳,从而依据分子大小和(或)电极性区分出不同的种类。使用凝胶电泳时,分子装载在一端的槽中。接下去将凝胶浸没在缓冲液中,并通电,这些分子就会穿越电场移动。由于DNA和RNA都是带负电荷的酸性物质,它们均向凝胶的正极方向移动。较大分子的迁移会受到凝胶基质的阻力,因此这些分子间也能依据分子量区分。当电泳结束时,将凝胶从缓冲液中移出,并在上面放置一个尼龙滤网和吸收材料。凝胶中剩余的缓冲液就会带着其中已得到分离的分子一起印迹到吸收材料上,这些分子就留在了尼龙滤网上。然后处理滤网使得上述分子能永久固定在其表面上,从而形成原始凝胶的镜像。最后用一种能识别(通过杂交)目标分子(探针)的标记分子冲洗滤网,并将剩余的未结合探针洗脱。对于DNA和RNA印迹,探针就是携带与目标分子互补序列的核苷酸小片段。核酸是由一种放射性元素标记的,可通过X线或其他技术探测。杂交探针的位置呈谱带状分布,能通过它来估算DNA或RNA片段的大小。如果电泳时与已知分子量的记号分子跑在平行的条带上,就能得出DNA或RNA片段的精确分子量。进行蛋白识别(western blot)时的探针是能识别目标蛋白质的标记抗体。同样可比较记号分子在凝胶电泳中的条带来确定分子量。
印迹技术也被用于其他目的,例如在特定基因被限制性内切酶消化后确定基因内的限制性位点地图,以及在细胞遗传学分析中比较标本及参考样本的基因组DNA的限制性位点。
(三)聚合酶链反应
聚合酶链反应(PCR)是在试管内进行的扩增过程。扩增的DNA或RNA片段在试管内与两种短链寡核苷酸引物结合(化学合成的单链DNA片段)。扩增由引物起始,继而进入一系列循环,这期间被称为模板的原始DNA分离为单链。双链的分离使得引物能在每条单链的末端与其互补序列结合或退火。一种热稳定的DNA多聚酶在引物末端添加核苷酸,通过阅读整个DNA单链,产生与单链DNA互补的序列。当多聚酶到达单链末端时,就产生了一条新的双链。于是这个循环再次开始,加热解离双链,再依靠引物和多聚酶产生新链。PCR每一回合的扩增都使DNA模板的数量加倍。即使开始时只有一个拷贝的DNA,通过数小时的PCR也有可能产生数以百万计的DNA片段。扩增的整个过程是在密封的试管或槽内进行的,使用一个能自动加热和冷却样品的特殊仪器。PCR现在已成为一种常规的工具,可足量生产某种遗传物质以供分析。
四、分子遗传学原理
(一)基因型和致病基因的确定
1953年,DNA结构和功能的发现奠定了分子遗传学的基石。而人类基因组测序工作的完成又大大增加了这块基石的分量。现在,临床医师手中有了一系列有助于疾病诊治的分子遗传学工具。对于这一点,有三个概念在心血管遗传学中特别有用:基因型、基因组学和蛋白质组学。基因型是指一个个体内基因组中DNA序列的组成,或是一个个体内23对染色体上的全部DNA序列。基因组学是指基因序列表达为RNA。基因组学的焦点在于哪些基因得到了表达,蛋白质组学研究细胞内或有机体内蛋白质的表达,以及蛋白质-蛋白质相互作用的网络。
从历史上来说,基因组学的研究主要集中在单基因异常的领域,例如由单个基因缺失或突变所引发的疾病。随着基因组学和蛋白质组学新工具的出现,人们已把注意力转向对于复杂疾病特性的遗传易感性的评价,例如冠状动脉疾病和高脂血症。要理解复杂疾病的遗传学基础,需要有对基因序列、基因编码的蛋白质及蛋白质功能的理解。但是,有一点已经日渐明确,那就是我们不可能通过推导人类基因组的核苷酸序列或是解开近30 000个编码相应蛋白或调节其他基因功能的基因座来解决复杂的心血管问题。而单个或系列基因的改变如何直接或间接地影响某种疾病表型的发生危险,其中具体的分子机制还需要大量的研究来明确。
(二)单基因疾病
经典的医学遗传学着重于单个的基因或单基因疾病,疾病的原因可追溯到单个基因的丢失或突变。目前为止,已确定了近1000种致病基因。单基因疾病并不常见,它们通过典型的孟德尔式或常染色体方式遗传。有趣的是,尽管单基因致病并不常见,但我们对于这其中机制的理解使得我们能够理解更常见的心血管疾病的发病机制。
简单地说,每个基因都有两个拷贝,称为等位基因。如果两个等位基因是相同的,该个体就称为纯合子;反之若两个等位基因不相同,该个体就称为杂合子。某特定基因座上特定的一对等位基因就代表这些基因的基因型。更广义地来说,基因型就是创造某一表型的所有遗传因素的总和。因此,表型就是由基因型所引起的可见或可测量的特质,例如冠状动脉疾病或肥胖。表型也可定义为基因作用的效果,可以是单基因或是整个基因型。
两个个体间或一个种群内的所有个体间核苷酸序列的差别形成了遗传变异。突变是指起源于核苷酸序列并可导致其编码的蛋白质结构改变的变异。在特定种群中的发生率小于百分之一的变异可称为突变。单基因疾病中已发现了约16 000种突变。突变的形式包括错义突变、无义突变、框移突变、缺失以及插入等。错义突变由一个或多个核苷酸的替代引起的,且这种替代导致编码蛋白质的一级结构发生改变。这类突变通过改变蛋白质的一级结构而改变它的功能。无义突变导致基因中终止密码子提前出现,从而形成截短的基因产物,这会引起蛋白质功能的改变,并会使蛋白产物不稳定。核苷酸的插入或缺失如果增加或减少三位密码子,就会导致产物蛋白质氨基酸的增多或减少。框移突变是指基因密码子的读码框发生错误。典型的框移突变引入框外终止密码子,从而导致蛋白翻译提前终止,产生结构异常的蛋白质。内含子和外显子的突变导致剪切错误,同样会引起蛋白结构的改变和翻译提前终止。最后,基因启动子或增强子的突变可导致蛋白质表达水平的改变,或是导致基因表达的时间性或空间性发生改变。
在单基因的心血管疾病中发现了很多种突变。例如,尽管家族性高胆固醇血症的原发缺陷是低密度脂蛋白受体(LDLRs)的缺陷,但在罹患此类疾病的患者中已发现了超过600种的LDLR基因突变。同样地,肥厚型心肌病是一种常染色体显性遗传病,它是由编码心肌收缩器内蛋白质的基因突变引起的。目前已在至少10种不同的肌节蛋白中找到多重原因的突变,这些肌节蛋白包括心脏P肌球蛋白重链、心脏肌球蛋白结合蛋白、心脏肌钙蛋白T、心脏肌钙蛋白I、α原肌球蛋白、必须轻链及调节轻链和心脏肌动蛋白。其他的单基因心血管疾病包括家族性长Q-T综合征、凝血因子V Leiden突变所致静脉血栓以及遗传性高血压。
(三)复杂性状分析
多态性是指常见的变异,定义为种群中的发生率大于百分之一。单核苷酸多态性(SNPs)是指不改变蛋白质结构的核苷酸替换。SNP是很有用的标记物,可用来在染色体基因座上标记基因。SNP可以是疾病易感性的标志,例如它可以通过对某种疾病的直接影响或是与该疾病的易感性基因座相邻,从而与这种疾病相联系。据估计,人类基因组中存在1400万个SNP。我们能通过数个公共数据库检索到假定的或是已确定的SNP,例如dbSNP就是国家生物科技信息中心的数据库。
单体型是指由遗传学区域分组的一系列SNP,在某一特定种群中是整体遗传的。单体型与疾病之间可能存在真正的联系,也可能仅仅由于混杂因素的影响而在表面上与疾病相关。如果某一SNP与某种疾病相关,很有可能这种SNP是作为某一单体型的一部分遗传的,而该单体型中的其他SNP与这种疾病也具有统计学上的相关性。这种等位基因的非随机联系称为连锁不平衡。如果基因组中两个不同位置的等位基因共同遗传的几率较估计的要大,就存在连锁不平衡。由于SNP可能只是疾病倾向的标志而非原因,如果要证明因果关系的存在就必须出现基因功能的改变。
现在,国际上正在共同努力来确定300个不同背景的个体体内所有22对染色体上全部的SNP,这些个体来自亚洲、非洲、欧洲和美洲。这个计划称为单体型图(Haplotype Map或HapMap),开始于2002年10月,其目标是根据来自人类不同种群的DNA样本,建立一个全基因组范围内的SNP集簇地图。HapMap会提供一个SNP路标,从而为疾病的研究提供连锁分析、相关性研究,以及SNP伙伴评估。因此,SNP就能帮助我们理解疾病的遗传学基础,其中的原因包括:SNP可以是基因功能改变的直接起因;也可以忽略因果关系,将SNP作为疾病的标志;由于它们在整个基因组内高频出现,可在遗传学研究中作为全基因组范围内的标志物。
(四)连锁分析和相关性研究
调查遗传特性的遗传学研究包括两种:连锁分析和相关性研究。连锁分析是调查家系中来自父母双方的两种特性是怎样共同遗传给子女的。系列多态性标志物或SNP可用来确定染色体基因座上两个等位基因的位置。编码这两种遗传特性的基因一般是非常靠近的,因此这两种特性,或是等位基因,是相互联系的。连锁性是由LOD评分决定的,或称几率的对数(logarithm of the odds)评分,标记物间相隔一定的距离,分界线是50%的共同遗传几率(不是全部共同遗传)。连锁分析在鉴别或研究孟德尔式的遗传特征时很常用。也可以用等位基因共享的方法来比较近亲的受累个体间(如受累的同胞间)等位基因的相似度。
以人群为基础的关联性研究对于不依据明确的孟德尔规律遗传的常见疾病的研究很有用。关联性研究通常采用病例对照的方法,对实验组和对照组进行比较。只有谨慎地选择最合适的对照人群,才能得出有效的结论,并从这些研究中推断出基因的功能。如果想要达到足够的效力,病例对照研究就必须拥有足够大的样本量,以达到统计学上的显著意义。在这类研究中,研究者分析候选基因中的已知SNP,采用某一SNP的等位基因作为变量,后者既而与某种疾病或结果的出现或缺席相联系。如果候选基因中的SNP未知,则直接在该研究的一个亚组以及对照人群中将上述基因排序,从而决定哪些SNP在这两个人群中呈现差异表达。接下来在剩余人群中采用以PCR为基础的技术确定SNP。这种方法的局限之处在于候选基因的选择偏倚:在研究中,只有那些已知或人们感兴趣的基因才会经常被选择。相反,通过位点克隆来识别基因的方法经常会把我们引向意想不到的发现。
(五)基因组扫描
SNP的基因组扫描是一种新技术,在流量平台上同对几千个SNP进行测定。通过利用SNP在整个基因组范围内的物理分布,将各个SNP之间的染色体区域与某种疾病相联系。通过这种技术,可将SNP标志为疾病的生物标记。这种技术在未来数年中将会成为研究热点。
(六)基因组学
基因组学是通过对基因组的平行测量研究基因的功能,通常使用芯片及连续基因表达分析(SAGE)的技术。芯片在药物研发中的应用正在逐渐扩展。它的用途包括基础研究和靶点探索,生物标记的确定,制药,毒物代谢动力学,靶点选择,预后检测的发展以及疾病亚型的确定。
基本的技术是从正常的或是测试状态的生物学样本中提取mRNA。RNA复制时掺入荧光标记的核苷酸或之后可用荧光染色的标记物。将标记的RNA与芯片杂交一段时间,之后多余的物质被洗脱,并将芯片放在激光灯下检验。最终的结果是每份生物样本上有4000°~5000°量的基因表达。由于一个完整的实验可以包含多至数百个芯片,最终RNA表达的数据大小可能相差很多。
(七)cDNA芯片
cDNA芯片产生于探针cDNA文库(500~5000碱基),方法是将与单个基因或探针相对应的cDNA点样在显微玻片的精确位置上。每个芯片测量两个样本,并提供每种RNA分子的相对测量水平。目标RNA由荧光染色标记,和对照样本一起与cDNA芯片的表面杂交。两个RNA样本竞争性地与每个探针结合。与cDNA序列配对的RNA与显微玻片上的cDNA斑点杂交。突光标记可由激光激发,因此就能比较荧光探针结合的cDNA斑点之间的信号强度。这种比较反映了每种基因表达的RNA量的比例。现在我们已应用规范列间比较的标准化策略,并继而应用前述的分析方法。
(八)寡核苷酸芯片
寡核苷酸芯片是由代表基因独特部分的合成核苷酸探针(12~80个寡核苷酸)附着于阵列表面而成的。cDNA合成是从实验性的mRNA样本开始的,继而进行试管内转录,从而制造生物素标记的cDNA,后者能与微阵列的靶点结合。以荧光染色标记的卵白素(一种能与生物素紧密结合的蛋白)处理微阵列,再用激光激活。在寡核苷酸芯片内,每个微阵列测量单一的样本,并为每个RNA分子提供绝对的测量水平。检测信号的强度就能反映每个基因的表达水平。
(九)SAGE
SAGE是一种在转录物直接测序的基础上描述基因表达特征的技术。它主要的优势是能在序列未知的情况下对转录物进行测定和分析。SAGE分析需要多出近10倍的mRNA,因此即使有自动测序仪器,它所要求的工作密集性也要大大超过一些芯片平台,因为最简单的双样本比较就要对约1.5×10 6个碱基进行测序。单是这个因素就导致了RNA的量较小时应用该技术的困难,但是,它的主要优势就在于它对基因表达水平改变的高敏感性。
数据在经由图像处理而取得后,通过三个步骤进行分析,即标准化、过滤和计算。标准化是针对于技术性的因素,例如,芯片的制造,染料结合的区别,杂交过程中探针分布失调,从而保证个体阵列之间的比较有意义。数据的过滤是指挑选出那些可能代表有意义的发现的数据。过滤的典型标准包括信号质量的评价以及基因表达水平的成倍改变。微阵列分析中的基因表达差异通常定义为相对基因表达水平的1.5~2倍的差异。
决定相似性和非相似性是数据分析的关键组成部分。有两种常用的方法:监控和非监控。监控的方法用以发现样本的组间表达水平有显著区别的基因,以及准确预测样本特征的基因。两种最常用的监控技术包括“最近邻方法”和“支持向量机”。使用非监控方法的学者则致力于发现数据组的内部结构或相互关系,而不是要决定怎样能最好地预测正确答案。四种常用的非监控方法包括层级聚类、自组织图、关联网络和主成分分析。在上述计算之后还要进行统计分析。在得出任何数据的面值之前,必须独立测定RNA的表达水平来验证发现的显著性,测定方法包括量化反转录PCR和常规的northern blotting技术。
(十)蛋白质组学
蛋白质组学的研究对象是基因组所表达的蛋白质。我们应该把基因组学和蛋白质组学看成是遗传范畴内互补的两个组成部分,它们起始于DNA,终止于修饰后的蛋白质。蛋白质是人类基因组的最终产物,并最终决定人类的生物学。蛋白质决定生物学的形态和功能。据估计,由于经历了剪切、转录过程中基因结构盒的交换、转录后修饰,人体中的蛋白质数量较基因数量要多5~6倍(约200 000)。蛋白质组学研究的目的是理解某一组织或生物体内正常或受干扰情况下全部蛋白质间复杂的相互作用。事实上,人类蛋白质组学还处于其婴儿期。
针对蛋白质组的分析方法目前还在发展与验证中。但是,任何蛋白质组分析都有五个基本的组成部分:样本采集,蛋白提取,蛋白分离,确定蛋白序列,以及与参考数据库比较蛋白序列以进行蛋白鉴定。取样的过程是很直接的,就是取得个体的组织活检标本或血样(在获得受检者的知情同意后)。蛋白提取通常采用化学途径,大多使用甲醇来去除所有的DNA、RNA、糖类以及脂质。提取出的蛋白质必须进行分离以便鉴定,这个步骤传统上采用二维凝胶电泳的方法。蛋白质在第一维利用质量分离,在第二维利用等电点或网状电荷分离。由于二维电泳的大部分斑点上包含多种蛋白质,现在也发展出了其他分离及鉴定蛋白质的途径,例如脂质色层分析法。脂质色层分析法应用固态和液态的介质,利用蛋白质的生化特性(包括分子量、等电位或疏水性)来分离蛋白质。这种方法可以连续应用以改善分辨率。还可应用其他类型的色层分析柱来改善敏感性和特异性,例如亲和力色层分析的柱内含有针对特殊功能的抗体,以达到预期的分离效果。分离之后就进行蛋白的鉴定,通常使用某种形式的质量光谱测定法。质量光谱测定法是将蛋白质或肽链转化为带电荷的种类,从而能依据它们的质核比进行分离。其中可供选择的离子化途径包括电喷射和基质辅助激光解吸电离(MALDI)等。接下来就要确定蛋白质的序列,继而通过与数据库内的已知序列进行比较分析从而明确地识别蛋白质。一旦明确了某一蛋白质组中的蛋白质,就能确定它们的相对丰富程度,来比较正常或疾病状态下蛋白质的相对丰富程度。最后,对蛋白质组的彻底分析还应包括一些功能的测定,这可以在培养的细胞中或是动物模型中进行。这种方法与功能性基因组分析相似,后者是一种关键的方法,通过识别基因的功能衡量某个基因或突变的重要性。
蛋白质组分析现在受到敏感性、特异性和处理量的限制。但是,该领域及该领域的方法学正在迅速发展。蛋白质组学在心血管疾病中的应用将对我们理解心血管系统的复杂功能提供很大帮助。
五、遗传修饰小鼠应用于人类心血管疾病研究
培养遗传修饰小鼠的技术对心血管研究产生了巨大的影响。小鼠是妊娠期短(21天)的小动物。但是,小鼠和人之间控制心血管发生和功能的分子途径具有相当的保守性,这两个物种之间调节心脏和血管发生的基因和信号转导途径都是相似的。随着小鼠和人类基因测序的完成,比较遗传学已成为可能。基于上述这些理由,遗传修饰小鼠对于心血管遗传学、发生生物学以及生理学的研究中都是必需的动物模型。以小鼠作模型来研究人类心血管疾病的限制性是显而易见的,但是基于小鼠中遗传操控的简易性,这种模型已成为标准的起始模型,经它检验假设之后再到较大动物中评估。这部分简要介绍小鼠中四种基因修饰方法的原理,包括转基因、基因缺失或“敲除”、条件性敲除以及研究小鼠生理学。同时我们也为读者提供了深入回顾的资料来源。
(一)转基因小鼠
培养转基因小鼠包括四个步骤:克隆目标基因;将该基因与转录调节序列融合,从而使它在小鼠的所有组织或特殊组织中表达;将纯化后的转基因注射入一个已受精的单细胞小鼠胚胎的精原核;以及将接受注射后的胚胎再植入代母中。注射的转基因随机地与受精卵的染色体整合,从而培养出一只表达注入的转基因的首建者小鼠,并将转基因遗传给50%的子代。继而就能以非转基因的同胞鼠作对照与转基因鼠进行比较研究。首建者转基因鼠的培养现已成为很多实验室的常规操作,且一般可在一个月以内完成。相似的技术也用来培养转基因兔、转基因大鼠和转基因猪。
对这些技术的改良催生了更复杂的转基因模型。细胞特异性的启动子可使转基因表达限制在心肌细胞、内皮细胞和血管滑肌细胞中,从而培养出转基因只在心血管系统中表达的转基因小鼠。我们可以通过过度表达某一转基因获得某项功能,也能消除单个基因的功能,方法是过度表达该基因的一种显性负向突变,而后者编码的蛋白质会干扰野生型蛋白质的功能。四环素操纵子系统的出现让我们能应用一种简单的药物来控制转基因表达的开或关。这类小鼠模型让我们能利用精确控制转基因表达的时间,并比较同一动物在转基因开或关的状态下的表型。
(二)基因灭活或敲除的方法
灭活是转基因的一种补充方法,用以研究某些特殊基因在小鼠的发生和生理中的作用。在基因灭活研究中,一种或多种基因的表达被“敲除”,从而培养出“失功能”的突变小鼠。敲除过程包括下列步骤:建立含有目的基因的靶载体,目的基因存在缺失突变或无义突变;用靶载体转染小鼠胚胎的多能干细胞;靶构造和内源基因的同源重组,从而产生同源目的基因缺失的胚胎干细胞;将突变后的胚胎干细胞注射到受精小鼠的胚泡中;以及将胚泡移植到代母中。通过这种途径所产生的幼鼠就成了嵌合体,它包括性腺内的所有组织都是部分来自突变的胚胎干细胞,部分来自移植的胚泡中的野生细胞。这种嵌合体动物与野生型动物交配后,来自嵌合体的突变精子和野生型卵子结合,从而培养出异源性基因敲除小鼠,它的所有细胞中目标基因的一个拷贝是突变的,另一个是野生型的。接下去使异源性动物之间交配,就能培养出同源性的基因敲除小鼠,它的所有细胞中目标基因都是缺失的。基因敲除动物中的基因缺失能产生特殊的表型,从而显示该基因在发育过程中以及对于正常和干扰状态下生物生理的直接作用。基因敲除小鼠的培养在技术上较转基因更具挑战性,通常需要9~12周的时间来完成。
(三)条件性基因敲除小鼠
重要基因的灭活经常会造成早期胚胎死亡,从而使得人们对这些表型的分析和理解变得非常困难。因此,组织特异性的基因剔除和(或)在发育的不同时间段灭活基因的方法就应运而生。另外,我们所感兴趣的经常是制造特殊的基因突变,而不是完全消除这些基因的表达。同源重组的方法也经常用来将特殊的突变导入野生型基因;技术上的区别在于这种“敲入”使用含有突变基因而不是基因缺失的靶结构。其他的同源重组方法可导入一个独立或不相关的基因到外源的基因组中,从而在靶基因组启动子的控制下调节新基因的功能。
另一种组织特异性基因剔除的方法是应用一种细菌噬菌体重组系统——Cre-lox。P 1细菌噬菌体编码称为Cre的酶,它能催化两个传导重组信号的特殊DNA序列(称为lox P位点)的重组。这个系统已通过一种靶结构调适到小鼠中,这种靶结构的目标基因是以loxP位点为侧翼的(“floxed等位基因”)。Floxed等位基因的同源小鼠与以组织特异性的方式(例如内皮、细胞、血管平滑肌细胞、心肌细胞)表达Cre重组酶的转基因鼠杂交,其子代就只在表达Cre重组酶的组织中出现目标基因的缺失。如果将Cre转基因置于四环素应答的启动子控制下,就能使基因缺失仅出现于四环素喂养后。
六、基因和以细胞为基础的治疗
基因导入是重组基因在哺乳动物细胞中的引入和表达。基因导入的目的是在目标细胞中引入重组基因来研究该基因表达的机制和结果。基因由载体转染人细胞。重组基因在宿主酶系的催化下经历转录为RNA并翻译为蛋白质的过程,最终表达重组蛋白质。重组蛋白质可能留在细胞内或分泌到细胞外间隙或循环中。基因表达可以是一过性的或稳定的,取决于基因是否整合入染色体中。DNA摄取和基因表达的效率通常称为转染效率,这取决于很多因素,包括DNA递送到细胞,胞浆对DNA的摄取,DNA在内体中的降解,DNA从内体中释放入胞浆,运输到胞核,以及保留在胞核中的一系列过程。
活体内基因导入是通过细胞介导或直接基因转移的方法进行的。细胞介导的或回体的基因导入包括取出宿主的自体细胞,并在试管内将载体转染入细胞。基因修饰过的细胞再通过输注或注射重新导入细胞。体外基因导入允许我们将重组的遗传物质递送到特殊的细胞(如内皮细胞或平滑肌细胞),并分析该类细胞中重组基因的表达。亦可将重组基因直接送到目的细胞及组织作为活体内基因导入的另一种方法。通过细胞特异性的启动子来实现基因在内皮细胞或平滑肌细胞中的表达可将目的基因导入血管系统。基因导入的体外途径和体内途径现已应用于血管疾病动物模型的培养以及针对心血管系统基因导入的临床研究。
(一)载体
合适的靶细胞的转染是基因导入中关键的第一步。因此,基因导入技术的发展代表了该领域内一个引人注目的研究方向。病毒和非病毒载体已应用于血管基因导入的研究。这些方法的共同特征就是基因递送入细胞的高效性。但是,载体在对外源DNA的处理和与染色体DNA的整合率上是有区别的。对于反转录病毒载体和慢病毒载体,导入的序列稳定地整合入靶细胞的染色体DNA中。这些载体经常被用作回体基因治疗。其他基因转移方法的结局主要是外源DNA以非整合的方式引入靶细胞核中。这些方法可引起高水平但一过性的基因表达。这些载体包括腺病毒、腺相关病毒以及阳离子脂质体,主要用于活体内基因导入研究。
(二)反转录病毒
反转录病毒是用于基因转移研究的首个载体,这可以追溯到20世纪80年代。对于反转录病毒作为载体的最初兴趣来自于一项观察结果,即这些载体能使培养中的增殖靶细胞得到100%的稳定转导。反转录病毒载体一开始用于血管基因导入的研究,主要是在体外研究中,但是它们的应用受到低转染效率的限制。反转录病毒载体近期在临床基因治疗的研究中用于重度联合免疫缺陷(SCID)的治疗。不幸的是,其中一个研究中的两名儿童出现了并发症:反转录病毒插入染色体X的一个致癌位点,最终导致白血病。
(三)腺病毒
血清型为2型和5型的腺病毒被用作心血管基因导入的载体。腺病毒基因是线状的双链DNA,长度约36kb,可分为100个地图单位,每个长度为360个碱基对。这类DNA的基因组末端含有短反向末端重复(ITRs),这对于病毒DNA的复制是必需的。基因产物分为早期(E 1~E 4)和晚期(L 1~L 5)区域,是以表达位于DNA复制起始之前或之后来区分的。腺病毒具有溶解性的生命周期,特征是它与哺乳动物细胞上的腺病毒糖蛋白受体结合,继而通过受体介导的胞吞作用进入细胞。腺病毒的衣壳蛋白保护病毒不受溶酶体的降解,病毒的DNA则易位到胞核中。病毒基因的表达依赖细胞转录因子和腺病毒的E 1区的表达,后者编码病毒基因表达的反式作用因子。在溶解性感染的过程中,病毒基因组在每个细胞中要复制几千个拷贝。病毒基因组与核心蛋白结合,并经由主要衣壳蛋白的自我装配被包装入衣壳。
为了生成基因载体,腺病毒基因组被设计成有复制缺陷的。我们在名为293细胞的细胞系中通过同源重组来构建载体,这包括以下两者的共转染:①含有目标cDNA和一个来自腺病毒基因组的E 1A和E 1B区的小区域(这些区域调节腺病毒的转录,在病毒复制过程中是必需的)的细菌质粒。②一个不完整的腺病毒基因组。两种DNA之间的同源重组产生重组的基因组,其中外源的基因代替E 1区。病毒系在293细胞中进一步繁殖而达到高滴度,一般是每毫升10 9~10 10个噬斑形成单位。
腺病毒载体有几种额外的优势,包括对哺乳动物细胞的高效感染以及能在活体内外非分裂细胞中表达。这些载体相对稳定,并可培植、浓聚到高滴度。该载体染色体外复制的方式大大减少了随机整合以及宿主细胞基因失调而导致突变的几率。但是,一系列的缺点限制了它们作为基因导入载体的应用。腺病毒感染后在血管和心肌细胞中的基因表达短暂,只能持续数周。宿主对腺病毒蛋白的免疫反应是限制它们在活体内应用的主要原因。虽然低水平的中和抗体并不会引发临床上的不良反应,但宿主出现对腺病毒的免疫反应时是否就应终止同血清型腺病毒的重复给予,这还是个悬而未决的问题。第一代重组腺病毒载体(E 1A和E 1B基因以及部分E 3基因缺失)已用于临床的基因治疗研究,虽然这些载体在动物模塑中被认为与组织炎症,尤其是肝脏和肺的炎症有关。高滴度的腺病毒载体对于直接暴露其中的病态肝脏是具有高度毒性的,并且曾很不幸地出现过一例致死的病例。E 2A基因的失活被认为是与基因表达时间的延长和肺脏与肝脏炎症的减少有关。在应用腺病毒载体的动脉基因导入研究中,我们观察到外周和肺动脉外膜中单核炎性细胞的浸润,但是没有发现坏死或血管炎。以前认为腺病毒对肺动脉的感染与血管周围的轻度炎性反应有关;但是滴入盐水或脂质体的肺动脉也同样表现出血管周围轻度的单核细胞聚集。尽管受到对腺病毒衣壳蛋白免疫反应的限制,但由于腺病毒载体转染的高效性,它对于动物模型内的活体基因导入还是有吸引力的载体。腺病毒载体在将来能否应用于临床让我们拭目以待。
(四)腺相关病毒
腺相关病毒(AAV)是一种缺陷型的人类细小病毒,拥有作为基因导入载体的诱人特质。这种病毒载体滴度高,一般对人类不具有致病性,在试管内可感染很多种细胞。AAV基因组是单链、线状的DNA分子,大小为5kb。野生型的AAV以位点特异性的方式整合到人类第19号染色体的一个单一的7kb区域上。AAV基因组的侧翼是拥有145个碱基对的反向末端重复,后者含有包装、DNA复制和整合所必需的序列。其编码区含有两个开放性读码框,它们在构建载体时被删除,并被一种或多种cDNA加转录调节因子取代。AAV载体只能容纳4~5kb的转基因盒,这限制了可用转基因的种类。AAV载体的繁殖要求复杂的包装,包括AAV的Rep及Cap蛋白和五种腺病毒蛋白(E 1A、E 1B、E 2A、E 4、VA)。这些复杂的包装要求排除了为AAV构建辅助细胞系的可能。目前,我们通过AAV载体与含有AAV Rep和Cap蛋白的非包装质粒共转染细胞来构建载体。继而以野生型或突变的辅助腺病毒感染转染细胞,再将AAV从混杂的腺病毒中以热处理以及平衡密度梯度离心的方式分离出来。
在离体研究中,AAV载体能感染多类型细胞,但迄今尚未建立在活体内的应用。血管内皮细胞和平滑肌细胞的转导方法现在仍然未知。更深层的限制包括包装细胞系的缺乏以及需要与腺病毒共感染,因此大批量生产纯化的AAV载体是很困难的。载体构建中病毒基因的删除限制了这些载体以位点特异的方式整合,但还是增加了插入诱变的可能性。AAV载体在理论上是很有吸引力的,但是要应用于临床还需要大量的工作。
(五)阳离子脂质体
阳离子脂类是带正电的脂类制剂,能自发地与带负电的DNA结合组成DNA-脂质共轭物。脂质成分使得DNA被内吞入细胞后与质粒膜或内体膜融合,从而方便DNA递送到细胞。从内体中释放后,质粒DNA仍保持染色体外DNA的形式。阳离子脂质体已被应用到许多动物模型的动脉基因导入研究中,包括大鼠、兔、狗和猪。阳离子脂质体的优点包括安全性好,不存在病毒编码序列,对cDNA的大小没有限制。它们应用于动物或人体所导致的生化、血流动力学或心脏的毒性很小;在实验室或临床中应用时的准备工作很简单。应用的限制包括转染效率低,基因表达持续时间短。
(六)多聚物
多聚物凝胶包裹的核酸和药物可被附着于支架或球囊上,直接作用于动脉。我们研制了水凝胶导管,将质粒DNA传递到活体的家兔动脉中,并在临床基因治疗实验中将这种技术用于人类。随着时间的推移,其他用于动脉支架术的多聚物被开发应用,但是很多早期的多聚物都会导致严重的炎症反应。新的化合物已成功地用于药物洗脱支架的研发。
(七)动物模型
基因导入是将核酸引入动物的体细胞,从而确定基因功能、分析疾病病理生理学、或取得某种治疗作用的有用方法。在过去的10年中,基因导入已被应用于许多心血管疾病的动物模型中。我们应用了以基因和细胞为基础的方法,包括最近热点,将基因导入与干细胞为基础的治疗结合起来。以基因导入为工具引发血管生长就是一个例证。
血管生长贯穿于血管生成、动脉生成、淋巴管生成的各个阶段。血管生成是新的血管从已有血管中萌芽的过程。动脉生成是含肌层的侧支血管自先前的动脉吻合处扩大,通常被称为“侧支化”。淋巴管生成是自现存的淋巴管生成新的淋巴管。这些概念广泛用于临床前和临床研究。血管内皮生长因子(VEGF A)的两种剪切异构体VEGF 165和VEGF 121在动物模型中都体现出生成血管的特质,并已经过临床试验的评价。血小板生长因子(PDGF)在动物中也表现出生成血管的功能。它与VEGFR-1结合,并与病理状态下的血管生成作用有关。有趣的是,PDGF也能通过动员骨髓造血干细胞和内皮祖细胞促进血管生成和动脉生成。尽管近来有学者用VEGF转导干细胞增强血管生成,但VEGF、PDGF和内皮祖细胞治疗局部缺血的临床实用性还没得到确定。其他生长因子的生成血管作用也通过基因导入模型得到了评价。缺氧诱导转录因子-1α能激活数种生成血管的生长因子,包括VEGF-A、VEGFR-2、胰岛素样式生长因子-2和促红细胞生成素。近来还有学者描述了一种能激活VEGF转录的亮氨酸拉链转录因子。
有一种假说认为生长因子的过度表达会导致治疗性的血管生长,这个假说已在数种周围血管疾病和心肌缺血的动物模型中得到检验,包括通过干细胞和内皮祖细胞体外转导。我们已在心肌和骨骼肌中验证了,通过腺病毒介导的VEGF和成纤维细胞生长因子的递送,从而以毛细血管增生和扩大的方式促进血管生长,但治疗停止(或转基因消失)就会使大部分血管退化。VEGF表达超过4周就能获得充分的血管重构,并使新生血管的生长在VEGF治疗撤除后还能持续几个月。我们在动物模型中发现,血流动力学的因素和血流的持续性对新生血管的稳定是很重要的。另外,临床前动物模型的预测价值与动物的大小是成反比的。许多应用和载体在小型动物模型(例如小鼠和大鼠)中运作得很好,但如果升级到更大的动物,例如猪、狗、羊,就会出现困难。在正常的年轻动物中有效也可能无法预测在患有慢性疾病的人类老年患者中的反应。事实上,患糖尿病的老年动物中血管生长是受损的。鉴于目前载体的限制,许多在动物中报道的有益的生物学效应在人类中可能是无法实现的。
(八)临床试验
心血管基因治疗试验经历了起伏的过程。许多Ⅰ期临床试验已经完成,但是很少有进展到Ⅱ期临床试验的。腺病毒载体使用,即使是在心血管方面,以及活体内甚低的转染效率均已受到人们的关注。大部分的研究都集中在促进血管生成和动脉生成从而改善心肌和骨骼肌的灌注上。迄今为止,针对治疗性血管生成的Ⅰ、Ⅱ、Ⅲ期临床试验均已进行。开始的Ⅰ期试验使用质粒DNA和腺病毒来诱导周围或心肌缺血灶的血管生成。这些临床试验在小样本患者中评估了经导管或直接注射以递送基因载体的安全性。得出的结论具有明确的一致性:基因载体或递送装置没有引起严重的不良反应。安全性得到了论证之后,Ⅰ/Ⅱ期研究就开始在较大数量的患者中评估软性的有效性终点。没有主要不良事件的报道;同时,虽然报道了阳性的有效性结果,但这些临床试验多未设相应对照组。但是总体来说,人们对这方面临床内在关键的了解随之增加。在接受治疗的患者中,安慰剂效应很常见,这可能与血流动力学的改变或临床治疗的改善有关。我们并不是总能预先定义有意义的临床终点,从而使得有效性数据的确立存在疑云。缺乏随机对照研究也阻碍了这个领域的发展。最近,一个纳入了较大数量患者,采用安慰剂对照,并有预先完善定义的临床终点的Ⅲ期临床试验开始实施。这个Ⅲ期临床试验的数据和长期随访的结果将是至关重要的,它们将决定基因治疗产品是否会被美国食品药品管理局批准,以及是否能在临床上用于治疗心肌和(或)周围缺血。完善对基因治疗药物的代谢动力学的了解非常重要。研究者们应该继续谨慎实施并评估这些临床试验。
未来的方向:现今,分子和细胞生物学已成为主流心血管研究中的一部分。这些方法增进了我们对心血管疾病发病机制的理解,引导了极为有用的动物模型的产生,并为分子治疗提供了基本原则。心血管研究正在转向下一个科学领域,即分子遗传学的领域,在这方面必将出现重大的进展。到现在为止,我们已经开始明了单个基因引发心血管疾病的机制。这些机制为我们理解常见心血管疾病的病理生理学复杂性提供了很大的启迪。分子遗传学领域的下一个重大挑战是更清楚地了解常见心血管疾病的遗传易感性。基因分型、基因组学和蛋白质组学都是很有前途的方法,但目前这些方法的研发尚不完全。现在,从这些技术中收集到的信息仅仅等同于那些观察敏锐并善于思考的医师在患者中发现罕见疾病的临床表型特征。虽然很多研究者满怀希望,我们现在还并不知道基因治疗或以细胞为基础的治疗会在将来的临床心脏病学实践中扮演怎样的角色。只有众多的医师、科学家以及临床研究者致力于进行谨慎且经过深思熟虑的研究,我们才有可能实现分子遗传学的前景,并将其应用于心血管疾病患者的治疗中。
(刘晓红 原 标)