基因组设计
基因编辑老方法
20世纪70年代首次采用重组DNA技术以来,将新的DNA插入生物体基因组带来的不可预测性,导致其在安全性和临床适用性方面具有不确定性。然而,该技术的前景太诱人了,因为它是用功能性副本替换损坏基因的最有效的方法之一。只要能够轻易修改DNA,我们的问题就只剩下如何使用基因疗法了。
1990年,基因疗法首次取得重大成功,当时,一个名为阿山提·德西尔瓦的孩子使用了该疗法。她患有“泡泡男孩”综合征,这是一种严重的联合免疫缺陷(SCID),会使患者的适应性免疫系统失效,导致人体无法抵御病原体、细菌。为了解决这一问题,科学家和医生抽取了她的骨髓和纯化的白细胞(WBCs),然后用一种逆转录病毒将一个有效基因插入其中。最终,他们将白细胞注射回她的身体,帮助她的免疫系统重回正常。在五岁时,她可以自由外出了,而这是她有生以来第一次享受这种自由。
2002年,法国的研究人员对十个孩子进行了类似的实验,研究人员使用了从患者骨髓中提取的干细胞,并制造功能性白细胞来抵御感染。令人振奋的是,该疗法起效了,SCID似乎消失了。但是,到了2007年,其中四个孩子患上了白血病,其中一人因病去世,逆转录病毒整合过程的随机性是罪魁祸首。至少,对其中一个孩子来说,病毒已经整合到一个肿瘤基因附近,这可能会导致白血病或其他癌症。但是,这并不是唯一值得引起警惕的案例。
杰西·基辛格(Jesse Gelsinger)接受了基因治疗,但最终失败了,这件事足矣震惊世界。在临床试验中,研究者使用了一种腺病毒载体[*译者注:腺病毒(Adenoviruses)是一种未被包覆的DNA病毒,它的多种特性足以让其成为理想的疫苗载体。腺病毒载体被认为是绝对安全的,同时也是最适合基因改造的]来治疗一种被称为鸟胺酸氨甲酰基转移酶缺乏症(OTCD)的疾病,这种疾病会使血液中的氨不断累积,最终致命。作为患者来说,基辛格是比较健康的,他可以通过控制饮食来降低血液中的氨含量,从而减弱OTCD的影响。基辛格是临床试验中第18个接受治疗者,他在接受治疗后很快就出现了浮肿、不适和黄疸等症状。他还出现了强烈且痛苦的炎症反应,随后是肾脏、肝脏和肺部衰竭,陷入了昏迷。不到四天,他就去世了。
1999年,基辛格的死亡导致了全球范围内对基因工程和对疾病采用基因疗法的恐慌,人们对此进行了全面调查。调查发现,临床试验中两位患者产生了严重的副作用,但科学家们没有立即通知机构或按要求暂停研究。此外,基辛格在接受基因治疗前进行的血液检查显示,他的肝功能很差,这意味着他根本不是最佳的试验人选。美国食品药品监督管理局(FDA)和美国国立卫生研究院(NIH)的研究表明,在基辛格去世前的七年,多达691名参加基因治疗试验的志愿者死亡、患病,然而,只有39起事件被及时上报。
詹姆·威尔逊(James Wilson)是宾夕法尼亚大学人类基因治疗研究所的主任,同时也是这起临床试验的负责人,他迫切地想了解事件的原因和经过。他致力于探索能够安全进行基因编辑治疗的其他手段,并找到了几个不错的候选方法(如腺病毒和AAV变种)。尽管如此,美国食品药品监督管理局还是指控威尔逊有几项研究违反了临床试验规范。2005年,威尔逊同意在五年内暂停他的人类学研究,而他所在的大学需要向政府支付51.4万美元的赔偿金。
由于基辛格之死带来的恐慌,以及相关的监管政策,2000年到2001年,基因工程临床试验略有减少。21世纪初,有段时间,如果你说自己在从事基因治疗的研究,在一些学术领域内里,这便意味着一种专业责任。但是,基因疗法潜力无穷,令人无法抗拒。该领域充满了关于如何改进治疗、传递和包装基因有效载荷的想法。
科学家和临床人员不禁要问:我们是否能使治疗更加安全?基因疗法能否如我们所希望的那样有效?科学家在基因工程新理念的基础上,研究了多种新的基因治疗动物模型,通过多种途径使这种方法变得更安全。近年来,使用基因工程方法的临床试验不断增加(见图4.1)。
虽然媒体将基辛格的死亡视为对整个治疗性基因编辑领域的挑战,但并没有导致新的试验被叫停。事实上,仅在2000年到2001年,将近200项新的基因工程临床试验启动。21世纪初,可怕的头条新闻掩盖了现实,从20世纪90年代末到20世纪20年代及以后,基因工程临床试验的数量将稳步攀升,特别是一些针对癌症的试验。
图4.1 基因工程临床试验兴起。上图:特定国家每年的试验数量,美国每年的试验数量最多,2018年被中国超过。下图:基因工程治疗的类型多样,特别是基于受体的治疗方法崛起,主要针对癌症的嵌合抗原受体细胞(CAR-T)临床疗法
人们的关注点一直很清晰:找到一种能够更准确地部署基因工程的方法。随机插入新基因有效载荷是有风险的,我们需要新的基因编辑方法,而这种方法很快就出现了。
基因编辑新方法
早期的基因治疗试验逐渐完善。如今,我们拥有了多种可以精准编辑特定基因的方法,这些新方法取代了过去随机添加来自腺病毒和AAVs的新遗传物质的方法,而后者可能导致了基辛格的死亡。此外,我们不断调整新方法,以此保证质量。比如,采用随机整合的方法,并在疗程开始之前进行例行检查。新的基因工程方法始于20世纪80年代初,主要围绕着酶展开。
基因组编辑的第一个工具出现在20世纪80年代末,来自被称为巨核酸酶的酶,它是内切核酸酶(Endonucleases)的一部分。正如其名(endo代表内部,nucle代表DNA所在的细胞核,ase代表酶),这些酶可以匹配和切割DNA的片段。基因组编辑的第一步十分关键,需要在选定的部位打破DNA(DSB双链断裂)。然后,就可以插入设计好的新序列中,修复DNA,再让细胞重新上路,这就好比将自己的腿切断,再让自己变得更高。研究人员在非常具体的位置制造出DSB双链断裂,范围从14到40个核苷酸,这样就可以针对基因组中特殊的点进行操作。但是,并非每一个已知的DNA序列都有巨核酸酶,由于缺乏调控,大大限制了它们的治疗潜力。
因此,我们需要更多可扩展的新方法。20世纪80年代以来,在遗传工程方面出现了三种新方法:第一,锌指核酸酶(ZFN);第二,转录激活因子样效应物核酸酶(TALEN);第三,规律间隔成簇短回文重复序列(CRISPR)。第一个使用这些基因编辑方法的临床试验始于2008年,由此开始,试验的数量和类型不断增加。2015年以来,相关技术得到快速发展。
有关ZFN的研究利用了转录因子。转录因子是基因表达的主调控者,它不断扫描基因组,看看哪些基因应该被打开,哪些基因应该被关闭。如果你的基因是厨房里的电器(如冰箱、烤面包机、炉子、研磨机),那么转录因子就是一个开关。这些酶经过数亿年的进化而形成,可以读取特定的DNA序列(称为基序motif),当它们找到自己所识别的特定基序时,就可以巧妙地控制你的细胞功能,就像我们快速认出自己的所爱之人那样。因此,ZFN成为候选酶是理所应当的,它可以精确地瞄准DNA序列。
然而,转录因子也有自己的调节杠杆和开关。例如,当它“拥抱”一个锌离子时,就会变得更加稳定,从而识别给定的基序并与DNA相互作用。因此,如果将一个患病的基因组看成一个打开的文本页,你想进行“查找”和“替换”,那么转录因子是“查找”,锌离子是“回车键”,你需要将它与另一种酶配对,以实现“替换”功能。
ZFN通过将两个原蛋白的片段合并在一起(称为融合蛋白)来完成“查找”和“替换”。大多数蛋白质在其大的三维结构中都有多个区域(Domain结构域),这些三维结构的子部分可以合并在一起,ZFN也不例外。因此,核酸酶实际切割DNA的部分(如巨核酸酶)可以与只识别特定位点的蛋白质片段(如ZFN和TF基序)连接,这样就能对整个基因组的特定位点进行切割。
然而,每个单一的TF基序都非常短(三四个碱基对),因此不具有特异性。在一个含有四个碱基的基因组中,使用三个碱基产生的目标,其多样性将只包括43(n=64)或44(n=256)的组合,这对于启用多类型目标来说太过局限。为了应对这一挑战,2002年Gior-dano实验室的研究人员在一个结构中使用了七八个这样的ZF识别位点,这样ZFN就可以一次性针对20~24个碱基,研究人员便能够在小鼠癌症模型中的靶向血管生成所需的基因。这次实验展示了ZFN方法的特异性和功能。2008年,它们被用于靶向胶质母细胞瘤细胞(体外)并增加其对治疗(糖皮质激素)的敏感性,但这并不是编辑基因组的唯一方法。
TALEN与ZFN十分相似,它们合并了核酸酶的DNA切割蛋白结构域,但使用的是TALE而不是位点识别能力。然而,基于一个高度保守的34个氨基酸序列,它们的识别域要长得多。这些蛋白由一种被称为黄单胞菌的植物病原菌排出,通过与宿主植物启动子序列相结合的方式,激活感染期间帮助黄单胞菌的各种植物基因,重新规划其植物宿主。
由于TALEN的识别域比ZFN的长,它们在2010年年初迅速成为基因组编辑的首选方法。TALEN的长结合位点(大于30个碱基对)使其具有更大的特异性,并降低了在人们不想编辑的部位(如致癌基因)进行“脱靶”切割的概率,而且其序列十分规律,更容易构建。基于这些特点,TALEN可以准确地编辑需要治疗的身体部位。
CRISPR与TALEN、ZFN相似,它在一个分子的引导下识别自己感兴趣的部位,切开DNA,然后将想要的变化纳入其中。CRISPR最为重要的一点是,它让基因组编辑更加简单。CRISPR通过使用向导RNA(gRNA)来工作,可以将整个分子机器引导到位,基于其高度特异性,导致DNA断裂。这里的关键部分在于,该项技术的“扫描元素”是一个RNA序列,而不是蛋白质基序,它允许识别DNA。这意味着,只要你知道序列,就可以直接且轻松地合成针对基因组特定区域的必要分子。鉴于将核序列转化为其氨基酸的三维形状十分复杂,用RNA合成新的物质,比用高度特异性的基序合成新的蛋白质更方便。