蛋白质结合位点预测及辅助分子对接
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 绪论

1.1 引言

蛋白质参与或介导了细胞的绝大多数功能。这些复杂的大分子表现出了极大的多样性,足以使它们有能力执行生命相关的各种各样的活动。事实上,没有任何其他生物分子能够替代过去数亿年中蛋白质所承担的功能。

对于研究蛋白质结构的人来说,理解和描述这种分子的多样性是一个很大的挑战。1958年,当第一个球蛋白三维结构(the oxygen-storage protein myoglobin)解析出来后[1],John Kendrew和他的同事写道:“这个分子的最大特征就是它的复杂性和非对称性,这种分子排布缺乏人们所期望的某种规则性,远比任何蛋白质结构理论所预测的更为复杂”。但是,随后基于分辨率更高的研究数据,人们发现肌红蛋白结构还是有一些规律的,并且这个结构规律也存在于其他蛋白质中。现代蛋白质结构理论把蛋白质描述成四层结构,即一级、二级、三级和四级结构。虽然这一框架对我们探寻蛋白质结构产生的生理功能并没有太多的帮助,但它可以使我们方便地描述和理解蛋白质。

理解蛋白质结构是探讨蛋白质功能的基础。蛋白质结构决定蛋白质功能。蛋白质的特殊结构允许三维空间中特定化学基团处于其特定的位置,这使蛋白质能够在生命活动中充当多种角色。这些化学基团的精确定位也使得蛋白质能够在生物体中发挥重要的结构、运输和调节功能。蛋白质功能多样性还表现为与其他分子(包括小分子和其他蛋白质)的相互作用。

生物过程是通过蛋白质-蛋白质的相互作用来实现的,所以要完全理解或要操纵生物过程就需要揭开蛋白质-蛋白质相互作用背后的机制。那么第一步就是要识别相互作用位点。蛋白质相互作用位点的研究方法大体上分为两类,即实验方法和计算方法。目前识别蛋白质相互作用位点的实验方法主要有NMR(nuclear magnetic resonance,核磁共振)[2]、X射线晶体学[3]和丙氨酸扫描突变[4]。尽管近些年来在实验方法学上有了很大的进展,但通过实验方法定位相互作用位点仍然是十分耗时和昂贵的。为了弥补实验方法的不足,需要发展其他方法克服和解决上述困难和问题。蛋白质结合位点预测方法应运而生,它能有效促进了人们对分子识别和相互作用的理解,提高了对蛋白质-蛋白质相互作用的计算预测能力,也为理性药物分子设计打下坚实的基础[5]

新药研究和开发分为药物发现、临床前研究和临床研究与应用等重要阶段[6],其中前两个阶段是在科学实验室里进行的。为了能在市场上正常销售,一个药物要经历广泛的研究和测试以判断它的有效性、安全性、副作用以及潜在的并发症。所以,新药研究和开发过程要牵涉很多的学科以及相应的专业人员,如化学、生物学、生理学、药学、临床医学等。

新药研究开发的关键是药物发现。药物发现由三个环节组成,即发现并确定靶标、发现先导化合物和优化先导化合物。先导化合物一般不能直接成药,需要对其结构做化学修饰和改造,以提高活性和特异性,改善药物代谢动力学特性,进而衍生出特异性高、安全性好、活性高的新药。

从药物发现的历史来看,人们已从仅仅依靠运气发现新药发展到依据靶标进行药物分子设计。目前的药物设计方法主要分为两类[7]。一类是传统药物分子设计方法(如图1.1所示),以组合库大规模筛选为代表。这个过程中,大量不同的化合物被创建并被甄别其生物活性。如果一个化合物表现出与生物靶标作用信号,那么其会被进一步优化而可能发展为一种新的药物。这种筛选过程会花费多年时间以及很多金钱,尽管这样,在药物开发的最后阶段,这个药物也有可能会因为没有足够的有效性或缺乏安全性而被舍弃。随着对新的有效的药物需求的增加,传统药物设计方法的盲目性和低效性使它远不能满足社会的需要。所以,第二类药物设计方法理性药物分子设计(如图1.2所示)应运而生。

图1.1 传统药物分子设计方法

图1.2 理性药物分子设计方法

理性药物分子设计基于这样的假设:特定生物靶标的调控可能具有治疗价值。一个生物分子能够作为靶标,两方面的信息是必需的:一是这个靶标与某种疾病过程相关联,其表现为这个靶标的突变与某种疾病状态一致;二是这个靶标具有可药性,即其能够与小分子相结合并使活性发生变化。

一旦适宜的靶标被确定,那么它通常会被克隆和表达,以建立筛选模型。另外,这个靶标的三维结构一般也需要被确定。

为了搜索结合靶标的小分子,首先建立潜在药物化合物的筛选库,理想的情况下,这些作为候选药物的化合物应该具有类药性,即应该满足一般药物具有的在口服生物利用度、化学和代谢稳定性以及毒性等方面的要求。这个筛选过程可以使用筛选模型试验来完成,而在靶标三维结构已知的情况下,虚拟筛选也可以用来筛选候选药物。由于虚拟筛选技术的使用,使得发现先导化合物的时间大大减少,同时药物开发的成本也降低了[8]

基于虚拟筛选的理性药物分子设计必须有两个条件。第一个条件是必须获得目标蛋白质的三维结构数据,并且这个结构最好是来源于X射线晶体学或者NMR。假如有与目标蛋白质具有较高序列一致性的蛋白质结构存在,那么同源模建的蛋白质结构也是可以接受的。第二个条件是配体结合的位置已知。识别结合位点一般有三种途径:①通过分析蛋白质和配体的共结晶结构得到;②与已知的结合位点进行序列或结构上进行比较;③使用结合位点预测方法进行预测。目前,蛋白质结合位点的识别已经成为一个令人感兴趣的重要领域,并且有很多算法被提出来试图解决这一问题[5]