购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第五节
基于计算机和信息学技术的药物发现

计算机辅助药物设计(computer-aided drug design,CAMD)、计算机辅助药物筛选(computerassisted drug screening)、理性筛选(rational screening)、虚拟筛选(virtual screening)以及人工智能在药物发现中的应用成为近年来的研究热点。虚拟筛选是计算机辅助药物设计方法应用的延伸与发展。虚拟筛选技术基于药物设计的化学理论计算方法,通过方法改进,提高计算速度,可以从大容量的化合物库中快速寻找有效化合物,为药物筛选与发现提供重要信息,以减少药物筛选的盲目性,降低筛选成本,提高新药发现的成功率。

一、基于靶点的分子设计和药物筛选

随着药物研究新方法、新技术的发展,越来越多的蛋白质三维结构被确证,新的药物靶点蛋白被发现。依据靶蛋白结构,依靠计算机技术进行药物分子设计得到迅速发展。分子对接法是依据靶蛋白结构对药物进行分析的主要手段之一。基于分子对接技术的虚拟筛选方法可以大量节省药物研发成本且有效缩小研发周期。基于靶点的虚拟筛选原则是通过对靶蛋白三维结构进行分析,发现其活性位点,依据小分子与活性位点的相互作用(如静电作用等)来筛选药物。分子对接技术包括三部分内容:结合位点的识别、构象搜索算法及打分函数。分子对接是指在靶蛋白分子的活性位点上依次连接化合物库中的分子,然后经过连续优化靶蛋白分子的构象、位置等,找到小分子化合物与靶点大分子的最优构象,计算出小分子化合物与大分子蛋白质相连接的方式与亲和力,并对结果进行打分,根据打分结果挑选出最佳配体,获得活性化合物。常用的分子对接软件包括AutoDock、SLIDE、DOCK和FlexX等,尽管它们在分子对接与计算过程中应用了不同的搜索算法和打分函数。

基于分子对接技术的虚拟筛选方法基本流程包括:①构建三维小分子数据库,对每一个小分子的原子种类及化学键都进行归属分配;②完成靶蛋白结构的质子化和原子电荷的归属,明确小分子的结合位点并建立计算网络;③将靶蛋白的活性作用位点与三维小分子库中的每种小分子进行匹配连接,计算两者之间的结合强度并打分;④依据评分结果筛选出得分较高的化合物。

二、活性化合物成药性的计算机早期评价

药物研发是一个耗资多、周期长、成功率低的过程,其中安全性是药物研发失败的一个主要原因。如果在药物研发早期能够准确预测候选化合物的安全性,则可以及早中止相关研发实验,降低开发成本,提高新药研发的命中率。传统的安全性评价方法是应用一系列毒性学实验,通常以动物实验为基础,开展组织病理学、生物功能检测等。常规的安全性评价实验无法满足对大量化合物实体库进行HTS的需求,更无法满足虚拟库中尚未合成的化合物安全性评价的需求。因此,常规毒理学评价难以满足现代药物研发的需求,迫切需要寻求新的安全性评价方法。

活性化合物早期药动学、安全性评价是成药性评价的重要内容,随着计算机技术、信息学技术与药物发现领域的渗透与融合,应用计算机方法进行化合物早期药动学和毒性评价可以在药物开发的早期及时、准确、快速评价活性化合物的成药性,可以降低开发成本、缩短研究周期、提高新药研发的速度和准确性。药动学性质包括吸收(adsorption)、分布(distribution)和清除(excretion)过程,简称ADME,与毒性(toxicity)合称为ADMET性质,是化合物早期成药性评价的重要参考指标。如何快速、廉价地在药物研发早期进行化合物ADMET性质预测成为药物研发过程中需要迫切解决的问题。近年来,利用计算方法预测药物的ADMET性质引起了广泛关注。目前,针对人体小肠吸收、血脑屏障透过、人体表观分布容积、清除率、致癌性、急性毒性、发育毒性、肝毒性、生殖毒性等ADMET相关的性质,使用机器学习方法分别建立预测模型,构建覆盖化合物ADMET性质预测平台,用于化合物ADMET预测,在药物研发早期对候选化合物进行成药性评价和风险评估,有助于提高药物研发的成功率、节省研发时间和减少经费投入。

三、针对药物筛选的化合物库建立

化合物库是按照特殊的研究目的构建的大量化合物集合,可以在短时间内、在特定的筛选模型上完成大量化合物样品的筛选。虚拟筛选指针对靶蛋白的三维结构或定量构效关系(QSAR)模型,从化合物库中搜寻与靶蛋白结合或符合QSAR模型的化合物的方法。制备化合物库需要考虑结构多样性、类药性等要素。

1.非药物类化合物排除法

在药物发现的早期,准确快速地排除无活性化合物,将有利于达到富集活性化合物、降低筛选成本的目的。在药物筛选的化合物样品准备阶段,非药物类化合物排除法(removal of non-drug-like compound)根据化合物类药性(drug-likeness)的特点,排除化合物数据库中违背化合物类药性特征的化合物。这种方法简单易行,在化合物数据库管理系统中即可完成。非药物类化合物主要包括以下几种类型:①存在非药物类元素如过渡金属元素的化合物;②分子量小于100或大于1000的化合物;③碳原子总数小于3的化合物;④无氮原子、氧原子或硫原子的化合物;⑤违反“Lipinski五规则”中两条或两条以上规则的化合物;⑥对于非中枢神经系统的药物筛选,应排除血脑屏障系数(logBB)大于0.3的化合物,这里,logBB是药物分子在大脑和血液中稳态浓度比值的对数,即log( C brain / C blood );⑦对于中枢神经系统的药物筛选,则应排除血脑屏障系数logBB小于0的化合物。大多数非药物类化合物具备以上特征,因此利用这种排除法,可以排除非特异性的无活性化合物,适用于大多数高通量筛选前的化合物样品准备。但也有例外,如抗肿瘤药物的筛选不排除金属有机化合物,麻醉用药的筛选不排除小分子量的化合物等。

2.假阳性化合物排除法

理论上讲,具有化学反应活性的化合物本不应该收集到用于药物筛选的化合物样品库中,但实际上化学合成工作者已经为高通量筛选提供了大量的化学反应中间产物,如醛、环氧化物、卤代烷等。这些化合物易于与生物大分子发生化学反应,在基于受体、酶或细胞检测实验中总是表现为假阳性(false positive),从而干扰药物研发的进程,因此应尽早予以排除。在药物筛选的前期,排除这些假阳性化合物的方法称为假阳性化合物排除法(removal of false positive compound)。

这些在生物学实验中表现为假阳性的化合物,其特征基团一般在水解条件下易于分解,可以与蛋白质及生物亲核试剂(如谷胱甘肽、二硫苏糖醇等)产生化学反应,在血清中稳定性很差。虽然从化合物数据库中排除所有可疑的假阳性化合物并不现实,但能够在先导化合物发现的早期剔除假阳性化合物是至关重要的。化合物是否为假阳性取决于化合物与生物大分子之间产生的相互作用是源于生物学反应还是化学反应。如果产生生物学反应的化合物是我们寻找的目标,那么产生化学反应的化合物则被认为是假阳性化合物。但特殊情况下,如果与生物大分子发生某种化学反应的化合物才是我们筛选与发现的目标,这种排除方法则并不适用。

四、针对候选药物靶点的预测

1.药效团搜索法

药效团可以通过配体和受体两方面来构建。当药物靶点的结构未知时,可以基于配体的结构进行药效团的构建,从一系列活性化合物结构出发,确定其生物活性必需的疏水、氢键等特征元素;当化合物的活性已知时,还可以建立药效团的3D-QSAR模型。在此基础上,从大量化合物数据库中搜索符合药效团模型的化合物,并预测其生物活性,从而实现活性化合物的高度富集,为高通量筛选提供优质的待筛化合物。当受体的晶体结构已知时,还可以通过探测生物大分子与配体的相互作用位点,来建立药效团模型。

由于药效团模型是基于活性配体的结构构建的,因此参与模型构建的配体结构类型和配体数目均会影响药效团模型的构成。构建的药效团模型是否可靠,还需要建立检验数据库(test database)进行验证,验证之后才能用于化合物数据库的搜索。检验数据库一般由化学试剂及文献报道的活性化合物组成。目前,常用的产生药效团的软件有DISCO、HypoGen、GASP、PHASE等。

2.分子对接法

分子生物学和结构生物学的发展使得大量的生物大分子的三维结构被解析,未被解析的受体大分子结构常常可以通过同源建模的方法得到。在此基础上,可以基于药物靶点或同源蛋白的结构,以复合物的配体作为参照化合物(reference compound),应用分子对接软件,从化合物样品数据库中搜索在空间和化学性质上均与药物靶点活性位点相契合的化合物,因此称这种方法为分子对接法(molecular docking approach)。另外,当药物靶点具有多个亚型时,应根据治疗疾病的特点,选择对药物靶点特定亚型契合度高、对其他亚型契合度低的化合物,以提高化合物的选择性,减少化合物的毒副作用。目前,常用的分子对接软件有Autodock、Gold、Dock、FlexX、Glide、MOE等。

五、基于已知药物和活性化合物结构的药物分子设计

1.分子相似法

分子相似法(molecular similitude approach)是基于分子相似性的虚拟筛选,将一个或多个与蛋白质结合的配体结构作为数据库搜寻的条件,从化合物数据库中搜索符合相似性标准的化合物,用于高通量筛选。上述药效团搜索法仅利用了配体的部分结构特点,而分子相似法则利用了分子的整体结构特点,与对照化合物的结构或形状进行比较,从化合物数据库中搜索符合条件的化合物。

目前,分子相似法已被广泛应用于药物设计过程中。由于组合化学合成技术的应用,化合物合成速度得到大大提高,因而产生大量不同结构的化合物。在此基础上,最常用的虚拟筛选方法就是基于相似性的方法。此外,这种方法还用于确定待筛化合物的结构类型。根据配体相似性进行分类以后,构建生物活性与亚结构或功能团之间的SAR模型,用于分析化合物活性评价的优先权。常用的分子相似性虚拟筛选软件有CerberuS、FlexS、GASP、MIMIC以及GRID等。

2.反向分子对接法

上述几种方法均用于从化合物数据库中挑选优质的化合物,为药物筛选做好化合物样品的前期准备。相反地,反向分子对接(reverse docking)是将同一个活性分子分别对接到多个蛋白质的活性位点,以确定该分子潜在的药物靶点的技术,能够高效、大规模地进行靶点的确定和验证,并预测与毒性相关的靶点。随着人类后基因组计划的实施,以及药物靶点快速确证技术和结构快速鉴定技术的应用,使越来越多的药物靶点结构信息得以解析,这些信息的积累将为反向分子对接法的广泛应用奠定重要信息基础。据报道,约35%的药物或先导化合物具有多靶点药效作用,药物与多靶点相互作用能够显著提高疗效,当然也可能导致不同程度的副作用和毒性。Bernard等运用反向分子对接软件SELNERGYtm发现了托非索泮(tofisopam)的作用靶点——磷酸二酯酶Ⅳ型(phosphodiesterase type 4,PDE4),为开发高选择性的PDE4抑制剂提供了广阔的应用前景。

六、人工智能技术应用于化合物结构预测和活性预测

人工智能(artificial intelligence,AI)又称为机器智能、机器学习,是指一个能够正确解释外部数据的系统,并通过从这些数据学习中进一步完成特定的目标和任务,为解决复杂性科学问题提供新的解决方案。随着计算机技术和信息化的不断发展,药物设计逐步应用数字化模拟技术,基于实验数据库进行数据挖掘,从已获得的实验数据发现潜在规律,建立机器学习模型进行药物设计,可有效减少药物筛选的经验性和盲目性,已成为药物发现领域的强有力手段。AI技术可应用于新药研发的多个环节:①AI利用生物信息学技术开展疾病分子网络分析,发现新的药物靶点。②AI运用生成对抗网络(generative adversarial network,GAN)、强化网络(deep Q network,DQN)等算法筛选先导化合物,发现新的药物分子。③结合计算机模拟,预测蛋白质-配体的相互作用,加速研发过程,降低研发成本。

AI在药物筛选中的应用:药物设计中的一个重要考虑因素是选择在生物利用度、生物活性和毒性等方面的性质,AI药物设计算法中使用分子表征包括分子指纹、受体与配体潜在的结合能量测算、分子碎片或不同类型的化学键、3D中的原子坐标、分子周围的电子密度等,进行机器学习和训练,用于化合物库中样品理化性质、生物活性及毒性的预测。

AI在药物设计中的应用:新药分子通常根据靶蛋白的配体结合位点的3D化学环境设计,所以靶蛋白的3D结构对于基于结构的药物发现至关重要。传统上将同源建模和从头蛋白质设计应用于此目的,AI的发展将使预测蛋白质的3D结构变得更加准确和复杂。在蛋白质结构预测评估中,AI工具AlphaFold用于预测药物靶蛋白的3D结构显示出优点,通过评分函数,可以探索蛋白质结构的微观结构。与传统的实验结构生物学方法比较,基于AI的结构预测大大节省了时间成本。

AI技术虽然跟能够缩短药物研发周期、缩减新药研发成本,但也存在一些局限性:①数据质量问题,在新药研发的靶点验证、临床前评价和临床试验等各个阶段,检测方法标准不统一,数据结构性差,质量参差不齐,数据准确性差等,给以数据集为基础的深度学习技术带来挑战。②数据学习导致结果不确定性。③数据信噪比不确定性。④优质数据库资源缺乏。

随着基因组和其他测序项目的不断发展,生物信息学研究的重点正逐步从积累数据转移到如何解释这些数据。基于分子设计和AI技术为新药研发提供了一种新的思维模式,并渗透到新药研发的各个阶段,成为新药研发的重要组成部分,有望能更好地助力新药研发。 AbLDM6pDuD4pjcQaL7ssim9IDYDvr/R3YitcPgyzlUufpdqF9zCLnGYwId/RU5Xz

点击中间区域
呼出菜单
上一章
目录
下一章
×