1.2 传统计算机辅助药物设计的历史
计算机辅助药物设计(Computer Aided Drug Design,CADD)是以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的关系,设计和优化先导化合物的方法。所谓的计算机辅助药物设计,实际上就是通过模拟和计算受体与配体的这种相互作用,进行先导化合物的优化与设计。计算机辅助药物设计与人工智能(特别是机器学习)紧密结合的方向有3个,分别是定量构效关系、分子对接和ADMET预测。
20 世纪六七十年代,理性药物设计这一新兴前沿领域应运而生并迅速发展,构效关系的研究也从以前的定性推测水平提升到定量计算水平。20世纪60年代,构效关系的研究进入定量时代,由药物化学家Hansch提出的Hansch分析将分子整体的疏水性、电性、立体参数与药物分子的生理活性联系起来,建立了二维定量构效关系方法。1988年,Cramer等提出了基于分子空间结构的比较分子场方法,即所谓的CoMFA方法。CoMFA通过比较同系列分子附近空间各点的疏水性、静电势等理化参数,将这些参数与小分子生理活性建立联系,从而指导新化合物的设计。相比Hansch方法,CoMFA考虑到了分子内部的空间结构,因而被称为三维定量构效关系。
从20世纪80年代第一个分子对接软件DOCK问世以来,分子对接(molecular docking)方法不断发展,利用对接来探究小分子与蛋白的结合口袋(binding pocket)之间的相互作用,已经成为药物设计中非常流行的一种模拟方法,也是常用的虚拟筛选(virtual screening)策略。分子对接中打分函数的训练往往采用机器学习方法(如回归方法),以获得最佳的组合权重。
在药物研发过程中,ADMET性质是衡量化合物是否能成药的关键因素。药物的ADMET性质是指药物在人体的吸收(absorption)、分布(distribution)、代谢(metabolism)、排泄(excretion)及毒性(toxicity),涉及药物在体内的药代动力学和毒理学相关性质。和定量构效关系类似,ADMET性质预测也是从分子的理化参数出发,通过神经网络/支持向量机(Support Vector Machine,SVM)等方法,将这些参数与ADMET性质建立联系。