基于支持向量回归和分子对接技术的中药CYP450,2E1抑制剂筛选


打开文本图片集

[摘要] 细胞色素P450 酶(CYP450)的抑制是药物相互作用最常见的原因,对CYPs抑制剂早期预测的研究有助于减少药物相互作用导致的不良反应。CYP450 2E1(CYP2E1)是CYP450酶系中参与药物体内代谢的主要酶,具有广泛的药物代谢底物谱。该研究以CYP2E1为研究对象,基于32个CYP2E1抑制剂,建立支持向量回归模型(support vector regression,SVR),并用测试集数据对CYP2E1定量模型进行验证,获得CYP2E1抑制剂最优预测模型。该研究同时利用CDOCKER分析阳性化合物与活性口袋相互作用模式及氨基酸,建立CYP2E1抑制剂最优筛选模型。综合利用支持向量回归模型和分子对接预测模型筛选中药化学成分数据库(traditional Chinese medicine database, TCMD),提高了计算效率和结果的准确性。SVR 预测模型初步得到6 376个中药化合物,通过分子对接进一步验证,最终获得247个对CYP2E1具有潜在抑制活性的中药化合物,其中部分已有实验证实其的确对CYP2E1具有抑制作用。该研究对CYP2E1 酶抑制剂的研究可为CYP450 抑制剂的虚拟筛选及其介导的药物不良反应预测提供指导,对临床合理用药提供一定的参考。

[关键词] 支持向量回归;分子对接;中药;CYP2E1抑制剂

[Abstract] Inhibition of cytochrome P450 (CYP450) enzymes is the most common reasons for drug interactions, so the study on early prediction of CYPs inhibitors can help to decrease the incidence of adverse reactions caused by drug interactions.CYP450 2E1(CYP2E1), as a key role in drug metabolism process, has broad spectrum of drug metabolism substrate. In this study, 32 CYP2E1 inhibitors were collected for the construction of support vector regression (SVR) model. The test set data were used to verify CYP2E1 quantitative models and obtain the optimal prediction model of CYP2E1 inhibitor. Meanwhile, one molecular docking program, CDOCKER, was utilized to analyze the interaction pattern between positive compounds and active pocket to establish the optimal screening model of CYP2E1 inhibitors.SVR model and molecular docking prediction model were combined to screen traditional Chinese medicine database (TCMD), which could improve the calculation efficiency and prediction accuracy. 6 376 traditional Chinese medicine (TCM) compounds predicted by SVR model were obtained, and in further verification by using molecular docking model, 247 TCM compounds with potential inhibitory activities against CYP2E1 were finally retained. Some of them have been verified by experiments. The results demonstrated that this study could provide guidance for the virtual screening of CYP450 inhibitors and the prediction of CYPs-mediated DDIs, and also provide references for clinical rational drug use.

[Key words] support vector regression;molecular docking;traditional Chinese medicine;CYP2E1 inhibitors

doi:10.4268/cjcmm20161323

代谢性药物相互作用(metabolism-based drug-drug interactions,DDIs)是指2种或2种以上药物在同时或前后序贯用药时,在代谢环节产生作用的干扰,从而发生疗效的增强或减弱,甚至产生毒副作用导致治疗失败[1]。而细胞色素酶 P450 家族(CYPs)是和人体内药物代谢关系最为密切的一类药物代谢酶大家族。CYP家族具有广泛的代谢底物谱,90%以上的代谢性药物相互作用是由P450酶系抑制或诱导所引起的[2],其中酶抑制作用导致DDI的临床意义远大于酶诱导作用,约占代谢性相互作用的70%[3]。由一种药物引起的CYP450 活性抑制,往往会导致另一种药物经由CYP450 的代谢障碍,从而引发毒副作用[4]。近年来,中药因其悠久的历史和显著的疗效而被广泛应用。但中药药物种类多、成分复杂,并且多作为复方用药,出现药物相互作用的可能性较大[5]。因此,对CYPs抑制剂活性的早期预测的研究有助于减少药物相互作用导致的不良反应,对临床安全、合理、有效、经济的用药具有重要意义。CYP450 2E1(CYP2E1)是CYPs酶系的主要成员之一,又称二甲基亚硝胺脱甲基酶[6],是许多低分子有机化合物以及药物在体内的主要代谢酶,主要分布在肝脏,占肝脏总P450酶的7% [7],并且其代谢的药物种类相当广泛,在制药工业上被广泛研究[8]。

近年来,支持向量回归(support vector regression,SVR)、分子对接等计算机模拟技术,因其高效、低耗而被广泛应用于潜在中药活性化合物的预测。宋向岗等[9]基于分子对接技术筛选获得川芎治疗脑缺血的潜在有效成分;蒋芦荻等[10]基于分子模拟技术筛选发现潜在中药烟酸受体激动剂;张景芳[11-12]利用支持向量机构建了化合物神经毒性和肾毒性判别模型,筛选获得潜在中药神经毒性和肾毒性成分。本研究综合利用支持向量回归模型和分子对接技术,筛选CYP2E1抑制剂,提高了计算效率和结果的准确性。

本研究以CYP2E1为研究载体,首先利用支持向量回归模型预测中药化学成分数据库(traditional Chinese medicine database, 版本2009),该数据库含有23 033个中药化学成分来源于6 735种中药,将获得的潜在活性成分利用分子对接技术进一步筛选,通过分析筛选结果中化合物与CYP2E1的氢键相互作用对化合物进行分类,最终获得潜在的CYP2E1抑制剂,具有高效性和一定的准确性。研究结果对于降低药物相互作用引起的药物不良反应以及相关药物研发均具有重要的理论意义和实际应用价值。

1 材料与方法

1.1 支持向量回归模型的构建与验证

1.1.1 数据收集及整理 经文献查阅[13]收集能有效抑制CYP2E1活性的化合物及其相关活性值,组成建立模型使用的数据集,包含32个阳性化合物。

利用Dragon 2.1计算化合物的1 481个分子描述符和由此生成的主成分描述符来表征分子结构,其中包括组成描述符、拓扑描述符、分子路径数、2D自相关描述符、电荷描述符,表征了化合物分子组成、拓扑、电荷分布、几何结构及物理化学性质等特征。

1.1.2 数据集划分 利用KS[14]方法,从阳性数据集中按照训练集与测试集4∶1的比例抽取相应数量化合物组成训练集,余下化合物组成测试集。该方法可以保证样本按空间距离分布均匀,使抽样具有代表性。划分结果如下:CYP2E1定量模型训练集中有26个阳性化合物,测试集中则有6个阳性化合物。

1.1.3 筛选分子描述符 利用Weka3.7通过十折交叉验证筛选分子描述符,对数据集进行维度约减,得到与所构建模型最相关的分子描述符子集。方法为CfsSubsetEval-P1-E1评估方法和BestFirst-D1-N5搜索方法[15],BestFirst-D1-N5通过返回进行贪心式爬山搜索,并按照性能好坏将描述符进行排序;CfsSubsetEval-P1-E1综合考虑单一属性的预测值和属性间的重复度,挑选相互之间关联程度较低却与类有高度关联的描述符。

1.1.4 模型的建立 利用SVR基于训练集化合物,建立定量预测模型。本实验利用libsvm3.1(http://www.csie.ntu.edu.tw/~cjlin/libsvm/)中的SVR算法,分别组合不同的数据降维方法和模型参数寻优方法进行建模,通过比较各模型训练集和测试集的评价参数,寻求最优建模组合。数据降维方法包括:不处理、利用MATLAB中ScaleForSVR函数进行降维处理。模型参数寻优方法选用RBF核函数,包括:不处理、粒子群优化算法(particle swarm optimization,PSO)和遗传算法(genetic algorithm,GA)。其中参数寻优(C,γ)的选择中采用逐一交互验证的方法确定C和γ值, RMS最小时的C和γ值。本研究基于2种数据降维方法和3种参数寻优方法,通过不同的参数组合探讨建立6个 CYP2E1抑制剂定量模型,并结合模型验证与评价以筛选获得最优参数组合。

1.1.5 测试集验证 用测试集化合物及其活性值对模型的性能进行评价,其评价指标包括:决定系数(coefficient of determination,R2)和均方误差(mean squared error, MSE)。R2越趋近于1,说明化合物和活性值的关联能力高;MSE值越小,说明计算活性值与实验活性值的偏差越小,即计算值更准确。

1.2 基于分子对接的预测模型构建与验证

利用SVR模型预测TCMD数据库获得潜在的活性化合物,为了提高预测结果的可靠性,本研究基于SVR模型预测结果利用分子对接技术进一步筛选,最终获得的化合物认为是潜在的CYP2E1抑制剂。

1.2.1 数据收集 蛋白三维结构选择:靶蛋白的三维结构从蛋白质数据库PDB(http://www.rcsb.org/pdb/home/home.do)中搜索下载,优先选择复合了相应CYP2E1抑制剂且分辨率较高的晶体结构,确定PDB代码为3E4E。

对于CYP450蛋白结构而言,主要包含铁卟啉及该亚型对应的抑制剂。其中铁卟啉是辅基,辅基与酶蛋白结合较为紧密,不能通过透析或超滤的方法除去,在酶促反应中,辅基不能离开酶蛋白。因此,铁卟啉对CYP晶体结构的解析有很大影响,本研究保留铁卟啉以更好体现实验的可靠性。

利用Discovery studio 4.0(DS4.0)中的Clean Protein工具对蛋白结构进行预处理,包括删去配体分子和水分子、补全不完整残基、删除多余蛋白质构象、加氢和分配相关电荷。

1.2.2 蛋白活性口袋的确定 基于晶体复合物中原配体小分子,初步定义活性口袋。利用CDOCKER模块,参数均为默认值,将原配体对接到对应原蛋白的活性口袋中,根据对接后的配体分子与原配体分子的均方根偏差(root-mean-square-deviation,RMSD)大小判断对接模型的可靠性以及对接程序参数设置的合理性,一般认为当RMSD≤2.0时,所用对接方法能够较好地重现原配体-受体的结合模式[16]。本研究通过调整活性口袋半径大小及其坐标位置使RMSD值达到要求,记录此时活性口袋信息及打分值-CDOCKER ENERGY。

1.2.3 阳性化合物与靶点的对接验证 利用CDOCKER模块将靶点与阳性化合物对接,参数及活性口袋设置均参照1.2.1项下结果。用Analyze Ligand Poses工具分析对接过程中靶点与阳性化合物发生相互作用的关键氨基酸,为分析化合物与靶点相互作用的合理性提供依据。

1.3 数据库的筛选

基于已评价获得的最优的CYP2E1支持向量回归模型,对TCMD数据库进行预测,以PDB晶体结构中原抑制剂配体的预测值为阈值,低于此阈值的为潜在活性化合物。之后基于SVR模型预测结果利用DS 4.0中的CDOCKER模块进行分子对接,以靶点与阳性化合物对接打分值-CDOCKER ENERGY最大值为阈值,打分高于此阈值并与CYP2E1形成氢键相互作用的化合物认为具有潜在抑制活性。

2 结果与讨论

2.1 支持向量回归模型构建试验

2.1.1 描述符筛选 利用weka机器平台从531个分子描述符和主成分描述符中筛选描述符子集,CYP2E1定量模型获得17个描述符,CYP2E1定量模型的描述符名称见表1。筛选获得的描述符包括拓扑描述符、几何描述符、官能团等模块,表征了化合物拓扑结构、几何结构、官能团、物理化学性质等特征,其对CYP2E1抑制剂的筛选较为关键。

2.1.2 模型构建及评价

基于筛选得到的17个分子描述符,根据1.1.4项下方法构建6个SVR模型,通过比较并综合考虑各模型间训练集和测试集的优劣,选取3号模型为最优模型。该模型将训练集和测试集的数据未通过降维处理,参数寻优选择GA进行建模,C为6.142,γ为0.012 4,得到模型的自身预测R2为0.995,MSE为0.001。训练集和测试集化合物活性的真实值和预测值曲线走势基本一致,见图1,表明该模型预测性良好。用测试集数据对CYP2E1定量模型进行验证,得到R2为0.767,MSE为0.004。结果表明CYP2E1定量模型对测试集有较好的预测能力。

2.2 分子对接靶点活性位点结果及阳性化合物验证

本研究基于晶体复合物中原配体小分子定义的活性位点,位点半径为9,空间坐标为40.009,29.870,9.981,原配体对接RMSD为1.057,阳性化合物打分值最大值为44.481。阳性化合物与靶点相互作用的氨基酸见表2,并且氢键相互作用与疏水相互作用为主要非键相互作用,静电作用相对较弱。氨基酸残基THR303已有文献研究[13]发现是抑制剂与CYP2E1结合时形成氢键相互作用的关键氨基酸。

2.3 数据库筛选

SVR模型以原配体IC50预测值407.919为阈值,获得6 376个中药化合物;分子对接以阳性化合物打分值最大值44.481为阈值,对已得到的6 376个中药化合物进一步筛选,获得330个对CYP2E1具有潜在抑制活性的中药化合物。根据筛选结果中化合物与CYP2E1形成的氢键相互作用,将筛选得到的化合物分为3类。第一类化合物与THR303形成氢键相互作用,含有141个化合物;第二类化合物不与THR303形成氢键相互作用,但与其他氨基酸残基形成氢键相互作用,含有106个化合物;第三类化合物与CYP2E1无氢键相互作用,含有83个化合物。部分化合物及其信息见表3。经分析,综合认为第一类化合物和第二类化合物可能具有抑制活性,为潜在的CYP2E1抑制剂,共计247个化合物。

以黄芩苷和红景天苷为例分析第一类化合物与CYP2E1之间的相互作用,见图2,黄芩苷与氨基酸ASP295,PHE298,ALA299,THR303发生氢键相互作用,与ILE115,ALA299,VAL364,LEU368,PHE478,HEM500发生疏水相互作用,与HEM500发生静电相互作用;红景天苷与氨基酸ALA299,THR303发生氢键相互作用,与VAL364,LEU368,HEM500发生疏水相互作用,与CYS437发生静电相互作用。第一类化合物与关键氨基酸THR303发生氢键相互作用,且与上文阳性化合物相互作用模式类似,推测具有相似的生物活性。刘华[17]研究发现茵桅黄注射液对CYP2E1有明显抑制作用,其作用与黄芩苷有关。田丽等[18]研究结果表明,红景天苷能抑制肝细胞CYP2E1的表达,同时使肝细胞氧化应激水平下降。已有研究结果与本实验第一类筛选结果相互佐证,表明本研究方法具有一定的可靠性。

以人参炔B为例分析第二类化合物与CYP2E1之间的相互作用,见图3,人参炔B与氨基酸ASN367发生氢键相互作用,与PHE106,HIS109,PHE298发生疏水相互作用。梁赅等[19]研究发现人参能降低肠和肝CYP2E1活性,人参中乙二酸二丁酯、人参炔B与其对CYP2E1的抑制作用可能有一定关联。第二类化合物与关键氨基酸THR303不发生氢键相互作用,但与其他氨基酸发生氢键相互作用,其可能通过其他相互作用模式发挥抑制活性。

以麻黄碱为例分析第三类化合物与CYP2E1之间的相互作用。麻黄碱仅与氨基酸ALA299发生疏水相互作用。吴文华等[20]研究发现麻黄碱对CYP2E1酶活性无抑制作用,仅具有一定促进作用。第三类化合物与蛋白无氢键相互作用,可能不具有抑制活性。

3 结论

本研究综合利用SVR模型和分子对接技术筛选TCMD数据库,并分析筛选化合物与CYP2E1形成的氢键相互作用,获得潜在CYP2E1抑制剂,具有高效性和一定的准确性。预测结果中的黄芩苷、红景天苷等化合物已有文献验证其对CYP2E1具有抑制作用,验证了实验所建模型的准确性和利用分子模拟技术筛选潜在活性化合物的可行性。筛选结果获得的潜在CYP2E1抑制剂,可预警中药抑制剂与CYP2E1酶代谢的化学药联合用药时发生药物不良反应。该研究结果对临床合理使用同类药品,避免有害药物代谢性相互作用的发生具有重要的理论意义和实际应用价值。

[参考文献]

[1] 刘彦卿,洪燕君,曾苏. 代谢性药物-药物相互作用的研究进展[J]. 浙江大学学报:医学版,2009(2):215.

[2] 王丹. CYP450组合探针模型的建立及其应用于快速筛选中药对CYP450的诱导作用[D].北京:中国人民解放军军事医学科学院,2008.

[3] 邹文,周文. 药物代谢性相互作用[J]. 食品与药品,2007(12):46.

[4] 晁丽. 细胞色素P450抑制剂虚拟筛选与分子对接[D].重庆:重庆大学,2014.

[5] 武佰玲,刘萍,高月,等. 天王补心丸中生地黄、玄参、天冬和麦冬水提液对大鼠肝CYP450酶含量及其亚型CYP3A,CYP2E1和CYP1A2活性的影响[J]. 中国中药杂志,2011(19):2710.

[6] 孙晨. 十八种中药对小鼠肾脏三种主要有机阴离子转运体及部分Cyps的影响[D].广州:广州中医药大学,2014.

[7] 魏春敏. CYP2E1酶在去甲斑蝥素代谢和环孢素诱导肝损伤中的作用研究[D].济南:山东大学,2014.

[8] 李珏. 细胞色素酶CYP2E1与芳香族底物结合的生物信息与结构生物学研究[D].上海:上海交通大学,2011.

[9] 宋向岗,周威,陈超,等. 基于分子对接方法的川芎治疗脑缺血的物质基础及分子机制研究[J]. 中国中药杂志,2015(11):2195.

[10] 蒋芦荻,贺昱甦,张燕玲. 基于分子模拟技术发现潜在中药烟酸受体激动剂[J]. 中国中药杂志,2014(23):4653.

[11] 张景芳,蒋芦荻,张燕玲. 支持向量机在中药肾毒性研究中的应用[J]. 中国中药杂志,2015(6):1134.

[12] 张景芳,蒋芦荻,张燕玲. 支持向量机在中药神经毒性成分筛查中的应用[J]. 中国中药杂志,2014(17):3330.

[13] Martikainen L E. Interactions of inhibitor molecules with the human CYP2E1 enzyme active site[J]. Eur J Pharm Sci, 2012, 47(5):996.

[14] Saptoro A, Tadé M O, Vuthaluru H. A modified kennard-sone algorithm for optimal division of data for developing artificial neural network models[J]. Chem Prod Process Model, 2012, doi: 10.1515/1934-2659.1645.

[15] 冼广淋,冼广铭. 支持向量机原理及其在模式分类中的应用[J]. 中国科技信息,2008(7):268.

[16] 胡衍保,彭静波,顾硕,等. 复方心可舒治疗冠病多靶点作用的分子对接[J]. 物理化学报,2012(5):1257.

[17] 刘华. 茵栀黄注射液对大鼠肝CYP2E1的作用[D].郑州:郑州大学,2010.

[18] 田丽,尹玲,关莉莉,等. 红景天苷对原代培养脂肪变性大鼠肝细胞细胞色素P4502E1蛋白表达的抑制作用[J]. 实用肝脏病杂志,2015(3):270.

[19] 梁赅,詹莉,汪晖,等. 人参和枳椇子对小鼠乙醇急性中毒保护作用及其机制研究[J]. 医学新知杂志,2006(2):82.

[20] 吴文华,刘丽,韩凤梅,等. 伪麻黄碱与麻黄碱对大鼠细胞色素P450酶活性的影响[J]. 中华中医药杂志,2011(8):804.

[责任编辑 马超一]