乳腺癌耐药蛋白抑制剂的理论预测研究文献综述

 2023-02-12 20:27:17

由ATP结合核式蛋白(ABC)转运体所形成的多药耐药性(MDR)是当今癌症化疗失败的主要原因,这类转运体能利用ATP水解的能量将细胞质中的代谢物如内外毒素排除细胞外。ABC转运体如糖蛋白(P-gp/ABCB-1),多药耐药相关蛋白1(MRP-1/ABCC-1),乳腺癌耐药蛋白(BCRP/ABCG-2)等在多药耐药性的形成过程中有着重要作用。在癌细胞内,这类转运体通常过量表达从而导致化疗药物的细胞内浓度减少。

ABC转运体分为7个亚族,共48种,在各种生物体类均有表达。在人体内,P-gp, MRP-1,BCRP也存在于各器官中。ABC转运体除了其在多药耐药中的作用外,在药物的吸收分布代谢等性质中也有其参与。近些年的研究中发现BCRP在药物的分布,组织保护中有着尤为重要的作用。同时药物与药物的相互作用也与BCRP有关。

研究表明,BCRP的底物拓扑替康与BCRP抑制剂GF120918同时服用能增加拓扑替康的生物利用度;BCRP强效抑制吉非替尼能增加大鼠对伊立替康的口服生物利用度。BCRP抑制剂的药理学性质能够增强抗癌药物的血脑屏障通透性以及药物在癌细胞内的浓度,BCRP抑制剂这一关键作用促使研究人员研发出了更出色的癌症治疗试剂,比如脂肪酸酰胺水解酶抑制剂,酪氨酸激酶抑制剂等

计算机模拟手段应用在药物研发早期能够在一定程度上减少相关实验技术的支持,增加成功率和成本有效性,通过生物实验的方法来测试各种抗癌试剂对乳腺癌耐药蛋白的活性是比较耗费时间和金钱的,所以很多计算模拟的方法被应用在预测乳腺癌耐药蛋白(BCPR)抑制作用的研究中,这些模型中大多使用统计学习方法和机器学习方法,主要包括:支持向量机(SVM)、人工神经网络(ANN)、多元线性回归(MLR),K临近算法(K-NN)。下面对近些年有代表性的工作予以概述:

2017年,王等[1]收集一个包含860个化合物(抑制剂和非抑制剂)的数据集,利用朴素贝叶斯算法,构建出140个朴素贝叶斯的预测模型,性能最好的预测模型的灵敏度(SE),特异度(SP),全局预测精度(OA)分别为0.914,0.877,0.935;2015年,Belekar等[9]利用406个化合物(284个抑制剂和122个非抑制剂)分别用支持向量机(SVM),K临近算法(K-NN),人工神经网络(ANN)构建出3个分类预测模型,三个分类预测模型的马修斯相关系数(MCC)分别为0.67,0.71,0.77.预测精度分别为85.2%,88.3%,90.8%。并综合考量出神经网络模型最优,此外还对该模型的应用域做出了讨论;2014年,Montanari等[8}基于一个包含780个化合物的BCRP抑制数据集使用ECFP_6分子指纹和朴素贝叶斯建立分类预测模型,该模型的全局预测精度为0.919、AUC为0.854,分析出了一些BCRP抑制剂和非抑制剂存在的一些亚结构,抑制剂的亚结构与其构效关系相吻合;2010年,Zhong等[12]利用基因遗传算法(GA)进行特征选择,共轭梯度算法(CG)做参数优化,得到了改良支持向量机(GACGSVM),用其构建出BCRP底物与非底物的预测模型,全局预测精度在训练集上为91.3%,在验证集上的预测精度为85.0%,又比较了该模型与其同时构建出的决策树(DT)和K-临近算法模型,在预测精度这一性能上,前者优于后两者。2007年,Matsson等[6}利用两个分子描述符(脂水分配系数,分子极性)对其收集的123个类药化合物构建了偏最小二乘全局预测模型,该模型在训练集的预测精度为93%,在测试集中预测精度为79%。

本设计拟先打算重复王等[1]人的工作,对乳腺癌耐药蛋白抑制剂用机器学习方法进行分类;然后再利用新的机器学习方法,如支持向量机(SVM),K-临近算法(K-NN),并与王等[1]人的工作对比,看能否到达比较好的效果。具体工作安排步骤如下:

1:先从各种来源搜集乳腺癌耐药蛋白活性抑制数据,比如相关文献报道,ChEMB数据;收集到的数据在 MOE 软件中的 MMFF94 力场进行能量最小化处理并保持分子的手性。

2:利用Discovery Studio软件计算各个化合物的分子描述符,并通过模拟退火和随机森林算法选择最优分子描述符集合

3:使用 Discovery Studio 软件利用上述的最优分子描述符构建朴素贝叶斯分类模型

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版