申请认证 退出

您的申请提交成功

确定 取消

重磅科研丨中科院微生物所&国科大: 使用深度学习从人类肠道微生物组中鉴定抗菌肽(国人佳作)

2023-02-02 13:53

综上所述,本研究展示了结合NLP方法和大型微生物组数据挖掘AMP的实用性。我们的概念验证研究产生了大量不同的AMP,通过不同的作用机制赋予其不同的抗菌效果。

编译:微科盟yl,编辑:微科盟居居、江舜尧。

微科盟原创微文,欢迎转发转载,转载须注明来源《微生态》公众号。

导读  

人类肠道微生物组编码多种抗菌肽(AMPs),但AMPs长度较短给计算预测带来了挑战。本研究结合了多种自然语言处理神经网络模型,包括LSTM、Attention和BERT,形成了从人体肠道微生物组数据中识别候选AMP的统一途径。在2349个候选AMPs序列中,有216个是化学合成的,其中181个显示出抗菌活性(阳性率>83%)。这些多肽中的大多数与训练集中的AMPs序列同源性小于40%。对11种最有效的AMP进一步鉴定显示,它们对耐药革兰氏阴性病原体具有很高的疗效,并对细菌肺部感染的小鼠模型显示出降低细菌负荷十倍以上的显著疗效。本研究展示了机器学习方法从宏基因组数据中挖掘功能肽的潜力,并加速发现有前景的AMP候选分子进行深入研究。  

论文ID

名:Identification of antimicrobial peptides from the human gut microbiome using deep learning

使用深度学习从人类肠道微生物组中鉴定抗菌肽

期刊Nature Biotechnology

IF:68.164

发表时间:2022.3

通讯作者:王军,陈义华

通讯作者单位:中国科学院微生物研究所;中国科学院大学

DOI号:10.1038/s41587-022-01226-0

实验设计

本研究通过收集序列、构建训练集和测试集,然后构建和优化NNMs形成AMP预测途径(图1)。然后,挖掘宏基因组和宏蛋白质组学数据,进一步筛选潜在的AMP,利用候选抗菌肽与细菌之间的相关网络分析,获得用于化学合成和体外验证的候选抗菌肽(图1)。从初步筛选中选择有前景的候选者,并进一步进行抗MDR细菌的疗效试验、细菌性肺部感染动物模型的体内实验和机制分析。

94281675293329760

图1 实验设计流程图。

结果

1 结合NLP模型创建AMP识别的统一途径

本研究应用NLP算法构建了AMP预测模型,包括三个类别的五个NNMs(图2b)。我们的基本模型是一种有效识别AMP的长短期记忆(LSTM)作为核心层的NNM。第二个模型用Attention层取代了LSTM层,产生了ATT模型。最后,我们引用了基于变压器的变压双向编码器(BERT)模型。使用独立的数据集测试和筛选NLP模型的超参数,所有模型在训练过程中快速收敛。

我们对模型的性能进行了优化,形成了一个统一的AMP识别途径。对于ATT和LSTM,我们使用平衡训练数据集用于比较,然后使用完整的非AMP训练数据集重新训练这两个模型。最初,我们的单独模型的关键评估参数精确度都不到50%。将序列按长度重新分析表明,≤50个氨基酸(AA)的AMPs精确度更高,因此我们在测试集中保留了较小的多肽用于模型的重新评估。

我们发现,不同模型识别的真阳性(TP)和假阳性(FP)序列的比例差异很大:LSTM预测的FPs是BERT的56倍,TPs比BERT高11%,ATT预测的FPs比BERT高46%,TPs高5%。这些差异不仅仅反映了不同模型的敏感性,因为当我们比较所有模型共享的TPs和FPs时,并在每个模型的最后一层提取这些预测向量,五个模型中这些序列的所有成对相关性中只有不到0.3%是显著相关的(图2c)。

由于它们的预测偏差是相互独立的,我们探索将这些不同的模型结合起来,以进一步提高精度,降低FPs。我们最终测试了各种模型组合(2-5个模型)的交集,并使用精度、召回率和精度召回曲线下面积(AUPRC)进行了评估。根据AUPRC以及这两个参数的排名显示,精度最高的组合是三个模型(ATT、LSTM和BERT)的组合(与单个BERT模型的最佳性能相比,改进了约15%),召回率达到83.32%,最高AUPRC为0.9244(图2d)。使用相同的测试数据集与其他现有AMP预测方法进行比较,发现我们的途径在AUPRC(图2e)和精度(其他工具:27.21~2.67%)方面超过了所有其他方法,尽管其中四个工具预测的AMPs的TP比我们的高0.66-6.75%,但FPs比我们的途径高74-~182倍(表1)。这些结果支持我们结合多个NLP模型的途径是一种从序列数据中识别AMP的可靠方法。

73331675293330197

图2 结合NLP模型建立AMP预测途径。

a,最初从各种数据库收集用于训练的AMP和非AMP的长度分布。大多数AMP低于300 AAs。后来,我们选择了长度匹配的AMP和非AMP集进行训练。b,测试和构建预测途径的五个NLP模型的摘要,包括使用两个训练数据集的LSTM模型;Attention模型使用两个训练数据集。FC,全连接;FV,特征向量;GELU,高斯误差线性单元(激活函数)。c,对于所有共享的FPs(上)和TPs(下),每个NNM的最后一个隐藏层中预测值向量之间的相关性概述。在每个图中,每个序列的预测值向量之间的预测向量的Spearman相关性FDRs在y轴上表示,现在相关性用红色表示。x轴表示Spearman相关系数。总体而言,只有不到0.3%的相关性是显著的。d,不同NLP模型组合的AUPRCs。其中ATT+LSTM+ERT组合的AUPRC最高(0.9244),精度最高(91.31%)。e,表1包含我们用于比较的代表性非NLP方法的AUPRCs。

表1 本研究的途径与其他目前可用的AMP预测工具之间的性能比较。

88461675293330393

2 在大型宏基因组队列中识别多个候选AMPs

人类微生物群具有复杂的群落结构,组成的微生物可能会利用许多AMPs来帮助竞争资源或稳定群落结构。因此,我们在人类微生物组数据中进行了AMP挖掘。在宏基因组数据中识别小开放阅读框(sORFs;长度为5-50个氨基酸)非常耗时且耗费计算资源(需要组装);因此,我们在之前基于宏基因组学研究组装的代表性基因组中直接使用了sORFs预测。基于超过90%的完整性(47.7%;图3a)和选择评分,筛选了人类微生物组样本中存在的总共154,723个代表性生物基因组。我们最终专注于4409个合格的代表性基因组(图3b)。

对AMP进行序贯预测和过滤来优化假定的AMP列表。从代表基因组中包含的非冗余sORF序列中预测了20,426,401个假定的AMP。计算机预测sORFs并不能确保它们以蛋白质的形式表达,我们随后与可用的宏蛋白质组学数据进行交叉验证,以筛选“非常可能”表达的多肽,最终确定了2349个候选AMPs(c_AMPs),其长度分布在6个AAs到50个AAs。

随后,我们利用来自大型队列的宏基因组数据集,基于关联网络分析对c_AMPs进行了分析。鉴于一些AMPs在调节和稳定群落结构方面作用已知,我们假设与微生物组成员具有强烈负相关性的c_AMP会抑制细菌生长并且更有可能发挥作用。这个网络可以帮助进一步消除我们发现中的FPs。因此,我们检查了来自15个独立队列的总计11,011个样本的宏基因组数据集,大多数样本超过100个(图3C)。对于每个队列,我们使用基于映射的方法来计算c_AMP丰度以及属和种水平的细菌相对丰度,以构建c_AMP-微生物相关网络,这与细菌相关网络不同,因为一个潜在的AMP可以由多种细菌编码,反之亦然。通过保留那些FDR≤0.05并出现在7个或更多队列中的负相关性,我们分别获得了368个和266个物种级和属级网络的非冗余c_AMP,其中241个共享(图3d,e)。

61961675293330459

图3 从宏基因组数据中挖掘候选AMPs。

a,从Pasolli等人的研究中收集的大规模宏基因组数据中组装的代表性基因组及其完整性概述。b,根据contig数、完整性和修饰水平进行筛选后,可为所选代表性基因组分配的分类水平。c,用于AMP挖掘的宏基因组数据的队列摘要,提供了发表年份、队列规模和祖先信息。d,e AMPs与细菌属(d)和种(e)分别呈负相关的网络,仅呈现在6个以上的队列中显著的相关性(Spearman相关和FDR<0.05),我们用来进一步筛选出现频率高和潜在有效的AMP。浅紫色圆点代表AMP;浅蓝色圆点代表细菌。

实验验证验证了高比例的功能性AMPs

然后我们化学合成了241个共享的c_AMP用于验证和表征。25个多肽经过三轮化学合成失败,最终得到216个c_AMP。然后,在60 μM浓度的液体培养基中检测了216个c_AMPs对金黄色葡萄球菌(ATCC 6538)、枯草芽孢杆菌(ATCC 23857)、大肠杆菌DH5α和铜绿假单胞菌(ATCC 15692)的抗菌活性。鉴定出181个具有抗菌活性的多肽(即抑制至少一种细菌的生长),阳性率为83.8%。同时,从预测的非AMP集合中随机选择一组10个阴性肽,其中6个成功合成,只有一个有效(最小抑制浓度(MIC)≤125 μM),表明我们的方法FN率较低,约为16.67%。选择了11个抗菌活性最高的c_AMP(图4A)。在这11个有效的c_AMP中,有7个最初发现于拟杆菌属的物种基因组中,已知拟杆菌属含有潜在的益生菌物种,这表明AMPs可能参与了病原菌的抑制。共有157个c_AMPs对革兰氏阴性菌有抑制作用。

然后,我们评估了181个c_AMP与以前报道的抗菌AMP的相似性。结果表明,我们的方法可以根据序列中AAs的内部关系来识别AMP,而不是根据训练数据集中使用的AMP的序列相似性来识别AMP。当我们的训练数据集涉及微生物和真核生物来源的AMP时,我们验证的c_AMP与训练数据集中使用的最接近的AMP的最高同一性仅为61.4%,大多数的同一性不到40%(图4b)。当我们计算训练数据集的c_AMP和非AMP之间的同一性时,AMP和非AMP之间最接近的同一性的中位数为33.3%,高于我们的c_AMP相对于已知AMP的中位数(31.1%)。此外,我们验证的c_AMP不仅是基于AA组成进行预测的,因为与已知的AMPs相比,它们的AA组成似乎不同,显示出相对较高的Glu、Lys、Asn和Gln残基比例和较少的Cys、His、Leu和Trp。

48091675293330637

图4 预测AMPs的实验验证和效价测定。

a,11个候选c_AMP对初步筛选的4株细菌的抑菌谱和抑菌水平表明,它们对多种细菌都有效(绿色),并且有很强的抑菌效果。* 0.001<P≤0.05;**0.001<P≤0.01;***P≤0.001。b,我们研究中181个经过验证的c_AMP与训练数据集的最高相似性分布。我们的大多数c_AMP与训练数据集中先前已知的AMP的相似性小于40%。数据以平均值±s.e.m表示。c,11种选定c_AMP的MIC分布与病原体扩展列表;对于肺炎克雷伯菌,所有c_AMP的MIC < 25 μM;对于其他革兰氏阴性菌,包括A. baumanii、E. cloacae和大肠杆菌,至少有一种c_AMP的MIC达到25 μM。同时,所有c_AMP对一种革兰氏阴性细菌的MIC均达到<10 μM。数据表示为平均值±s.e.m。d,参照数据库中收集的MIC值,对大肠杆菌(左,已知AMP为浅红色)和金黄色葡萄球菌(右,已知AMP为蓝色)获得的选定AMP(紫色)的MIC范围,表明我们的AMP是迄今发现的最有效的AMP之一。n=3个独立实验。数据表示为平均值±s.e.m。e,代表MDR、革兰氏阴性(MDR G−)菌株的抗生素耐药性谱,包括鲍曼不动杆菌(Ab3、Ab8和Ab11)、肺炎克雷伯菌(NK04047、NK06129、NK08334和NK01067)和大肠杆菌(E01-7-1、E02-7-2和E02-16-2)。抗生素耐药性:红色表示耐药(R),紫色表示易感暴露增加(I),绿色表示敏感(S),空白块表示未测试(N)。已在这些菌株中测试的抗生素包括阿米卡星(AK)、阿莫西林-克拉维酸(AMC)、氨苄青霉素(AMP)、氨曲南(ATM)、氯霉素(C)、头孢他啶(CAZ)、氯霉素(CAP)、头孢唑啉、环丙沙星(CIP)、头孢氨苄(CL)、头孢曲松(CRO)、头孢噻肟(CTX)、头孢呋辛(CXM)、厄他培南(ETP)、头孢吡肟(FEP)、头孢西丁(FOX)、庆大霉素(GEN)、亚胺培南(IPM)、左氧氟沙星/半水合物(LEV)、美罗培南(MEM)、多粘菌素-B(PB)、头孢哌酮/舒巴坦(SCF)、甲氧苄啶(TMP)、磺胺甲恶唑(SXT)、四环素(TC)、替加环素、替卡西林(TIM)、妥布霉素(TOB)和哌拉西林/他唑巴坦(TZP)。f,11种选定c_AMP对测试MDR G-菌株的相应MIC值,证明多个c_AMPs(如c_AMP1043、c_AMP575、c_AMP595、c_AMP660和c_AMP2043)对所有菌株和其余c_AMP(c_AMP518除外)具有高效力,对多种菌株有效。数据表示为平均值±s.e.m。

4 筛选抗革兰氏阴性菌最有效的多肽

本研究从最初的抗菌活性筛选中检测了前11种c_AMP对常见的耐药革兰氏阴性细菌病原体的抗菌活性。所有11种c_AMP均表现出对大肠杆菌DH5α和铜绿假单胞菌(ATCC 15692)的抑制活性(图4a)。然后,将抗菌测试的细菌种类扩大到鲍曼不动杆菌、肺炎克雷伯菌和阴沟肠杆菌,并进行MIC值测定。对于肺炎克雷伯菌,共有10个c_AMP的MIC<25μM,而对于其他革兰氏阴性菌,包括鲍曼不动杆菌、阴沟肠杆菌和大肠杆菌,至少有一个c_AMP的MIC达到25 μM。此外,共有9个c_AMP对至少一种革兰氏阴性菌的MIC<20 μM(图4c)。与我们收集的所有AMP数据库中已知的具有MIC的AMP相比,我们的c_AMP的MIC在所有AMP中是最低的。事实上,只有7个先前证实的AMPs对大肠杆菌的MIC低于我们选择的c_AMPs(图4d)。其中,β-防御素2、Cathelicidin BF、防御素_NP-1、Mainainin 2和Mastoparan样肽12c前体也被合成并用作本研究的阳性对照,其MIC总体上与先前报道的相同。

MDR、革兰氏阴性菌(如CRE和ESKAPE成员(肺炎克雷伯菌、鲍曼不动杆菌、铜绿假单胞菌和肠杆菌)尤其值得关注。为了评估所选c_AMP抵抗MDR、革兰氏阴性菌的能力,我们对10株临床分离的MDR进行了生长抑制试验。简言之,所有被测试的菌株都对第三代头孢他啶、头孢曲松、头孢吡肟和头孢哌酮钠/舒巴坦钠(CAZ、CRO、FEP和SCF)具有耐药性;所有肺炎克雷伯菌和大肠杆菌临床分离株以及鲍曼不动杆菌对至少一种碳青霉烯类抗生素厄他培南、亚胺培南或美罗培南(ETP、IPM或MEM)具有耐药性。在我们的实验中,c_AMP1043对所有临床分离株的MIC<10 μM,7个c_AMP对至少9株临床分离株的MIC<20 μM(图4f)。因此,我们选择的候选AMP与已知AMP的相似性较低,但具有广谱和强大的抗菌活性,包括抗MDR和革兰氏阴性菌。

5 所选c_AMP对小鼠模型中的细菌性肺部感染有效

在进行小鼠体内感染实验之前,我们评估了11个c_AMP对真核细胞的毒性,包括HCT116细胞(人结肠癌细胞系)和新鲜人红细胞。我们使用不同的浓度对这11种多肽进行了溶血和细胞毒性分析,并估计了各自的IC50/CC50值(图5a)。结合这些结果和我们针对MDR肺炎克雷伯菌的c_AMP的MIC数据(图4c),我们选择c_AMP1043、c_AMP593和c_AMP575进行体内分析,使用感染肺炎克雷伯菌的小鼠模型,我们监测体重恢复作为主要读数。与赋形剂处理的对照组相比,用c_AMPs处理的感染小鼠体重恢复速度明显更快(图5c);额外的菌落形成单位(c.f.u.)和实时聚合酶链反应检测进一步证实了在c_AMP处理后24小时小鼠肺中的肺炎克雷伯菌负荷显著降低(图5e),表明c_AMPs降低了细菌感染的严重程度。具体而言,虽然大约一半的对照组小鼠体重下降超过7天,但所有使用c_AMPs处理的小鼠都恢复到了原来的体重。结果表明,三种c_AMP对肺部感染均具有抗菌活性,且对宿主无明显不良影响,值得进一步研究。

56581675293331024

图5 c_AMP治疗细菌感染的小鼠模型及c_AMP1043的作用机制研究。

a,真核生物毒性筛选和溶血实验测定所选AMPs的CC50/IC50,以log2-转换值表示。b,动物实验中使用的三种c_AMP的时间杀灭分析。用16倍最低抑菌浓度(MIC)的AMPs在液体培养基中处理大肠杆菌细胞,并在连续时间点测量c.f.u.。c,对哺乳动物细胞没有明显毒性的三种c_AMPs对肺炎克雷伯菌感染小鼠模型有效。小鼠鼻内接种109c.f.u.肺炎克雷伯菌,第2天给感染小鼠鼻腔注射50 μl (5×MIC) c_AMPs,每组7只。与未治疗肺炎克雷伯菌感染组相比,c_AMP治疗组小鼠体重恢复明显更快。双侧t检验*P < 0.05和**P < 0.01。d,用c_AMPs处理后肺组织中的细菌负荷显著降低。e,用c_AMP1043和HEPES处理的大肠杆菌细胞的TEM检查显示,细胞内容物渗漏和细胞壁/膜破裂;实验进行了三次,结果相似,并显示了一个具有代表性的数字。f,包括ALP、PI、NPN和DISC3(5)在内的机制分析表明,c_AMP1043能够通过破坏革兰氏阴性细菌大肠杆菌的外膜发挥作用。在PI、NPN和DISC3(5)分析中,观察到信号呈剂量依赖性增加,反映了c_AMP1043对相应细胞成分的影响。

6 c_AMP的作用机制

然后,我们重点阐明了所选AMP的作用机制,特别是c_AMP1043,它在体外对肺炎克雷伯菌的疗效最高。AMPs的常见机制是通过在细胞壁或细胞膜上形成孔来裂解细菌,我们的时间杀灭试验显示AMP的杀菌效果在2-6小时内表现出来(图5b)。我们首先用透射电子显微镜(TEM) 监测了大肠杆菌DH5α细胞在c_AMP1043处理后的潜在形态变化(MIC = 2 μM,用1×和10×MIC处理5 h),并在浓度为1×MIC时,细胞出现了剂量依赖性皱纹,细胞内容物泄漏;在更高的浓度下,细胞发生崩解(图5d),表明细胞壁的完整性降低。我们进行了四个实验来确定c_AMP1043影响的确切细胞成分。虽然测量崩解的大肠杆菌DH5α细胞的碱性磷酸酶(ALP)细胞外水平与未处理的细菌相比没有变化(图5F,ALP),但我们用不透膜的探针碘化丙啶(PI)检测到荧光强度增加。在用c_AMP1043处理细胞1 h后,我们发现PI强度随着c_AMP1043浓度的增加而增加,从而表明细胞膜被破坏(图5f,PI)。接下来,我们使用荧光探针1-N-苯基萘胺(NPN)检测了c_AMPs处理30 min的大肠杆菌DH5α细胞外膜的通透性。我们观察到的剂量依赖性荧光强度增强表明c_AMP1043损害了外膜的完整性(图5F,NPN)。此外,我们还使用了电位荧光探针DiSC3(5)。我们检测到c_AMP1043在c_AMPS处理细胞1 h后,DiSC3(5)信号强度随剂量的增加而增加(图5f),结果表明c_AMP1043可以破坏膜电位。这些结果表明,外膜电位的破坏有助于观察c_AMP1043对革兰氏阴性细菌生长的抑制作用。

另外10个c_AMP对大肠杆菌的潜在膜破坏和细胞壁损伤效应也进行了评估。使用上述ALP、PI、NPN和DiSC3(5)分析,我们确定了8种作用于细胞膜并引起破坏的多肽,其中2种还裂解了细胞壁。尽管如此,剩下的两个肽c_AMP593和c_AMP575对治疗小鼠感染模型是有效的,我们目前的功能分析组合没有得出潜在的机制。值得注意的是,在用c_AMP1043连续处理30 d后,在大肠杆菌DH5α中未检测到耐药性。由于我们在训练数据集中包括了AMP,而没有区分它们的化学类别或机制,旨在通过隐藏的序列特征来发现AMP,因此这里的结果表明,我们的途径也可能捕获具有不同功能机制的AMP。

讨论

最近在生物医学研究中应用人工智能方法的激增带来了许多新的机会,包括用于眼、肺、癌组织病理学和抗生素临床诊断的图像处理相关工具。在本研究中,通过将多肽序列作为文本,应用NLP方法,结合肠道微生物组序列大数据集,鉴定出许多微生物功能肽。以前,识别具有相似功能的蛋白质的典型方法是基于序列比对,例如BLAST,或使用隐马尔可夫模型识别保守的基序和结构域;然而,这些方法很难应用于短肽,特别是对于那些缺乏显著同源性的肽。在训练数据集中,我们观察到已知AMP之间的同源性明显高于已知AMP和非AMP之间的同源性。相比之下,基于不同NNMs的NLP方法已被证明在识别特定序列子集方面更有效;在我们的例子中,验证的c_AMP与已知AMP的同源性小于50%。

本研究使用了三个不同的NLP模型,并注意到每个模型独立预测都有偏差;因此,我们将这些模型组合到一个统一的途径中来优化预测性能。通过考虑三个模型的交集,我们在测试数据集中获得了>0.92 AUPRC和>91%的精度。值得注意的是,参考数据库中不断积累的AMP、数据质量的提高以及NLP模型的方法进步将进一步提高AMP的挖掘能力。虽然我们的流程使用了相对简单的模型组合来实现精确度和召回率之间的平衡,但在未来的应用中,可以对预测分数的各种临界值以及包括NLP和非NLP方法进行进一步优化。

本研究将我们的AMP挖掘方法应用于人类肠道微生物组数据,这些数据被认为是包括AMPs在内的大量功能蛋白的储存库。作为背景,尽管微生物AMP有很长的实验发现历史,其医疗潜力已被广泛认识,但很明显,经过验证的AMP只占自然界中所有AMP的一小部分。理论上,我们的方法可以进一步从宏基因组序列中挖掘AMP,因此,可以为各种应用(包括基因工程)提供候选。我们与宏蛋白质组数据进行交叉验证以确保潜在多肽的表达,并在多个宏基因组队列中进一步选择与细菌种类显著负相关的AMP,以选择潜在的c_AMP进行后续功能研究。尽管纳入标准可能过于严格,但我们仍然确定了200多个候选者,其中181个被证实具有抗菌活性。考虑到一些化学合成的多肽可能由于不能产生二级结构而失去某些生物学功能,并且在最初的抗菌活性测定中只使用了4种菌株,因此筛选出的非活性c_AMP也可能对其他细菌发挥抗菌作用。

后续研究证实,我们的方法可以发现不同的、未报道的AMP,它们具有不同的抗菌活性谱,并采用不同的抗菌作用机制。在之前,已经进行了几项人工筛选AMP预测或优化特征的研究。我们的途径也没有特别依赖于序列相似性或AA组成来预测AMP(图4B),因为我们验证的c_AMP与已知AMP的同源性很低,并且对选定c_AMP的机理分析证了我们的方法没有选择性地识别特定作用机制的AMP。事实上,在我们的训练数据集中,我们只使用了经过实验验证的AMP的序列信息,然而,我们的方法设法检测到它们内部的深层隐藏特征,从而在宏基因组中发现了不同的AMP。

虽然NLP方法目前以文本方式输入,但未来的努力可能会纳入对肽功能至关重要的结构信息。目前,在我们选择的多肽中,我们通过圆二色谱观察到螺旋主导肽的富集,这与以前的发现一致,即α-螺旋,形成孔的多肽是最有效的AMPs。另外,从剩余的181个多肽中随机选择的11个多肽显示出高度多样化的复杂结构。对于选定的c_AMP,其对大肠杆菌和金黄色葡萄球菌的低MIC与最著名的AMPs相似,丰富的分子集合使我们能够进一步选择对真核细胞具有低细胞毒性的AMPs进行体内测试,最终旨在临床应用。AMP数据库中可用的MIC数据显示,只有7个AMP对大肠杆菌的MIC较低;其中,没有AMP是细菌来源的,只有一种来自Bungarus fasciatus的动物抗菌肽经测试对MDR、革兰氏阴性菌有效。针对有限数量细菌的MIC值仅适用于所有AMP中的一小部分,因此在我们的研究中不被视为选择标准,这为进一步修剪AMP数据以进行训练留出了空间,如果有更多数据可用,甚至可以挖掘高效AMP的亚群。

本研究最终在使用人类细胞的实验中选择了三种低毒肽,并在小鼠模型中证实了它们对肺炎克雷伯菌典型肺部细菌感染的有效性。这些c_AMP和其他c_AMP可以作为药物优化的起点。此外,进一步深入分析这些c_AMP的作用机制也有助于提高它们的特异性,因为到目前为止,所有已发现的机制都集中在细胞膜上。此外,这种修饰可以减弱对哺乳动物细胞的一些毒性,从而排除了通过体内实验进一步验证有效c_AMP的可能性;在更广泛的工业应用中,这个问题对AMP可能不那么关键。特别是,c_AMP67、c_AMP69和c_AMP660显示出抗MDR、革兰氏阴性菌活性,这是临床上主要的感染威胁之一,目前批准临床使用的有效抗生素很少。因此,在保持抗菌活性的同时,探索可能降低哺乳动物细胞毒性的多肽的修饰可能值得进一步关注。

综上所述,本研究展示了结合NLP方法和大型微生物组数据挖掘AMP的实用性。我们的概念验证研究产生了大量不同的AMP,通过不同的作用机制赋予其不同的抗菌效果。除了提供一组有前景的候选分子以进一步改进具有挑战性的药物应用(例如耐抗生素细菌)之外,本研究表明,与传统的基于实验的方法相比,NLP驱动的方法可以在更短的时间内实现目标类肽识别的高成功率。这一方法也代表了许多基于大规模数据集的环境和医学宏基因组学测序研究的“再利用”应用,以发现部分功能性“暗物质”。显然,这种方法的应用可以极大地促进肽制剂的鉴定和优先级的研究和治疗。最后,值得强调的是,非常类似的方法应该适用于挖掘参与微生物信号传导的其他类型的肽,并用于调节宿主免疫或新陈代谢。

不感兴趣

看过了

取消

大肠杆菌,宏基因组,微生物,肠道

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交