申请认证 退出

您的申请提交成功

确定 取消

综述 | 齐鲁工大&韩国中央大学:从人类肠道微生物组中发现和挖掘酶(国人佳作)

2021-10-09 11:31

与肠道酶注释相关的另一个挑战是它们广泛的底物混杂。

编译:微科盟听雪斋,编辑:微科盟汤貝、江舜尧。

微科盟原创微文,欢迎转发转载,转载须注明来源《微生态》公众号

导读  
技术和生物信息学方法的进步导致了大量人类肠道宏基因组数据集的产生。代谢组学还提供了有关微生物群产生和修饰的小代谢物的大量数据。相比之下,调节代谢产物转化的微生物酶还没有得到深入的研究。在这里,我们讨论了最近用于从人类肠道微生物组中发现和挖掘酶的成果和技术。关于代谢物、反应、基因组序列和蛋白质结构的丰富知识,可能推动酶挖掘策略的发展。正在进行的注释肠道微生物群酶的成果将解释催化机制,这可能将指导肠道微生物群在诊断和治疗方面的临床应用。   

论文ID

 

名:Discovery and mining of enzymes from the human gut microbiome

从人类肠道微生物组中发现和挖掘酶

期刊Trends in Biotechnology

IF:19.536

发表时间:2021.7.22

通讯作者:贾保磊&Che Ok Jeon

通讯作者单位:山东齐鲁工业大学生物工程学院生物基材料与绿色造纸国家重点实验室;韩国中央大学生命科学系


综述框架



主要内容


1 人体肠道微生物组的组学数据
人体肠道中的微生物通过发酵膳食纤维、抵御病原体入侵、合成维生素、代谢外源性物质以及通过微生物代谢物触发宿主反应,在维持宿主健康方面发挥着至关重要的作用。近几十年来,新一代测序(NGS)和生物信息学分析的进展加快了人体内和人体上微生物组的研究。随着测序成本的显著降低,大量样本已测序,包括宏基因组和扩增子测序在内的数据已由全球科学家存入公共数据库。MGnify(以前称为EBI宏基因组学)作为世界上最大的归档、组装和存储资源之一,通过对来自各种生物群落的微生物组数据集的分析在过去两年中的数据集数量增加了两倍,截至2020年,共保存了近140 000个宏基因组数据集。使用高通量质谱和核磁共振波谱的代谢组学策略已被广泛应用于检测、鉴定和量化来自人类肠道的代谢物,包括膳食化合物、外源性物质和内源性代谢物。这些分子是调节微生物-微生物和微生物-宿主相互作用的关键调节因子,维持生态系统的平衡状态,从而影响宿主健康。大量可用的光谱和化合物信息存储在化合物数据库和光谱库中,如PubChemMetlin,以及人类代谢组学数据库(HMDB)。截至2020年,HMDB中已储存了约110 000个代谢物条目。
此外,元转录组学、元蛋白质组学和培养组学方法已用于人类肠道微生物组学研究,以探索样本中的基因表达、蛋白质丰度和菌株或物种。这些组学研究产生了大量数据,包括未知的生物信息和功能数据,生物学家称之为“暗物质”。蛋白质暗物质是指不代表具有已知功能的同源蛋白质的蛋白质序列。这些蛋白质也称为孤儿蛋白质,在蛋白质数据库中被归类为未知功能域(DUF)。人类肠道微生物组中40%的蛋白质序列缺乏功能注释。此外,由于基于序列相似性的计算注释,酶分子功能的错误注释和过度预测在公共数据库中经常发生。此外,阐明人类肠道中未知酶的功能尤其具有挑战性和困难,因为这些酶在这一复杂而独特的生态环境中催化多种酶反应。因此,研究肠道微生物酶的功能对于宏基因组学和代谢组学数据的知识鸿沟是必要的。代谢组学数据有助于更好地了解肠道微生物群、饮食和宿主健康之间的关系。
注释人类肠道微生物群中酶的功能的复杂性和必要性促使我们总结酶挖掘的方法。酶的功能可以通过基于表型的功能筛选进行实验注释,其他文章也对此进行了综述。在这篇综述中,我们使用组学数据描述了人类肠道微生物酶的发现和注释。我们进一步指出了不同方法的优点、缺点和潜在应用。我们的目标是总结用于发现和注释未知蛋白质的策略或人类肠道中的酶,这可以帮助科学家确定最适合他们需要的方法来用于未来的酶注释。
 
2 代谢物驱动的酶挖掘
肠道内代谢物的鉴定有助于酶的注释,因为这些代谢物可以被视为酶介导代谢途径中的底物、中间产物或产物。从代谢物开始的方法包括RNA测序(RNA seq)以确定代谢物上调的基因,比较基因组学以揭示转化代谢物的独特基因,以及相关分析以确定与某些代谢物相关的基因(图1)。
 

1. 基于代谢物信息从肠道微生物群中挖掘酶。A)从转录组和转录组数据中挖掘酶。在存在或不存在代谢物的情况下对细菌进行转录谱分析,然后进行RNA提取、测序和生物信息学分析,揭示了底物上调的基因,这些基因是参与底物代谢的候选基因;这些被进一步纯化用于活性分析。B)基于比较基因组学的酶注释。对具有(代谢剂)或不具有(非代谢剂)代谢分子能力的菌株进行测序,并进行比较基因组学分析,以确定代谢剂和非代谢剂之间的独特基因,这些基因编码可能催化分子的酶。C)通过分析代谢组学和宏基因组学数据之间的相关性来挖掘基因的方法。成对代谢组学和宏基因组学数据是从大量人群中检索到的。分类和聚类后,确定代谢物和蛋白质簇的共现性和相关性。通过体外实验,选择含有目标代谢物的相关蛋白质簇,以进一步确认酶的功能。

 
2.1 基于转录组和转录组数据的酶的发现
RNA seq可以获得转录组和转录组数据,以便在给定的条件下使用NGS检测、排序和量化生物样本中的RNA。当这种方法用于原核分析时,物种或微生物群暴露于某些代谢物,这些代谢物可以用作细菌的生长基质或可代谢的药物。转录活性基因或基因簇可以通过全转录组RNA序列识别,然后进行生物信息学分析。最后,这些代谢物诱导的基因功能可通过酶功能分析进一步分析(图1A)。
通过转录组学分析,在肠道中发现了来自多形拟杆菌和卵形拟杆菌的几种新型碳水化合物活性酶(CAZymes)(表1);它们可以发酵多种多糖,是结肠中的主要物种。在该方法中,通过RNA-seq分析在目标糖存在下生长的细菌的全基因组转录谱,并从转录组数据中识别响应于糖生长的转录上调基因,表达并纯化上调基因以确认其功能。该策略已被广泛用于注释碳水化合物活性酶。最近,该方法已被用于鉴定分解复杂N-聚糖的内-β-N-乙酰氨基葡萄糖苷酶,降解粘蛋白的内切O-聚糖酶,以及降解人类肠道中复杂阿拉伯木聚糖的酯酶。碳水化合物活性酶的鉴定将提高我们对饮食如何影响宿主疾病相关过程的理解,进一步支持个性化营养和治疗的发展。除了碳水化合物活性酶外,还使用转录组学分析来揭示迟缓埃格特菌(Eggerthella lenta)中存在的钼依赖性脱羟基酶,迟缓埃格特菌是一种普遍存在的肠道放线杆菌,可使多巴胺(儿茶酚胺神经递质)脱羟基。随后的一项研究还表明,该酶代谢去甲肾上腺素(另一种儿茶酚胺神经递质),这表明含有钼依赖性脱氢酶的肠道细菌可能会影响人类的精神健康。这些实验表明,转录组学方法可广泛用于发现人体肠道内代谢各种化合物的酶。
转录组数据可用于鉴定新酶。先前的一项研究确定了暴露于宿主靶向药物(地高辛、地高辛、尼扎替丁、柳氮磺胺吡啶等)后肠道微生物群的转录谱,并确定了外源性反应基因。尼扎替丁是一种用于治疗胃和肠道溃疡的药物,据报道,该药物会发生N-氧化物键断裂,接触尼扎替丁会诱导人体肠道中作用于氮键的酶的表达。此外,用于治疗各种心脏病的地高辛可诱导还原酶、转录调节因子和小分子转运体的表达。在另一项研究中,转录谱分析显示,这些被称为强心苷还原酶( cgr )的基因由迟缓埃格特菌表达。这些cgr基因的功能由比较基因组学证实,如下一小节所述。转录组分析也被用于促进20β-羟基类固醇脱氢酶的注释,该脱氢酶代谢氢化可的松,氢化可的松是一种广泛用于治疗炎症性疾病的药物。总的来说,研究表明肠道微生物群可以代谢多种药物来影响宿主,相关酶不仅可以从纯培养转录组中提取,还可以从肠道群落转录组中提取。
尽管转录组学分析可以估计对代谢物直接反应的基因上调,但这种方法并非没有挑战。微生物的纯培养通常是转录组学实验的先决条件,以便为比较分析提供适用和准确的数据。然而,大部分肠道微生物无法培养,这限制了转录组学的应用范围。高通量培养组学的发展扩展了分离微生物的种类,这可能有助于该方法的广泛应用。
 
2.2 从比较基因组数据中挖掘酶
对各种原核生物基因组的比较分析将基因和基因组对齐,从而可以精确识别相似和独特的区域。通过这种方法,可以在菌株、物种或属的水平上进行比较,并可以使用多种软件平台进行比较,如EzBioCloudRoaryIMG/MMicrobesOnlineEDGAR。从基因组比较中获得的菌株之间的变异信息可进一步与菌株代谢相关化合物的能力相结合。具有代谢活性的菌株中的独特基因可以在生化上表达和表征(图1B)。
比较基因组学已经在一些研究中被用来比较迟缓埃格特菌的基因组,以揭示植物次生代谢物代谢的关键酶,如地高辛(表1)。植物源性地高辛是一种用于治疗心力衰竭和导致心律失常的毒素的药物。在迟缓埃格特菌菌株中,肠道中植物来源的地高辛的减少与cgr操纵子有关,cgr操纵子编码两个CgrsCgr1Cgr2)和另外6个邻近基因,包括一个转录调控因子、一个富马酸还原酶和四种功能未知的蛋白。如迟缓埃格特菌菌株灭活地高辛的能力不同,对25株迟缓埃格特菌进行比较基因组研究,包括8株能减少地高辛的菌株,研究表明Cgr1高度保守,广泛分布于不同的迟缓埃格特菌菌株中,而Cgr2是地高辛代谢产物基因组中的一个独特基因。作为一种膜蛋白,Cgr1可以将电子从膜中的醌转移到相关的还原酶,如Cgr2。因此,假设Cgr2是一种降低地高辛的酶。基于体外活性测定的生化实验表明,Cgr2是一种[4Fe-4S]簇依赖还原酶,优先减少地高辛、地高辛、哇巴因和其他豆蔻内酯。迟缓埃格特菌还催化木脂素的减少,木脂素是大多数人每天消耗的植物多酚。木脂素由肠道微生物群分解为肠木脂素,肠木脂素是一种活性代谢物,具有抗氧化、抗雌激素和抗新生血管生成作用,有利于人类健康。在另一项研究中,比较了包括EggerthellaGordonibacter在内的Coriobacteriia目的25个菌株(16个木脂素代谢菌和9个非代谢菌)的基因组,以及一种来自迟缓埃格特菌的苯乙醚还原酶在所有代谢物中都是保守的,但在所有非代谢物中都不存在。这一发现证明,该酶催化木脂素还原为亚麻木脂素,从而启动木脂素向肠木脂素的活化。总之,这些研究表明迟缓埃格特菌菌株可以代谢多种外源性物质,比较基因组学是鉴定酶功能的可行方法。
比较基因组学具有挑战性和优势。首先,具有不同表型的几个菌株是比较基因组研究的先决条件。第二,在数据分析中必须考虑保护和其他基因组特征。例如,Coriobacteriia的泛基因组是保守的,基因增益/丢失,而不是其他因素,这些可能是这一类表型变异的驱动力,有助于通过比较基因组学挖掘蛋白质。这种方法可能不适用于从梭菌属菌株中提取蛋白质,因为比较基因组学无法提供一个狭窄的候选范围,这是因为梭菌属的泛基因组和高度进化的可塑性。
 

表1. 酶功能和注释方法总结。


2.3 基于宏基因组和代谢组数据相关性的酶发现
一些微生物转化,如人体肠道中胆固醇转化为粪醇,在不同人群中有所不同。代谢这些分子的酶的基因组挖掘可以通过分析代谢物水平变化与特定基因和/或细菌类群丰度变化之间的共现和相关性来进行。该方法首先从微生物群样本中收集成对的宏基因组数据和代谢组学质谱数据。两个数据集之间的成对关联被整合,以将代谢物分配给其微生物生产者。转化代谢物的候选酶可过度表达,并通过活性分析进一步鉴定(图1C)。
胆固醇转化为粪醇会降低胆固醇水平,这对人类健康很重要,因为高胆固醇水平会增加心血管疾病的风险。然而,直到最近,负责这一反应的酶才为人所知。2020年,Kenny和同事收集了样本的微生物组数据集,并进行了配对的宏基因组和代谢组学测量,以期从人类肠道微生物群中提取酶。来自宏基因组数据集的蛋白质基于其氨基酸序列身份进行聚类。在这些数据集中,蛋白质簇的出现和粪醇的出现与特异性和敏感性相关。组学数据整合显示8.6%的蛋白质簇(>5000)与粪醇的存在相关,缩小了候选数量。这些候选基因被定位到产粪甾醇真细菌的基因组中,真细菌可以通过形成胆甾酮作为中间产物将胆固醇转化为粪甾醇,最终显示约300个候选蛋白簇。利用胆固醇代谢的生化知识进一步筛选这些簇。只有四个短链脱氢酶家族的簇能够以不依赖氧的方式催化胆固醇氧化反应,而一种来自产粪甾醇真细菌的蛋白质(ECOP170)被认为是胆固醇脱氢酶(表1)。人类肠道中胆固醇脱氢酶的发现是通过逐步缩小候选范围,采用多种方法完成的。除胆固醇脱氢酶外,还使用类似的策略检测属于霉菌酸家族的棒状霉酸合成的假定基因,其成员充当人类T细胞的配体并诱导免疫反应。这种多学科策略可以为进一步的实验研究提供准确的信息。
基于组学数据之间相关性的方法尚未在该领域得到广泛应用,因为从大型数据集中检测相关性具有挑战性。然而,目前的研究表明,该方法可以与其他方法相结合,有效地缩小潜在目标酶的范围,代表了一种有希望的挖掘肠道微生物组的策略,该微生物组独立于序列同源性和细菌培养。
 
3 以序列为中心的酶的发现
人类肠道微生物群测序产生大量数据。基于序列相似性搜索、序列分类和遗传位点的策略已广泛应用于肠道微生物群中基因的发现和注释。
 
3.1 基于共同生化特性的酶的发现
来自一个蛋白质家族的酶同系物总是具有相似的生化特性,用结构相似的底物和产物催化相同类型的生化反应,并且显示出可识别的序列相似性。使用作用于类似底物并催化类似反应的功能特征序列搜索数据库已广泛用于注释未知酶(图2A)。当两种酶之间的序列一致性低于65-80%时,它们可以作用于不同的底物。然而,标准因情况而异;一些同源基因的序列同源性低至25%,作用于同一底物,而一些同源基因显示出高度多样的底物特异性。
一些酶,如羟基类固醇脱氢酶、磷脂酶D和胆碱三甲胺裂解酶,已根据该策略成功注释。在这里,我们介绍了该方法在挖掘脱羧反应数据方面的应用。在一项早期研究中,根据其序列和底物与酪氨酸脱羧酶的相似性,鉴定了共生产芽胞梭状芽胞杆菌和活泼胃球菌的色氨酸脱羧酶(表1)。按照这种方法,脱羧酶反应可以扩展到左旋多巴(一种帕金森病药物)的脱羧酶反应。数十年前,肠道微生物群证明左旋多巴脱羧为多巴胺。短乳杆菌的酪氨酸脱羧酶对酪氨酸和左旋多巴都有活性。利用BLAST对全套人类微生物群项目(HMP)参考基因组进行短序列分析,以鉴定具有左旋多巴脱羧活性的人类肠道微生物群酶。肠球菌属的命中率最高,四种粪肠球菌菌株被用于进一步研究,因为它们都显示出完全的脱羧活性,并共享高度保守的酪氨酸脱羧酶操纵子。从肠球菌中纯化的酪氨酸脱羧酶对酪氨酸和左旋多巴都有活性。尽管对酪氨酸的催化效率显著高于对左旋多巴的催化效率(5-10倍),但酪氨酸的丰度并不能阻止左旋多巴脱羧,两种底物同时转化。根据酶的发现,(S)-α-氟甲基酪氨酸可使酶失活,并提高左旋多巴在小鼠体内的生物利用度。这些研究表明脱羧酶的高度混杂性,并强调了肠道微生物群对药物利用率和代谢的影响。
总之,在应用此方法之前需要以下信息,这可能会限制其适用性。首先,反应的底物和产物必须清晰。其次,应该确认能够催化反应的微生物,这可以缩小候选序列的范围。尽管有这些要求,该策略以简单易用的方式提供了对酶功能的合理预测。
 

2. 基于序列的酶功能注释。A)基于酶的生物化学特性挖掘酶。为了挖掘催化与肠道中发生的底物和产物(P)的已知反应的未知酶,可以使用催化相同类型反应的特征化酶作为针对代谢底物的菌株基因组的BLAST搜索或针对HMPBLAST搜索的查询序列。可以通过实验验证输出蛋白的功能。B)从蛋白质序列相似网络(SSN)中发现新酶。蛋白质序列从数据库中检索,如NCBIEMBLInterProPfam(左上图)。SSN可由基于序列身份的酶相似性工具(EST)生成,以将蛋白质分类为多个簇,并将其分为特征簇(带有放大的圆圈)和未知簇(较小的圆圈)(右上图)。蛋白质的功能可以从基因邻域工具(GNT)中推断出来,该工具可以将结果显示为基因邻域网络或有组织的基因簇(左下面板)。基于核心酶的保守转运体,可以预测新的基因位点(上图)。路径中未知的酶和中间产物也可以根据位点中的特征酶进行注释(下面板)。人类微生物组中每个簇的丰度可以通过化学引导功能分析(CGFP)来估计(右下面板)。

 
3.2 基于蛋白质序列相似性网络和基因组背景分析的酶注释
蛋白质序列相似性网络(SSN)分析可以将相关蛋白质分组,从而实现聚类关系的可视化。感兴趣的蛋白质序列可以从数据库中检索出,如NCBIInterProPfam和欧洲分子生物学实验室的欧洲生物信息学研究所(EMBL-EBI)。在线酶功能启动酶相似性工具(EFI-EST)建立了大量序列的全局SSN,以基于序列比对破译序列、结构和功能关系(图2B)。一个网络资源,化学引导功能分析(CGFP),可以测量人类微生物组中的蛋白质丰度,为实验研究中非特征蛋白质的优先排序提供信息。这三个被称为基因组酶学的联合工具有助于发现新的酶和代谢途径。
使用这些工具的一个典型例子是从甘氨酰自由基酶(GRE)超家族中挖掘和发现了几种新酶(表1)。2017年,Levin及其同事使用InterPro数据库(53.0版)中的6343GRE蛋白质序列构建了SSN,并将蛋白质分离为241个簇。CGFP显示来自簇15和簇16的蛋白质广泛存在于粪便样本中。这两个集群中蛋白质的基因组邻域为它们的生化功能提供了线索。艰难梭菌中簇15中的一种蛋白质被注释为反式-4-羟基-L-脯氨酸脱水酶,而来源于食葡糖罗斯拜瑞氏菌簇16中的另一种蛋白质被根据体外活性测定确定为丙二醇脱水酶。2019年,Xing及其同事使用相同的方法分析GRE蛋白家族。由于基因组测序技术的进步,对数据库(68.0版)进行了更新,蛋白质序列的数量达到14 228个。EFI-GNT分析显示,硫酸盐和亚硫酸盐还原菌的序列占主导地位的一个簇与小室蛋白和三元ATP非依赖性周质转运蛋白有关。最后的酶活性实验表明,来自肠道细菌沃氏嗜胆菌的酶是一种羟乙基磺酸盐磺化酶。另一项使用蛋白质组学实验的研究发现并表征了羟乙磺酸盐磺化酶的功能,该研究表明羟乙磺酸盐磺化酶在沃氏嗜胆菌使用羟乙磺酸盐生长期间强烈表达。总之,这些研究表明GRE家族中大多数簇的生物化学功能尚未确定,这表明该酶超家族中存在未经探索的催化多样性。除GRE家族外,其他蛋白质家族,如激酶、金属裂解酶、酰基高丝氨酸乳糖酶和羧酯酶,也已通过酶相似性工具成功挖掘。总的来说,这些研究表明EFI-EST是一个有用的工具,用于注释人类肠道微生物组中的酶。

EFI-ESTEFI-GNT与溶质结合蛋白和糖转运体的结合已被用于发现D-芹糖、D-高三醇、D-半乳糖醇、苏糖醇、L-苏糖醇和赤藓糖醇的分解代谢途径,表明酶相似性工具的灵活使用在酶挖掘中有着广泛的应用。除EFI-GNT外,使用其他工具进行的基因组背景分析已被用于挖掘人类肠道中的酶。由于EFI结合了三种方法,它是一种用户友好且功能强大的工具,用于注释和发现新酶。

 
4 新酶的结构导向发现
如果活性位点区域发生轻微变化,同源酶可能识别不同的底物或催化不同的反应。因此,可以通过利用结构信息预测酶的底物特异性并发现新功能(图3)。
 

3. 基于蛋白质结构的酶功能注释。A)从数据库中收集蛋白质序列,并根据序列相似性和结构特征进行分类,这可以通过同源建模获得。酶特性中选择目标蛋白;B)蛋白质结构可以通过X射线晶体学或蛋白质结构建模获得。代谢物库由人类代谢组学数据库(HMBD)或其他数据库编制。大量的代谢物被发现与活性位点对接,结合能被估计。选择具有最高等级和对接分数的分子,使用活性分析进行进一步的实验研究。

 
4.1 通过蛋白质结构分类发现酶
结构引导注释的一种方法基于结构分类(图3A)。该方法已用于确定β-D-葡萄糖醛酸酶(GUS)对较大底物的功能,如庚烷壬糖。持续的研究发现了新的黄素单核苷酸结合GUS,可重新激活雌激素葡糖苷酸。GUS催化从小分子结合物或复杂碳水化合物中清除葡萄糖醛酸,并参与外源代谢和膳食化合物分解代谢。此外,GUS可能在人类肠道生态系统的适应性进化中发挥核心作用。研究表明,结构分类扩大了人类肠道中微生物GUS可能的生物学功能范围,从而扩展了目前关于肠道反应的知识。
 
4.2 高通量分子对接酶注释
这种利用高通量分子对接的结构引导注释方法已被用于发现烯醇化酶超家族酶(图3B)。尽管该超家族中的蛋白质具有相似的结构,在N端有一个(β/α7β-桶结构域,在C端有一个α+β-封盖结构域,但它们催化广泛的反应,包括烯醇化、外消旋、差向异构化、脱水和使用各种未知底物的环二聚体。通过SSN分析,该超家族中的二肽差异构酶同源物被收集并分类成若干簇,在肽聚糖循环和微生物次级代谢产物合成中发挥重要作用。对每种结构进行约400个备选L/L-二肽的同源性建模和对接,以确定特异性决定残基并预测每种酶的底物特异性。选择17种具有代表性的酶进行体外酶活性分析,并最终验证了三组具有不同二肽活性的二肽差异构酶,包括一种来自肠道细菌的多形拟杆菌,对L-丙氨酸-L-甘氨酸具有特异性。在另一项研究中,使用类似的方法发现了烯醇化酶超家族中的反式-4-羟基-l-脯氨酸甜菜碱差异构酶,该方法基于将>87000个代谢物对接到假定烯醇化酶的晶体结构中(表1)。由于结构引导注释已应用于烯醇酶的复杂超家族,该方法可扩展到其他蛋白质家族。
结构引导酶注释是揭示酶潜在底物特异性的有效方法;然而,这种方法受到一些障碍的限制,例如蛋白质家族的结构覆盖不完整、代谢物数据库不完整以及同源性建模和对接算法的缺陷。结构基因组学和利用深度学习预测蛋白质结构的进展可能促进结构导向酶注释的快速进展。
 
5 结语
总之,对肠道微生物群的研究正在从描述肠道微生物群发展到阐明其酶的分子机制。了解酶的功能和催化机制可以指导药物使用、肠道微生物组工程以及治疗和临床试验,以治疗人类疾病。尽管在这一新兴和有希望的领域仍面临许多挑战,但破译催化机制并利用这些知识改善人类健康至关重要。本文综述了基于生物信息学的人类肠道微生物群中新酶的发现和注释的最新研究。不同方法的联合分析可以提供关于催化相关反应的酶的令人信服的假设。此外,这些策略可以从其他资源(如瘤胃、土壤、海洋和植物)中识别微生物蛋白质。除了本综述中所述的方法外,其他方法,如蛋白质组学分析、活性导向蛋白纯化、系统发育导向基因组挖掘、整合路径图、基于吉布斯抽样的统计注释和底物反应位点,可以注释新酶,由于研究人类肠道微生物群蛋白质时的空间限制或缺乏方法实施,本综述中未对其进行讨论。
尽管人类微生物群是新酶的金矿,但酶挖掘是一项费时费力的任务,很难完成,特别是在通过体外研究其活性来确定生化功能时。人工智能相关过程,如机器学习和深度学习,可能有助于自动挖掘和注释酶。对于酶功能的研究,用于蛋白质纯化和体外研究的底物筛选的高通量技术以及用于体内研究的遗传操作可能有助于解决这个问题。值得注意的是,高通量设备,如微芯片和液滴微流控设备,已被开发用于测量酶活性。CRISPR-Cas系统可以以高通量和面向目标的方式编辑细菌基因组。使用噬菌体递送的CRISPR-Cas9的平台已被应用于以序列特异性方式从复杂肠道菌群中去除某个菌株,最终,我们设想使用这种方法来研究特定基因或途径的功能,并评估从肠道菌群中去除特定微生物的效果。
与肠道酶注释相关的另一个挑战是它们广泛的底物混杂。由于肠道微生物群遇到一系列物质,包括膳食化合物、药物和环境污染物,肠道中的微生物酶采用一种通才策略,以酶效率为代价接受多种相关底物。广泛的底物特异性是肠道微生物GUS、偶氮还原酶和Cgr家族的共同特征。肠道微生物酶在多大程度上表现出广泛的底物范围尚不清楚;然而,这一特性增加了正确注释酶功能的难度。可以想象,一种酶可能表现出一种新的功能。因此,若干计算和实验方法的融合已被证明是挖掘新酶所必需的,并且是解决这个问题的一个有希望和实用的解决方案。

不感兴趣

看过了

取消

微生物,肠道,蛋白质,方法,研究

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交