tFold-TCR:快速准确地建模TCR-p-MHC复合物
αβTCR对pMHC的识别是适应性免疫系统的基础。快速准确地建模TCR-pMHC结构对于理解TCR在分子水平上对pMHC的识别至关重要,这对于开发基于TCR的治疗药物和疫苗是必不可少的。尽管有显著的兴趣,但由于TCR-pMHC相互作用的多样性和有限的结构数据,这一挑战仍未解决。这里,腾讯AI Lab、清华大学深圳国际研究生院和莫纳什大学团队,介绍了tFold-TCR,这是一种高通量、端到端通用模型,用于预测TCR-pMHC复合物的3D原子级结构,能够预测不同类别的TCR和来自不同系统的MHC结构。tFold-TCR利用专门训练的、对蛋白质-蛋白质相互作用敏感的大规模蛋白质语言模型,提取链内和链间残基接触信息及进化关系,从而避免了多序列比对(MSA)搜索的需求。它还具有创新的结构预测和灵活对接模块,以提高准确性,特别是在相互作用接触方面。与现有方法(包括AlphaFold-3)相比,tFold-TCR在DockQ评估下的预测成功率提高了30.7%,并且速度超过25倍。这些进展使得大规模表征TCR及其与pMHC的相互作用成为可能。利用这一能力,这里构建了TCRStructDB,这是迄今为止最大的TCR-pMHC结构数据库,涵盖了220万个TCR,80万个pMHC和45000个TCR-pMHC复合物,网址为https://ai4s.tencent.com/tcr。TCRStructDB为生物学中最多样化的受体-配体相互作用之一提供了前所未有的见解。
TCRs的特异性和多样性主要来源于六个CDRs,每个链中有三个区域,它们同时与肽段和MHC分子结合。体细胞基因重排以及CDR3区域内的核苷酸插入和删除,在每个个体中生成了具有显著克隆和结构多样性的TCR库,在胸腺选择前包含超过10^11种不同的受体。这种多样性使人体能够以高特异性靶向广泛的抗原,使TCRs成为新型治疗药物的有希望的候选者。基于TCR的细胞疗法和可溶性疗法在临床前研究和早期临床试验中显示出令人鼓舞的结果,特别是在对常规疗法难治的血液恶性肿瘤和实体瘤方面。
蛋白质的3D结构最终决定了其功能和活性。理解TCR-pMHC复合物的结构基础对于阐明TCR特异性、合理设计TCR亲和力及其在疫苗设计、自身免疫和癌症治疗中的意义至关重要。CDR3环的灵活性通常导致这些区域无法准确建模或在结构中缺失。虽然成对的TCR序列数量呈指数增长,但TCR-pMHC结构数据库仅逐步增加,突显了填补这一差距的未满足需求。因此,快速而准确的计算建模方法对于在分子水平上研究TCR-pMHC相互作用至关重要。
传统的算法在建模未结合配体的TCR和TCR-pMHC复合物时,主要利用基于模板的建模结合能量最小化。这些方法通常由于模板稀缺、TCR CDR的灵活性和多样性以及TCR-pMHC对接方向的广泛变化而面临挑战。最近,基于深度学习的结构预测方法,特别是AlphaFold,在预测单体和多聚蛋白结构方面表现出显著的成功。基于AlphaFold-Multimer开发的方法如TCRdock和TCRmodel2已用于改进TCR-pMHC复合物结构预测。这些方法在预测蛋白质复合物方面取得了高精度。然而,这些方法依赖于大规模的多序列比对(MSAs),并且速度较慢,限制了它们作为高通量工具的潜力。
蛋白质语言模型(PLMs)已广泛应用于蛋白质功能预测和序列设计等任务。这些模型通过掩码语言模型学习蛋白质序列内部的相互作用。基于PLM的结构预测方法绕过了耗时的多序列比对搜索过程,但主要用于单体蛋白质结构预测。一些研究尝试将基于PLM的方法应用于多聚体预测。然而,除了抗体等特定子问题外,其预测准确性与基于MSA的模型相比仍有显著差距。
高精度结构预测软件,如AlphaFold3和ESMFold,已经使得大规模结构数据库的构建成为可能。AlphaFold DB和ESM宏基因组图谱已经预测并整理了UniProt和MGnify中绝大多数序列的结构。最近的研究填补了关于病毒蛋白在结构数据库中的空白。然而,现有的结构数据库主要集中在单体蛋白上,因为当前的结构预测软件在处理蛋白质-蛋白质相互作用(如抗体-抗原和TCR-pMHC复合物)方面存在困难。这种缺乏复杂结构数据库的情况对结构生物学家构成了重大挑战,因为理解蛋白质-蛋白质相互作用对于阐明许多生物学过程和机制至关重要。此外,预测复杂结构需要大量时间来跨多个链搜索MSA。
在这里,介绍了tFold-TCR,这是一种基于PLM的端到端方法,用于预测TCR-pMHC复合物的3D原子级结构。tFold-TCR采用了一种专门训练的、对蛋白质-蛋白质相互作用敏感的大规模蛋白质语言模型,提取链内和链间残基-残基接触信息及进化关系,消除了繁琐的MSA搜索需求。它还创新性地结合了结构预测和表示驱动的柔性对接模块,以增强结构预测,特别是在相互作用接触方面。tFold-TCR可以在几秒钟内预测未配体的TCR复合物、未结合的pMHC复合物以及TCR-pMHC复合物。为了深入了解生物学中最多样化的受体-配体相互作用之一,利用tFold-TCR的高通量预测能力构建了TCRStructDB,这是最大的提供TCR-pMHC结构的数据库,涵盖了几乎目前已知的所有配对的TCR-pMHC和未配体的TCR及pMHC。讨论了TCRStructDB数据特征的可靠性,并提供了一个在线平台以扩展其应用,支持T细胞介导的癌症治疗并提高免疫治疗干预的成功率。最后但同样重要的是,还探讨了使用tFold-TCR设计TCR的CDRs的潜在方法。
基于序列的结构预测适用于未结合配体的TCR和未结合的pMHC
由于PDB中TCR结构数据有限,tFold-TCR采用独立模块分别预测TCR和pMHC结构,而不是像AlphaFold-Multimer和AlphaFold-3那样使用单一共享模型处理不同输入。准确预测TCR和pMHC的结构,特别是TCR的CDR3区域,对于验证其功能至关重要,并且是tFold-TCR准确建模TCR-pMHC复合物结构的前提。
在tFold-TCR中,预测未结合TCR和未结合pMHC的模型具有相同的架构,并使用相同的参数初始化。这些模型之间的主要区别在于使用了不同的训练数据集。以未结合TCR预测模型为例,如图1a所示,它包含三个主要模块:预训练的大规模蛋白质语言模型(ESM-PPI-TCR)、特征精炼模块(Evoformer-Single)和结构模块。ESM-PPI-TCR模块旨在从蛋白质复合物中提取链内和链间信息,为下游结构预测任务生成特征。通过进一步预训练现有ESM-2模型开发了ESM-PPI-TCR,使用来自多个大型数据库(包括UniRef50、PDB、PPI数据库、抗体数据库、肽数据库以及收集的TCR数据库)中的单体和多聚体进行训练。这种增强使得模型能够有效提取链内和链间信息,以及pMHC的肽链间信息。Evoformer-Single模块更新并精炼了来自语言模型的输入蛋白质特征。最后,结构模块使用不变点注意力(IPA)执行SE(3)等变变换,将获得的表示映射到预测的原子级3D结构。这种模块化方法确保tFold-TCR能够准确预测未结合TCR和未结合pMHC的结构,这对于后续准确建模TCR-pMHC复合物结构至关重要。
为了全面评估tFold-TCR的性能,采用了一种广泛使用的时序分离方法。以2022年1月1日为分界点,此前的数据用于训练和验证,而2022年及之后的数据则保留用于测试。对于未配体的TCR和未结合的pMHC,构建了两个非冗余基准:STCRDab-22-TCR和STCRDab-22-pMHC,分别包含24个TCR和18个pMHC。
首先将tFold-TCR的推理时间与现有方法进行了比较,如图1b所示。值得注意的是,tFold-TCR展现出显著的速度优势,对于未结合配体的TCR,其速度比AlphaFold-Multimer快5000倍,对于未结合的pMHC则快4000倍。这种显著的速度提升主要归功于ESM-PPI-TCR的实现,该方法有效地消除了耗时的MSA搜索的需求。尽管AlphaFold-3也使用了MSA,但经过大量的工程优化减轻了其速度劣势,使得tFold-TCR仍然比AlphaFold-3快大约40倍。
对于一般的蛋白质结构预测,基于PLM的模型以其速度著称,但通常表现略逊于基于MSA的模型。然而,如图1c和表B2所示,tFold-TCR在预测未结合配体的TCR结构方面表现出色。比较了tFold-TCR与现有的通用蛋白质结构预测方法,包括AlphaFold-Multimer、AlphaFold-3,以及TCR特异性方法,如TCRModel2。在FR中,所有考察的方法相比其他区域表现出最高的性能,但tFold-TCR在其中最为准确。CDR-A3和CDR-B3区域由于其显著的序列和结构多样性,是最具挑战性的组成部分。tFold-TCR显著优于所有其他方法。这表明tFold-TCR在处理这些关键区域的复杂性和多样性方面具有卓越的能力,进一步确立了其在TCR结构预测中的稳健性和准确性。还发现,对于较长的CDR3区域,tFold-TCR预测的CDR3-RMSD值增加,Pearson相关系数为0.7,这与预期一致,因为较长的CDR3区域表现出更大的灵活性,更难以预测。
表B2 未结合TCR预测在STCRDab-22-TCR基准上的性能和运行时间。
不同配对的TCR链之间的预期方向对于确定整体结合表面至关重要。为了评估链间方向的准确性,使用了多个指标,包括DockQ、Fnat、LRMS和iRMS,以评估对接界面的准确性。此外,还使用RMSD和GDT(全局距离测试)来评估未结合配体的TCR的整体结构。tFold-TCR在大多数指标上的表现优于其他评估方法,除了Fnat。具体来说,tFold-TCR预测的整体结构最为准确,平均RMSD为0.704 Å,平均GDT为0.956。这些结果突显了tFold-TCR在准确预测链间方向和未结合配体的TCR整体结构方面的卓越能力,使其成为TCR结构预测的高度可靠工具。
虽然tFold-TCR对未配体的TCR进行了快速且准确的预测,但对于未结合的pMHC,其性能略逊于基于MSA的方法,如AlphaFold-Multimer和AlphaFold-3。在STCRDab-22-pMHC数据集上,tFold-TCR的平均DockQ分数为0.908,而AlphaFold-Multimer和AlphaFold-3分别为0.927和0.926。尽管tFold-TCR达到了较高的整体结构准确性(RMSD=0.684Å,GDT=0.959),其对肽侧链的预测准确性不如AlphaFold-3,导致Fnat分数较低。尽管可用于肽的共进化信息有限,但基于MSA的模型可以通过适当的配对策略提取更有效的共进化信号,从而实现更准确的预测。此外,准确的模板结构可以帮助AlphaFold-Multimer和AlphaFold-3优化肽的侧链。
图1 tFold-TCR方法和结果适用于未结合配体的TCR和未结合的pMHC
使用tFold-TCR进行高通量TCR-pMHC复合物预测
一旦训练了一个TCR结构预测模型和一个pMHC结构预测模型,就将这些模型的输出用作特征生成模块,并使用额外的柔性对接模型将它们集成。tfold-TCR的完整架构,即构建的TCR-pMHC复合物预测模型,如图2a所示。它主要由三个模块组成:TCR特征生成模块、pMHC特征生成模块和表示驱动的柔性对接模块。
在tFold-TCR用于复合物预测的训练过程中,预训练的特征生成模块(包括TCR和pMHC)保持固定,以促进整个模型的收敛和优化。表示驱动的柔性对接模块主要由两部分组成:特征融合模块和复合物结构预测模块。特征融合模块有效整合了从TCR和pMHC特征生成模块获得的序列表示、对表示以及未结合结构,生成TCR-pMHC复合物的初始序列表示和对表示。随后,复合物结构预测模块(包括16个块的Evoformer-Single堆栈和8个块的结构模块)通过Evoformer-Single块更新这些表示,并将更新后的表示映射到预测的复合物结构,同时通过结构块提供预测置信度。在表示驱动的柔性对接模块中,tFold-TCR不仅计算TCR-pMHC复合物的构象,还更新TCR和pMHC的结构,模拟柔性对接的过程。重要的是,tFold-TCR不需要输入的TCR和pMHC是配对的,因为它使用位置编码来处理不同的链,从而能够有效地识别和适应缺失的链(例如,只有Beta链的TCR或单链的MHC I)。这种能力使它能够高效利用STCRDab数据库中的结构数据。
将tFold-TCR与著名的结构预测方法进行了比较,包括AlphaFold-Multimer和AlphaFold-3,以及TCR特定的方法如TCRModel2和TCRDock。此外,还评估了几种对接方法。然而,即使使用结合的TCR和结合的pMHC作为输入,这些对接方法的性能也明显较差。
如图2b、表B4和表B5所示,tFold-TCR在预测TCR-pMHC复合物结构方面表现与AlphaFold-3和AlphaFold-Multimer相当。与AlphaFold-3和AlphaFold-Multimer相比,tFold-TCR保持了稳定的预测准确性,且没有出现文献中描述的幻觉行为。与TCR-MHC I相比,tFold-TCR在预测TCR-MHC II时的准确性相对较低。这种差异可归因于MHC-II分子的开放结构,使得肽配体可以从结合沟的两端延伸出来。这一特性增加了TCR-pMHC-II结合基序的复杂性,使准确预测更具挑战性。对于TCRModel2,pMHC被截断,仅保留MHC顶部的两个α螺旋和一个β片层结构。AlphaFold-Multimer使用TCR特异性MSA和模板作为输入来预测结构。这种pMHC的截断使得比较有些不公平。当使用完整的TCR-pMHC复合物进行评估时,平均DockQ分数约为0.4。
表B4 TCR-pMHC复合物预测在STCRDab-22-TCR pMHC基准测试中的表现。SR表示由DockQ算法定义的DockQ成功率。
表B5 TCR-pMHC复合物预测在Rossjohn实验室基准测试中的表现。
tFold-TCR相比AlphaFold-Multimer和AlphaFold-3的性能优势并不特别显著。然而,tFold-TCR最大的优势在于其计算速度。由于tFold-TCR消除了耗时的MSA搜索需求,而是使用语言模型作为输入,因此tFold-TCR比AlphaFold-Multimer快2000多倍,比AlphaFold-3快30倍,如图2c所示。观察到,采用表示驱动的柔性对接模块对TCR-pMHC系统进行联合建模,使TCRCDR-A3和CDR-B3区域的RMSD减少了4%。虽然这一改进可能看起来并不显著,但它突显了灵活性在提高整体结构建模中的作用。
在TCR-pMHC复合物的结构预测中,准确预测CDR环与表位之间的相互作用接触点至关重要,但由于这些区域的无序和灵活性,这一任务仍然具有挑战性。图2d展示了TCR-MHC I和TCR-MHC II预测结构的例子,突出了接触区域。值得注意的是,尽管tFold-TCR与其他大多数结构预测工具一致,但在准确预测侧链相互作用方面存在类似的局限性。然而,tFold-TCR能够准确预测TCR和pMHC之间的主链界面。以图2e所示为例,实验结构显示共有14个接触对,而tFold预测了15个接触对。性能指标显示,14个中的12个被召回,召回率约为85.7%,15个中的12个为精确匹配,精确率为80%。重要的是,tFold-TCR的预测有效重现了CDR环与P4-P6表位残基之间的相互作用,这对于肽段的特异性识别至关重要。理解这些相互作用对于识别公共TCR中的潜在病毒逃逸突变非常重要。
图2 tFold-TCR方法和结果用于TCR-pMHC复合物。
大规模TCR和pMHC结构数据库
蛋白质的结构指示了其功能和活性。为了解析TCR-pMHC相互作用的结构特征,基于新开发的tFold-TCR构建了目前最大的结构TCR数据库TCRStructDB。TCRStructDB是一个在线平台,提供大量数据,包括已知TCR-pMHC复合物的结构、未结合的配对TCR和未结合的pMHC,以及一系列搜索和分析工具。
从现有的数据库如STCRDab、TCR3d、IEDB、HuARdb、OTS等,以及多项利用10x Genomics测序技术描绘免疫细胞的研究中收集了配对的全长TCR-pMHC复合物、未结合的TCR和pMHC测序数据。当实验结构不可用时,使用tFold-TCR预测为包含的测序数据提供相应的结构。具体来说,在数据库整理过程中,对所有原始数据应用了一个统一的处理管道,如图3a所示。该管道包括三个主要阶段:原始测序数据处理、序列数据的注释和验证,以及结构预测。
第一阶段,处理了原始测序数据以获得与TCR相关的氨基酸(AA)序列数据。具体来说,下载的原始10X测序数据使用10x Genomics CellRanger软件重新分析。然后通过参照10x barcodes将个体序列进行配对。第二阶段,使用了如ANARCI等软件对TCR序列进行重新编号,确保它们是全长且不含模糊氨基酸。对于无法获得完整链序列的TCR,使用Stitchr根据可用的V和J基因数据、CDR3序列信息以及物种元数据生成有效的全长TCR序列。随后进行了基于ANARCI的注释和验证。最后阶段,利用tFold-TCR获得了多种与TCR相关序列的结构信息,包括未结合配体的TCR、未结合的MHC、pMHC以及TCR-pMHC复合物。
因此,TCRStructDB目前包含总计4,517,910对TCR序列,其中包括2,226,260个独特的TCR片段可变(Fv)区序列,每个序列都匹配其相应的预测结构数据。此外,还为817,584个pMHC复合物预测了结构数据,包括531,578个MHC I和286,006个MHC II,以及45,755个TCR-pMHC复合物的预测结构数据条目。与现有的TCR特异性结构数据库如STCRDab相比,TCRStructDB提供了显著更多的结构数据,TCR数据增加了约2400倍,pMHC数据增加了约1300倍,TCR-pMHC数据增加了约65倍。与已知最大的TCR特异性序列数据库OTS和VDJDB相比,TCRStructDB涵盖了所有这些数据库的数据,在丰富性和全面性上超过了它们(图3b)。此外,TCRStructDB将持续更新和维护,以增加可用数据的深度和多样性。
TCR的Fv区是由V基因和J基因的重排生成的。在分析非冗余序列中的V-基因配对时,观察到不同V-基因配对之间的频率存在显著差异。具体来说,如TRAV29/DV5*01-TRBV5-1*01、TRAV1-2*01-TRBV20-1*01和TRAV17*01-TRBV20-1*01等V-基因配对被发现是最常见的配对之一(图3d)。这可能是由于这些基因型组合在TCR基因重排过程中更有可能发生。在MHC亚型方面,HLA-B被确定为最常见的MHC-I亚型,而HLA-DR是MHC-II中最常见的亚型(图3e)。
图3 TCRStructDB概览。
数据特征及TCRStructDB的应用
据所知,TCRStructDB是目前最大的数据库,提供TCR-pMHC、TCR和pMHC的配对序列和结构信息,通过数据分析可以提供有价值的见解,类似于之前基于AlphaFoldDB和ESMAtlas的工作。首先从序列角度分析了TCR的功能特征。分析结果显示,共享相同V基因和J基因的TCR在基于序列的语言模型(ESM-PPI-TCR)衍生的序列特征空间中聚集在一起。然而,没有观察到结合相同pMHC的TCR的聚类现象,这表明仅靠序列相似性可能不足以完全解释TCR对其相应pMHC的结合特异性。其他因素如结构特征或TCR-pMHC互作的动力学可能在决定TCR特异性和功能方面起着重要作用。进一步从结构角度分析了TCR的功能特征,以探索TCRStructDB提供的生物学见解和潜在应用。
TCR与pMHC之间的对接角度,包括交叉角和入射角,是分析TCR-pMHC复合物时使用的关键几何参数。尽管TCR-pMHC复合物的形成存在变异性,现有的结构研究显示,TCRs在与不同的MHC分子结合时保持一致的对接方向,角度分布在较窄范围内,并且在不同结构中聚类。先前的研究表明,在胸腺发育过程中选择的TCRs被限制为以特定的对接方向识别pMHC复合物,这对于正常的免疫功能至关重要。大多数识别I类或II类MHC的TCRs将其结合相互作用集中在α1-和α2/β1螺旋的中心区域。然而,一项现有研究发现,在MHC等位基因组内没有偏向性的TCR V基因使用,也没有在MHC I中发现保守的TCR-MHC接触。这一发现挑战了TCR和MHC基因共同进化以实现胚系识别的假说。实际上,它表明对接方向主要受MHC分子特定区域中的保守残基影响。目前尚不清楚对接方向偏好是由胚系编码的残基直接决定的,还是胸腺选择的结果。
为了便于利用TCRStructDB,将其开发为一个在线平台,提供一系列搜索和分析的Web应用程序,网址为https://ai4s.tencent.com/tcr。这些应用程序分为三大主要功能组:结构预测、结合检索和相似性检索。如图4b所示,用户将查询的TCR和pMHC序列输入界面。然后通过适当的界面调用相应功能,经过计算后,后台显示相关结果,包括预测结构和数据库检索结果。
ELAGIGILTV(来自黑色素瘤的MART-1蛋白)是一种重要的肿瘤相关抗原,通过MHC呈递给T细胞,并已被广泛研究。利用MART-1靶点,在TCRStructDB数据库中检索了一系列能够与该靶点结合的TCR。图4c分析了这些TCR序列。在CDR-A3区,序列主要以"CAV"开头并以"LTF"结尾,在中间位置高频出现"GGG",表明存在一个对结合特异性至关重要的保守基序。在CDR-B3区,序列主要以"CASS"开头并以"EQYF"结尾,在不同位置上"GGG"和"G"显著保守,表明存在一个与MART-1抗原相互作用所必需的重复模式。对于V和J基因的使用,A链中TRAV12-2基因占主导地位,而B链中没有明显的主导V基因,TRBV27和TRBV28显示出较高的频率。
除了序列数据外,TCRStructDB的独特之处在于其能够分析可以结合抗原的TCR结构,为研究人员提供了额外的视角。进一步收集了来自10x抗原-肽特异性刺激实验中无法结合该目标的一组TCR,并预测了相应的TCR-pMHC结构。这些结构与TCRStructDB中能够结合目标的TCR-pMHC结构进行了比较,并随机选择了一些序列进行可视化,如图4d所示。发现,能够结合MART-1抗原的TCR具有相似的CDR-B3结构,这与非结合TCR的结构显著不同,显示出完全不同的对接方向。
结合序列和结构分析来研究结合与非结合的TCR具有重要意义,因为它提供了对抗原识别和结合决定因素的全面见解。通过识别保守基序和结构模式,我们可以更好地理解TCR与肿瘤相关抗原相互作用的特异性和亲和力。
除了结构之外,亲和力一直是研究人员关注的重点。然而,TCR与pMHC之间的亲和力通常较弱,已知的亲和力数据也较为稀缺,因此未包含在TCRStructDB中。类似于大多数结构预测模型,该模型预测结合结构时,并不考虑输入的TCR是否能与pMHC结合,或者肽段是否能与MHC结合。然而,鉴于该模型可以在几秒钟内完成复杂的预测,可以为那些基于序列的结合预测模型和亲和力预测模型提供额外的输入信息。
为了验证这里的结论,从ATLAS数据库中获取了76个突变序列及其相应的突变效应,这些数据基于1AO7复合物。由于1AO7在数据库中具有最多的可用突变信息,因此选择了它。大多数这些复合物没有精确的实验结构。鉴于TCR特异性主要源于CDR3-肽段相互作用,只保留了发生在CDR3和肽段区域的突变。利用tFold-TCR,预测了这些突变体的结构,并计算了CDR3片段与肽段之间的平均距离。分析了预测的距离变化与实验观察到的突变效应(∆∆G)之间的关系。结果表明,二者存在中等程度的正相关(Spearman = 0.491),如图4e所示,这表明tFold-TCR在预测蛋白质突变导致的结合亲和力变化方面具有潜力。
TCRStructDB中的准确序列和结构特征,结合在线平台的应用,有可能导致更有效的T细胞介导的癌症治疗。此外,在序列和结构水平上区分结合和非结合TCR的能力可以提高治疗性TCR选择的精确性,从而提高免疫治疗干预的整体成功率。
图4 数据特征和TCRStructDB的应用。
总结
总之,tFold-TCR不仅作为一种高效工具,能够快速准确地进行结构预测,还展示出作为平台技术的潜力,可以推动基于TCR的治疗和疫苗创新。通过使研究人员能够探索潜在的TCR-pMHC相互作用的广阔领域,tFold-TCR促进了有效TCR基础治疗的设计。它提高TCR-pMHC复合物结构预测的准确性和速度的能力,可用于虚拟筛选和TCR设计等应用。预计tFold-TCR将为免疫学家提供一个全面的工具,加速结构生物信息学的进步。此外,本研究构建的TCRStructDB是迄今为止最大的TCR结构数据库,为结构生物学家提供了宝贵的数据资源,丰富了他们对这些复杂相互作用的理解。这一资源有望在分子生物学和免疫学方面带来重要的见解,促进治疗应用的突破。
Abramson, J. et al. Accurate structure prediction of biomolecular interactions with alphafold 3. Nature 1-3, 2024.
Fandi Wu. et al. Fast and accurate modeling and design of antibody-antigen complex using tfold. bioRxiv 2024.02.05.578892.
Fandi Wu, et al. Fast and accurate modeling of TCR-peptide-MHC complexes using tFold-TCR. bioRxiv 2025.01.12.632367
Raybould, M. I. et al. The observed t cell receptor space database enables paired-chain repertoire mining, coherence analysis and language modelling. bioRxiv 2024-05.
Shanker, V. R., et al. Unsupervised evolution of protein and antibody complexes with a structure-informed language model. Science 385, 46-53, 2024.
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读