申请认证 退出

您的申请提交成功

确定 取消

10分+ 空间细胞结构预测胶质母细胞瘤的预后

2023-08-16 10:09

新兴的空间转录组技术在保留组织结构的同时实现了转录组分析。此外,高分辨率组织学图像在空间转录组学中很容易获得,为分子特征和组织学特征的整合提供了关键机会。

导语

肿瘤内异质性和细胞状态可塑性是胶质母细胞瘤治疗耐药性的关键驱动因素。本文研究了空间细胞组织与胶质母细胞瘤预后之间的关联。利用单细胞RNA-seq和空间转录组学数据开发了一种深度学习模型,以从组织学图像中预测胶质母细胞瘤细胞的转录亚型。研究采用该模型对来自410名患者的4000万个组织spots进行了表型分析,并在两个独立的队列中确定了肿瘤结构与预后之间的一致关联。预后不良的患者表现出较高比例的肿瘤细胞表达缺氧诱导的转录程序。此外,星形胶质细胞样肿瘤细胞的聚集模式与预后较差有关,而星形胶质细胞与其他转录亚型的分散和连接与风险降低相关。为了验证这些结果,研究开发了一个单独的深度学习模型,该模型利用组织学图像来预测预后。将该模型应用于空间转录组学数据揭示了与生存相关的区域基因表达程序。总体而言,我们的研究提供了一种可扩展的方法来揭示胶质母细胞瘤的转录异质性,并在空间细胞结构和临床结果之间建立关键联系。

背景介绍

今天小编为大家带来一篇基于   空间细胞结构预测胶质母细胞瘤的预后   发表在10分+ nature communications的思路。题目为    Spatial cellular architecture predicts prognosis in glioblastoma   。

90951692142276701

数据介绍

本研究中分析的所有数据集,包括空间转录组学,单细胞RNA-seq和组织学图像。单细胞数据都存储在GEO中,空间转录组数据来自Datadryad,10X,libd;组织学图像是从GDC数据门户获得。

结果解析

01空间转录亚型的鉴定

为了解决GBM在空间背景下的转录异质性,本研究对三个空间转录组学数据集进行了综合分析。 综合数据集包括从22名患者获得的23个GBM样本。每个样本包含2500~4702个基因表达spots,产生75,625个转录组。数据预处理和批处理效应归一化在“方法”部分中进行了描述。为了确定每个spot中的细胞数量,我们对组织学图像进行了细胞核分割。细胞计数范围为3至38,平均计数为13个细胞。为了确定GBM样本的基因组异常,我们使用每个spot的转录组学图谱推断拷贝数改变(CNA),其中来自正常脑组织(n = 6名患者来自3名患者的6个组织)的数据作为参考  。肿瘤样本在染色体上显示出广泛的CNA,包括Chr 6,Chr 7的增益和Chr 8,Chr 10和Chr14的损失(图1a)。由于GBM细胞具有高度浸润性,因此每个spots可能含有肿瘤细胞和正常脑组织的混合物。为了估计每个spot内的肿瘤细胞含量,我们首先指定一个突出的CNA事件,该事件在每个肿瘤的所有spot中共享为肿瘤特征CNA。然后根据CNA签名的评分估计肿瘤细胞含量。在每个肿瘤中至少计算三个特征事件,以确保可靠和无偏倚的估计。我们发现我们的方法能够区分肿瘤区域与组织学正常的外周组织。因此,我们使用基于CNA的肿瘤细胞含量估计来过滤恶性spots,而在随后的分析中去除了低(<20%)肿瘤细胞含量的spots。 为了鉴定恶性spots的转录亚型,研究采用了两种互补的方法。首先,我们使用恶性spots的转录组进行共识非负基质分解(cNMF), 以鉴定患者的复发性基因表达模块。其次,我们使用来自单细胞RNA-seq的数据作为参考,对spots进行了计算反卷积。通过cNMF分析,我们发现了五个不同的元基因模块(图1b)。为了将这些模块与已发表的单细胞RNA-seq模块区分开来,我们将每个模块 命名为“nmf.x”。前两个模块与神经元谱系发育和突触功能有关(图1b)。模块#1富含神经祖细胞(SNAP25,CD24和SYN1)的标记物,而模块#2与少突胶质细胞祖细胞(PLP1,CNP,MBP) 密切相关。因此,我们将模块#1指定为nmf。NPC和模块#2作为nmf.OPC。模块#3表现出星形胶质细胞标志物(GFAP和APOC1) 和参与抗原加工和炎症反应的基因(例如HLA-DRA,B2M和CD74)的共表达(图1b)。这种共表达模式可能反映了星形胶质细胞的反应性转化 。因此,我们将模块#3命名为nmf.RA(反应性星形胶质细胞)。其余两个模块#4和#5富含间充质(MES)相关基因,如VIM和COL6A1(图1b)。模块#4显示了糖酵解过程(GAPDH,PGK1,LDHA)和缺氧反应(VEGFA,HILPDA,ADM)的富集,因此命名为NMF。MES缺氧。另一方面,模块#5富含编码细胞外基质(COL6A1,FN1,MMP9)的基因,但缺乏缺氧特征,并被指定为nmf。 接下来,我们使用来自单细胞RNA-seq的数据进行反卷积分析,以估计不同GBM细胞类型与恶性spots的比例(图1g)。为了捕获肿瘤细胞和免疫细胞,我们整合了三个单细胞RNA-seq数据集作为参考:GSE131928,GSE163108和GSE84465。 对于肿瘤细胞,我们从参考文献中纳入了四种转录亚型:(1)NPClike,(2)OPClike,(3)AClike,(4)MESlike。根据缺氧反应基因(如HILPDA、VEGFA)和糖酵解基因(如GAPDH、LDHA)的表达,将MESlike细胞进一步分为缺氧依赖性(MEShypoxia)和缺氧依赖性(MESlike) 组。对于免疫细胞,我们专注于T细胞和巨噬细胞。根据我们的反卷积分析,我们发现肿瘤细胞的组成在单个spot内相对均匀。在大多数spots中,占主导地位的肿瘤细胞类型占所有肿瘤细胞的70%以上(图1h)。值得注意的是,大约30%的spots仅由一种肿瘤细胞类型组成(图1h)。对免疫细胞分布的分析表明,49%的spots含有一种免疫细胞类型,大约 8%的spots由T细胞和巨噬细胞的混合物组成(图1i)。总体而言,这些spots被归类 为nmf.NPC, nmf.OPC, nmf.RA, nmf.MES-like, nmf.MES-hypoxia 并分别富含NPClike, OPClike, AClike, MESlike and MEShypoxia cells(图1j) 。此外,与其他spots 相比,nmf.RA spots的巨噬细胞浸润增加,而nmf.MES样spots增加了T细胞的比例。这些结果表明,单个spot通常由一种肿瘤细胞类型主导,而肿瘤细胞经常与免疫细胞混合。

67581692142277267

图1

02转录亚型可通过组织学图像预测

由于已知基因表达特征会影响细胞形态,我们假设可以从组织学图像推断细胞类型分布。我们开发了GBM-CNN,一个用于图像分类的卷积神经网络(图2a)。GBM-CNN的输入是从苏木精-伊红(H&E)染色的组织学图像中提取的斑块。空间转录组学中,一个斑块的边缘长度(56\(\mu m\))大致等于一个基因表达spot的直径(55\(\mu m\))。输出是每个补丁中存在的细胞类型。我们将该问题表述为多标签分类任务。为了预测肿瘤细胞,由于每个spot仅由一种细胞类型占据(图1h),因此我们旨在预测每个斑块中肿瘤细胞的主要类型。对于免疫细胞,由于T细胞和巨噬细胞经常与肿瘤细胞混合(图1i,j),我们将它们作为独立标记包括在内。为了评估GBM-CNN的性能,我们使用来自空间转录组学队列的数据(n = 23个肿瘤;n = 69,647个spots)进行了留一交叉验证(LOOCV)。在每次迭代中,模型在来自22个肿瘤的spot上进行训练,而来自剩余肿瘤(n = 1)的spot则用于验证。为了防止过度拟合,模型架构和相关超参数在所有迭代中保持一致。每次迭代后,我们都会在验证样本上评估模型的性能。对于预测肿瘤细胞,F1评分为0.86,标准差(SD)为0.15(图2b)。受试者工作特性曲线下面积(AUROC)为0.93,SD为0.05。空间可视化表明,该模型准确地预测了队列中优势细胞类型的分布,即使是队列中异质性最强的肿瘤。为了评估显性肿瘤细胞类型是否与任何组织学特征相关,我们从H&E图像中提取了每个图像通道的颜色值以及纹理和直方图特征。分析表明,提取的图像特征在不同样本中有所不同。然而,当我们对从 ResNet50 模块的最后一层(图 2a)中提取的特征向量(2048\(\times\)1)进行相同的分析时,我们观察到生成的簇与验证样本中的转录亚型之间存在很强的相关性。这些结果表明,GBM-CNN学习了原始组织学特征之外的转录亚型的潜在表征。

接下来,我们评估了GBM-CNN在预测免疫细胞方面的表现。由于T细胞和巨噬细胞被视为独立标记,我们分别评估了每种细胞类型的敏感性和特异性(图2c,d)。对于预测T细胞,灵敏度为0.80(SD:0.08),特异性为0.83(SD:0.05),AUROC为0.80(SD:0.08)(图2c)。对于预测巨噬细胞,灵敏度为0.84(SD:0.09),特异性为0.81(SD:0.07),AUROC为0.89(SD:0.11)(图2d)。这些结果表明,GBM-CNN能够从组织学图像中准确预测肿瘤细胞的亚型和免疫细胞的存在。

为了测试GBM-CNN的分类性能是否可以推广到外部患者队列,我们将图像模型应用于来自IvyGap队列(n = 184张载玻片,来自n = 8名患者)和TCGA-GBM队列(n = 693张载玻片,来自312名患者)的全载玻片(WSI)。IvyGap队列包括来自343个GBM相关基因及其相邻H&E染色组织学切片的原位RNA杂交数据。我们预计,具有GBM-CNN特定转录亚型的肿瘤细胞应具有高信使RNA(mRNA)表达水平(即基本事实),以获得相应的细胞类型特征。如图2e,f所示,分类为“MESlike”的肿瘤区域显示出MES相关特征的高mRNA表达水平,例如COL4A1,PDPN。此外,分类为“MES-缺氧”的区域与HIF1A的表达一致。同样,分类为“NPC样”和“OPC样”的区域分别与SNAP25和OLIG2的表达相关。分类为“AC样”的区域显示PTPRZ1和EGFR的表达升高,巨噬细胞浸润的区域与CD163的表达一致(图2f)。

59111692142277381

图2

03转录亚型组成与预后的关系

为了评估预测的转录亚型组成如何与预后相关,我们使用TCGA队列患者的诊断切片作为发现队列,并使用CPTAC队列的切片 作为验证队列。由于切除肿瘤区域的绝对大小因患者而异,因此组织成分的下游分析可能导致对大切除肿瘤的偏倚。为了克服这种潜在的抽样偏差,我们实施了两种策略。首先,我们根据斑块数量(指示组织大小)对每个队列中的肿瘤进行排名,并去除贴片数量最少的底部5%肿瘤。其次,我们在Cox回归分析中将性别,年龄,IDH状态和组织大小作为协变量。遵循这种严格的过滤策略,我们在TCGA队列中获得了最终一组693张载玻片(n = 312名患者),在CPTAC队列中获得了227张载玻片(n = 98名患者)。我们的多变量Cox回归分析表明,具有高比例的贴片被归类为MES缺氧的样本与较差的预后相关。在TCGA队列中,MES缺氧亚型的风险比(HR)为2.06(P = 0.008),在CPTAC队列中为2.23(P = 0.01)。此外,NPC样亚型的比例与两个队列中更好的预后相关,尽管这些关联没有达到统计学意义。

04空间细胞结构与预后的关系

迄今为止提出的结果已将转录亚型组成与患者预后联系起来。然而,由于空间组织和细胞相互作用在驱动克隆进化,肿瘤进展和治疗耐药 性中起着关键作用,我们试图评估恶性细胞的空间分布如何有助于预后。为了表征空间细胞组织,我们首先构建了一个空间邻域图来表示每个肿瘤内的细胞群落(图3a)。在此图中,每个修补程序都是一个spot,边表示修补程序之间的直接连接。每spot的表型是每个贴片中由优势肿瘤细胞类型表示的预测转录亚型。为了确保对空间细胞组织及其与预后的关联进行无偏探索,我们在生存分析中将亚型比例作为协变量。 我们首先评估了不同转录亚型之间相互作用的频率如何影响预后。我们的结果表明,AC样亚型之间的连通性增加对应于风险增加(图3b,c和图3d,e,TCGA:HR = 3.70,P < 0.01;CPTAC:HR = 3.32,P < 0.01)。相反,当AC样亚型与其他亚型(例如NPC样,MES样和MES缺氧)连接时,风险降低(图3b,c和图3f,g)。为了进一步证实这些结果,我们检查了聚类系数,该系数表示相同的转录亚型在空间邻域图中聚集在一起的程度。我们发现AC样亚型的聚类系数越高,预后越差(TCGA:HR = 3.82,P = 0.004;CPTAC:HR = 3.96,P = 0.009)。值得注意的是,单独的AC样亚型的比例并不是预后的重要预测指标,突出了空间关系相对于单独丰度的价值。

42181692142277493

图3

05与预后相关基因表达标志物的鉴定

迄今为止提出的结果已经建立了转录亚型组成与患者预后的空间结构之间的联系。为了进一步探索与预后相关的空间基因表达程序,我们开发了一个单独的深度学习模型,该模型使用组织学图像来预测预后(图4a)。该模型旨在为每个补丁分配一个积极的分数,其中较高的分数会导致更差的预后。我们使用TCGA-GBM队列的数据(n = 693张载玻片,来自n = 312名患者)通过五重交叉验证评估了模型的性能。此外,我们还测试了在CPTAC队列中训练的TCGA队列模型(n = 227张幻灯片,来自n = 98名患者)。为了评估模型的准确性,我们得出了一个综合评分(CS),该评分结合了一致性指数(C指数)  和综合brier评分 。CS 的范围从 0.0 到 1.0,值越高表示预测越准确。在TCGA队列中,该模型的CS为0.74(SD:0.03)。此外,我们使用中位预测分数将患者分为高风险组和低风险组。与低危组患者相比,高危组患者的预后明显较差(对数秩检验,P = 2.47E-07)。为了对模型的性能进行基准测试,我们将其与基线模型进行了比较,在基线模型中,激进分数由具有相同架构的随机、未经训练的模型预测。训练模型的CS显著高于基线模型(Mann-Whitney U检验,P = 0.004)。同样,在CPTAC测试队列中,该模型的CS为0.75,与低积极评分的患者相比,具有高积极评分的患者预后明显较差(对数秩检验,P = 0.03)。 为了确定与生存相关的空间基因表达程序,我们接下来使用经过训练的预后模型,使用配对的组织学图像预测空间转录组学队列中每个spot(n = 69,647)的积极评分(图4b)。我们的分析显示,转录亚型之间的积极评分显着不同(图4c-e)。MES缺氧亚型被分配为最高的侵袭性评分,其次是反应性星形胶质细胞,MES样,NPC样和OPC样细胞(图4e)。为了确定与预后相关的基因,我们使用该队列的中位数分数划分所有spot,并将得分高的spot与得分低的spot进行比较。我们发现4,569个基因在高侵袭性区域显着上调(图4f,log2FC>0.25,P<0.01),在低侵袭性区域显着上调1984个基因(log2FC>0.25,P <0.01)。基因集分析显示,与高侵袭性(图4g)相关的基因参与调节损伤反应(SOD2,TNR,PTN),糖蛋白代谢过程(MT3,RAMP1,CST3),抗原加工(AZGP1,CD74,HLA-DRA),氧化应激反应(RHOB,PON2,AQO1)和胶质发生(PTPRZ1,GFAP,SOX4)。另一方面,与低侵袭性相关的基因(图4h)与神经元发育有关,包括神经核发育(MBP,CALM1,CNP),少突胶质细胞分化(PLP1,OPALIN,MAG),神经递质转运(SNAP25,SYT1,SLC17A7)和轴突发育(STMN1,UCHL1,CCK)。已知一些基因与GBM预后有关,例如PTPRZ1 和EGFR 。然而,我们发现了许多其他以前未知的基因,如SNRPD3,TPST1和GUCD1。这些数据表明,恶性细胞对缺氧环境和炎症刺激的反应性转化导致预后恶化。

91191692142277594

图4

06用于预测空间转录亚型和侵袭性的软件

为了使我们训练的图像模型可用于未来的研究,我们开发了GBM360,这是一款用户友好的软件,用于预测和可视化GBM组织学图像中的转录亚型和预后(图5a)。使用GBM360,用户可以上传svs或tiff格式的H&E组织学图像(图5b,c)。

该软件提供三个关键功能:

(1)从组织学图像预测GBM细胞的转录亚型并可视化生成的空间细胞图(图5d)

(2)预测和可视化区域侵袭性评分(图5e)

(3)以及执行各种统计分析以表征转录亚型组成,空间细胞组织和亚型相互作用(图5f,g,h)

67061692142277712

图5

讨论

新兴的空间转录组技术在保留组织结构的同时实现了转录组分析。此外,高分辨率组织学图像在空间转录组学中很容易获得,为分子特征和组织学特征的整合提供了关键机会。本研究整合了来自单细胞RNA-seq,空间转录组学和组织学图像的数据,以解决GBM中的空间细胞异质性。所呈现的结果有可能提高我们对空间细胞结构如何与患者预后相关的理解。

不感兴趣

看过了

取消

母细胞瘤,胶质,细胞,肿瘤

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交