新一代测序的使用阐明了多种癌症的基因组图谱。在选定的肿瘤类型中,突变分析可提供指导治疗的预后和预测信息。
导语
本论文提供了胃癌的32个基因特征,可以预测患者对化疗和免疫检查点抑制的反应。特征是使用机器学习算法识别的,并使用多个独立的数据集进行了验证。
背景介绍
今天小编为大家带来一篇研究胃癌Signature的发表在17分+ nature communications的思路。题目为Development and validation of a prognostic and predictive 32-gene signature for gastric cancer。
数据介绍
本论文使用来自567名胃癌患者肿瘤的基因组数据来鉴定32个基因特征和四个分子亚型。使用三个独立的数据集对该signature生成的风险评分进行了验证。研究还分析了转移性或复发性疾病患者对辅助化疗和免疫检查点抑制剂的反应。
研究设计
本文的主要研究思路是:开发胃癌的32基因特征,可以预测患者对化疗和免疫检查点抑制的反应。使用32个基因表达水平的无监督聚类来鉴定胃癌的四种分子亚型。使用线性内核构建支持向量机,以生成风险评分,该评分可以预测五年总体存活率。使用三个独立的数据集验证风险评分。证明分子亚型预测胃切除术后对5-氟尿嘧啶和铂辅助疗法的反应,以及转移性或复发性疾病患者对免疫检查点抑制剂的反应。最终表明32基因特征是一种有前途的预后和预测性生物标志物,可以指导胃癌患者的临床护理,应以前瞻性的方式使用大型患者群组进行验证。
结果解析
01、预后32 基因特征和分子亚型的鉴定
研究流程: 来自 TCGA 的来自 19 种不同癌症的 6681 名患者的体细胞突变谱被输入 NTriPath,以识别胃癌中特异性改变的通路。生成了 567 名胃癌患者基于微阵列的 mRNA 表达谱,并将其输入 NTriPath。基于包含前三个改变途径的 32 个成员基因的表达的无监督聚类用于识别分子亚型。在多个独立队列中测试了分子亚型的预后和预测能力。TCGA 癌症基因组图谱。
图1 显示了识别、测试和验证胃癌预后和预测生物标志物的工作流程。 对癌症基因组图谱 (TCGA) 发表的 19 种不同癌症类型的 6681 名患者的体细胞突变谱进行了分析 。该数据被输入NTriPath,并确定了在胃癌中特异性改变的通路。为了研究这些胃癌特异性途径的预后效用,我们从延世大学医学院 Severance 医院接受切除术的 567 名患者的治疗前肿瘤样本中生成了基于微阵列的 mRNA 表达谱。89% 的患者患有 II 期或 III 期疾病,中位随访时间为 61 个月 。
我们之前发现 NTriPath 识别的前三个途径具有最大的预后效用 11 。前三个胃癌特异性通路由TP53、BRCA1、MSH6、PARP1和ACTA2等 32 个基因组成,这些基因富集于 DNA 损伤反应、TGF-β 信号传导和细胞增殖通路 。我们根据 32 个基因的表达水平对 567 名患者延世队列进行共识聚类,并根据共识累积分布函数 (CDF) 图和 delta 面积图以及共识矩阵的手动检查发现了四种不同的分子亚型( 如图2A )。第 1 组患者的肿瘤过度表达与细胞周期和 DNA 修复相关的基因,而第 4 组患者的癌症过度表达 TGF-β、SMAD、雌激素信号传导和间充质形态发生途径中发现的基因。第 3 组患者的肿瘤过表达在细胞凋亡信号传导和细胞增殖途径中发现的基因。第 2 组的肿瘤没有表现出明显的过度表达基因模式。 在单变量分析中,分子亚型与年龄(P =0.003)、分期(P =0.021)、Lauren分型(P <0.001)和神经周围侵犯(P <0.001) 的差异显着相关(表 1 )。第 1 组和第 2 组患者年龄较大,更有可能患有肠型组织学肿瘤。第 4 组患者的肿瘤更有可能具有弥漫型组织学和神经周围浸润 。最后,观察到各组之间总体生存率存在显着差异。第1组患者的预后最好,但未达到中位总生存期,而第4组患者的预后最差,中位总生存期为65个月(图1) 。
先前的研究表明,与 Epstein-Barr 病毒 (EBV) 感染和微卫星不稳定性 (MSI) 相关的肿瘤与患者预后的改善相关。我们发现 EBV 阳性或 MSI 肿瘤的比例没有差异。使用单变量分析中显着的变量进行的多变量 Cox 比例风险分析表明,年龄、分期和分子亚型与死亡风险独立相关。为了解决变量选择可能产生的偏差,我们还进行了正则化 Cox 回归并发现了类似的结果。这些发现表明,32 基因特征的预后独立于已知与结果相关的临床和病理变量。 我们之前确定了 5 种基于转录组的分子亚型,可以预测生存 7 。在那份报告中,炎症亚组的预后最好,间质亚组的预后最差,其他3组的预后中等,并且相互重叠。我们比较了两种分类方案,发现每个 32 基因组通常代表所有 5 种分子亚型 。第 4 组中,间充质组患者的预后最差,生存率也最差。然而,即使在这种情况下,也只有 45.7% 的间充质组患者属于第 4 组。最后,当我们重复包括其他分类方案的多变量分析时,我们发现 32 基因亚型继续与总生存率相关 。
我们还将 32 基因特征与亚洲癌症研究小组 (ACRG;n = 300)发布的分类系统进行了比较 。我们发现第 4 组(最差生存率)在 MSS/EMT 组(最差生存率)中尤其丰富。第 1 组(最佳生存期)也富含 MSI(最佳生存期),但 45% 的 MSI 样本出现在第 2-4 组中,因此不存在直接相关性。最后,MSS/TP53+ 和 MSS/TP53− 组在第 1-4 组中的分布更加均匀。因此,32 基因特征不仅仅是以前分类系统的概括,而且提供了新的预后信息。
图1
02、机器学习识别风险评分以预测五年总体生存率
然后,研究试图将 32 基因特征的预后能力利用到临床相关工具中,使临床医生能够估计胃癌患者五年总生存的概率。使用延世队列作为训练集,我们使用具有线性核的支持向量机(SVM)构建了一个二元分类器。使用第 1 组和第 4 组训练 SVM 模型。预后最好的组 1 被赋予阴性标签,预后最差的组 4 被赋予阳性标签。接下来,我们使用 ACRG(基因表达综合:GSE62254)14、Sohn 等人发布的数据来验证 SVM 模型。(n =267;基因表达数据存储在:GSE13861和GSE26942)和癌症基因组图谱。研究发现风险评分可以预测五年总生存率(图2C)。重要的是,研究发现风险评分的预后独立于已知与所有数据集中的较差结果相关的临床和病理特征。这些结果表明,基于32个基因特征的机器学习衍生的风险评分可以预测胃癌患者五年总生存的概率。
图2
03、分子亚型预测对全身治疗的反应
接下来我们研究了分子亚型是否可以预测对全身治疗的反应。研究队列包括在建立辅助化疗作为护理标准之前接受治疗的患者。因此,我们能够将仅接受手术的患者与接受三种辅助化疗方案之一的患者进行比较:5-氟尿嘧啶 (5-FU) 单药治疗、5-FU 和铂类双药治疗、或 5-FU 加另一类全身治疗。我们对总生存期进行了多变量 Cox 比例风险分析,包括每个遗传亚组内的辅助化疗方案、癌症分期、年龄、淋巴血管侵犯和神经周围侵犯作为协变量 。研究发现,与28名未接受辅助化疗的第3组患者相比,接受 5-FU 加铂治疗的18名第3组患者显示出显着更好的总生存期(风险比 (HR),0.28(95% CI,0.08-0.96)),P = 0.043)。相比之下,接受 5-FU 加铂治疗的12名第1组患者的生存率比未接受辅助治疗的26名第1组患者的生存期更差(HR,6.80(95% CI,1.46-31.6),P = 0.015)。 接受治疗与第2组和第4组患者的生存差异无关。该数据表明分子亚型可以预测对辅助化疗的反应。
图3
04、使用排名最高的胃癌相关途径进行无监督共识聚类
为了研究 NTriPath 生成的排名最高的胃癌相关通路特征的预后效用,我们使用非负矩阵分解 (NMF) 进行共识聚类。这是使用 567 名延世队列患者的表达谱和不同数量的亚组(k=2-7)的顶级胃癌相关通路的成员基因进行的。 我们首先根据排名前三的胃癌相关通路的32个成员基因的表达进行共识 NMF 聚类。我们通过目视检查并考虑共表相关系数、共识矩阵的累积分布函数 (CDF) 和每个k组的Delta值来确定四个亚组 。
为了测试NMF子组的稳健性,我们使用具有线性内核的SVM从四个NMF子组构建了一个多类分类器,并执行留一交叉验证来预测NMF子组成员 。具体来说,我们使用带有线性内核的支持向量机,使用“全对比较”方法,我们构建 𝐊 ( 𝐊 − 1 )2 二元分类器,每个分类器都经过训练以区分每对类。从预测结果(长度为K的向量)获取类成员概率(长度为K的向量) 𝐊(𝐊−1)2 )的二元分类器,我们使用Park等人提出的聚合方法 。为了防止过拟合,我们使用了更简单的模型:在假设每个二元分类问题同等重要的情况下,将聚合方法中分配给SVM分类器的聚合权重(长度向量)固定为统一向量;和正则化参数,在每个二元分类中,问题设置为LibSVM 工具箱(版本 3.17)中的默认设置。我们通过生成接收者操作特征曲线并测量曲线下面积来测量多类分类器的性能(AUC)。分类的平均 AUC 为 0.981。我们使用这种多类分类器,该多类分类器使用经过延世四种亚型训练的线性核的支持向量机,在监督分类设置中将其他队列的患者分类为四种亚型。
图4
讨论
新一代测序的使用阐明了多种癌症的基因组图谱。在选定的肿瘤类型中,突变分析可提供指导治疗的预后和预测信息。然而,体细胞突变的简单编目无法捕获基因-基因相互作用的下游影响以及在癌症生物学中发挥重要功能作用的途径改变。因此,我们假设潜在丰富的预后和预测信息来源在很大程度上被忽视了。我们之前表明,通过我们开发的机器学习工具 NTriPath,将已知的分子相互作用网络与体细胞突变数据整合,可以产生肾细胞癌、膀胱癌、头颈鳞状细胞癌和黑色素瘤的预后信息。在这项研究中,我们验证了这种针对胃癌的方法,这种疾病几乎没有可用的生物标志物。我们根据 32 个基因的表达生成了一个分子亚型方案,这些基因包含胃癌特有的前三个改变的途径。我们发现 32 个基因特征可以预测总体生存率和治疗反应。因此,从诊断时获得的组织样本生成分子特征可以为预测和治疗计划提供临床上重要的信息。
我们使用机器学习来开发预测五年总体生存率的遗传风险评分。值得注意的是,风险评分是通过对来自我们一个机构的患者队列进行培训而生成的,该机构允许使用高度精细的临床数据并进行长期随访。然后,我们在多个大型独立胃癌患者队列中验证了风险评分。目前癌症患者风险分层的金标准是病理分期,只有在手术切除后才有可能。为了补充术前的传统分期方式,我们的遗传风险评分是一种评估风险的客观指标,代表了一种强大的新风险分层工具,有可能在个体化的基础上优化治疗选择和顺序。
目前很少有预测性生物标志物可以指导胃癌患者的治疗选择。HER2 扩增的胃癌患者可从曲妥珠单抗中获益,但这仅适用于一小部分患者。同样,虽然 Pietrantonio 等人。最近表明,与单独手术相比,患有MSI肿瘤的可切除胃癌患者并未从化疗中获益,只有 5-10% 的胃癌具有MSI。就检查点抑制剂而言,治疗通常以MSI状态和PD-L1表达为指导,但其预测能力有限。例如,KEYNOTE-061研究发现pembrolizumab并没有改善胃癌患者的总体生存率,包括肿瘤具有高PD-L1表达的患者。我们的32基因检测有可能增强现有的生物标志物并提高胃癌护理的精确度。我们发现第3组患者是唯一表现出与辅助5-FU和铂类化疗相关的生存率提高的患者,而第1组患者与辅助5-FU和铂类化疗相关的生存率较差。我们的研究结果可能广泛适用,因为氟吡啶和铂类治疗方案是大多数患者(尤其是西方患者)局部和转移性疾病患者的一线治疗。
值得注意的是,我们还发现分子分类与对免疫检查点抑制剂的反应相关,因为第1组和第3组患者的反应率明显高于第2组和第4组患者。重要的是,我们没有发现MSI-H肿瘤在第1组和第3组。有趣的是,第3组患者对5-FU和铂类双药化疗以及抗PD-1治疗均表现出良好的反应率。可以考虑在该患者群体中结合所有三种药物进行临床试验。与此同时,尽管第1组患者的预后最好,但使用 5-FU 和铂类治疗的结果却较差。对于这些患者,可以考虑免疫检查点阻断治疗,这些患者对此表现出显着的反应。
我们的研究结果建立在我们之前的工作基础上,该工作确定了一个基因分类器,该分类器可以预测和预测II期和III期患者对辅助化疗的反应。因此,我们之前的研究和当前的报告表明,胃癌的全面基因组分析可以提供有临床影响的信息来指导治疗。然而,我们目前的研究受到我们分析的回顾性的限制,可能会因选择偏差而混淆。例如,我们的训练集基于辅助化疗成为标准护理之前获得的样本。因此,转诊患者进行术后化疗还是观察的决定尚不清楚。未来需要对32基因特征的效用进行验证研究,以预测对5-FU和铂类疗法以及免疫检查点抑制剂的反应,以证实我们的研究结果,这些研究结果基于中等规模的队列。理想情况下,这些未来的研究是以前瞻性的方式进行的。下一个,虽然我们表明分子分类器与免疫检查点抑制剂的反应增加有关,但反应可能无法准确预测总体生存率。因此,分子分类方案的预后和预测效用应使用临床上最相关的终点(例如总生存期和/或生活质量)进行前瞻性验证。最后,支撑32基因特征的预后和预测能力的分子机制是未来研究的重要主题。例如总体生存率和/或生活质量。最后,支撑 32 基因特征的预后和预测能力的分子机制是未来研究的重要主题。例如总体生存率和/或生活质量。最后,支撑32基因特征的预后和预测能力的分子机制是未来研究的重要主题。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您