TPD药物组学研究中设置样本实验重复的必要性
前言:基于蛋白质组学中的数据非依赖采集(Data Independent Acquisition,DIA)模式实现对不同蛋白的相对定量,可用于探究靶向蛋白降解(Targeted Protein Degradation,TPD)药物的靶向特异性,及潜在脱靶风险。为有效监测差异蛋白变化,采用合理的实验设计、严谨的统计方法进行组学数据挖掘是不可缺少的环节。在此,本文主要讨论TPD药物组学中设置有效、合理的实验重复的必要性。(DOI: 10.1007/ 978-1-0716-1024-4_1)。
1. 蛋白组学研究中的实验重复分类
实验设计对最终的实验结果可靠性起着决定性作用,尤其在蛋白质组项目中,合理的实验重复设计至关重要。目前来说,实验重复类型主要包括生物学重复和技术重复。不同实验设计,其生物学重复和技术重复的定义存在差异,因此本文基于TPD药物处理前后的细胞样本进行描述,TPD组学的生物学重复是指同一个实验组别中独立制备的样本个数,例如药物A设置3个生物学重复,指的是对3份相同来源的细胞样本进行相同的给药处理;TPD组学的技术重复是指对同一个生物学样本进行多次重复技术检测,例如3次技术重复是指同一个生物学重复的样本进行3次质谱检测。在TPD组学实验中,生物学重复会带来较明显的给药前后的细胞生物差异结果,但质谱多次技术重复采集的差异程度极小,因此在TPD组学中一般不对技术重复做要求。
通常生物学重复用于概括性结论的说明,技术重复用于减少这些结论的变异性。同时采用生物学重复与技术重复可以使得实验设计更加严谨,实验结果更加可靠。但根据TPD组学的实验特点,建议对药物处理前后的细胞样本设计有效的生物学重复,一般不对技术重复做要求。
2. 设置实验重复的必要性
2.1 文章发表及项目申报要求
目前蛋白质组学领域主流的杂志如MCP (Molecular & Cellular Proteomics),JPR (Journal of Proteomeresearch),Proteomics,JP (Journal of Proteomics)等对于大规模蛋白质组学数据的严谨性都有非常高的要求,对于没有生物学重复以及技术重复的组学结果概不接收,并且都要求在正文或者补充数据中写明实验设计以及数据分析的细节,因此建议用于科学研究的实验设计至少采取3次生物学重复。
此外,若TPD组学实验结果用于药物申报,需要根据《体外诊断试剂临床实验指导原则》中最低样本量的要求。参考对应的指导原则,可采用统计学公式计算所需样本量。
2.2 统计学要求
TPD研究中涉及通过蛋白质组学分析差异蛋白。一般来说,只有当样本生物学重复达到3个及以上时,才能够用于进行较为可信的显著性检验,并且结果可信度随着样本重复的增加而增加。显著性检验用于推断实验组与对照组是否有差异,以及这种差异是否显著。差异蛋白分析需要结合差异倍数的计算以及显著性分析对数据进行筛选,只有符合筛选标准的蛋白才被认为是可信的上下调蛋白。
此外,统计学中功效一般是针对效应值(量化现象强度的数值)而言,也就是在统计推断中检测出某个效应值的把握,可以看作真实效应发生的概率。嘉华药锐通过整合众多组学数据,得到了理论上的真实效应发生概率和生物学重复的关系(细胞样本)。如图所示,当生物学重复为1时,此时功效为0;而功效会随着生物学重复数据增加而增加,当接近大于等于15个时,功效接近1。其中,当生物学重复由2个增加至3个时,功效增幅最大;当生物学重复由3逐步增加时,功效的增幅逐步降低。当每组3个生物学重复时,真实事件发生的概率已经能够达到数据分析要求。综合考虑到数据可信度,及实验成本问题,一般实验建议选择3个生物学重复。一般来说,若TPD组学数据用于临床生物标志物发现等大队列样本研究中,则需要更多的重复,其数据可信度才能达到临床生物标志物发现标准。
功效与生物学重复关系图(细胞样本)
2.3 准确定量特定蛋白
TPD蛋白组学是高通量的数据集,能够精确地展示蛋白整体稳态的变化。但由于TPD组学相对定量的特点,在对中低丰度,尤其低丰度蛋白进行相对定量时,会因肽段强度过低导致质谱监测可能会出现偏差。因此,相同处理组建议3个及以上的生物学重复,能够有效的提高蛋白定量的准确性。尤其在判断TPD药物处理前后的异常蛋白、或潜在脱靶蛋白时,3个及以上的生物学重复能够提供有效的参考价值。
综上所述,通过蛋白质组学探究TPD药物的靶向特异性,及潜在脱靶问题过程中,应根据实验特点、分析标准采用合适的实验重复。在基于TPD药物处理前后的细胞样本的组学实验中,通常建议设置3个及以上的生物学重复。
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读