到底是疫苗效力、还是疫苗保护力?如何分析更容易得出科学且严谨的结果?
Hanson临床科研扯淡喵
关键词:疫苗;效力;有效性;医学统计
作者 丨 扯淡喵,统计专业,主要研究因果分析和纵向数据方法,现于NHLBI做fellow,合作于Richard Childs和Valentin Fuster的团队。
编辑 丨 Henry
导言:
在读新冠疫苗文献的时候,我们经常面临两个词翻译的困扰:efficacy和effectiveness。
英语很容易理解,但一直未找到中文的统一术语。
各类文章中更是翻译的极为混乱,并导致了很多错误。
我们也讨论了很多次,之前曾把vaccine efficacy翻译成疫苗保护力,而把vaccine effectiveness翻译成疫苗有效性。
最近,我们再次与统计学的几位专家进行了沟通,并确定了以世界卫生组织(WHO)的翻译稿为准,并请统计学专家进行了解读。
WHO的翻译为:efficacy - 疫苗效力、effectiveness - 有效性。
(图源:WHO)
疫苗效力(efficacy)
“通过对照临床试验来衡量疫苗效力(efficacy),即对接种疫苗的人产生“值得关注的结果”(通常指疾病)的人数与接种安慰剂(placebo)产生此种结果的人数进行比较。
研究完成后,会比较各组中的患病人数,按受试者是否接种了疫苗计算患病的相对风险(relative risk, RR)。由此统计师即可算出疫苗效力(efficacy),即疫苗在多大程度上降低了患病风险。
(图源:WHO)
即,通过对照研究临床试验得到疫苗效力。新冠疫苗的效力越高,则越能保护人群感染COVID-19。
比如,BNT162b2的疫苗效力为95%,意味着在接受临床试验者中,接种疫苗的受试者患病风险比接种安慰剂的受试者低95%。
(图源:WHO)
疫苗有效性(effectiveness)
疫苗有效性(effectiveness)是衡量疫苗在真实世界中发挥作用的一项指标。
相对应由于疫苗效力(efficacy)只是临床试验中针对受试者的的特定结果。疫苗有效性(effectiveness)则是观察疫苗对整个社区的保护效果。
很显然,真实世界中的有效性(effectiveness)可能与临床试验衡量的效力(efficacy)不同。
WHO对疫苗的效力(efficacy)给了明确的定义和计算方法,也就是对目标人群做随机对照试验后对比疫苗组(vaccinated group)和安慰剂组(placebo group)的感染率,住院率,重症率,死亡率等。
由于选择效应(selection bias)(只有特定人群做志愿者),参与试验的人群难以代表所有人口(或限定范围内的所有人口,如地区限制),所以观察广泛人群中的疫苗有效性(effectiveness)是必要的。
然而WHO并没有给明确的计算方法,不同研究中有各自的定义,这里我们不作讨论,仅讨论如何作有意义的对比。
相对于随机对照试验而言,观察性研究的数据包含多种因素,最大的问题是疫苗组(vaccinated group)与未接种组(unvaccinated group)没有可比性,这就需要一个统计模型(比如Cox模型)来消除其余变量的影响,比如年龄,性别,区域感染率等。
当然,如果较真,即使是双盲随即临床对照(double-blindedrandomized controlled trial, RCT)也难以保证可比性:对于一般自身疾病而言,治疗时间对结果影响不大。但对于流行病则不同,接种时间不同,周围环境的危险程度也实时在变。然而分组试验时难以控制接种时间,导致实验组和安慰剂组(placebo group)难以直接比较。。
在广泛人群内,当然时间这个因素更难以控制。
估计疫苗有效性的另一个问题是,很难采集非疫苗组的数据。
大多数研究把测试为阴性的人作为非疫苗组,显然这是有偏颇的,还有很多没有感染过的人从未出现在记录中。Linet al. (2022, NEJM) 利用了一千万人数的北卡州的人口普查数据(population census data),将未接种疫苗(unvaccinated)且未感染(uninfected)的人补充道研究数据中,极大的提高了数据的可靠性,使得待研究群体(study population)非常有代表性,毕竟是2020的人口普查。当然其中还有另外一些其他补充数据的细节,篇幅所限,仅止于此。
现在根据补充好的数据,我们看似可以用Cox模型加入各种因素如年龄,性别,区域感染率(county-levelinfection rate)等来计算疫苗有效性(effectiveness)。
然而我们尚未考虑时间因素:
第一,不同时间在流行不同的变种(variants);
第二,接种人群的第一针疫苗接种时间跨度很大(我们假设第二针都按要求时间)。
综上,我们需要在模型中加入控制时间因素的变量(Cox model中的base line risk是关于日历时间的函数,但需要在hazard ratio中加入事件相关变量(time-varying covariates) )。
这里Lin etal. (2022,NEJM) 假设疫苗有效性(effectiveness)只取决于接种当前时间距离第一针的相对时间(time elapsed after 1st shot),以及疫苗种类,具体定义可以参考文章中的模型。
例0 [研究时间范围从2020/12/11到2021/09/08],
[2020/12/11---[+]---[V1]---[V2]---[t]---2021/09/08]
时间轴中,[+]是阳性时间,[V1]第一次接种时间,[V2]第二次接种时间,t-V1即相对第一次接种的时间,作者假设疫苗有效性(effectiveness)只取决于t-V1。再辅以模型中其他因素(如年龄性别等)可以得到风险指数。
然后对数据做进一步处理,即对于接种人群严格定义,对某种两针完全接种的疫苗而言:
1. 如果某个体在第一针前有感染记录,那么忽略掉此后的事件(包括第一次接种,第二次,感染等),就像撸串一样撸掉后面的事件,然后将此人记录到未接种组。
例1 [研究时间范围从2020/12/11到2021/09/08]
[2020/12/11---[+]---[V1]---[V2]---[+]---2021/09/08]
撸掉阳性事件[+]之后的记录:[V1]第一次接种,[V2]第二次接种
[2020/12/11---[+]---2021/09/08]
2. 如果某个体在第一针和第二针之间有感染记录,那么撸掉此后的事件(包括第二次接种,感染等),然后将此人记录到接种一针的群组。
例2 [研究时间范围从2020/12/11到2021/09/08]
[2020/12/11---[V1]-[+]---[V2]---[+]---2021/09/08]
撸掉阳性事件[+]之后的记录:[V2]第二次接种,[+]阳性
[2020/12/11---[V1]-[+]---2021/09/08]
3. 如果某个人在接种第二针前无感染记录,将此人记录到完全接种的组。
4. 如果没有接种记录但有感染记录,计入未接种组。
5. 如果既没有接种记录又没有测试几录,去人口普查里找来顶人头数,那么怎么顶呢:
对于特定人口学变量如(年龄,性别,地区)的组合(定义了特定(age, sex, region)的strata),在COVID追踪系统我们可以查到这类人(within stratum of (age, sex, region))的人数(如果打过疫苗(vaccinated)或者做过测试(tested)),然后我们在人口普查(population census)结果中查看这类人的人数,相减即可得到COVID系统未记录的人,他们既没打过疫苗也没有感染过(或者在家自己好了,这里我们假设他们没感染)。这样我们就补全了人群(符合年龄条件的18-XX岁的)。如果不这么做,显然疫苗有效性(effectivenss)会被高估,因为未接种且未感染的人没有计入。
其中1-4条保证我们只计第一次感染的时间,因为接种前感染过再打疫苗会有更高免疫力,然而我们不应该把这种免疫力全算作疫苗效用。严格规定人群可以缩小研究范围直到有充分的可比性。
文章最后给出各种疫苗的有效性(effectiveness)作为关于第一针接种后相对时间的函数,然而它的数值并不是百分比有效性(effectiveness),而是一个较难解释的有效指数(1- hazard rate)。
但是从趋势上看,接种后的有效性(effectiveness)可持续至少8个月,说明了mRNA疫苗的长期有效性(long-term effectiveness)。
编者按:
非常棒的解析。
尤其是深入讨论了如何使得药物/疫苗有效性研究更为科学严谨的方法和策略,对临床科研非常有用。
原文链接:
https://www.who.int/zh/news-room/feature-stories/detail/vaccine-efficacy-effectiveness-and-protection
https://www.nejm.org/doi/full/10.1056/nejmoa2034577
https://www.nejm.org/doi/full/10.1056/NEJMoa2117128
https://www.nejm.org/doi/full/10.1056/NEJMoa2117128
Hanson临床科研,由6位在美国的医生及医学科学家组成。
本文来源:
微信公众号:Hanson临床科研(ID:HClinicalResearch)