NPLD-GHI Journal Club 2020年9月文献评判
精选文章
Leonard S A, Kennedy C J, Carmichael S L, et al. An Expanded Obstetric Comorbidity Scoring System for Predicting Severe Maternal Morbidity[J]. Obstetrics & Gynecology, 2020.
文章摘要
【标题】广义产科合并症评分系统预测严重孕产妇并发症
目的:
创建和验证广义产科合并症评分系统,用于预测严重孕产妇并发症,并可一致适用于当前美国各产科患者出院数据集。
方法:
使用加利福尼亚州2016-2017年住院分娩产妇的出院数据建立评分体系。结局指标包括:根据美国疾病控制和预防中心指数定义的严重孕产妇并发症,以及非输血性严重孕产妇并发症(除外输血是唯一严重孕产妇并发症的病例)。根据国际疾病分类第十版临床修订诊断代码(ICD-10-CM)的界定,研究选择了27个严重孕产妇并发症的患者危险因素。我们使用机器学习集成的定向因果推理方法,根据校正后风险比(adjusted risk ratios,aRRs)对高危因素进行排序;使用这些结果为每一个合并症评分,并合计得到一个总分。我们使用加州和国家健康管理数据集中对该评分系统进行验证,并将该评分系统的性能与先前制定的产科合并症指数进行比较。
结果:
在919,546例分娩中,严重孕产妇并发症率和非输血性严重孕产妇并发症率分别为168/10000例和74/10000例。最高危合并症为胎盘植入(严重孕产妇合并症和非输血性严重孕产妇合并症的aRR分别为30.5、54.7),最低危合并症为妊娠期糖尿病(严重孕产妇并发症和非输血性严重孕产妇并发症的aRR分别为1.06、1.12)。针对每种并发症制定基于aRR值的标准化评分,严重孕产妇并发症评分为1~59分,非输血性严重孕产妇并发症为1~36分。广义产科合并症评分系统总体性能良好(加利福尼亚州数据集的严重孕产妇并发症、非输血性严重孕产妇并发症两者的C统计值分别为0.78和0.84,全国数据集分别为0.82和0.87),与之前制定的产科合并症指数相比有所改善。校正曲线显示了预测值与实际结局(患者高危因素)之间的良好一致性。
结论:
我们开发并验证了广义产科合并症评分系统,以期对不同合并症人群更好地进行严重孕产妇并发症率的比较。
文献评判
1.评判标准
西北大学芬堡医学院麻醉科
医学论文质量评分表(改良版)
评定项目(每项评分0~2分,总分:20分)
1 问题和假设
2 伦理研究委员会和知情同意
3 研究设计方法,随机的方法
4 研究对象:入选标准,排除标准,人群描写指标
5 主要临床指标,次要临床指标
6 标本量计算,统计的α值(P值)
7 统计方法的合理性
8 研究的局限性
9 讨论的逻辑性和结论的客观性
10 实际临床意义,直接临床结局相关的
2.文献相关内容摘要及其质量评价评分
评
17分
文章:
广义产科合并症评分系统预测严重孕产妇并发症
评分标准(0~20分)
2分
1,评定项目:问题和假设
评分标准(0~2分)
背景:
过去几年间,孕产妇并发症率逐渐成为监测和改善产科质量大有前景的指标。2012年,美国疾病控制与预防中心(CDC)及其合作伙伴采用国际疾病分类临床修订(ICD-CM)诊疗编码,创建了一套纳入多种标识的指数系统以识别医疗管理数据中的严重孕产妇并发症。当前版本的严重孕产妇并发症指数纳入了21个分娩住院期间特定、明确定义的严重事件作为标识,例如败血症、急性肾衰和子宫切除术。严重孕产妇并发症指数已广泛用于研究、监测和质量改善项目,但是患者已有的合并症也极大地影响着个体严重孕产妇并发症风险,因此有必要采取充分的校正策略来比较不同患者人群中严重孕产妇并发症率。
在对医疗管理数据进行多种健康结局研究时,合并症指数是一个广泛使用的对已患疾病进行汇总和校正的工具。使用最普遍的是Elixhauser等人开发的常见合并症指数,van Wal-raven等人将其改良为单一合并症评分。这些指数系统大多使用ICD-CM代码来界定一系列患者已有合并症,以进行预测和校正。与二分类变量相比,合并症评分的加权值可用于描述患者人群(特征),改善回归模型拟合,以及评估与其他变量的交互性。尽管产科研究经常使用Elixhauser指数和其他常见合并症指数,但这些评分系统最初制定时却是明确除外产科患者的。Bateman等人首先认识到医疗管理数据对于产科合并症指数的需求,因此他们基于2000年~2007年全国“医疗补助”(Medicaid)患者的分娩住院样本开发了一个产科合并症评分。这个由Bateman等人建立的合并症评分较其它评价指标而言有了显著改善,但其可推广性受以下因素限制:受试人群仅限于医疗补助保险患者,使用了非标准定义的严重孕产妇并发症作为预测结局,基于ICD-9-CM编码的数据和评分。此外,预测变量之间的区别不大(受试者操作特征曲线下面积(AUROC)为0.657),预测能力未得到验证,并且使用了严格统计模型。其他研究人员也开发了产科合并症指数,但不适用于美国的医疗管理数据。
这项研究目的是开发和验证一个可在美国不同医疗管理数据集中通用的广义产科合并症评分。
1分
2,评定项目:伦理研究委员会和知情同意
评分标准(0~2分)
这项研究已通过加利福尼亚州保护人类受试者委员会和斯坦福大学研究合规办公室的伦理学批准。研究报告遵循了STROBE(《加强流行病学中观察性研究报告质量声明》)和TRIPOD(《个体预后或诊断的多变量预测模型透明报告》)标准。
1分
3,评定项目:研究设计随机方法
评分标准(0~2分)
研究设计:
回顾性队列研究
数据来源:
经与加州州立卫生计划与发展办公室签订数据使用协议,获准使用加利福尼亚州孕产妇优质医疗合作组织(California Maternal Quality Care Collaborative)的数据。
2分
4,评定项目:研究对象:入选标准,排除标准,人群描写指标 评分标准(0~2分)
入选标准:
2016-2017年在加利福尼亚州许可的医院中所有活产分娩的产妇出院数据。
排除标准:
未经加利福尼亚州州立卫生计划与发展办公室数据使用协议许可的孕产妇医疗管理数据。
人群描写指标:
选择了27种合并症(即,本文使用的严重广义孕产妇合并症),包括受试者内科合并症、本次妊娠相关并发症、既往剖宫产史以及人口学特征(产妇年龄等)。
用于识别每个预测指标的ICD-10-CM诊断代码由研究小组咨询产科医疗账单编码专家后选择。
1分
5,评定项目:主要临床指标,次要临床指标
评分标准(0~2分)
主要临床指标:
根据美国CDC严重产妇并发症指数标识和相应的ICD-10-CM编码界定的严重孕产妇并发症、非输血性严重孕产妇并发症(除外输血是唯一严重孕产妇并发症的病例)。
2分
6,评定项目:标本量计算,统计的α值(P值)
评分标准(0~2分)
样本量:919,546例
本研究使用了2016年和2017年在加利福尼亚州许可的医院中所有活产分娩的患者出院数据(N=919,546)。
p值:0.05
我们使用Benjamini-Hochberg错误发现率程序进行多重比较校正,保留了具有显著P值(0.05)的危险因素。
2分
7,评定项目:统计方法合理性
评分标准(0~2分)
使用的统计方法:
校正后风险比(aRRs):采用定向因果推断方法,根据校正后风险比和风险差异的95%置信区间(95% CI),对潜在的严重孕产妇并发症风险因素的重要性进行排序。与传统的统计方法相比,定向研究方法已被反复证明评估结果更准确、更精确。
交叉验证:为了评估该指数系统性能,我们随机选择了75%的分娩数据作为训练集,其余25%分娩数据作为验证集。变量重要性分析中也采用了四倍交叉验证。
我们评估了该指数的区分度和校准度,以确定其准确性。对于区分度,绘制受试者操作特征(ROC)曲线和精确率—召回率(Precision-Recall)曲线,并计算各自的曲线下面积(AUC)。ROC曲线显示了真阳性率如何随假阳性率而变化;相反地,精确率-召回率曲线显示阳性正预测值(精准率)如何随真实阳性率(召回率)而变化。
局部加权回归联合分组可视化技术:通过此方法对合并症评分的校准度进行了评估,将严重孕产妇并发症和非输血性严重孕产妇并发症的实际风险与预测风险进行了比较。
2分
8,评定项目:研究局限性(原文自评)
评分标准(0~2分)
本研究存在一定的局限性。
与健康数据相比,医疗管理数据库中的出院数据在准确性和细节方面存在局限性。非常罕见的产科并发症可能会被低估或忽略,如果仅从住院分娩产妇中获得数据,合并症的确诊率就很低。识别出院数据中的严重孕产妇并发症和非输血性严重孕产妇并发症时,确定真实病例方面也受到限制。
出院数据往往不包括生命体征、化验结果、用药记录和病情严重程度等这些可以预测产科并发症的关键信息。我们在设计研究之初即认识到了这些局限性,鉴于现有电子健康记录数据集尚无法或尚未普遍应用于严重孕产妇并发症的监测,本研究旨在创建一个可适用于任何使用ICD-10-CM编码的医疗管理数据集的孕产妇严重并发症预测/评估工具。
本研究的数据分析部分受限于超大规模患者样本量和研究纳入的合并症数量,这使得我们无法引入比敏感性分析更加多样性的机器学习算法。
研究分析方法要求对合并症进行二项分类,这使得我们无法对一个合并症的不同严重程度进行不同评分。
2分
9,评定项目:讨论的逻辑性和结论的客观性
评分标准(0~2分)
本研究利用加利福尼亚州的孕产妇出院管理数据,开发并验证了广义产科合并症评分系统,以预测严重孕产妇并发症的情况。本研究使用国家商业索赔数据进一步对该评分系统的有效性进行外部验证,并对非输血性严重孕产妇并发症(除外输血是唯一严重合并症指标的病例)进行了复制分析。产科合并症评分系统的设计目标是广泛应用于美国当前的医疗管理数据集并服务于其他多种用途。而且,这些评估指标可作为一种校正手段用于对不同医院、不同合并症人群的严重孕产妇并发症率和非输血性严重孕产妇并发症率的准确比较。
本研究开发的合并症评分系统整体性能良好,并且有效改善了以前产科合并症的评分情况。在加州和全美数据集中,严重孕产妇并发症结局的AUROC约为0.8。并且计算了精准率—召回率曲线的AUC统计数据,因为当研究使用罕见结局指标(例如严重孕产妇并发症)时ROC曲线可能误导性地抬高。为了与以前的研究进行比较,我们将Bateman等人的ICD-9-CM诊断代码和Easter等人的合并症指标翻译为ICD-10-CM诊断代码。值得注意的是,我们使用Bateman产科合并症指数计算的AUROC与Bateman等人使用国家医疗补助数据发表的原始论文中报道的相同(0.65)。而当比较本研究产科合并症评分与Bateman产科合并症指数的AUC统计数据时, 本研究评分系统的AUROC(严重孕产妇并发症分别为0.78和0.65)和精准率-召回率AUC(严重孕产妇并发症分别为0.13和0.05)都要高得多。此外,非常低的精准率-召回率AUC(尤其是在低风险范围内)可能表明Bateman先前报告的AUROC统计数据(0.657)可能对评分系统的性能过于乐观。
我们认为,预测模型性能的提高可能是不同合并症选择、更可靠统计方法、评分分值范围更大等因素综合作用的结果。与以前的研究相比,我们增加并改良了许多合并症标识。此外,我们使用了定向因果推理方法来创建预测模型,克服了传统回归建模的许多限制。最后,每种合并症的评分范围为1~59。相比之下,Bateman及其同事的研究中评分范围是1~5。我们还创建了非输血性严重孕产妇并发症率评分(合并症评分范围为1~36),这是疾控中心和其他机构目前普遍使用的。将每种合并症的得分相加,得出该患者的合并症总得分。根据评估总分,严重孕产妇并发症和非输血性严重孕产妇并发症的预测风险与实际风险非常吻合(即模型校正良好),这是评价临床实用预测模型性能的一个重要但经常被忽视的部分。
开发产科合并症评分系统的主要动机是提供一种可比较不同合并症患者群体中严重孕产妇并发症率的有效方法。不同妇产科医院之间患者病例差异很大,因此无法比较其严重孕产妇并发症率。不同患者人群间充分的病例组合校正有助于比较不同医院之间严重孕产妇并发症率。此外,产科合并症评分系统提供了一个通用方法来描述严重孕产妇并发症情况,同时通过减少模型协变量数量、允许纳入合并症和其他危险因素之间的交互作用进而改善严重孕产妇并发症的统计模型。
几种特定合并症的评分值得进一步讨论。产科最严重的合并症:胎盘植入、肺动脉高压,现在已被给予恰当的、非常高的评分(50分或更高);在之前的评分中,每个合并症得分均以5为上限。当我们开始思考社会人口决定因素的作用时,新增加的合并症例如主要精神健康障碍和药物滥用,都对统计模型产生重要影响。将现有社会人口因素纳入敏感性分析,并没有明显改善结果,因此有必要进行深入研究。相对于其它影响因素,高龄产妇和高体重指数(BMI)对统计的影响较小。
这项研究拥有许多优势。合并症评分是根据2016-2017年加利福尼亚州所有分娩数据开展的一项当代大规模非选择性队列研究。这有助于研究罕见的合并症以及非输血性严重孕产妇并发症;后者在以前的风险预测分析中并未纳入过,但与仅以输血为严重症状的严重孕产妇并发症相比,可能包含更严重的并发症。据我们所知,本研究也是首次在美国使用ICD-10-CM诊疗代码研究合并症和严重孕产妇并发症;并且由产科医疗账单编码专家、产科流行病学家和母胎医学医师组成的专家团队精心选择了ICD-10-CM合并症代码。与ICD-9-CM代码相比,通过使用ICD-10-CM代码,合并症评分为当前和将来的医疗质量评估提供了工具。此外,在合并症评分的开发和验证中采用了严格的方法。我们使用了精妙的定向因果推论统计分析,并使用多种测量方法评估了模型的性能,不仅包括AUROC统计数据,还包括TRIPOD建议采用的精准率-召回率AUC统计数据和校正图。本研究从内部和外部同时验证了合并症评分的有效性,进一步支持这个评分系统在美国不同产科患者群体中的普适性。
2分
10,评定项目:实际临床意义,直接临床结局相关的 评分标准(0~2分)
总而言之,我们开发并验证的这一新型广义产科合并症评分系统,可以更准确预测分娩住院期间严重孕产妇并发症、非输血性严重孕产妇并发症的妊娠结局。这些评分可应用于任何使用ICD-10-CM诊疗代码的产妇出院数据集,并可成为孕产妇健康研究和医疗质量改善的有效工具。
3.研究专业评判
点评项目
流行病学点评
点评人:王瑾
统计学点评
点评人:Anna Huang
1.研究问题是否具有临床意义?
美国疾病预防中心(Centers for Disease Control and Prevention, CDC)2012年推出的严重孕产妇并发症率(severe maternal morbidity, SMM) 的计算包含了产妇在分娩过程中出现的各种无法预期的导致短期和长期的危害的各种严重并发症。从1993 年到2014年,严重孕产妇并发症率翻了一番。在2014年,据CDC统计,这些严重并发症影响了全美超过五万产妇。目前严重孕产妇并发症率在产科的科研、医疗质量控制和流行病调查方面起到了重要的作用。但是又被病人人群本身的基础疾病状况很大地影响。
这项研究推出了广义产科合并症积分系统用来预测严重孕产妇并发症这套积分系统对于不同医院的不同基础状况的病人人群能够进行评估,帮助不同医院之间的严重孕产妇并发症率横向比较。对比既往的产科合并症积分系统,有更好的可操作性和临床意义。这套积分系统也可以恰当地用来评估病人发生严重并发症的不同危险因素。比如胎盘前置和产妇肺动脉高压就有非常高的积分。它还添加了很多新的合并症:比如精神疾病和药物成瘾等社会经济因素。
NA
2.研究内容的先进性、可行性?
本研究使用了第10版国际疾病临床修订分类(International Classification of Diseases Clinical Modification,ICD-10-CM) 代码作为各项合并症诊断的依据。研究还使用了多种测量方法评估了模型的性能,不仅包括绘制受试者工作特征(receiver operating characteristic curve, ROC) 曲线和曲线下面积(areas under the curve, AUC)统计数据,还包括TRIPOD建议采用的精准率-召回率AUC统计(Precision-Recall AUC Analysis)数据和校正图。这套积分系统对当前和未来的医疗质量评估和产科研究提供了有效工具。
NA
3.试验设计的严谨性?
NA
如文章所述,实验设计得益于大样本的数据库。孕产妇出院诊断数据非常有用,它能够捕获孕产妇死亡的各种危险因素之间的危险比。
4.研究方法的合理性?
本研究总结了美国加州医院系统2016-2017年的近92万个所有活产分娩产妇的出院数据。它使用ICD-10 CM诊断代码确定了27个严重孕产妇并发症危险因素。进而使用机器学习集成的定向因果推理方法,根据校正相对危险度(aRRs)对高危因素进行排序。研究进一步使用了交叉验证来评估了这个积分系统的有效性。它还使用了绘制受试者工作特征(ROC)曲线和精准率-召回率曲线,并计算各自的曲线下面积(AUC):对积分分系统的敏感度和特异度进行了分析。
研究方法符合研究伦理,并且数据收集的规模合理且令人印象深刻。由于研究设计的总体数据前瞻性记录采集,因此可以完成风险比的计算,并能够通过受试者工作特征(ROC)曲线来确定评分系统对孕产妇死亡率的准确性。
5.研究过程的质量控制?
NA
由于样本量较大,本研究的结果关联也比较确切,保证了ICD-10-CM得分的准确性和研究的正确性。考虑到以前的计分系统使用输血作为与本研究的比较,因此也应加以利用,应予以赞扬。研究设计和计算的总体质量控制做得很好。
6.研究结果的可信度?
研究使用了复杂的因果推论统计分析,并使用多种测量方法评估了模型的性能,不仅包括AUROC统计数据,还包括TRIPOD建议采用的精确率-召回率AUC统计数据和校正图。本研究从内部和外部同时验证了合并症评分的有效性。
这个研究结果可信,也和临床相关联,应该可以在临床实践中予以推广使用。但是,正如文章提及的局限性所言,在计算合并症时并未考虑多变的社会因素和患者特征,而这些因素又影响着美国多元人口的孕产妇死亡率,在积分的未来版中应给予考虑。
7.证据水平及原因?
NA
这项研究提供的证据显示,大多数孕产妇是低危的,以前用于预测孕产妇死亡率的评分系统存在缺陷。研究人员改进了现有的,并创建了一个更好更强大的版本,以应对妊娠中存在的各种合并症,从而更好地为待产分娩做准备。
8.临床是否采用?(与目前方案比较)
广义产科合并症积分系统使得不同医院系统的不同混合病例人群能够进行严重孕产妇并发症率的可靠对比。同时它提供了对不同研究人群的可靠的危险因素描述方法,改善了在严重孕产妇并发症统计模式,减少了其他不同因素造成的影响。这为未来孕产妇健康研究和医疗质量控制提供了有效的工具。
NA
4.临床专科点评荟萃
妇产科:
郑勤田(广州市妇女儿童医疗中心妇产科医疗总监;美国亚利桑那大学医学院妇产科)
首先,这个积分系统让我联想起我国医院排名。我们有不少排名系统,但多是根据名气,出名的大学附属医院很自然地排到前面,社会医院永远翻不了身。这种排名实际意义有多大,对中国医疗质量提高有无作用的确值得商榷。我国医疗数据很多,能否根据这篇文章的思路,把每个医院的产科质量客观地评估一下,这样产生的排名可能更有价值。
Leonard的研究分析了27种与母体严重并发症相关的危险因素,并对这些危险因素进行评分。胎盘植入分数最高为59分,妊娠期糖尿病和高龄≥35并列最低为1分。如果不把输血治疗作为严重并发症,危险因素的最高分数为36分。
在统计学方法上,这一研究采用了AI技术,比传统的多元回归更为准确。此前,Bateman等根据ICD-9数据首次报道了产科风险因素指数。他专门为Leonard的研究写了述评,并予以高度评价。风险指数的实施不仅有利于产科质量评估,更重要的是有利于精确转诊,以保证患者安全。
我国目前采用6色风险评估,根据轻重程度,依次分为绿色、黄色、橘黄色、粉红色和红色,紫色代表传染性疾病。这种分类方法在我国实施时间不久,经验尚有待积累。Leonard的最新研究对我国孕妇的风险分类也有重要价值。胎盘植入是威胁我国孕产妇安全的重要疾病,Leonard这一研究会使我们更加重视胎盘植入的研究、转诊和治疗。
妇产科:
罗国阳(美国霍华德大学医学院终身教授兼妇产科主任)
近年来人们一直在寻找一个更好更完善的方法来评估产妇分娩时的风险,利用风险评估来决定对产妇的临床处理或者转到有条件的上级医院。本文作者制定了两个评分系统,一个是预测根据美国 CDC定义孕产妇严重并发症,另一个是预测非输血性孕产妇严重合并症。他们利用了和孕产妇合并症相关的27个参数,他们得出了从 1到59的对严重孕产妇合并症指数,和从1到36的非输血性严重孕产妇合并症指数。这个评估系统在对2016到2017年加州分娩的产妇得到了验证。这个评估方法比以前的评估方法更好,因为它利用了新的国际疾病分类系统和更多的参数。但是也有不完善的地方:1)它利用的疾病诊断数据是产妇出院时的记录,并不能完全区分这些这些病是以前存在的还是在分娩的发生的,这样会抬高评估分数,比如贫血是因为 产妇本来就有贫血,还是分娩时失血而导致的贫血?2)出院记录并不能完全反映真实的疾病严重程度,比如一个因为严重哮喘发作而同时分娩而导致的严重疾病,和一个正常分娩但是产妇有哮喘病史在出院记录诊断里出分不了;3)出院记录诊断并不能把所有的病到列出来,这样一些慢性疾病并没有记录上去,这样就会降低评估分数。总之,这样的评估系统有待更多的研究来完善。
麻醉科:
李韵平(美国哈佛医学院教学医院BIDMC产科麻醉部主任)
美国CDC将严重孕产妇并发症率和孕产妇死亡率一样, 作为医疗评估指标。近年的经验表明, 严重孕产妇并发症率已经广泛应用于产科质控、监测、临床研究。它是最有期望的质控指标。严重孕产妇并发症率是指孕产期影响孕产妇近期和远期健康的严重疾病或并发症的发生率。严重孕产妇并发症率的分母是每1万在医院分娩的产妇。CDC严重孕产妇并发症率的分子是21种合并症和并发症总和[附表1]。
附表1. 21种CDC严重孕产妇并发症 | |
急性心肌梗塞 动脉瘤 急性肾衰 成人呼吸窘迫综合征(ARDS) 羊水栓塞 心脏停搏或室颤 心脏除颤 DIC 子痫 心衰 脑血管意外 | 肺水肿或急性心衰 严重麻醉并发症 败血症 休克 镰刀状细胞病急性发作 血栓或者气栓 血液成分输血 子宫全切 气管切开 呼吸衰竭需要呼吸机 |
美国CDC从1993年开始监测严重孕产妇并发症率。然而,严重孕产妇并发症率在美国逐年增加[附图1]。增加的最主要的原因是由于产科出血增加导致的输血增加。如果排除输血(绿色的线条),也即-非输血性严重孕产妇并发症率,最近10年却没有明显的增加。羊水栓塞、DIC、血栓的发生率基本持平。急性心衰、肺水肿、脑血管意外、心脏停搏、子痫则明显减少;麻醉严重并发症减少最多,占首位(-87%) 。
斯坦福妇产科的Stephanie Leonard医生以及同事认为,孕产妇的基础疾病可以明显增加严重孕产妇并发症的风险,也即- 如果某医院收治转院的重症孕产妇,该医院严重孕产妇并发症率将会明显增加; 相反,基层医院的严重孕产妇并发症率则会减低。作者认为有必要对严重孕产妇并发症率进行调节,增加在医院之间的可比性。作者在Elixhauser 和Bateman 产妇基础疾病评分系统的基础上,提出了广义产科合并症评分系统(Expanded Obstetric Comorbidity Score System), 旨在提高严重孕产妇并发症率在全国水平的可比性。
附表2. 加州2016-2017年92万分娩的产科数据库 | |
严重孕产妇并发症率 | 168/10000 产妇 |
不包括输血的严重孕产妇并发症率 | 74/ 10000 产妇 |
从附表2 可以看出, 50% 以上的严重孕产妇并发症是输血事件。所以,增加出血倾向的疾病明显增加严重孕产妇并发症率。
附表3. 27种广义严重孕产妇合并症 | |
孕产妇≥35岁 剖宫产史 产前贫血 妊娠糖尿病 早产(<37周) 子痫前期无严重特征或妊娠高血压 胃肠疾病 重大精神健康疾病 急性或中度重度哮喘 产时BMI≥40(kg / m2) 带严重特征的先兆子痫 毒品滥用 慢性高血压 出血性障碍 | 神经肌肉疾病) 双胎或多胎妊娠 先前存在的糖尿病 胎盘早剥 妊娠前心脏病 前置或完全胎盘胎盘 甲状腺机能亢进 减肥手术史 慢性肾脏病 结缔组织或自身免疫性疾病 植入性胎盘 肺动脉高压 艾滋病毒或艾滋病 |
作者提出的广义产科合并症评分系统包括了27种疾病[附表3],进行严重孕产妇并发症相关性比较。
附表4. 严重孕产妇并发症高风险疾病发生率和它们的相对风险评分 | ||
发生率 | 相对风险评分 | |
胎盘植入 | 0.12% | 59 |
肺动脉高压 | 0.02% | 50 |
慢性肾脏疾病 | 0.22% | 38 |
既往出血性疾病史 | 2.1% | 34 |
既往心脏疾病史 | 0.85% | 31 |
HIV、艾滋病 | 0.01% | 30 |
前置胎盘 | 0.58% | 27 |
严重子痫前期 | 2.7% | 11 |
双胎、多胎 | 1.7% | 20 |
胎盘剥离 | 1% | 18 |
附表4提示,合并这些疾病的产妇都是高风险产妇。但它们的发生率相对较低。
附表5. 最常见的基础疾病和它们的相对风险评分 | ||
发生率 | 相对风险评分 | |
高龄产妇 > 35岁 | 22.2% | 2 |
剖宫产史 | 18% | 4 |
既往贫血史 | 12% | 20 |
妊娠期糖尿病 | 9.5% | 1 |
早产 < 37 周 | 8% | 18 |
轻型子痫前期 | 8.5% | 11 |
附表5是最常见的基础合并症。高龄产妇和糖尿病常见,可喜的是它们严重孕产妇并发症的风险很低。相反,特别值得注意的是,贫血、早产、轻型子痫前期,它们常见而且严重孕产妇病残率风险高。我们对这些疾病不要掉以轻心。
读者应该注意到,如果将轻型和重型子痫前期合并相加,子痫前期总的发生率为11.2%, 风险评分为总和为22. 可见子痫前期是预防治疗的重点。
另外,通过广义产科合并症评分系统可以计算综合评分。如果既往心脏疾病史的孕妇在双胎的情况下,她的严重孕产妇病残率风险评分是叠加的31+20 = 51,非常危险的情况。
需要强调的是,胎盘植入和肺动脉高压是严重孕产妇并发症风险最高的疾病。
5.知识点回顾
诊断试验和受试者工作特征曲线
(Receiver Operator Characteristic Curve, ROC)
胡灵群,石海霞
作为一名临床医护工作者,大家天天遇到疾病的诊断。教科书里往往罗列了一串临床症状、体征、实验室影像学检查,最后来一段诊断、鉴别诊断,显然最后需要有个诊断,然后开始治疗。细菌性疾病比较容易,培养阳性,什么细菌就是什么细菌性疾病。但有些模棱两可的东西就麻烦了。大家或许还记得医学院学系统性红斑狼疮时诊断标准的概念。诊断标准显然不是专家确定的。是怎么来的?我们怎么知道它的准确性如何?这就是这篇文章中的一个主要统计学现象,诊断试验和受试者工作特征(Receiver Operator Characteristic, ROC)曲线及其相关概念。
诊断标准、筛选标准、预测指标都是同一类问题。这种标准的建立一定需要有个“金标准”衡量。这篇文章选择了出院时的严重并发症作为“金标准”,以往“文荟谭┃我国产妇剖宫产术后阴道分娩的预测模型”的“金标准”则为最后通过剖宫产术后阴道分娩成功出生[见下文微信链接],系统性红斑狼疮可能是病理证据和病程轨迹等。通常将结果判断(诊断标准的确诊、筛选结果的阳性、预测结果的准确)设为是与非的二分类问题(binary classifier)。也因为这样,建立统计学预测/诊断模型通常使用逻辑(logistics)多项回归模型。其结果也就是统计模型的Y值,0则非,1则是。由于所建模型的X值,预测或诊断要素对结果Y值的贡献或影响力并非平等,每个X前的系数便是表示所起作用的大小。
最后建立的预测模型或诊断标准得出的结果和“金标准”之间的比较是由计算所得的敏感性和特异性判定模型优劣。由于计算上的“对抗性”,一个高,另一个就得低,让模型优劣判断比较困难。近来使用了接收者操作特征(receiver operating characteristic,ROC)曲线下面积(Area Under the Curve,AUC)来表示,让其变得简单直观。
诊断试验,这篇文章是预测结果(严重孕产妇并发症)需要被评价其方法的优劣。该类模型常常涉及到很多基本概念,常用评价指标包括灵敏度、特异度、真实性、可靠性[1,2]。但连续的或有序分类变量检测结果难以单纯靠以上某一指标加以比较评价,而如何全面比较分析敏感度、特异度显得尤为重要。
附表6. “真假”混淆矩阵
由该表引申出一些重要的概念,如灵敏度/真阳性率/召回率=TP/(TP+FP), 特异度/真阴性率=TN/(TN+FN)[附表6],但如何兼顾灵敏度、特异度和临界值的选择,答案就是ROC曲线和AUC[1-3][附图2][附图3]。
在获得ROC曲线后,便可轻而易举计算出 AUC,AUC可反映诊断试验的价值,换言之其能评价分类情况下预测模型的好坏[1]。AUC取值范围在0.5-1之间,AUC=0.5说明模型预测效果最差,类似抛分币,5-5开。ROC曲线图中虚线表示AUC=0.5[1,2],我们可以通过实际AUC与0.5进行直观简单的比较,看出预测效果。
AUC值越接近于1说明预测模型效果越好,当AUC<0.5时,需要反向预测,以增加预测的准确度[1-4]。广义产科合并症评分系统预测分娩住院期间严重孕产妇并发症率和非输血的严重孕产妇并发症率的ROC曲线见图1[5],前者AUC为0.78,后者AUC为0.84,说明广义严重合并症评分系统预测价值较高,该方法临床值得借鉴推广[附图2]。
如何判断试验的临界点,初筛要求高敏感度,而涉及到确诊需要高的特异度,进而综合评价诊断试验的效果,ROC曲线和AUC的评价效果显而易见。总而言之,对于诊断试验,ROC曲线帮助选择判断出最好的阈值,通过限定横轴的取值范围,纵轴值越接近1则是诊断试验最佳的截点。AUC非常适合评价样本不均衡的二分类变量模型的好坏。
此外值得一提的是,除了常用的诊断方法,临床研究中最常见的用于疾病诊断、预测和预后的生物标记物也常常需要进行ROC曲线分析,通过以图形方式显示灵敏度(真阳性率,回召率)和(假阳性率,误诊率)1-特异度之间的取舍,来评估具有连续结果测试的诊断准确性和直观性[6]。ROC分析应用于生物标志物进行诊断研究时,需要结合临床进行评判。
文章中提到使用的精确率-回召率曲线( Precision-Recall Curve, PR曲线)也是一种衡量一个预测模型/诊断标准的方法。相对于ROC曲线的真阳性-假阳性间的关系,PR曲线是通过灵敏度(真阳性率,回召率)和正确率(PPV=Positive Predicting Value=TP/(TP+NP))来审视模型的优劣[附表5][附图3][7]。
(a)和(c)为ROC曲线,(b)和(d)为Precision-Recall曲线。(a)和(b)展示的是分类其在原始测试集(正负样本分布平衡)的结果,(c)和(d)是将测试集中负样本的数量增加到原来的10倍后,分类器的结果。可以明显的看出,ROC曲线基本保持原貌,而Precision-Recall曲线则变化较大[8]。
参考资料
1
Hajian-Tilaki K. Receiver operating characteristic (ROC) curve analysis for medical diagnostic test evaluation[J]. Caspian journal of internal medicine, 2013, 4(2): 627.
2
Greiner M, Pfeiffer D, Smith R D. Principles and practical application of the receiver-operating characteristic analysis for diagnostic tests[J]. Preventive veterinary medicine, 2000, 45(1-2): 23-41.
3
Crichton N. Receiver operating characteristic (ROC) curves[J]. Journal of clinical Nursing, 2002, 11: 134-136.
4
Kamarudin A N, Cox T, Kolamunnage-Dona R. Time-dependent ROC curve analysis in medical research: current methods and applications[J]. BMC medical research methodology, 2017, 17(1): 53.
5
Leonard S A, Kennedy C J, Carmichael S L, et al. An expanded obstetric comorbidity scoring system for predicting severe maternal morbidity[J]. Obstetrics & Gynecology, 2020, 136(3): 440-449.
6
Søreide K. Receiver-operating characteristic curve analysis in diagnostic, prognostic and predictive biomarker research[J]. Journal of clinical pathology, 2009, 62(1): 1-5.
7
维基百科: 灵敏度和特异度, Available at https://zh.wikipedia.org/wiki/%E9%9D%88%E6%95%8F%E5%BA%A6%E5%92%8C%E7%89%B9%E7%95%B0%E5%BA%A6 on 09/27/2020.
8
机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率. https://cloud.tencent.com/developer/article/1125619, Retrieved on 09/27/2020.
中文引用|张惠欣,杨志芬,石海霞,唐琳,王瑾,Anna Huang,郑勤田,罗国阳,李韵平,胡灵群. 文献评判┃广义产科合并症评分系统预测严重孕产妇并发症[J]. J NPLD-GHI. 2020 Oct 2;8(4):2.
英文引用|Zhang HX, Yang ZF, Shi HX, Tang L, Wang J, Anna Huang, Zheng QT, Luo GY, Li YP, Hu LQ. Journal Club: Journal Club: An Expanded Obstetric Comorbidity Scoring System for Predicting Severe Maternal Morbidity[J]. J NPLD-GHI. 2020 Oct 2;8(4):2.
Journal of No Pain Labor & Delivery
- Global Health Initiative
(ISSN: 2475-711X)
无痛分娩中国行杂志
免责声明:
本微信公众平台所刊载原创或转载内容不代表米勒之声的观点或立场。文中所涉及药物使用、疾病诊疗等内容仅供参考。
— END—
人点赞
人收藏
打赏
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!