首页
快讯
关注
资讯
- 健康
- 科技
- 热点
- 视频
- 产业
- 政策
- 护理
- 投资
- 医改
- 养老
- 疫情
- 人物
- 医保
- 疾病
- 管理
- English
- 临床
- 心血管
- 肿瘤
- 内分泌
- 妇儿
- 感染
专题
专区
知识

欢迎登录体验更多功能

搜索

通过处理临床记录对DRG进行早期预测并估计住院成本

2022

05/17

MEWS矩阵

A-

A+

应用基于NLP的模型来估算基于DRG支付的医院成本是可行的。

全文2413字，欢迎关注！

背景介绍

卫生保健支出已成为各国支出的重要组成部分，许多卫生系统面临着提高效率和提供可持续保健的挑战。成本监测和管理对医院保持财务竞争力以及提供高质量的护理至关重要。

现有研究从付款人的角度对医疗费用进行预测，而本文搭建了一个可以绕过繁琐的编码过程的自动系统，基于良好表征的患者数据预测病例级DRG，并在人群水平上估算预期费用，尽管存在误差，但它允许医院在早期仅使用常规数据预测资源使用情况，并据此做出决定，更好地分配资源。

数据集与预处理

患者记录包括护理笔记、医生笔记、放射学报告和其他笔记；不包括出院总结在内的后期创建的报告。

医院就诊记录满足以下条件：18岁以上仅涉及一次ICU就诊，48HPA窗口期间至少有一个临床记录（HPA表示进入ICU的相对时间，HPA为负表示进入ICU前时间），可用官方DRG规则唯一编码，且编码不与新生儿或治疗后相关。

每个病人从入院开始收集，按记录时间连接成患者的单个文本字符串作为输入的临床文本数据。

模型介绍

本研究分别创建Medicare severity-DRG (MS-DRG)和all patient refined-DRG (APR-DRG)两个版本的DRG队列，使用卷积神经网络(CNN) 和CAML架构从早期常规临床文本中识别重要的诊断指标，并封装临床模式，再使用注意机制（attention mechanism）集中CNN特征，并将其修改为单标签DRG预测任务，将概率最高的代码作为DRG分组结果。最后根据分组得到相应的DRG权重，并估算患者群体的成本并预测CMI。

交叉验证

保留10%的数据作为保留测试集，其余90%的数据分成五个部分进行五次交叉验证、训练和调整独立模型的超参数。计算从五个模型的结果得到的平均值和标准差。

开发另一种使用结构化临床测量(如生命体征和实验室测量)的基于神经网络的模型，并将结果与分析临床文本得到的结果对比。

研究结果

评估DRG预测性能

84751652755638771

结果表明，检测更频繁的DRG时，检测结果进一步提高。同时，虽然结构化数据的表现较强，但基于NLP的模型始终优于使用结构化临床数据的模型(双侧t检验下p值< 0.01)，F1得分对比最强。

评估患者群体基于DRG的成本估算

1. 计算绝对CMI误差：(预测的CMI-真实的CMI)/目标人群真实CMI。

2. 不同HPA对CMI预测的影响

计算不同HPA的CMI误差，结果如下如所示。

36321652755639212

结果表明，在进ICU前后（+-6HPA）CMI预测得到显著改善，24 HPA CMI的错误为2·40(1·07%)和12·79%(2·31%)，而在48 HPA趋向于稳定。

3. 人口规模对CMI预测的影响

对测试集中的患者进行下采样，随机抽取20个替换亚组，得到100个相同大小的亚群，并应用交叉验证中获得的五个模型中的一个来预测CMI，并计算两种DRG类型在24和48 HPA时的平均CMI和95%置信区间(CI)。

4201652755639320

上图表明，在24 HPA时，不同队列规模下，MS-DRG模型和APR-DRG模型的CMI误差分别在8·0%和15·0%以下。此外，48HPA的预测往往优于24HPA的预测。

成本估计

通过从每个DRG测试集随机抽取500个住院病例，得到预测的CMI。在基本支付率为6000美元的假设下估计医院基于DRG的支付金额。

94961652755639814

从上图可以看出，模型在开始时倾向于低估人口支付，并逐渐变得更加可靠，MS-DRG接近真实支付金额，APR-DRG稳定在稍低的水平。

研究讨论

该研究表明，应用基于NLP的模型来估算基于DRG支付的医院成本是可行的。使用临床文本进行DRG预测的效果始终优于单独的临床测量，证明挖掘临床文本来支持决策是有价值的。该模型在个体病例上的错误相互抵消从而降低了总体CMI误差，且患者规模发生变化时，模型仍然稳健。

该建模方法在不同的DRG系统上具有灵活性，可以推广到其他分组结构和权值相似的DRG。此外，该模型跳过DRG分类步骤，直接学习以真实数字预测患者成本，因此可以将成本建模策略推广到DRG以外的场景。

该模型得到的最常见的三个主要诊断类别(MDCs)是：循环系统(05)、神经系统(01)和呼吸系统(04)的疾病和紊乱。MS-DRG的表现总体优于APR-DRG，这可能是因为APR-DRG具有更细粒度的预测目标(1136 vs. 738)。

局限性

数据只来自于美国一家医疗中心，数据集在位置和患者代表性方面存在局限性，方法的有效性有待于基于其他数据集的研究。

由于数据去识别， DRG权重没有映射到确切的财政年度。

该模型只处理了常规的临床记录，而没有考虑ICD编码。

在少镜头和零镜头学习场景下，DRG的本体结构可以帮助处理罕见DRG的信息。

仅通过预测DRG而没有针对医院来估计医院成本。

考虑用独立的模块为不同类型的临床文本建模，且输入长度变短又有助于BERT等模型取得更好的表现。

建模方法仍有待改进，以在个体水平上做出更准确的DRG预测。

由于ICU患者的急性病情更具动态性和可预见性，且重症监护通常比其他住院患者产生更多的可学习数据，将该模型用于模拟其他住院患者时，需要进一步探索输入数据和预测因子的选择，权衡疾病严重程度和不同患者群体数据的可用性。

参考文献：

[1] Liu J , Capurro D , Nguyen A , et al. Early prediction of diagnostic-related groups and estimation of hospital cost by processing clinical notes[J]. npj Digital Medicine, 2021, 4(1):103.

声明：MEWS矩阵所刊载内容之知识产权为MEWS矩阵及相关权利人专属所有或持有。未经许可，禁止进行转载、摘编、复制及建立镜像等任何使用。