CSA2023丨易斌教授：围术期大数据研究的设计和注意点

2023-11-20 10:07

围术期大数据研究的设计和注意点

围术期大数据研究的设计和注意点

陆军军医大学西南医院

易斌教授

75211700175662576

基于围术期大数据的预测类问题的算法应用

围术期预测类研究基本思路和实验设计

31391700175662795 69251700175662856

适用于围术期大数据预测类研究算法

线性模型
逻辑回归
朴素贝叶斯
决策树
支持向量机
集成学习（随机森林；自适应提升[Adaboost]；梯度提升决策树[GBDT]；极端梯度提升[XGBoost]）
神经网络（长短时记忆网络；深度残差网络）

围术期大数据目前已遇预警类研究的瓶颈

目前基本上都是预警类研究，高质量数据集支撑下单用深度学习可以有效预测围术期各种危重症的发生，然而技术逐渐被掌握，基于深度学习的预警类研究越来越内卷：一投就中，一投就拒。主要瓶颈包括围术期大数据的质量、问题鲁棒性问题（外部验证问题）、算法问题等。增加投稿命中率有如下建议：

研究目的的思路和内容的一致性；
模型的应用价值；
数据质量、代表性、样本量；
预测建模方法了解度；
推广应用性（解决鲁棒性）

预警类研究的瓶颈---数据质量

3351700175663455

围术期数据“鲁棒性”的影响：

73141700175663776

一家医院建模，另外医院作为外部验证惨不忍睹：“灵敏度、精确率、召回率、AUC”。三家医院的离散度巨大，尤其华西医院。

多中心/大样本公共数据库建模、单/多中心验证：未来方向

多中心/大样本的模型外部验证明显好于单中心模型：无论多中心外部融合验证、还是分别验证效果均佳，提示模型的“泛化性”更好。

围术期数据“鲁棒性”的影响：解决方法（数据壁垒+外部验证）

31391700175662795 19491700175664468

解决鲁棒性的最有效方法是多中心的融合数据联盟

多中心数据建模的推广性显著高于单中心；
多中心合作研究核心问题是解决数据壁垒；
多团队的联合攻关：互为研究参与者，从合作方拿走二级数据（而非原始数据，可以有效避免数据壁垒问题）。

可以预计AI的研究很快会代替RCT研究的同时，单中心的AI研究将被淘汰（内卷加深），而多中心/大样本建模、单/多中心验证是未来方向。多中心/大样本的模型外部验证明显好于单中心模型，目前本团队正在进行的一项利用术前指标预测术后呼吸并发症的研究，涉及的三家医院分别进行了单中心外部验证，效果较好，提示模型的“泛化性”良好。

围术期大数据算法瓶颈：很多团队的瓶颈

1. 基于围术期大数据的算法概述及分类

传统机器学习的算法：k近邻、线性模型、决策树、朴素贝叶斯、逻辑回归、支持向量机以及集成学习等
深度神经网络算法：前馈神经网络、卷积神经网路、递归神经网络等
强化学习算法：蒙特卡罗、时间差分、Qlearning、DQN等

2. 算法研究：算法创新+算法策略优化

3. 围术期大数据算法创新（集成创新）

4. 围术期大数据算法策略优化方法

梯度下降法（最简单、最常用）

➢ 随机梯度下降

➢ 小批量梯度下降

➢ 提前停止

牛顿法和拟牛顿法

共轭梯度法

启发优化法

5. 研究团队的持续性/生命力

6. 研究亚领域往往周期短：数据研究→算法研究

7. 优势学科：影像学、肿瘤、眼科等基本上都是算法研究

8. 围术期大数据：预警类的研究

算法研究：明显提升效果

围术期大数据的特点需要算法研究
算法应用效果较差的时候，可以进行算法研究提升效果
算法集成创新+梯度下降法

强化学习提高预测模型效果

强化学习（Reinforcement learning，RL）是机器学习的子领域，目前外科领域高度关注RL。只有强化学习框架下的深度学习，才能实现多目标优化的医疗决策研究。例如，把某项疾病（比如冠心病患者的围术期管理）的治疗用药过程、阶段效果以及最终结局告诉RL，达到一定的例数后，会返给你目前样本量下最优结局下的最优用药方案。

强化学习常用贝叶斯网络(Bayesian networks，BNs)和马尔可夫决策过程(MDP)建模和解决，其中BNs主要用于处理简单低维的问题如病人情况良好的简单手术类型，而MDP的高维复杂数据有先天优势，可用于复杂手术类型和危重患者。我们团队开发了一种自我监督因果特征强化学习方法用于非侵入性血红蛋白预测。

背景：贫血状态下的眼结膜HB预测效能亟待提高（1.9g）；
强化学习的自我监督因果特征来提高模型预测性能（1.19g）；
该模型可用于移动部署和健康自我筛查。

在线设计工具

30031700175665475

基于围术期大数据的辅助医疗决策支持类问题

做正确的医疗决策难，围术期麻醉管理中动态、持续做正确决策更难。相比预测类研究，决策类研究难度急剧上升。

52421700175665818 31391700175662795

基于围术期大数据的辅助医疗决策支持类问题的算法应用：

围术期辅助医疗决策支持类研究基本思路

96101700175666105

适用于围术期大数据辅助医疗决策支持类研究的算法

◆ 决策树

◆ 长短时记忆网络

◆ 生成对抗网络

◆ 条件随机场

◆ 强化学习

➢ 贝叶斯网络

➢ 马尔可夫决策过程（MDP）

➢ Qlearning（MDP的早期版本）

➢ 蒙特卡罗

➢ 时间差分

➢ DQN

强化学习的应用前景：

强化学习（Reinforcement Learning，RL）是机器学习的子领域，目前外科领域开始高度关注RL。只有强化学习框架下的深度学习：才能实现多目标优化的医疗决策研究。例如，把某项疾病（比如冠心病患者的围术期管理）的治疗用药过程、阶段效果以及最终结局告诉RL，达到一定的例数后，会返给你目前样本量下最优结局下的最优用药方案。

强化学习常用贝叶斯网络（Bayesian networks，BNs）和马尔可夫决策过程（MDP）建模和解决。其中BNs主要用于处理简单低维的问题如病人情况良好的简单手术类型，而MDP的高维复杂数据有先天优势，可用于复杂手术类型和危重患者。

决策类研究越来越受到重视：

麻醉学的围术期管理必须关注多目标决策优化。自2021年起，外科学开始高度关注多目标优化，包括循环管理、容量管理、麻醉深度管理、手术方式、基础疾病管理、疼痛管理、心理管理等。单目标的优化，可能有不可控的结果（例如某项研究：阿片类药物为目标，对疼痛满意度提高6%，然而术后安全事件显著增加）。

需要注意的是，目前ERAS研究遇到重要瓶颈：

ERAS措施太多，有过度嫌疑：明显加重医护工作量、浪费资源；期望去除“无效”部分；
ERAS的RCT研究都是单目标优化：传统RCT研究无法完成多目标优化（分组问题），需要新的研究方法；
多目标优化研究可能有不同的结果；各ERAS措施之间，可能存在明显相互影响；
一些措施可能缺乏循证医学证据，一些简单有效措施也可能被忽略；
重要词汇：林毅夫-合成谬误：共同富裕、防疫、碳中和、平台治理。

合成谬误（Fallacy of Composition）：由萨缪尔森提出，对局部说来是对的东西。仅仅由于它对局部而言是对的，便说它对总体而言也必然是对的，是一种谬误。在经济学领域中，十分肯定的是：微观上而言是对的东西，在宏观上并不总是对的；反之，在宏观上是对的东西，在微观上可能是十分错误的。

利用贝叶斯网络优化ERAS麻醉决策，可能是第一篇麻醉决策多目标优化领域的文章，筛选可能有争议的18个ERAS相关麻醉决策，期望形成综合ERAS措施推荐，主要结局指标包括住院时间、住院费用等。

我们团队关于术后脓毒症患者预防性使用肝素的最优方案研究

科学问题：迄今无预防血栓、减少补体激活、减少炎性因子相关的指导性具体用药方案（依据指南和专家共识）；
数据来源（MIMIC IV）506例术后发生脓毒症ICU患者，120例死亡；
State: SOFA评分5个状态；Action：以4h时间窗，u/kg/h

54361700175666278

研究结论：对于术后脓毒症患者，采用1.38-1.88ug/kg/h的肝素，可有效降低SOFA评分，利于患者的康复。该研究方法可以在复杂的不同病例、不同时段变化的治疗方案以及病情复杂变化中，有效找出最优化的个体化方案，常规RCT研究无法完成，因此具备较佳应用前景。

在围术期管理医疗决策中的应用前景：

全部参数实时动态的闭环，为麻醉用药机器人提供前期基础（目前的闭环（BIS+TCI）麻醉管理过于粗糙）（技术成熟；缺乏标注数据；专家知识替代是目前最好方法）
ERAS研究新领域：某些有争议的围术期管理措施/药物，怎么组合才是达到患者最早出院/费用最低?（团队研究技术基本成熟，高质量数据集是难点，欢迎合作）
重症患者围术期管理（目前的攻关重点，借鉴ICU和慢病领域）

新进展：大模型在围术期医学中的应用

基石模型（Foundation Models），也称大型语言预训练模型，是基于大数据打造的，具有庞大网络结构和大量参数的深度学习模型。基石模型起源于2017年Vaswani等人提出的Transformer模型：基于注意力机制，具有并行运算和高可扩展性；2018年Google Al语言团队在其基础上提出BER模型：上下文理解能力和记忆能力。

Open AI团队发布GPT (Generative Pre-trained Transformer）模型：文本生成能力；
GPT-2：阅读理解和机器翻译等能力；
GPT-3：扩大模型规模（100倍），自然语言推理、零样本学习；
GPT-3.5：加入强化学习，对话能力（ChatGPT）；
GPT-4：再次扩大规模，支持多模态数据；

通用模型还包括谷歌GLam和PaLM，国内的“悟道”、“文心一言”。通用模型上直接开展专业应用的报道，等于“有一个外行帮你使用百度，再给你写一个报告”。大模型和普通模型区别：

常规模型需要标注，大模型的零样本学习不需要标注：目前只有大模型才能完成闭环麻醉管理；
常规模型为单任务，大模型多任务之间的知识迁移和共享表示：只有大模型支持多种风险的同时评估、风险预警和决策支持；
常规模型泛化性差；大模型零样本学习、多任务学习、分布式训练的方法（联邦学习）：只有大模型能最终解决模型的推广性问题；
不是构建大模型（目前国内很难有硬件条件完成），而是用大模型的技术。

围术期大数据势必推动麻醉学管理的进步

麻醉学的科学问题借助围术期大数据研究是必然趋势：可以完成RCT无法应用的研究，建议尽早介入；
随着研究的深入，围术期大数据研究越来越多，内卷严重，严谨的设计+多中心研究（工作量越来越大）；
特有规律和流程：建议找成熟团队帮带研究；
研究的难点在于高质量数据集：要么来自于知名数据库，要么提供足够的佐证证明数据的质量（投稿的关键）。

· 作者简介 ·

65591700175666736

易斌教授

陆军军医大学西南医院

教授，主任医师，博士研究生导师。

陆军军医大学第一附属医院（重庆西南医院）麻醉科主任。

中华医学会麻醉学分会委员；全军麻醉青年委员会副主任委员；重庆市医学会麻醉学分会副主任委员；重庆市医师会麻醉学分会常委。

重庆英才·创新领军人才，陆军科技英才，重庆医师协会“优秀麻醉医师奖”，陆军军医大学优秀研究生导师。

主持国家自然科学基金项目 5 项，主持国家重点研发计划、国家科技支撑计划分课题各 1 项、主持重庆市教改重点课题 1 项以及中国学位与研究生教育委员会等教学课题 4 项；重庆市课题 4 项；第一/通讯作者发表SCI 40 篇（TOP 6 篇，最高分 17.649）；参加了“北京小汤山抗击非典”、“汶川抗震救灾”、“2020年武汉抗疫”“2022年上海抗疫”等。