医院如何评测 AI 临床应用与运行效果?《医疗机构部署DeepSeek专家共识》发布
据统计,目前全国已有百余家三甲医院实现DeepSeek本地化部署,但在实施过程中,普遍面临技术认知断层、实施路径模糊等挑战。
医疗行业具有其独特的专业性与敏感性,每一项数据都与患者的隐私以及生命健康权益息息相关。因此,当医疗机构考虑引入DeepSeek等人工智能技术时,务必要进行周全、严谨的规划。在此背景下,《医疗机构部署DeepSeek专家共识》(简称《共识》)于3月29日正式对外发布。
《共识》由北京卫生法学会大数据互联网人工智能医疗专委会联合中国生物医学工程学会医学人工分会法律伦理专家组共同制定,系近30家国内顶尖医疗卫生及学术研究机构的医疗、医院管理、医学信息、卫生政策、法学、医学伦理等领域专家根据国内外相关法律法规及医疗机构实践总结出的医疗机构部署DeepSeek的详细指南,旨在为医疗机构提供科学、规范且安全的部署指南,确保包括但不限于DeepSeek等人工智能技术在医疗领域的应用既能契合医疗行业特性,又能切实推动医疗服务水平的提升。
《共识》系统规范了AI在医疗场景的部署流程,强调通过技术标准化与风险管控,提升诊疗精准度,保障患者隐私安全。据《共识》起草组召集人、中国医学科学院医学信息研究所医疗卫生法制研究室主任曹艳林向健康界介绍,《共识》从医疗需求适配性、技术能力与基础设施、法律法规与伦理风险、数据准备与管理、模型选择与优化、系统集成与培训、性能监测与持续优化、风险管理与应急处置、合规审查与评估等多个维度提出系统性部署框架,旨在为AI「落地」医疗场景提供标准化路径。
比如,在医疗需求适配性评估方面,《共识》提出应正视DeepSeek的局限性,充分考虑幻觉、错误等情况,在诸如处方、诊疗方案、最终签署病历、报告等场景,务必审慎实施,客观认识DeepSeek生成的内容仅作为辅助,最终仍需有资质的医务人员确认,最大限度确保医疗安全。
《共识》从部署前的评估、部署过程实施、部署后管理与监测三个方面详细阐述了医疗机构在引入DeepSeek时应考虑的关键因素。针对AI「落地」医疗场景的关键环节,《共识》提出三点明确要求:
一是开展医疗需求适配性评估,重点针对不同科室临床痛点定制解决方案;
二是强化数据质量与基础设施建设,强调原始病历数据的专业化处理与安全保护,遵循「患者隐私信息最小化」原则;
三是建立全流程法律法规与伦理风险审查机制。
《共识》对部分场景的应用规则提出了详尽的案例参考。如在模型适配调整方面,《共识》以心血管疾病高发的医院为例,指出可对模型中与心血管疾病诊断相关的参数与结构优化,通过增加特定疾病特征权重、调整神经网络层数与节点数,使模型更精准识别心血管疾病影像特征与临床指标,提升诊断准确性与预测精度。
在与医院现有信息系统集成方面,《共识》提出DeepSeek系统应与现有系统无缝集成,实现数据自动流通与共享。医生在电子病历系统(EMR)查看患者病历信息时,可直接调用DeepSeek辅助诊断功能,系统自动从实验室信息管理系统(LIS)获取检验结果,从影像归档和通信系统(PACS)调取影像资料,经DeepSeek分析后,将诊断建议直接反馈至EMR系统界面,为医生提供一站式服务,提升医疗工作效率与连贯性。
值得注意的是,《共识》提出医疗机构应构建全面、科学的性能监测指标体系,这是评测DeepSeek运行效果的关键。在模型准确性方面,应定期统计模型诊断结果与金标准诊断(如病理诊断结果、专家会诊结论等)的一致性比例,衡量模型诊断正确性。随着医疗技术发展与疾病谱变化,医疗机构应定期更新模型,纳入新医疗数据与临床知识,如出现新疾病亚型或治疗方法时,将相关数据加入训练集重新训练模型,使其适应医疗实践新需求。
据《共识》起草组核心成员、北京清华长庚医院执行长柳玉倩向健康界介绍,AI 模型凭借对海量病例的持续学习能力,能够为医生提供有力辅助,助力医生更快速、准确地识别病征。不过,在这一过程中,严格监控数据使用边界至关重要,只有这样才能在充分发挥AI模型优势的同时,切实保障数据安全。
「医疗机构的AI部署涉及医疗业务、技术、法律、伦理等多个层面协同推进。唯有严格部署前评估、科学部署过程实施以及完善部署后管理与监测,才能充分发挥其在医疗领域的优势,为提升医疗服务水平、保障患者健康提供有力支撑。」曹艳林表示,下一步,《共识》将紧密结合临床实际反馈,不断进行优化迭代,使其更加贴合医疗实践的需求,持续为医疗机构提供有效指导。
扫码▽ 即可获取AI课程回放和思维导图
成为讲师/评委,加入医项目和主题社群
医疗机构部署DeepSeek专家共识
以DeepSeek为代表的前沿人工智能技术,正为医疗领域带来变革性机遇,在提升医疗服务品质、革新管理流程等方面展现出巨大潜力。但医疗行业因其专业性与敏感性,数据涉及患者隐私与生命健康权益[1],医疗机构在引入DeepSeek时,必须进行严谨规划与精准执行。《共识》旨在为医疗机构提供一套科学、规范且安全的部署指南,确保技术应用既能契合医疗行业特性,又能切实推动医疗服务水平的提升[2]。
部署前评估
1.1 医疗需求适配性评估
临床应用场景梳理:深入剖析医院各科室的业务流程,精准定位DeepSeek的应用场景。
例如在影像科与心电图室,DeepSeek能够凭借先进的多模态图像及信号识别算法,快速识别X光、CT(计算机断层扫描)、MRI(磁共振成像)、心电图等影像中的异常特征,如肿瘤、骨折、心血管病变、心律失常等,并以直观的方式标注出来,为医生提供诊断参考,极大提高了诊断效率,避免因工作量增加所引发的医疗错误等。
临床科室病历书写工作烦琐,DeepSeek可根据患者诊疗信息,自动生成结构化病历框架,涵盖基本信息、主诉、现病史、体格检查、辅助检查结果、诊断及治疗方案等关键板块,大幅减少医生书写时间,让其能将更多精力投入患者诊疗中。
此外,针对中国医生临床工作繁重,DeepSeek可协助整理复杂患者烦琐的病情资料,如历史病历、检查、检验等,将其按时间线进行罗列及归纳梳理,同时借助高质量知识库,DeepSeek可根据特定患者的临床信息,整理相关医学知识、资讯乃至最新研究成果,帮助医生提高诊疗效率[3]。
但值得注意的是,DeepSeek模型的高效运行高度依赖高质量医疗数据。医院现有医疗数据的规模决定了模型学习的广度与深度,大规模数据能让模型接触到更丰富的病例类型,提升对复杂病情的处理能力[4]。
数据质量至关重要,准确、完整、一致的数据是模型输出可靠结果的基础。数据的多样性也不可或缺,涵盖常见与罕见病例的数据,有助于模型全面学习疾病特征,避免因数据偏差导致误诊或漏诊。例如电子病历系统中的诊断、检验检查结果等数据,应经过整理与预处理,顺畅对接DeepSeek的训练与应用模块。
除此之外,还应正视DeepSeek的局限性,充分考虑幻觉、错误等情况,在诸如处方、诊疗方案、最终签署病历、报告等场景,务必审慎实施,客观认识DeepSeek生成的内容仅作为辅助,最终仍需有资质的医务人员确认,最大限度确保医疗安全。
1.2 技术能力与基础设施评估
信息技术团队能力评估:信息技术团队是DeepSeek部署与后续维护的核心力量。团队成员对人工智能技术的理解深度与掌握程度,直接关系到部署工作的成败。
在算法应用方面,团队需熟悉深度学习、机器学习等主流算法原理,能根据医院业务需求合理选择并调整算法模型。
在数据处理上,要具备清洗、标注、存储与管理海量医疗数据的能力,确保数据质量与可用性。
在系统维护阶段,需拥有快速定位与解决系统故障的能力,保障DeepSeek系统稳定运行。只有具备这样一支技术过硬的团队,才能在部署过程中顺利完成技术选型、参数配置及后续优化[5]。
硬件设施评估:深度学习模型的训练与推理运算涉及海量数据处理与复杂数学计算,对硬件资源要求极高。
医院现有服务器的计算能力,尤其是CPU与GPU性能,直接影响模型训练与推理速度。高性能GPU服务器能大幅加速模型运算,使DeepSeek可在短时间内完成大量影像分析或复杂病情预测。存储设备须具备大容量与高可靠性,以存储海量医疗数据及训练好的模型文件。
网络带宽要稳定且高速,保证数据传输不延迟、不中断,例如在远程会诊中,高速网络能确保患者影像数据快速传输至DeepSeek系统并及时返回辅助诊断结果,提升会诊效率[6]。
1.3 法律法规与伦理风险评估
合规性审查:全球范围内,医疗数据保护与人工智能应用相关法律法规日益完善。《中华人民共和国数据安全法》[7]《中华人民共和国个人信息保护法》[8] 《中华人民共和国网络安全法》[9]明确规定了数据和个人信息处理者的安全保护义务,医疗机构在处理患者数据和敏感个人信息时,必须采取严格安全防护措施,防止数据泄露、篡改与滥用。欧盟《通用数据保护条例》(GDPR)、美国《健康保险流通与责任法案》(HIPAA)也对医疗信息隐私与安全作出了规定。
医疗机构部署DeepSeek时,需依据这些法律法规,全面审查数据获取及使用流程,从患者数据采集环节确保获取明确知情同意,在数据存储与传输中采用加密技术保障安全,在使用阶段严格遵循最小必要原则,避免未经授权的数据处理[10]。如医疗机构与其他开发者合作进行Deepseek部署,应签订协议明确数据所有权归属、数据存储与访问限制、数据保密义务及数据泄露或算法缺陷导致的损害的赔偿责任等[11]。
伦理评估:医学伦理是规范医疗机构人员从业的重要准则,DeepSeek的部署与应用必须接受伦理审查。医院伦理委员会需从多维度评估其对患者权益与医疗公平性的影响。
在医疗决策辅助方面,要确保算法不会因数据偏差或设计缺陷,对不同性别、种族、经济状况的患者产生歧视,保障医疗资源分配公平[12]。例如在疾病筛查项目中,若DeepSeek模型因训练数据中某类患者样本不足,导致对该类患者疾病漏检率升高,将严重损害患者权益与医疗公平性。伦理委员会应通过细致审查部署方案,提出合理改进建议,确保DeepSeek应用符合伦理道德规范[13]。
部署过程实施
2.1 数据准备与管理
数据清洗与标注:原始医疗数据常存在噪声、错误与重复信息,严重干扰DeepSeek模型训练效果。数据清洗需运用数据挖掘与分析技术,识别并去除无效或错误记录,如在患者检验数据中,对超出正常范围且不合理的数值,通过与临床医生沟通或数据校验规则核实修正。
专业医疗人员的标注工作至关重要,在影像数据标注中,医生需准确标注病变位置、形状、大小、类型等信息,为模型提供精确学习样本。标注过程要建立严格质量控制机制,通过多人交叉标注、定期抽检等方式,保证标注结果准确一致。
数据安全与隐私保护:数据安全贯穿数据全生命周期。传输环节采用加密、备份、标签标识、访问控制、安全认证等技术措施和其他必要措施,对数据加密传输,防止网络传输中数据被窃取或篡改。数据库存储时,对患者姓名、身份证号、联系方式等敏感字段加密处理,即便数据库遭受攻击,敏感信息也不会泄露。
严格遵循最小必要原则,医疗机构向DeepSeek系统提供数据时,仅提供运行所需最少数据量,如疾病诊断模型训练,若仅需患者症状、检验结果等数据即可,就不应包含家庭住址、职业等无关信息,最大限度保护患者隐私[14]。
2.2 模型选择与优化
模型适配调整:不同医院医疗业务具有独特性,疾病谱分布、诊疗流程与临床实践习惯存在差异。需根据医院实际情况对DeepSeek模型进行适配调整。针对医院常见疾病,如心血管疾病高发的医院,可对模型中与心血管疾病诊断相关的参数与结构优化,通过增加特定疾病特征权重、调整神经网络层数与节点数,使模型更精准识别心血管疾病影像特征与临床指标,提升诊断准确性与预测精度。
模型验证与测试:内部测试环境需模拟真实临床场景,使用大量涵盖不同病情、不同患者群体的真实医疗数据。交叉验证是常用评估方法,将数据划分为多个子集,多次训练与验证模型,综合评估性能指标,如准确率、召回率、F1值等。
只有模型在各项性能指标达到预设标准,且在不同场景下表现稳定可靠,如不同类型疾病诊断、不同年龄段患者数据测试中均性能良好,才可投入临床实际应用。这一过程需反复测试优化,确保模型为临床医疗提供准确有效支持[15]。
2.3 系统集成与培训
与现有信息系统集成:医院现有的电子病历系统(EMR)、实验室信息管理系统(LIS)、 影像归档和通信系统(PACS)等构成医疗信息核心架构。DeepSeek系统与这些现有系统无缝集成,可实现数据自动流通与共享。医生在EMR系统查看患者病历信息时,可直接调用DeepSeek辅助诊断功能,系统自动从LIS系统获取检验结果,从PACS系统调取影像资料,经DeepSeek分析后,将诊断建议直接反馈至EMR系统界面,为医生提供一站式服务,提升医疗工作效率与连贯性[16]。
医护人员培训:医护人员是DeepSeek临床应用的直接使用者,其对系统的熟悉与正确运用能力至关重要。培训内容涵盖DeepSeek功能原理、操作方法及结果解读。通过理论课程讲解人工智能辅助医疗基本原理,让医护人员理解DeepSeek如何通过数据分析提供诊断建议。案例演示展示实际病例中DeepSeek应用效果,让医护人员直观感受其优势。模拟操作培训让医护人员在虚拟环境实践操作,熟悉系统界面与流程。
设置培训考核环节,通过理论考试与实际操作考核,确保医护人员掌握DeepSeek使用方法,能正确理解运用辅助诊断结果,避免过度依赖或错误解读,考核合格方可在临床工作中使用DeepSeek系统。
部署后管理与监测
3.1 性能监测与持续优化
建立性能监测指标体系:构建全面、科学的性能监测指标体系是评测DeepSeek运行效果的关键。模型准确性方面,定期统计模型诊断结果与金标准诊断(如病理诊断结果、专家会诊结论等)的一致性比例,衡量模型诊断正确性。
系统响应时间指标:监测医生输入数据到DeepSeek返回结果所需时间,一般要求数秒内完成响应,以保障医疗工作效率。资源利用率指标关注服务器CPU、GPU等硬件资源使用情况,确保系统高效运行同时不过度消耗硬件资源,避免资源耗尽致系统崩溃。通过实时数据采集与分析,绘制性能指标变化曲线,直观展示系统运行状态[17]。
持续优化机制:依据性能监测数据反馈,及时发现模型与系统问题并针对性优化。随着医疗技术发展与疾病谱变化,定期更新模型,纳入新医疗数据与临床知识,如出现新疾病亚型或治疗方法时,将相关数据加入训练集重新训练模型,使其适应医疗实践新需求。优化系统架构与算法,通过改进数据存储结构、优化算法流程等,减少系统运行资源消耗,缩短响应时间,确保DeepSeek始终以最佳状态支持医疗服务。
3.2 风险管理与应急处置
风险预警机制:搭建全方位风险预警系统,实时监测数据泄露、模型偏差、系统故障等风险。数据访问监控系统实时记录分析数据访问行为,一旦发现异常数据查询,如短时间大量下载敏感数据、非授权用户访问关键数据等行为,立即发出预警。模型性能监测指标波动也可预警模型偏差风险,当模型准确率、召回率等关键指标持续下降或异常波动,提示模型可能存在偏差,需及时评估修正。
通过设置合理风险阈值与预警规则,在风险初期及时发现并应对。应急处置预案制定:制定详细、可操作性强的应急处置预案是保障医疗服务连续性的关键。
数据泄露事件发生时,立即启动数据封锁程序,限制涉事数据访问权限,防止扩散,同时启动追溯程序,追踪数据泄露源头,查明原因。及时通知相关部门与受影响患者,提供补救措施,如身份保护服务、医疗信息安全咨询等。系统故障时,迅速切换至备用系统,若未配备备用系统,则立即启动人工操作流程,如影像诊断暂时采用人工阅片,确保患者诊疗不受影响。故障排除后,全面检测评估系统,确认无误后重新投入使用。
3.3 合规审查与评估
定期法律法规合规审查:法律法规不断发展,医疗机构需密切关注国内外医疗数据保护、人工智能应用相关政策法规变化。定期对DeepSeek应用进行合规审查,确保系统使用与数据管理策略始终符合最新法律法规要求。新数据安全法规出台后,及时对照法规条款,更新医院数据安全防护措施,如加强数据加密强度、完善数据访问权限管理等[18]。
伦理再评估:随着DeepSeek在临床持续应用,其对患者权益与医疗伦理原则的影响可能出现新问题。医疗机构应定期开展伦理再评估,收集医护人员实际使用反馈、患者意见建议,审视系统在医疗决策辅助、患者隐私保护、医疗公平性等方面表现[19]。针对可能出现的伦理问题,如算法偏见导致诊断偏倚、患者对数据使用担忧等,及时调整改进,保障医疗人工智能应用的伦理正当性与可持续性。
共识起草小组专家(排名不分先后)
曹艳林(中国医学科学院北京协和医学院)
王婧(清华大学附属北京清华长庚医院)
李昱熙(北京大学第一医院)
张怡(清华大学)
钟光珍(首都医科大学北京朝阳医院)
宋萍(重庆医科大学附属儿童医院)
共识参与讨论专家(排名不分先后)
刘宇(北京卫生法学会)
周辉(中国社会科学院法学研究所)
袁靖(中国医学科学院阜外医院)
柳玉倩(清华大学附属北京清华长庚医院)
陈政(北京协和医院)医务处
胥雪冬(北京大学第三医院)医务处
魏亮瑜(北京医院)
王将军(中日友好医院)
娄丹(北京大学国际医院)
刘星(中南大学湘雅医院)
王晓敏(中南大学湘雅三医院)
孙熹(华中科技大学同济医学院附属同济医院)
董来东(山东大学齐鲁医院)
丁勇(浙江大学邵逸夫医院)
左泽锦(四川大学华西医院)
刘爱华(首都医科大学北京天坛医院)
徐海林(北京大学人民医院)
匡泽民(首都医科大学附属北京安贞医院)
刘晓琴(北京地坛医院)
柴象飞(慧影医疗科技(北京)股份有限公司)
查滨(京东健康互联网医院)
姚宇轩(联想中国区)
[参考文献]
[1]国务院.网络数据安全管理条例[Z].2024-09-24.
[2]张梦莹,武春晶,尹晓迪.医院接入 DeepSeek 有期待亦有担忧[N].山西晚报,2025-03-11(005).
[3]全国人大常委会.中华人民共和国医师法[Z].2021.
[4]国务院.中华人民共和国人类遗传资源管理条例[Z].2024.
[5]国家互联网信息办公室,工业和信息化部,公安部,等.互联网信息服务算法推荐管理规定[Z].2021.
[6]国家互联网信息办公室,工业和信息化部,公安部.互联网信息服务深度合成管理规定[Z].2022.
[7]全国人大常委会.中华人民共和国数据安全法[Z].2021.
[8]全国人大常委会.中华人民共和国个人信息保护法[Z].2021.
[9]全国人大常委会.中华人民共和国网络安全法[Z].2016.
[10]国务院.医疗机构管理条例[Z].2022.
[11]中共中央办公厅,国务院办公厅.关于加强科技伦理治理的意见[Z].2022.
[12]国家卫生和计划生育委员会.涉及人的生物医学研究伦理审查办法[Z].2016.
[13]刘漫,沈鹏熠,张茹梦.人工智能技术在医疗护理中的应用研究[J].中国农村卫生事业管理,2025,45(3):177-182.
SUN M,SHEN P Y,ZHANG R M.Application of artificial intelligence technology in medical nursing[J].Chinese Rural Health Service Administration,2025,45(3):177-182.
[14]全国人大常委会.中华人民共和国基本医疗卫生与健康促进法[Z].2019.
[15]梅子仪.「AI+医疗」下一站走向何方[N].南方日报,2025-03-07(B03).
[16] 邹 锐 , 彭 雪 .DeepSeek 助 力 基 层 医 疗 「 智 慧 革 命 」 [N]. 绵阳日报,2025-03-04(003).
[17]国家卫生和计划生育委员会.医疗质量管理办法[Z].2016.
[18]国家互联网信息办公室.个人信息保护合规审计管理办法[Z].2025.
[19]国家卫生健康委员会,教育部,科学技术部,等.涉及人的生命科学和医学研究伦理审查办法[Z].2023.
[20] 卢 林 . 以 AI 为 翼 构 建 智 慧 医 院 高 质 量 发 展 新 范 式 [J]. 中国卫生,2025(3):21.
扫码报名AI讲师
欢迎医院、高校、企业人员报名!
对于公立医院/高校的讲师,有授课奖励!
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读