互联互通背景下医疗数据治理面临什么问题,如何治理?

中国数字医学姬卫东、李琳、张振、周毅

随着新医改的深入开展,医疗 卫生信息化进入了快速发展期[1]。 原国家卫生计生委员会发布的 《“十三五”全国人口健康信息化 发展规划》要求夯实人口健康信息 化和医疗健康大数据基础,推进互 联互通信息标准落地应用,消除信 息壁垒,畅通部门、区域、行业之 间的数据共享通道,探索健康医疗 大数据信息互联互通机制[2],其充 分体现了信息标准化、互联互通的 重要性已提升至国家战略高度。在 此背景下,良好的数据治理不仅是 医疗信息互联互通的前提,也是 医疗单位综合实力的侧面体现。 当前,国内外对于通用数据治理的 理论研究和治理实践已有一定的成 效,但针对医疗数据治理的研究尚 处于起步阶段,原因在于医疗数据 治理不仅要遵循数据治理的通用规 律与思路,也要考虑医疗信息互联 互通的特点。因此,本研究旨在医 疗信息互联互通的背景下,对目前 我国医疗数据治理存在的问题进行 分析,并提出针对性的建议。 

1.医疗数据治理概述 

医疗数据的构成较复杂,按数 据类型可分为疾病诊疗类、健康监 测类、管理和运营类、规则和知识 类四大类,各类数据涉及的内容非 常复杂[3],见表1 。

医疗数据除具 有传统大数据的数量大、种类多、 产生速度快等特点之外,还具有复 杂性、精确性、隐私性、异构性及 封闭性等特点。目前我国的健康医 疗大数据种类繁杂、标准不统一, 并且质量参差不齐,疾病相关数据 维度多、特性各异,隐私数据匿名 化处理需要加强。数据治理作为提 升数据价值的一种必要手段,在大 数据时代凸显出重要作用。 

目前业内关于数据治理的定义 仍未统一,常见的定义如下:数据 治理是对数据资产管理行使权力和 控制的集合,包括计划、监控和执行等[4];数据治理是在企业数据管 理中决策权和相关职责的分配;数 据治理是指更加严谨规范的信息质 量控制规程[5]。我国也有相关机构 定义数据治理的概念,主要包括以 下3点:数据治理要确保评估信息利 益相关者的需要,确保有效助力业 务决策机制和方向,确保对绩效和 合规的监督[6]。 

综上,数据治理首先需要由权 威机构对数据资产制订管理计划, 同时该机构对管理过程中的各环节 应具备控制力。但由于包括卫生主 管部门、医院、体检机构等多机构 及患者个人均存有数据,使得医疗 数据确权难以明确,而数据治理的 权威机构又缺乏相关规定,这就造 成了医疗数据相对的复杂性和分散 性[7]。因此,国家卫生健康委制定 了《国家健康医疗大数据标准、安全 和服务管理办法》,明确指出要在保 障公民相关权利的基础上,对我国公 民在我国境内所产生的健康医疗数据 加以规范管理和开发利用。 

2.互联互通背景下医疗数据 

面临的问题 从医疗信息互联互通的背景出 发,根据我国当前医疗机构在数据治 理方面的现状来看,医疗数据还存在 许多问题,主要体现在以下方面。 

2.1 数据的完整性不高 一方面由于 医疗机构信息系统相对独立,区域 卫生信息中心平台覆盖不全,而单 个医疗机构又获取不了患者的其他 社会环境信息[8],因而数据完整性 不高;另一方面由于部分医疗机构 追求诊断效率,导致医疗信息系统 使用不完全或业务未开展,从而造 成数据的不完整。例如,部分医院 门诊部患者数量多,门诊要求效率 高,诊间时间有限,导致了门诊电 子病历使用率低,造成诊疗数据的 缺失。 

2.2 数据的标准化程度不够 在临床 工作中,医师等在对信息系统的使 用中,出于对诊疗效率和诊疗精确 度的考虑,对标准化术语、名称等 使用不规范。例如,信息系统以标 准化字典与文本自由录入相结合 的方式实现门诊患者诊断下达功 能,但在自由文本录入的诊断中 出现“发热?”“发热待查”“I 期”“1期”等诊断,占比超过了 20%;数据清洗缺乏统一的策略, 从而降低了数据质量[9]。 

2.3 数据的准确度不够 由于大部分 医疗信息系统的自动化程度低,医 务人员在诊疗过程中需要手动录入 数据,可能出现原始数据错漏、不 完整等问题的出现。许多医疗智能 化设施如便携式生命体征测量设备 等,由于缺乏统一的度量与验证, 从而导致了采集数据的偏差;数 据采集设备容易受环境等其他因 素的干扰,从而造成数据缺失、 错误等。 

2.4 数据的整合性欠缺 由于缺乏统 一的元数据标准,数据整合困难; 同时,缺乏对主数据的统一管理, 对患者或医生医疗过程中的核心数 据实体难以进行唯一标识,因而无 法实时更新,大量数据以文本、图 像、影像等非结构化的形式存储, 这均使得数据后续整合与分析的难度 增加。基于上述情况,若将这些数据 集合起来,数据的可用性依旧很差, 每个字段的含义和取值范围无法明 确,想要使用简单的查询办法找到所 需数据也较为困难。 

2.5 数据的一致性差 造成医疗数据 一致性差的原因主要有两方面,一 是由于现有的医疗数据标准尚未完 全统一,健康医疗信息领域市场巨 大,医疗信息化厂商多,导致异构 数据源产出的健康医疗数据标准不 一致;二是主要体现在医疗机构内 部,各诊疗节点数据前后不一致, 数据指标统计方法不一致。 

2.6 数据的安全隐患大 网上预约诊 疗、健康检测设备的普及应用等必 然加大了健康医疗数据泄露的风 险,虽然业内已有相关的隐私保护 条例,但仍需要系统化地建立健康 医疗大数据安全防范措施。 

3.医疗数据治理对策 

医疗数据管理制度的完善,进 一步促进了医疗数据的完整性和标 准化程度。例如,针对医疗信息系 统使用不完全或业务未开展的问 题,可以以使用率、执行率为评价 指标进行定期考核,并纳入绩效考 核体系。改进门诊电子病历,提出 全级通用的门诊电子病历模板,同 时实现诊疗数据的自动带入、检查 检验报告快速引入、门诊病历复写 等功能,从而帮助门诊医师快速完 成病例,提升数据的完整性[10]。明 确的规范要求对医疗大数据的治理 极为重要,然而保障数据质量,做 好元数据管理、主数据管理、数据 生存周期的管理等工作同样重要。 

3.1 保障数据质量 医疗大数据的多源性和多样性使医疗数据变得复 杂,由于系统原因、人为原因造成 数据的质量问题使得数据的互联互 通出现问题,从而给医疗机构及患 者造成不利影响。因此,应从管理 技术、管理流程等方面对症下药, 提出全面的数据质量管理方法[11]。 

以医院医疗数据治理为例,通 过知识图谱、数据融合等关键技术 能够较好实现医疗健康数据的质量 控制[9],见图1。

针对医疗大数据存在的质量问 题,医疗机构和卫生行政部门须采 取必要措施进行质量控制。首先, 制订数据质量的管理目标与质量管 理标准,使各机构可结合标准对数 据质量进行分类管理,明确不同数 据之间的关系和依赖性;其次,建 立专门的数据质量管理机构并明确 管理机制,各环节管理责任到位, 开发流畅易行的数据质量管理方 法;第三,加大保障数据质量的相 关技术研发力度,促进数据质量管 理水平和数据质量的提升;第四, 识别数据生存周期各阶段中影响数据 质量的关键因素,以构建数据质量多 维度评估框架;最后,采用定性评 估、定量评估或综合评估等方法,评 估和持续优化数据质量。 

3.2 元数据管理 元数据是描述数据 的数据,其提供了主题域中识别、 定义和分类数据的方法。数据治理 成功的关键在于元数据的管理[12], 即赋予数据上下文和含义的参考框 架[13]。而对元数据标准进行高效应 用则是元数据管理的核心要求之 一。我国已颁布《卫生管理基本数 据集》等一系列医疗行业元数据标 准规范,但在实际应用过程中,常 无法落实到位,甚至还会出现错 用。因此,应当建立一种可以补充 这些标准并将不同的应用相互关联 的完善的元数据管理机制。该机制 的建立以知识图谱技术为依托,便 捷地对元数据的概念及概念层次、 属性及属性类型、关系及关系定义 域和值域进行定义,还可表示模式 层更复杂的约束关系。借助图结构 的表达能力,还可表达数据间的多 种相关关系,从而建立更加灵活的 数据约束条件[14],方便地表达和扩 充元数据。只有这样,才能将这些 元数据标准规范有效应用于医疗系 统中,更好地促进医疗大数据的治 理工作,利用医疗大数据资源为公 众服务。 

建立信息资源目录元数据库对 于管理数据资源也具有重要的意 义。目前,在国内这方面比较典型 的研究包括构建健康医疗大数据资 源核心元数据模型等[15]。用户可以 通过这些核心元数据了解到健康医 疗大数据资源的基本内容,便捷地 实现信息资源的定位、高效检索、 数据交换与管理。 

3.3 主数据管理 医疗数据的主数据 种类很多,包括患者数据、诊断数 据、药品数据、检验项目数据、科 室数据等。当前主数据管理有两个 问题有待解决。第一,如何构建患 者的主索引号,从而识别不同系统 中同一名患者不同ID之间的映射 关系,因为每个系统里都有独立的 ID。第二,患者的基本信息(如 年龄、性别等)同时存在医院各个 信息系统中,难免会存在数据填写 质量不一致或数据不能及时更新 等问题。因此,需要在定义系统 主数据的情况下,构建主数据管 理中央库,从而解决主数据的碎片 化问题。可以从各系统抽取数据, 进行数据融合,形成完备的主数据 信息,然后再将主数据信息分发给 各业务系统,保证各业务系统中这 些信息的准确性和完整性。形成公 共的重要属性由主数据管理系统管 理,各业务系统的特色属性由各系 统独立管理的模式[16]。 3.4 数据生存周期的管理 数据生存 周期管理是医疗数据治理的核心工作之一。一般包括大数据组织、现 状评估、制定大数据战略、数据定 义、数据采集、数据分析、数据呈 现、数据治理及持续改进,见图2。 虽然目前在针对医疗健康数据治理 的数据流及工作流的理解上已较为 成熟,但在实际管理操作过程中对 于细节的注重和把握还不够。 

因此,医疗机构应该明确定义 数据的生存周期,在不同的阶段制 定有效的管理策略,从而降低成本 与风险;确保数据生存周期各阶段 数据的保密性、完整性和可用性; 确保数据生存周期的管理符合法律 法规、行业监管等要求,保证数据 的获取合法、存储完整、整合高 效、分析有效、应用合规、归档可 靠和销毁完全等。

4.医疗数据治理的实践 

目前,国内有一些关于医疗数 据治理实践的典型案例[2]:①华西- 成华全科健康大数据管理平台的建 立解决了各信息系统间存在的孤岛 效应及无法进行有效的数据共享的 问题。通过对18家医疗机构现有的 HIS的原始数据元数据的管理、数 据模型元数据的管理以及主题数据模型元数据的管理及可视化工具开 发,从而实现更加便捷地了解区域 健康医疗大数据资产的分布情况及 其产生过程。②首都医科大学宣武 医院为解决院内数据质量冲突问 题、复杂数据的获取问题以及数据 治理过程中的数据安全保障问题, 从数据治理的顶层设计出发,抓住 数据治理重点,实现了不同就诊场 所、不同时间的患者及诊疗信息的 贯通,全院级别的影像数据统一管 理,在保证信息安全的前提下增强 各类临床数据的可及性。 

以上案例说明只有充分了解目 前医疗大数据总体存在的问题、医 疗大数据标准体系的构成以及存在 的缺陷,才能从数据治理的宏观层 面出发,提出更加准确和有效的治 理决策;在数据治理过程中也应切 记,数据治理着力点并非在于数据 本身,而是关于业务流程、决策以 及多方组织机构的相互协作。 

5.结语 

医疗数据作为医疗行业重要的 信息资源,如何对其进行高效的治 理、如何促进医疗信息的互联互 通、如何充分发挥其价值作用,已 成为目前医疗信息研究的热点。只 有充分了解目前医疗数据总体存在 的问题,了解医疗大数据标准体系 的构成以及存在的缺陷,才能从数 据治理的层面出发,提出更加准确 和有效的治理决策。 

本研究在医疗信息互联互通的 背景下,阐述了医疗数据的相关概 念与目前面临的诸多问题,提出了 多项优化医疗数据治理的对策,以 作之一。一般包括大数据组织、现 状评估、制定大数据战略、数据定 义、数据采集、数据分析、数据呈 现、数据治理及持续改进,见图2。 虽然目前在针对医疗健康数据治理 的数据流及工作流的理解上已较为 成熟,但在实际管理操作过程中对 于细节的注重和把握还不够。 因此,医疗机构应该明确定义 数据的生存周期,在不同的阶段制 定有效的管理策略,从而降低成本 与风险;确保数据生存周期各阶段 数据的保密性、完整性和可用性; 确保数据生存周期的管理符合法律 法规、行业监管等要求,保证数据 的获取合法、存储完整、整合高 效、分析有效、应用合规、归档可 靠和销毁完全等。 图2 大数据生命周期 4 医疗数据治理的实践 目前,国内有一些关于医疗数 据治理实践的典型案例[2]:①华西- 成华全科健康大数据管理平台的建 立解决了各信息系统间存在的孤岛 效应及无法进行有效的数据共享的 问题。通过对18家医疗机构现有的 HIS的原始数据元数据的管理、数 据模型元数据的管理以及主题数据 期促进医疗行业技术进步和服务质 量的提升。 

参考文献 

[1] 陈方平,袁洪,王安莉,等.互联互通标 准化测评对医院信息化的作用[J].中国 卫生信息管理杂志,2014,11(6):588-592. 

[2] 田烽,陈志强,邹志合.互联互通测评 工作中的信息化建设实践及应用[J].医 学信息,2021,34(3):29-30. 

[3] 浙江数字医疗卫生技术研究 院 .imit 白皮书 : 健康医疗数据治 理[ R / O L ] . ( 2 0 1 9 - 1 0 ) [ 2 0 2 1 - 9 - 1 3 ] .  http://www.imit.org.cn/data/upload/ portal/20210119/6006a8d185c5c.pdf. 

[4] SUSAN E.The DAMA guide to the  data management body of knowledge  (DAMA-DMBOK)[M].Bradley Beach:  Technics Publications LLC,2010:58-72. 

[ 5 ] A D L E R S . T h e I B M d a t a  governance council maturity model:  Building a roadmap for effffectve data  governance[J].IBM Corporaton:Somers,  NY,USA,2007. 

[6] 张明英, 潘蓉. 数据治理白皮书国际 标准研究报告要点解读[J].信息技术与 标准化,2015(6):54-57. 

[7] 王融.关于大数据交易核心法律 问题: 数据所有权的探讨[J].大数据,  2015(2):49-55. 

[8] 卫荣.健康医疗大数据质量治理研究[J]. 中国卫生质量管理,2020,27(3):5-8. 

[9] 阮彤,邱加辉,张知行,等.医疗数据治 理——构建高质量医疗大数据智能分析 数据基础[J].大数据,2019,5(1):12-24. 

[10] 叶全富,舒婷.基于电子病历系统的 医疗质量评价现状与趋势探讨[J].中华 医院管理杂志,2018,34(7):560-563.