我行我show!中国医院管理案例评选,医院卓越管理实践大秀场。
点击查看
(一)背景
随着社会的发展,人们对健康的理解越来越全面。健康不仅仅意味着生理上的无疾,还包括良好的心理状态和社会关系。制订生存质量测定量表是世界卫生组织为实现“人人健康”而实施的众多计划之一。近年来,世界上出现了不少健康测定量表,
但是大多数量表偏重于测量疾病的症状、残疾的程度,没有全面
地测定个体的生存质量,没有对健康进行全面的评价。另外,许多量表是由北美、欧洲等国家研制的,鉴于文化背景的不同、经济发展的差异,这些量表未必能直接应用于地球上的其他国家和地区。在这种情形下,研制一个对个体生存质量进行全面测定、能用于不同文化背景、测定结果具有国际可比性的量表便成为十分必要。按照世界卫生组织的定义,与健康有关的生存质量是指不同文化和价值体系中的个体对与他们的目标、期望、标准以及所关心的事情有关的生存状况的体验。这是一个内涵丰富的概
念,它包含了个体的生理健康、心理状态、独立能力、社会关系、个人信仰和与周围环境的关系94。在这个定义之下,生存质量
主要指个体的主观评价,这种对自我的评价是根植于所处的文化、社会环境之中的。根据上述定义,世界卫生组织研制了
WHO QOL-100量表,该量表包含100个条目,覆盖了与生存质
量有关的6个领域和24个方面,每个方面有4个条目,另外还包括4个关于总体健康状况和生存质量的问题。表6-3-1列出了WHOQOL-100的结构。第一稿,由两位医学卫生专家独立地将量表从
英文翻译成中文,第三位专家对翻译稿进行总结,形成量表的第
一稿。第二稿,由两个核心工作组分别就第一稿进行讨论。一个核心工作组由医师、护士和医科大学生组成,另
一个核心工作组由患者组成。经过讨论,对第一稿进行修改,形
成第二稿寄给世界卫生组织总部。此部分也包含了认知测试的内容。
3.逆向翻译
请一位具有较高专业造诣的英语教师把第二稿逆向翻译成英文,此人事先没有看过英文原稿。在翻译前向逆向翻译者说明量表的用途及结构,避免出现偏倚。
4.核心工作组
文原版进行比较,修改第二稿,形成第三稿。
5.反应尺度试验第四稿,请一组患者和医科大学生做应第三稿,由核心工作组对逆向翻译稿和英答尺度练习,根据结果修改应答尺度,形成第四稿。
6.“96中文版”
第四稿,在广东地区进行预调查,根据预调查结果对第四稿进行修改,形成WHOQOL-100广东版。通过全国范围内领域专家对WHOQOL-100广东版逐字逐句的讨论和修改,把修订稿称为“96中文版”,并在全国六城市进行正式的现场调查。
7.“97中文版”
由另外两位英语教师独立完成了96中文版的逆向翻译工作。通过比较逆向翻译稿和原文,参考六城市现场试验的结果,对“96中文版”进行了微小改动,形成了“97中文版”。
8.世界卫生组织生存质量测定量表的中文版中文版”逆向翻译,将“97中文版”、逆向翻译稿以及中文版研制和现场考核报告一并报请世界卫生组织生存质量研究协作组审核。协作组于同年正式接受“97中文版”为世界卫生组织生存质量测定量表的中文版。通过对“97
(三)认知报告
本量表是个体的主观评价,量表引进过程中请患者参与修改和测试练习,不断修订完善量表即是认知测试的过程。
(四)预调查
在广东省东西南北和中部各选一地区(湛江、梅州、韶关、中山和广州)进行预实验,每地调查约100名对象)。根据调查所得资料分析量表的信度、效度和反应度等计量心理性质。同时还根据结果制定了一个含有较少条目的简表。根据预调查结果对第四稿进行修改,在广东省卫生厅指导下在广东地区最后形成WHOQOL-100广东版。
在卫生部科教司标准办公室的指导下,1996年4月17~19日在北京召开国内合作研究组织会议,与会者对WHOQOL-100广东版进行了逐字逐句的讨论和修改,并把修订稿称为“96中文版”。
(五)正式现场调查及性能检验
在卫生部科教司指导下,以方积乾(中山医科大学)、佟之复(北京老年医学研究所)、叶葶葶(上海医科大学)、王家良(华西医科大学)、丁宝坤(中国医科大学)和李志刚(西安医科大学)为首的六个单位的研究人员于1996年在广州、北京、上海、成都、西安、沈阳等六个城市对形成的“96中文版”进行现场试验。WHO QOL-100量表中文版包含103个问题,除英文版原有问题外,另有3个问题是中文版所特有的。每地调查300人,样本中注意患者与健康者、男与女、年龄结构等因素的均衡。病种主要指年轻人中的慢性肝炎、胃溃疡、慢性支气管炎、抑郁症等,中年人中的高血压、冠心病、糖尿病、关节炎等,老年人中的癌症、心血管疾病、糖尿病和骨折等。另外还考察了50名患者治疗前后生存质量的变化。WHOQOL-100量表中文版调查1654例资料,其中,患者877名,正常人777名;男性838名,女性816名;年龄小于45岁者767名,大于等于45岁者887名。六城市现场试验的资料汇总到中山大学公共卫生学院医学统计教研室,并寄给世界卫生组织总部。以下计算均借助SPSSfor WindowsVersion 7.5完成。
采用Cronbach'sα系数考察内部一致性。在量表的6个领域中Cronbach'sα系数以生理领域最低(0.4169),环境领域最高(0.9323);除独立能力领域为0.571外,其他均高于0.7000。在量表的24个生存质量方面,行动能力方面最低(0.3816),对药物及医疗手段的依赖性方面最高(0.9034),其他方面均大于0.6500。表明WHOQOL-100量表中文版具有好的信度。2.内容效度计算各个领域及方面间的Pearson相关系数r来分析量表的内容效度。量表的各个领域及方面之间均存在一定的相关性,其中,各方面与其所属领域之间相关较强,而与其他领域相关较弱,如FACET1、FACET2、FACET3与DO Ml的相关系数的绝对值均大于0.8000。可见WHOQOL-100量表中文版具有较好的内容效度。3.区分效度使用t检验和多重回归分析患者和正常人在各个方面及领域得分的差别,考察量表的区分效度。发现除心理领域、精神/宗教/信仰领域外,其他领域得分患者和正常人的差别都有统计学意义(P<0.05)。在24个方面中,有14个方面能区分开患者和正常人(R<0.05)。心理领域及其下属的4个方面、性生活、社会安全保障、获取新信息等的机会、休闲娱乐活动的参与、交通条件、精神宗教信仰等方面却不能区分。使用LISREL(linear structural relations) 理论及相应软件(EQSfor windows) 进行证实性的因子分析(con-firm atory factor analysis) ,考察量表的结构效度。用总的生存质量与健康状况得分代表生存质量,用各领域得分来表达相应的领域,建立了总的生存质量与6个领域的因子结构模型。模型的拟合优度指数(comparativefit index,CFI) 等于0.904,说明量表具有较好的结构效度。另外,分别考察6个领域各自的因子结构(即各个领域与其下属方面的因子结构),它们的CFI均大于0.9。类似地,分别针对患者和正常人数据拟合上述模型,它们的CFI除正常人的生理领域为0.892外均大于0.9.综上所述,该量表具有较好的信度和效度。我们认为WHO QOL-100中文版是一份较好的用于测量中国人生存质量的量表,可以应用于公共卫生和其他医学领域。量表不同语言版本的等价性是国际合作研究中不同地区和国家的结果具有可比性的前提条件。WHOQOL-100量表是在世界卫生组织的统一领导下,全球15个(后又增9个)处于不同文化背景、不同经济发展水平的国家研究中心共同研制的。它不仅具有较好的信度、效度、反应度等计量心理性质,而且具有国际可比性,即不同文化背景下测定的生存质量得分具有可比性9。下面是针对WHOQOL量表在不同地区和国家调查数据1.概念等价性尽管目前对生存质量的概念与构成尚未达成共识,但以下几点是比较公认的”:①生存质量是一个多维的概念,包括身体功能、心理功能、社会功能等;②生存质量是主观的评价指标(主观体验),应由被试者自己评价;③生存质量是有文化依赖性的,必须建立在一定的文化价值体系下。国外的量表很多方面不适合中国的国情,如对宗教信仰、个人隐私、性生活等都远较国人重视,而国人比较看重饮食文化、(纵向)家庭亲情和工作稳定等。因此,对国际生存质量评定量表的文化调适势在必行。2.条目等价性如前述量表性能检验涵盖条目等价性方法,下面介绍另一方法对条目等价性的考核方法。方法举例:条目功能差异98。条目功能差异(differential item functioning,DIF) 的定义是对于某个特定条目,如果来自同一目标特质的两批平行被试组,即两组的同一目标特质的分布相同中,显现出不同的统计特性,那么该条目就存在功能差异。由于生存质量必须建立在一定的文化价值体系下,因此形成的WHOQOL-100量表不可避免地存在有DIF的条目。在跨文化生存质量研究中,DIF可以定义为在不同的文化背景下具有相同生存质量的不同个体对同一条目的反应不同。根据DIF的检测方法所依据的理论基础,DIF检测方法可以分为基于经典测量理论和基于IRT的方法。如MH方法(Mantel-Haenszel procedure) 和等级logistic回归是基于经典测量理论的方法,而Lordx和IRT-ANOVA是基于IRT的方法。WHO QOL-100量表是5分类的Likert量表,根据WHO-QOL-100量表的数据特点,选择等级logistic回归和IRT-ANOVA分析DIF.资料来源于世界卫生组织生存质量研究小组提供的来自中国香港和阿根廷的WHOQOL-100量表社会关系领域的数据进行DIF分析,以找到WHOQOL-100量表社会关系领域在中国香港和阿根廷之间有差异的条目(1) 运用等级logistic回归进行DIF分析:领域的总分作为匹配变量(domain),因变量是条目的得分,自变量是中心(cen-tre) 。为控制犯I类错误的概率,关于自变量系数为0的统计学检验的显著性水准定为0.01。如果关于中心的系数是零的统计学检验的P值大于0.01,就认为该条目存在DIF;如果P值不大于0.01,就认为该条目不存在DIF。应用SPSS11.0软件进行等级logistic回归,结果诊断出在中国香港和阿根廷之。
2) 用IRT-ANOVA进行DIF分析:IRT-ANOVA是基于IRT的方差分析的简称。IRT是基于潜在特质理论的一系列项目反应模型的总称,在该研究中应用的条目反应模型为Rasch等级模型(Rasch ordered categories model) 。IRT-ANOVA在软件RUM M 2010中进行,显著性水准定为α=0.01,结果诊断出有DIF的有F13.4、F14.4、F15.2、F15.3和F15.4(表6-3-3)。
每种方法都有优缺点和使用条件。等级logistic回归的优点一是易操作,大多数统计软件包中都有logistic回归现成的模块;二是可以控制混杂因素的影响。logistic回归的缺点是,当量表中有DIF的条目较多时,各个条目的总分不能很好地代表被试在该领域的得分,依据总分作为匹配变量作出的DIF结果可靠性较低。IRT-ANOVA的优点是,不需要匹配变量,结果可靠性受量表中有DIF的条目的个数影响小。缺点一是可操作性差,二是IRT-ANOVA建立IRT的基础上,当模型和数据拟合的不好时,DIF诊断的假阳性率较高。鉴于以上对于logistic回归和IRT-ANOVA优缺点的讨论,可考虑将以上两种方法的结果结合来下结论。可以看出两种方法的一致率较高,在考虑到降低假阳性率的情况下,可以认为同时被两种方法诊断为有DIF的条目F13.4、F14.4、F15.3和F15.4,为WHOQOL-100量表社会关系领域在中国香港和阿根廷之间有差异的条目。
鉴于WHOQOL-100量表的研制方法具有跨文化的特征,WHO QOL-100量表有DIF的条目可能是由于不同语言环境下概念和语义的不同而引起,但也不能肯定是由于文化特异性引起,其需要进一步的研究才能证实。
WHO QOL-100量表作为一个整体,已经被证实具有较好的信度、效度、反应度等心理测量学性质。因此,对那些有DIF的条目进行删除或者重写是不可能的,因为可能影响原量表的心理测量学特性,唯一的方法是校正。已经有人提出来用IRT的等值技术-统计模型来校正有DIF的条目。但是根据IRT的理论,等值需要有铆测试,因为不可能找到可以分别在不同的文化背景下回答生存质量量表中的问题的人,也很难找到完全与文化背景无关的条目,所以铆测试在生存质量研究中很难甚至无法实现。因此,在跨文化的生存质量研究中,急需一适合生存质量研究的校正DIF的模型的出现。

3.操作等价性99中文版量表中的问题及格式原则上不能
改动。量表中的问题按回答的格式而分组。有关本国特点的内
容附加在量表的末尾,而不能加在量表中间。填写量表在进行生存质量调查时,假如回答者有足够的能力阅读量表,应由其本
人填写或回答,否则,可由访问者帮助阅读或填写。在WHO-QOL-100量表的封面上印有有关填写本量表的详细说明,当访
问员帮助填写的时候,应该把该说明读给被调查者听。适用范围和时间框架量表,用于评价回答者所生活的文化和价值体系
内,与他们的目标、期望、标准以及所关心的事情有关的生
存状况。
WHO QOL量表测定的是最近两周的生存质量的情况,
但
在实际工作中,根据工作的不同阶段的特殊性,量表可以考察不同长度时间段的生存质量。如评价一些慢性疾病如关节炎、腰
背痛患者的生存质量,可调查近4周的情况。在接受化疗的患
者的生存质量评价中,主要根据所要达到的疗效或产生的副作用来考虑时间框架。WHO QOL-100量表中文版的计分:中文版量表能够算出6个领域、24个方面以及1个评价一般健康状况和生存质量的评分。6个领域是指:生理(PHYS)、心理(PSYCH)、独立性(IND) 、社会关系(SOCIL) 、环境(ENVIR)和精神/宗教信仰(DOM 6) 。各个领域和方面的得分均为正向得分,即得分越高,生存质量越好。我们并不推荐将量表所有条目得分相加计算总分。考察一般健康状况和生存质量的4个问题条目(即G1、G2、G3、G4)的得分相加,总分作为评价生存质量的一
个指标(详细的整理数据、计算各个领域/方面得分的SPSS程序见附录)。方面计分(facetscores) :各个方面的得分是通过累加其下属的问题条目得到的,每个条目对方面得分的贡献相等。条目的记分根据其所属方面的正负方向而定,许多方面包含需要将得分反向的问题条目。对于正向结构的方面,所有负向问题条目需反向计分。有3个反向结构的方面(疼痛与不适、消极情绪、药物依赖性)不包含正向结构的问题条目。各国附加的问题条目归于其所属的方面,且记分方向与该方面一致,下面举例说明方面计分。不需要反向计分的方面:积极感受(pfeel) =F 4.1+F 4.2+F 4.3+F 4.4包含需反向计分条目的方面:精力与疲倦(energy)=[F 2.1+(6一F 2.2) +F 2.3十(一
领域计分(domainscores) :每个方面对领域得分的贡献相等,各国附加的方面归属于相应的领域,且按正向计分。各个域的得分通过计算其下属方面得分的平均数得到,计算公式.下,注意根据下面的计算程序负向结构的方面的得分需要反向换算。生理领域(PHYS)=[(24—pain)十energy+sleep]/3
心理领域(PSYCH)=[p feel十think+esteem+body+(24一neg)
]/5
独立性领域(IND)=[mobil+activ+(24―medic)
+
work] / 4
社会关系领域(SOCIL) =(relat十socil十sex x)
/3
环境领域(ENVIR)=(safety+home+finan+servic十in-
form+leisure+envir十transp) / 8
精神/宗教信仰领域(DOM6) =spirit
得分转换:各个领域及方面的得分均可转换成百分制,方法
是转换后得分=(原始得分-4)×(100/16)。关于数据缺失:当一份问卷中有20%的数据缺失时,该份问卷便作废。如果一个方面中有一个问题条目缺失,则以该方面中另外条目的平均分代替该缺失条目的得分。如果一个方面中有多于两个(包含两个)条目缺失,那么就不再计算该方面的得分。对于生理、心理和社会关系领域,如果有一个方面的得分缺失,可以用其他方面得分的平均值代替。对于环境领域,可以允许有两个方面的缺失,此时用其他方面得分的平均值代替缺失值。如前述量表性能检验涵盖测量等价性方法,下面介绍利用证实性因子分析对测量等价性的考核方法。
方法举例:证实性因子分析100
应用证实性因子分析方法通过检验量表的因子结构及对应
的参数在不同语言版本间的不变性可以考核量表的测量等
价性。
证实性因子分析是针对量表条目之间的协方差进行分析,
理论基础是结构方程模型(structural equation model, SEM) 。
世界卫生组织生存质量研究小组的研究结果认为量表WHO-
QOL-100的因子结构应该是一个包含四个领域的二级结构(图6-3-1) 。
研究小组先后采用WHOQOL-100英语版本和其本国语言版本对83例精通英语的本国人进行调查。每名受调查者
填写英语版本和本国语言版本的先后顺序是随机的。调查时间
前后间隔一周,以保证受调查者的生存质量在两次调查间
持稳定。在83名受调查者中男性42例,女性41例;患
例,健康人43例。患者和健康人的性别构成差异无统计学意
义。判断两个语言版本等价性的标准有:①模型与数据的拟合
优度,一般认为CFI大于0.9时,模型与数据是吻合的;②对模
型参数相等所作的假设检验得到的P值,如果P<0.05,则认为对应的模型参数(因子负荷)不相等。借助软件EQS6.0完成
应用证实性因子分析,分别对英语版和本国语言版调查所得数据拟合该因子结构,结果见表6-3-4。考虑到此次研究的样本量偏小,仅为83例,而CFI分别等于0.807和0.829,所以认为数据与模型的拟合是可以的;对所有模型参数相等的假设检验得到的P值均大于0.05。综合上面结果,可以认为两个语言版本是具有测量等价性的。
WHO QOL-100从英文版到中文版的跨文化调适是根据世界卫生组织生存质量研究协作组制定的工作纲要完成的。从英文翻译成中文,再从中文逆向翻译成英文,我们比较原版和逆向翻译稿,发现它们之间存在一些差异。现就这些差异进行讨论和解释。主要讨论的方面包括问题的格式、与应答尺度有关的副词等。另外,根据中国的传统文化特征,我们还增加了三个问题,分别是“家庭摩擦问题”、“食欲问题”和“生存质量的总评价”在制订WHOQOL-100中文版时,我们尽量深入理解英文版的内容,使得中文版在内容上与原版等效。在表达形式上,也尽量与英文版一致。但由于语言和文化上的差异,生硬的直译反倒破坏等效性。我们从疑问句的格式、简略答案的格式、副词的选用、用词的斟酌等方面谨慎地进行了改动以适应中国人的语言文化习惯。根据国际协作组关于不同国家或地区的版本可以附加少量有价值的问题的协议,我们增加了有关家庭关系和食欲的两个问题和对自身生存质量总评价的一个问题。以上措施均围绕一个目的:保证中文版与英文版的一致性,同时兼顾国际可比性和实际可操作性的要求。目前, WHO QOL-100及WHOQOL-BREF的中文版已经被世界卫生组织确认。经中华人民共和国卫生部法制与监督司提出, WHO QOL-100中文版命名为《生存质量测定量表》(In-strument for quality of life assessment) ,由中华人民共和国卫生部于1999年12月9日发布为中华人民共和国卫生行业标准WS/T119-1999,从2000年5月1日开始实施。