【PRO专栏】效度及其评价方法

2021

02/02

黎麟

A-

A+

效度及其评价方法

效度(validity)指的是量表是否测量了我们希望测量的东西。例如，智商测验是否真正测量了智力的高低?生存质量量表是否真正测量了人们的生存质量?抑郁量表是否真正测量了患者抑郁的程度?这些都是关于效度的问题。一般说，有四种类型的效度：内容效度、标准效度、结构效度和区分效度。内容效度是一种基于概念的评价指标，其他三种是基于经验的评价指标。如果一个量表实际上是有效的，那么我们希望上述四种效度指标都比较满意。但是，在实际工作中，人们可以根据具体情况对其中的一种或多种效度进行考核。

1.内容效度内容效度是一个定性地评价效度的指标，它关心量表是否能够测量我们所需要测量的抽象概念、领域和方面。对比事先对概念的定义和最终的量表，可以得到关于内容效度的评价。采用专家评价的方法可以了解内容效度的大小。缺乏内容效度的测量会歪曲对所关心概念的理解。就像利用不具有代表性的样本对总体进行推断会得到错误结论一样。内容效度的主要局限在于它对概念定义的依赖性。心理学和社会学中的许多概念都缺乏一致的认同，这给研究者在定义概念和选择指标上带来额外的负担。例如，关于“亚健康”的定义就缺乏一致的认同，所以存在许多测量亚健康的量表，相互之间有时还存在一定的差别。在评价量表的内容效度时，常用的方法是分析量表条目与其所属领域或方面得分的相关性，以及与其他领域或方面得分的相关性。如果条目与其所属的领域或方面的相关较强，而与其他领域或方面的相关较弱，则可以认为量表具有较好的内容效度。

2.标准效度又称效标效度，它指的是测量与标准测量之间接近的程度。常常采用它们之间的相关系数来衡量。评价标准效度必须要有一个与之比较的标准。当然，使用这种方法的关键在于作为准则的测量方式或指标一定要是有效的，否则越比越差。现实中，我们评价效标效度的方法是相关分析或差异显著性检验，但是在调杳问卷的效度分析中，选择一个合适的准则往往十分困难，也使这种方法的应用受到一定限制。

3.区分效度量表应能区分已知的两类不同人群(例如，“健康人”和“患者”)的特征。分别调查两类不同人群，计算量表各领域得分和总得分，再进行比较，分析这两类人群得分的差别是否有统计学意义，从而判断量表是否具有区分效度。假设检验的结果有统计学意义就表明量表有区分不同属性人群的能力，具有区分效度。