某研究想了解使用量角器測量膝關節彎曲角度在不同測試者間的信度(reliability ),徵召 100位受試者,所有受試者皆先後由兩位測試者進行測量,一位測試者為資深物理治療師,另一位為剛畢業的物理治療系學生。請問要用那種統計方式來檢測其信度?
詳細解析
本題觀念:
本題考查的是信度分析(Reliability Analysis)中的施測者間信度(Inter-rater reliability)統計方法的選擇。 具體情境為:針對連續變項(Continuous variable)(如角度測量),評估兩位不同施測者(資深治療師 vs. 學生)對同一組受試者測量結果的一致性或相關性。
在物理治療與醫學統計中,對於連續數據的信度分析,黃金標準(Gold Standard)通常是組內相關係數(Intraclass Correlation Coefficient, ICC)。然而,當考題選項中未出現 ICC 時,**皮爾森相關係數(Pearson's r)**通常被視為次佳或傳統的替代選項,用來評估兩組數據間的線性關聯強度。
選項分析
-
A. 變異係數(Coefficient of Variance, CV)
- 分析:變異係數的公式為 。它主要用於標準化數據的離散程度,比較不同單位或平均數差異極大的數據集的相對變異度。
- 錯誤原因:CV 通常用於評估單一測量方法的精確度(Precision)或穩定性,而非用來計算兩個不同施測者之間的「相關性」或「一致性」。
-
B. 皮爾森相關係數(Pearson's product-moment coefficient of correlation)
- 分析:此係數()用於測量兩個連續變項之間的線性關係強度。數值介於 -1 到 +1 之間,越接近 1 代表兩者的測量結果越呈現正相關(即資深治療師測出高角度時,學生也傾向測出高角度)。
- 正確原因:在選項缺乏 ICC 的情況下,Pearson's 是評估兩組連續測量數據「關聯性」的標準統計指標。雖然它有無法偵測「系統性誤差」(Systematic bias,例如學生每次都比資深治療師少測 5 度,相關係數仍可能很高)的缺點,但它仍是信度分析中最基礎的相關性指標。
-
C. 測量標準誤(Standard Error of Measurement, SEM)
- 分析:SEM 是信度的一種衍生指標,公式為 。它代表測量分數的絕對誤差範圍,用來解釋個人分數的精確度。
- 錯誤原因:SEM 是利用信度係數(如 ICC 或 r)計算出來的結果,而非用來「檢測」信度的統計檢定方法本身。你需要先算出信度係數,才能算出 SEM。
-
D. 配對T檢定(Paired t-test)
- 分析:配對 t 檢定是用來檢測兩組平均數是否有顯著差異(Systematic difference)。
- 錯誤原因:T 檢定只能告訴你「兩位施測者的平均值是否不同」(有無系統性偏差),無法告訴你他們的測量結果是否「一致」或「相關」。例如:若兩人測量結果完全無關(隨機亂測),平均數卻剛好相同,T 檢定會顯示無差異,但信度其實極低。因此 T 檢定不能作為信度的主要指標。
答案解析
本題正確答案為 (B) 皮爾森相關係數(Pearson's product-moment coefficient of correlation)。
雖然現代醫學統計更推崇使用 ICC 或 Bland-Altman Plot 來評估施測者間信度,但在本題給定的選項限制下,皮爾森相關係數是唯一能提供「相關性係數(Reliability Coefficient)」的選項。它能反映剛畢業學生與資深治療師測量數據的變化趨勢是否一致,符合題目「檢測其信度」的要求。
核心知識點
考生應掌握以下信度與效度分析的統計選擇邏輯:
-
連續變項(Continuous Data)的信度分析:
- 首選(Gold Standard):組內相關係數(ICC)(尤其是 Model 2 或 3)。
- 次選(相關性):皮爾森相關係數(Pearson correlation, r)(缺點:無法偵測系統性偏差)。
- 一致性檢驗(Agreement):Bland-Altman Plot(圖形分析,看誤差分布)、配對 t 檢定(僅看有無系統性差異,非信度係數)。
- 絕對信度指標:SEM(測量標準誤)與 MDC(最小可偵測變化值)。
-
類別變項(Categorical Data)的信度分析:
- Kappa 係數(Cohen's Kappa / Weighted Kappa)。
-
觀念釐清:
- 信度(Reliability) = 一致性(Consistency)、再現性(Reproducibility)。
- t-test 測的是「差異」(Difference),相關係數測的是「關係」(Relationship)。信度高代表差異小且關係強,但統計上通常先看關係強度。
參考資料
- Portney, L. G., & Watkins, M. P. (2015). Foundations of Clinical Research: Applications to Practice. F.A. Davis. (物理治療研究法權威教材,詳述 ICC 與 Pearson 在信度上的應用與區別)
- Koo, T. K., & Li, M. Y. (2016). A Guideline of Selecting and Reporting Intraclass Correlation Coefficients for Reliability Research. Journal of Chiropractic Medicine, 15(2), 155-163.