物治 - 臨床統計應用考古題解析 - 民國115年

本題觀念：

本題考查的是信度分析（Reliability Analysis）中的施測者間信度（Inter-rater reliability）統計方法的選擇。具體情境為：針對連續變項（Continuous variable）（如角度測量），評估兩位不同施測者（資深治療師 vs. 學生）對同一組受試者測量結果的一致性或相關性。

在物理治療與醫學統計中，對於連續數據的信度分析，黃金標準（Gold Standard）通常是組內相關係數（Intraclass Correlation Coefficient, ICC）。然而，當考題選項中未出現 ICC 時，**皮爾森相關係數（Pearson's r）**通常被視為次佳或傳統的替代選項，用來評估兩組數據間的線性關聯強度。

選項分析

A. 變異係數（Coefficient of Variance, CV）
- 分析：變異係數的公式為 $CV = \frac{SD}{Mean} \times 100\%$ 。它主要用於標準化數據的離散程度，比較不同單位或平均數差異極大的數據集的相對變異度。
- 錯誤原因：CV 通常用於評估單一測量方法的精確度（Precision）或穩定性，而非用來計算兩個不同施測者之間的「相關性」或「一致性」。
B. 皮爾森相關係數（Pearson's product-moment coefficient of correlation）
- 分析：此係數（ $r$ ）用於測量兩個連續變項之間的線性關係強度。數值介於 -1 到 +1 之間，越接近 1 代表兩者的測量結果越呈現正相關（即資深治療師測出高角度時，學生也傾向測出高角度）。
- 正確原因：在選項缺乏 ICC 的情況下，Pearson's $r$ 是評估兩組連續測量數據「關聯性」的標準統計指標。雖然它有無法偵測「系統性誤差」（Systematic bias，例如學生每次都比資深治療師少測 5 度，相關係數仍可能很高）的缺點，但它仍是信度分析中最基礎的相關性指標。
C. 測量標準誤（Standard Error of Measurement, SEM）
- 分析：SEM 是信度的一種衍生指標，公式為 $SEM = SD \times \sqrt{1 - r}$ 。它代表測量分數的絕對誤差範圍，用來解釋個人分數的精確度。
- 錯誤原因：SEM 是利用信度係數（如 ICC 或 r）計算出來的結果，而非用來「檢測」信度的統計檢定方法本身。你需要先算出信度係數，才能算出 SEM。
D. 配對T檢定（Paired t-test）
- 分析：配對 t 檢定是用來檢測兩組平均數是否有顯著差異（Systematic difference）。
- 錯誤原因：T 檢定只能告訴你「兩位施測者的平均值是否不同」（有無系統性偏差），無法告訴你他們的測量結果是否「一致」或「相關」。例如：若兩人測量結果完全無關（隨機亂測），平均數卻剛好相同，T 檢定會顯示無差異，但信度其實極低。因此 T 檢定不能作為信度的主要指標。

答案解析

本題正確答案為 (B) 皮爾森相關係數（Pearson's product-moment coefficient of correlation）。

雖然現代醫學統計更推崇使用 ICC 或 Bland-Altman Plot 來評估施測者間信度，但在本題給定的選項限制下，皮爾森相關係數是唯一能提供「相關性係數（Reliability Coefficient）」的選項。它能反映剛畢業學生與資深治療師測量數據的變化趨勢是否一致，符合題目「檢測其信度」的要求。

核心知識點

考生應掌握以下信度與效度分析的統計選擇邏輯：

連續變項（Continuous Data）的信度分析：
- 首選（Gold Standard）：組內相關係數（ICC）（尤其是 Model 2 或 3）。
- 次選（相關性）：皮爾森相關係數（Pearson correlation, r）（缺點：無法偵測系統性偏差）。
- 一致性檢驗（Agreement）：Bland-Altman Plot（圖形分析，看誤差分布）、配對 t 檢定（僅看有無系統性差異，非信度係數）。
- 絕對信度指標：SEM（測量標準誤）與 MDC（最小可偵測變化值）。
類別變項（Categorical Data）的信度分析：
- Kappa 係數（Cohen's Kappa / Weighted Kappa）。
觀念釐清：
- 信度（Reliability） = 一致性（Consistency）、再現性（Reproducibility）。
- t-test 測的是「差異」（Difference），相關係數測的是「關係」（Relationship）。信度高代表差異小且關係強，但統計上通常先看關係強度。

參考資料

Portney, L. G., & Watkins, M. P. (2015). Foundations of Clinical Research: Applications to Practice. F.A. Davis. (物理治療研究法權威教材，詳述 ICC 與 Pearson 在信度上的應用與區別)
Koo, T. K., & Li, M. Y. (2016). A Guideline of Selecting and Reporting Intraclass Correlation Coefficients for Reliability Research. Journal of Chiropractic Medicine, 15(2), 155-163.

詳細解析

本題觀念：

選項分析

答案解析

核心知識點

參考資料