115年:物治概論(1)
下列何者最不適合用來描述研究資料的變異度(variability )?
A標準差( standard deviation )
B偏態(skewness )
C全距(range)
D四分位數( interquartile range )
詳細解析
本題觀念:
本題考查生物統計學中**變異度(Variability)或離散趨勢(Measures of Dispersion)**的測量指標。研究資料的描述通常分為三大類:
- 集中趨勢(Central Tendency):描述資料的中心位置,如平均數(Mean)、中位數(Median)、眾數(Mode)。
- 變異度(Variability/Dispersion):描述資料的分散程度,即資料點距離中心有多遠。
- 分佈形狀(Distribution Shape):描述資料分佈的形態,如偏態(Skewness)、峰度(Kurtosis)。
選項分析
- A. 標準差(Standard deviation):屬於變異度指標。
- 它是最常用的變異度測量,描述資料點與平均數(Mean)之間的平均距離。標準差越大,代表資料分佈越廣、變異程度越大。
- B. 偏態(Skewness):不屬於變異度指標(這是正確答案)。
- 偏態是用來描述資料分佈形狀(Shape)或對稱性的指標。
- 它告訴我們資料的分佈是向左偏(Left-skewed/Negative skew)還是向右偏(Right-skewed/Positive skew),而不是資料「分散」了多少。一組資料可以非常集中(低變異度)但高度偏斜,也可以非常分散(高變異度)但完全對稱(零偏態)。
- C. 全距(Range):屬於變異度指標。
- 計算方式為「最大值減去最小值」,是最簡單的變異度測量,直接反映了資料涵蓋的總範圍。
- D. 四分位數(Interquartile range, IQR):屬於變異度指標。
- 雖然中文寫「四分位數」(通常指 Q1, Q2, Q3 這些點),但英文明確標示為 Interquartile range(應譯為四分位距)。
- IQR = Q3(第75百分位數)- Q1(第25百分位數),描述的是資料中間 50% 的分散程度。它比全距更穩健,不易受極端值影響。
答案解析
題目詢問何者最不適合用來描述資料的「變異度」。 選項 A、C、D(標準差、全距、四分位距)皆是統計學上定義明確的離散趨勢指標,用來量化資料的擴散程度。 選項 B(偏態) 則是分佈形狀指標,用來判斷資料是否對稱,而非測量其分散的大小。因此,偏態最不適合作為變異度的描述指標。
正確答案為 B。
核心知識點
考生應熟記以下統計指標的分類:
-
變異度/離散指標(Measures of Variability):
- 全距(Range):易受極端值影響。
- 四分位距(IQR):適用於偏態分佈或有極端值的資料(常與中位數並用)。
- 變異數(Variance) & 標準差(SD):適用於常態分佈(常與平均數並用)。
- 變異係數(CV, Coefficient of Variation):用於比較不同單位或平均數差異大的兩組資料之相對變異度。
-
分佈形狀指標(Measures of Shape):
- 偏態(Skewness):0 = 對稱;>0 = 右偏(正偏);<0 = 左偏(負偏)。
- 峰度(Kurtosis):描述分佈的平坦或尖峭程度。
臨床重要性
在閱讀醫學文獻時,區分這些指標至關重要:
- 若數據呈現常態分佈(如健康人的血壓、身高),通常使用 Mean ± SD 來描述。
- 若數據呈現偏態分佈(如住院天數、某些生化檢驗值),應使用 Median (IQR) 來描述,因為 SD 會受到極端值拉扯而失真,無法正確代表資料的集中與分散情形。
參考資料
- Measures of Variability: Range, Interquartile Range, Variance, and Standard Deviation. Statistics By Jim.
- Skewness | Definition, Examples & Formula. Scribbr.
- Biostatistics: The Bare Essentials. Norman & Streiner. (經典生物統計教科書定義)