* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다
1. 이론 정리
1) 윌콕슨 검정 개요
(1) 정의
a) 윌콕슨 검정(Wilcoxon Tests)은 비모수적 검정 방법으로, 모집단이 정규성을 만족하지 않는 경우에도 사용할 수 있다.
(a) 윌콕슨 부호 순위 검정(Wilcoxon Signed-Rank Test): 단일 표본 또는 대응 표본의 중앙값이 특정 값과
같은지를 검정한다.
(b) 윌콕슨 순위 합 검정(Wilcoxon Rank-Sum Test): 두 독립적인 모집단의 중앙값이 동일한지를 검정한다.
b) 비모수 검정이므로 모집단의 분포 가정이 필요하지 않으며, 이상치(outlier)에 덜 민감하다.
(2) 필요성
a) 데이터가 정규성을 만족하지 않을 경우 t-검정(t-test)과 같은 모수적 방법이 적절하지 않을 수 있다.
b) 윌콕슨 검정은 중앙값(median)을 기반으로 하므로, 평균을 이용하는 방법보다 강건한(robust) 검정을
수행할 수 있다.
2) 윌콕슨 부호 순위 검정(Wilcoxon Signed-Rank Test)
(1) 가설 설정
a) 귀무가설(H₀): 표본의 중앙값이 특정 값과 같다.
b) 대립가설(H₁)
(a) 단측 검정: 중앙값이 특정 값보다 크거나 작다.
(b) 양측 검정: 중앙값이 특정 값과 다르다.
(2) 검정 절차
a) 각 표본에서 비교 기준이 되는 값(m₀)을 뺀 차이 \( D_i = X_i - m_0 \)을 계산한다.
b) 차이의 절댓값을 구하고 순위를 매긴다.
c) 부호를 결정한다.
(a) \( D_i > 0 \)이면 + 부호를 부여한다.
(b) \( D_i < 0 \)이면 - 부호를 부여한다.
(c) \( D_i = 0 \)이면 해당 데이터를 제거한다.
d) 양수 순위 합 \( W^+ \)과 음수 순위 합 \( W^- \)을 계산한다.
e) 검정 통계량을 다음과 같이 정의한다.
\[
W = \min(W^+, W^-)
\]
(3) 검정 통계량의 정규 근사
a) 표본 크기 \( n \)이 충분히 크다면(일반적으로 \( n > 15 \)), 리아푸노프 중심 극한 정리(Liapounov CLT)에 의해
윌콕슨 통계량 \( W \)은 정규 분포로 근사된다.
b) 정규 근사 사용 시 검정 통계량:
\[
Z = \frac{W - \mu_W}{\sigma_W}
\]
여기서,
\[
\mu_W = \frac{n(n+1)}{4}, \quad \sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{24}}
\]
c) 정규분포 근사를 사용할 경우 정규화된 검정 통계량 Z를 이용하여 p-값을 계산한다.
3) 윌콕슨 순위 합 검정(Wilcoxon Rank-Sum Test)
(1) 가설 설정
a) 귀무가설(H₀): 두 모집단의 중앙값이 같다.
b) 대립가설(H₁)
(a) 단측 검정: 한 모집단의 중앙값이 더 크거나 작다.
(b) 양측 검정: 두 모집단의 중앙값이 다르다.
(2) 검정 절차
a) 두 표본을 결합하여 순위를 매긴다.
b) 한 그룹의 순위 합 \( W \)을 계산한다.
c) 기대 순위와 비교하여 검정을 수행한다.
(3) 검정 통계량의 정규 근사
a) 표본 크기 \( n_1, n_2 \)가 충분히 크다면(일반적으로 \( n_1, n_2 > 7 \)), 리아푸노프 중심 극한 정리에 의해
윌콕슨 순위 합 검정 통계량은 정규 분포로 근사된다.
b) 정규 근사 사용 시 검정 통계량:
\[
Z = \frac{W - \mu_W}{\sigma_W}
\]
여기서,
\[
\mu_W = \frac{n_2(n_1 + n_2 + 1)}{2}, \quad \sigma_W = \sqrt{\frac{n_1 n_2 (n_1 + n_2 + 1)}{12}}
\]
4) 리아푸노프(Liapounov)의 중심 극한 정리
(1) 정의
a) 독립 확률 변수들의 합이 정규 분포로 수렴하는 중심 극한 정리(Central Limit Theorem, CLT)의
일반화된 형태이다.
b) 특정 조건을 만족하는 경우, 임의의 분포를 따르는 확률 변수들의 합이 정규 분포로 근사됨을 보장한다.
(2) 수식과 증명
a) 독립 확률 변수 \( X_1, X_2, ..., X_n \)이 존재하고, 기대값과 분산이 각각 \( E(X_i) = \mu_i \), \( Var(X_i) = \sigma_i^2 \)라 하자.
b) 표준화된 합을 다음과 같이 정의한다.
\[
S_n = \frac{\sum_{i=1}^{n} (X_i - \mu_i)}{\sqrt{\sum_{i=1}^{n} \sigma_i^2}}
\]
c) 리아푸노프 조건: 임의의 \( \delta > 0 \)에 대해
\[
\lim_{n \to \infty} \frac{1}{\sum_{i=1}^{n} \sigma_i^2} \sum_{i=1}^{n} E\left[ |X_i - \mu_i|^{2+\delta} \right] = 0
\]
이 조건이 성립하면, \( S_n \)은 표준 정규 분포 \( N(0,1) \)로 수렴한다.
(3) 윌콕슨 검정과의 관계
a) 윌콕슨 검정에서 순위 데이터의 합은 독립적인 확률 변수들의 합으로 표현된다.
b) 표본 크기가 충분히 크면 리아푸노프 조건이 성립하여 검정 통계량이 정규 분포로 근사된다.
c) 이를 이용하여 윌콕슨 검정에서 정규 근사를 적용할 수 있음을 보장한다.
5) 이론 요약
(1) 윌콕슨 검정은 비모수적 방법으로, 데이터의 분포 가정을 필요로 하지 않는다.
(2) 정규성을 가정할 수 없는 경우에도 정확한 검정 및 근사 검정(정규 근사)이 가능하다.
(3) 리아푸노프 중심 극한 정리를 이용하여 큰 표본에서는 정규 분포 근사를 적용할 수 있다.
(4) 일반적으로 표본 크기가 충분히 크면(n > 15), 정규 근사를 이용하여 검정이 수행 가능하다.
(5) 이상치(outlier)에 민감하지 않아 신뢰성이 높다.
2. 예제
1) 문제
(1) 문제 1: 윌콕슨 부호 순위 검정 (Wilcoxon Signed-Rank Test)
한 연구자가 신약이 체온을 낮추는 효과가 있는지 검정하려 한다. 10명의 환자의 신약 복용 전과 후 체온을 측정한 결과는 다음과 같다.
- 복용 전 체온 (°C): 36.8, 37.2, 37.0, 36.9, 37.1, 37.3, 37.2, 36.8, 37.0, 36.9
- 복용 후 체온 (°C): 36.6, 37.0, 36.7, 36.7, 36.9, 37.0, 37.1, 36.5, 36.8, 36.6
귀무가설 \(H_0\): 신약 복용 전후의 체온 차이가 없다.
대립가설 \(H_1\): 신약 복용 후 체온이 감소하였다.
유의수준 0.05에서 윌콕슨 부호 순위 검정을 수행하라.
(2) 문제 2: 윌콕슨 순위 합 검정 (Wilcoxon Rank-Sum Test)
두 개의 다른 비료(A, B)가 농작물의 성장에 미치는 영향을 비교하고자 한다. 각각 8개의 농장에서 측정된 작물 높이(cm)는 다음과 같다.
- 비료 A: 15.2, 16.8, 14.9, 17.1, 15.8, 16.5, 15.0, 16.2
- 비료 B: 14.8, 15.3, 14.6, 15.9, 15.1, 15.5, 14.9, 15.4
귀무가설 \(H_0\): 두 비료의 효과는 동일하다.
대립가설 \(H_1\): 비료 A가 비료 B보다 더 효과적이다.
유의수준 0.05에서 윌콕슨 순위 합 검정을 수행하라.
(3) 문제 3: 정규 근사를 이용한 윌콕슨 부호 순위 검정
한 제조 공장에서 생산된 제품의 무게(단위: g)가 표준 무게 250g과 차이가 있는지 검정하려 한다. 무작위로 12개의 제품을 선택하여 무게를 측정한 결과는 다음과 같다.
- 제품 무게 (g): 248, 251, 249, 253, 250, 252, 247, 251, 250, 249, 248, 254
귀무가설 \(H_0\): 제품 무게의 중앙값은 250g이다.
대립가설 \(H_1\): 제품 무게의 중앙값은 250g과 다르다.
표본 크기가 충분히 크므로, 정규 근사를 이용하여 윌콕슨 부호 순위 검정을 수행하라.
2) 풀이
(1) 문제 1: 윌콕슨 부호 순위 검정
a) 체온 차이 계산 (\(D_i = X_i - Y_i\))
| i | \(X_i\) (복용 전) | \(Y_i\) (복용 후) | \(D_i = X_i - Y_i\) |
| 1 | 36.8 | 36.6 | 0.2 |
| 2 | 37.2 | 37.0 | 0.2 |
| 3 | 37.0 | 36.7 | 0.3 |
| 4 | 36.9 | 36.7 | 0.2 |
| 5 | 37.1 | 36.9 | 0.2 |
| 6 | 37.3 | 37.0 | 0.3 |
| 7 | 37.2 | 37.1 | 0.1 |
| 8 | 36.8 | 36.5 | 0.3 |
| 9 | 37.0 | 36.8 | 0.2 |
| 10 | 36.9 | 36.6 | 0.3 |
모두 양수이므로, 복용 전 > 복용 후 임을 알 수 있다.
b) 절댓값을 구한 후 순위 부여
| \(D_i\) 절댓값 | 순위 (R) | 평균 순위 |
| 0.1 | 1 | 1 |
| 0.2 | 2,3,4,5,6 | \( \frac{2+3+4+5+6}{5} = 4 \) |
| 0.3 | 7,8,9,10 | \( \frac{7+8+9+10}{4} = 8.5 \) |
c) 부호 적용 후 검정 통계량 \( W \) 계산
- 양수 순위 합 \( W^+ \) 계산 :모든 차이가 양수
\[
W^+ = 1 + 4 + 4 + 8.5 + 4 + 8.5 + 4 + 8.5 + 4 + 8.5 = 55
\] - 음수 순위 합 \( W^- \) 계산 \[ W^- = 0 \]
- 검정 통계량:
\[ W = W^+ = 55
\]
d) 정규 근사 적용 및 \( Z \) 값 계산
- \(\mu_W = \frac{n(n+1)}{4} = \frac{10(10+1)}{4} = 27.5\)
- \(\sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{24}} = 10.6\)
- \(Z\) 값:
\[
Z = \frac{W - \mu_W}{\sigma_W} = \frac{55 - 27.5}{10.6} = 2.594
\]
e) p-값 계산 및 결론 도출
- \( p = P(Z \geq 2.594) \approx 0.0047 \)
- p-value < 0.05 -> 귀무가설을 기각한다.
- 결론: 유의수준 0.05보다 매우 작으므로 귀무가설을 기각하고, 신약이 체온을 유의하게 감소시킨다고 할 수 있다.
(2) 문제 2: 윌콕슨 순위 합 검정
a) 순위 부여
- 두 그룹을 합쳐서 순위를 매긴다.
- 동점(ties)이 있을 경우, 평균 순위 사용.
| 값 | 그룹 | 순위 |
| 14.6 | B | 1 |
| 14.8 | B | 2 |
| 14.9 | A | 3.5 |
| 14.9 | B | 3.5 |
| 15.0 | A | 5 |
| 15.1 | B | 6 |
| 15.2 | A | 7 |
| 15.3 | B | 8 |
| 15.4 | B | 9 |
| 15.5 | B | 10 |
| 15.8 | A | 11 |
| 15.9 | B | 12 |
| 16.2 | A | 13 |
| 16.5 | A | 14 |
| 16.8 | A | 15 |
| 17.1 | A | 16 |
b) 순위 합 계산
- 비료 A의 순위 합 \( W_A \) 계산
\[
W_A = 3.5 + 5 + 7 + 11 + 13 + 14 + 15 + 16 = 84.5
\]
- 비료 B의 순위 합 \( W_B \)
\[
W_B = 1 + 2 + 3.5 + 6 + 8 + 9 + 10 + 12 = 51.5
\]
c) 정규 근사 적용 및 \( Z \) 값 계산
비료 A의 표본 크기는 8, 비료 B의 표본 크기를 8로 두고, 귀무가설 하에서 비료 A의 순위 합의 기대값과 표준편차는
다음과 같이 계산된다.
(a) 기대값과 표준편차 계산
\[
\mu_W = \frac{n_1(n_1 + n_2 + 1)}{2} = \frac{8(8 + 8 + 1)}{2} = 68
\]
\[
\sigma_W = \sqrt{\frac{n_1 n_2 (n_1 + n_2 + 1)}{12}} = \sqrt{\frac{8 \times 8 \times 17}{12}} \approx 11.24
\]
(b) 표준화된 검정 통계량
\[
Z = \frac{W_A - \mu_W}{\sigma_W} = \frac{84.5 - 68}{11.24} = 1.47
\]
d) p-값 계산 및 결론 도출
- \( p = P(Z \seq 1.47) \)
- 정규분포표를 참고하면,
\[
p \approx 1- 0.929 = 0.0708
\]
- p-값 > 0.05이므로, 귀무가설을 기각할 수 없음.
- 비료 A와 B의 효과 차이가 통계적으로 유의하지 않음.
(3) 문제 3: 정규 근사를 이용한 윌콕슨 부호 순위 검정
a) 중앙값과의 차이 계산 (\(D_i = X_i - 250\))
| i | 제품 무게 (\(X_i\)) | 차이 (\(D_i = X_i - 250\)) |
| 1 | 248 | -2 |
| 2 | 251 | 1 |
| 3 | 249 | -1 |
| 4 | 253 | 3 |
| 5 | 250 | 0 (제외) |
| 6 | 252 | 2 |
| 7 | 247 | -3 |
| 8 | 251 | 1 |
| 9 | 250 | 0 (제외) |
| 10 | 249 | -1 |
| 11 | 248 | -2 |
| 12 | 254 | 4 |
0을 제외한 데이터 개수 n = 10
b) 절댓값을 구한 후 순위 부여
| \(D_i\) 절댓값 | 원래 순위 | 순위 (R) |
| 1 | 1,2,3,4 | 2.5 |
| 2 | 5,6,7 | 6 |
| 3 | 8,9 | 8.5 |
| 4 | 10 | 10 |
c) 부호 적용 후 검정 통계량 \( W \) 계산
- 양수 순위 합 \( W^+ \) 계산
\[
W^+ = 2.5 + 8.5 + 6 + 2.5 + 10 = 29.5
\]
- 음수 순위 합 \( W^- \) 계산
\[
W^- = 6 + 2.5 + 8.5 + 2.5 + 6 = 25.5
\]
- 검정 통계량:
\[ W = \min(W^+, W^-) = \min(19.5, 25.5) = 25.5
\]
d) 정규 근사 적용 및 \( Z \) 값 계산
- 기대값과 표준편차
\[
\mu_W = \frac{n(n+1)}{4} = \frac{10(10+1)}{4} = 27.5
\]
\[
\sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{24}} = 9.83
\]
- 표준화된 검정 통계량 (연속성 보정 적용)
\[
Z = \frac{W - \mu_W - 0.5}{\sigma_W} = \frac{29.5 - 27.5 - 0.5}{9.83} = 0.153
\]
e) p-값 계산 및 결론 도출
- \( p = P(Z \leq 0.153) \)
- 정규분포표를 참고하면,
\[
p \approx 0.439 *2 = 약 0.88(양측 검정이므로 * 2)
\]
- p-값 > 0.05이므로, 귀무가설을 기각할 수 없음.
- 제품 무게가 250g과 통계적으로 유의한 차이가 없음.
# R code
# 문제 1: 윌콕슨 부호 순위 검정
# 데이터 입력
before <- c(36.8, 37.2, 37.0, 36.9, 37.1, 37.3, 37.2, 36.8, 37.0, 36.9)
after <- c(36.6, 37.0, 36.7, 36.7, 36.9, 37.0, 37.1, 36.5, 36.8, 36.6)
# paired = TRUE, alternative = "greater" (즉, 복용 전 > 복용 후)
wilcox.test(before, after, paired = TRUE, alternative = "greater")
# 문제 2: 윌콕슨 순위 합 검정
# 데이터 입력
fert_A <- c(15.2, 16.8, 14.9, 17.1, 15.8, 16.5, 15.0, 16.2)
fert_B <- c(14.8, 15.3, 14.6, 15.9, 15.1, 15.5, 14.9, 15.4)
# 비모수 검정 (두 집단 독립, one-tailed: A가 B보다 크다)
wilcox.test(fert_A, fert_B, alternative = "greater")
# 문제 3: 정규 근사를 이용한 윌콕슨 부호 순위 검정
# 제품 무게 데이터
weights <- c(248, 251, 249, 253, 250, 252, 247, 251, 250, 249, 248, 254)
# wilcox.test: 차이 계산 후 0 차이는 자동 제거, mu = 250 기준으로 검정 (정규 근사 사용: exact = FALSE)
wilcox.test(weights, mu = 250, alternative = "two.sided", exact = FALSE)
# Python code
import scipy.stats as stats
import numpy as np
# 문제 1: 윌콕슨 부호 순위 검정
before = np.array([36.8, 37.2, 37.0, 36.9, 37.1, 37.3, 37.2, 36.8, 37.0, 36.9])
after = np.array([36.6, 37.0, 36.7, 36.7, 36.9, 37.0, 37.1, 36.5, 36.8, 36.6])
# R의 paired Wilcoxon 검정은 차이(before - after)가 모두 양수일 경우 p-value가 매우 작게 나옴.
# SciPy의 wilcoxon 기본은 양측 검정을 수행하므로, one-sided p-value는 (two-sided/2)로 계산 가능.
stat, p_two_sided = wilcoxon(before - after)
p_one_sided = p_two_sided / 2
print("Wilcoxon statistic =", stat)
print("One-sided p-value =", p_one_sided)
# 윌콕슨 부호 순위 검정 수행
wilcoxon_result = stats.wilcoxon(pre - post, alternative='less')
print("문제 1: 윌콕슨 부호 순위 검정 결과")
print(wilcoxon_result)
# 문제 2: 윌콕슨 순위 합 검정
fert_A = np.array([15.2, 16.8, 14.9, 17.1, 15.8, 16.5, 15.0, 16.2])
fert_B = np.array([14.8, 15.3, 14.6, 15.9, 15.1, 15.5, 14.9, 15.4])
# mannwhitneyu 검정, alternative="greater" (A의 값이 B보다 크다는 대립가설)
stat, p_value = mannwhitneyu(fert_A, fert_B, alternative='greater')
print("Mann-Whitney U statistic =", stat)
print("One-sided p-value =", p_value)
# 문제 3: 정규 근사를 이용한 윌콕슨 부호 순위 검정
import numpy as np
from scipy.stats import wilcoxon
weights = np.array([248, 251, 249, 253, 250, 252, 247, 251, 250, 249, 248, 254])
# 각 값에서 250을 빼서 차이 계산; wilcoxon 함수는 차이가 0인 관측치는 자동 제거합니다.
stat, p_value = wilcoxon(weights - 250, alternative='two-sided')
print("Wilcoxon statistic =", stat)
print("Two-sided p-value =", p_value)
'통계' 카테고리의 다른 글
| 8.6 Best Critical Regions (0) | 2025.01.03 |
|---|---|
| 8.5 Power of a Statistical Test (0) | 2025.01.03 |
| 8.3 Tests About Proportions (0) | 2025.01.03 |
| 8.2 Tests of the Equality of Two Means (0) | 2025.01.03 |
| 8.1 Tests About One Mean (0) | 2025.01.03 |