* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다
1. 이론 정리
1) 개요
(1) 한 개의 모수에 대한 가설 검정은 모집단의 평균이 특정한 값과 다른지를 검정하는 과정이다.
(2) 가설 검정은 귀무가설 \(H_0\)과 대립가설 \(H_1\)을 설정하고, 표본 데이터를 기반으로 \(H_0\)를 기각할지를 결정한다.
(3) 본 절에서는 정규분포를 가정한 단일 평균 검정에 대해 다룬다.
2) 정의
(1) 귀무가설 (Null Hypothesis, \(H_0\))
- 모집단의 평균이 특정한 값 \(\mu_0\)와 같다는 가설
- 예: \(H_0: \mu = \mu_0\)
(2) 대립가설 (Alternative Hypothesis, \(H_1\))
- 모집단의 평균이 \(\mu_0\)와 다르거나, 크거나, 작다는 가설
- 양측 검정: \(H_1: \mu \neq \mu_0\)
- 단측 검정(우측): \(H_1: \mu > \mu_0\)
- 단측 검정(좌측): \(H_1: \mu < \mu_0\)
(3) 유의수준 (\(\alpha\))
- 귀무가설이 참일 때 잘못 기각할 확률 (제1종 오류의 확률)
(4) 검정통계량 (Test Statistic)
- 표본을 통해 계산된 통계량으로 가설을 평가하는 기준
(5) p-값 (p-value)
- 귀무가설이 참이라고 가정할 때, 현재 표본보다 극단적인 결과가 나올 확률
(6) 검정의 오류
- 제1종 오류(Type I Error): \(H_0\)가 참인데 이를 기각하는 오류. 확률 \(\alpha\).
- 제2종 오류(Type II Error): \(H_0\)가 거짓인데 이를 기각하지 않는 오류. 확률 \(\beta\).
- 검정력(Power): \(1 - \beta\), 즉 대립가설이 참일 때 \(H_0\)를 기각할 확률.
3) 정규분포에서 평균 검정
(1) 모분산이 알려진 경우
- 검정통계량:
\[
Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}
\]
- 기각 기준 (유의수준 \(\alpha\)):
- 단측 검정 (\(\mu > \mu_0\)): \(Z \geq Z_\alpha\) → \(H_0\) 기각
- 단측 검정 (\(\mu < \mu_0\)): \(Z \leq -Z_\alpha\) → \(H_0\) 기각
- 양측 검정 (\(\mu \neq \mu_0\)): \(|Z| \geq Z_{\alpha/2}\) → \(H_0\) 기각
(2) 모분산이 알려지지 않은 경우
- 검정통계량:
\[
t = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}
\]
- 자유도: \(df = n - 1\)
- 기각 기준 (유의수준 \(\alpha\)):
- 단측 검정 (\(\mu > \mu_0\)): \(t \geq t_\alpha(n-1)\) → \(H_0\) 기각
- 단측 검정 (\(\mu < \mu_0\)): \(t \leq -t_\alpha(n-1)\) → \(H_0\) 기각
- 양측 검정 (\(\mu \neq \mu_0\)): \(|t| \geq t_{\alpha/2}(n-1)\) → \(H_0\) 기각
4) p-값을 활용한 가설 검정
(1) \(p\)-값이 유의수준 \(\alpha\)보다 작으면 \(H_0\)를 기각.
(2) 예제에서 \(\bar{X} = 62.75, \mu_0 = 60, \sigma = 10, n = 52\)일 때,
\[
Z = \frac{62.75 - 60}{10 / \sqrt{52}} = 1.983
\]
\(p\)-값 = 0.0237 → \(\alpha = 0.05\)에서 \(H_0\) 기각.
(3) 양측 검정의 경우, \(p\)-값은 단측 검정의 \(p\)-값의 두 배.
2. 제1, 2종 오류와 검정력


1) 제1종 오류(Type I Error, \(\alpha\))
- 귀무가설 \(H_0\)이 참인데 잘못 기각하는 오류
- 그림에서 붉은색 영역
- \(\alpha\) 값이 작을수록 제1종 오류를 줄일 수 있으나, 제2종 오류가 증가할 수 있음
2) 제2종 오류(Type II Error, \(\beta\))
- 귀무가설이 거짓인데 기각하지 않는 오류
- 그림에서 청색 영역
- \(\beta\) 값이 작을수록 검정력이 증가함
3) 검정력 (Power, \(1 - \beta\))
- \(H_1\)이 참일 때 \(H_0\)를 기각할 확률
- 검정력은 표본 크기 \(n\)이 클수록 증가
- 제2종 오류(\(\beta\))를 제외한 대립가설 분포에서의 나머지 영역.
- 즉, 대립가설(\(H_1\)) 분포에서 임계값 오른쪽(또는 왼쪽)의 하얀 부분이 검정력에 해당함.
3. 예제
1) 문제
(1) IQ 점수가 \(N(\mu, 100)\) 분포를 따르는 모집단에서 무작위 표본 \(n = 16\)을 추출하여 \(\bar{X} = 113.5\)를 얻음.
- \(H_0: \mu = 110\) vs. \(H_1: \mu > 110\)
- \(\alpha = 0.05, 0.10\)에서 \(H_0\)를 기각하는지 검정.
- \(p\)-값을 계산.
2) 답안
(1) IQ 검정
- \(Z = \frac{113.5 - 110}{10 / \sqrt{16}} = 1.4\)
- \(\alpha = 0.05\)에서 \(Z_{0.05} = 1.645\)이므로 \(H_0\) 기각 안함.
- \(\alpha = 0.10\)에서 \(Z_{0.10} = 1.282\)이므로 \(H_0\) 기각.
- \(p\)-값 = \(P(Z \geq 1.4) \approx 0.0808\)
4. 결론
1) 제1종 오류는 유의수준 \(\alpha\)와 직접적으로 연관되며, 제2종 오류는 검정력과 반비례 관계를 가짐.
2) 표본 크기를 증가시키면 검정력이 증가하여 제2종 오류를 줄일 수 있음.
3) 그림에서 두 분포의 겹치는 영역이 오류가 발생하는 영역이며, \(\alpha\)와 \(\beta\)를 조정하는 것이 중요함.
1. 검정력 (Power of a Test)
1) 정의
(1) 검정력(Power)은 대립가설(\(H_1\))이 참일 때 귀무가설(\(H_0\))을 올바르게 기각할 확률을 의미함.
(2) 수식적으로 검정력은 다음과 같이 정의됨.
\[
\text{Power} = 1 - \beta
\]
여기서 \(\beta\)는 제2종 오류(Type II Error)의 확률로, \(H_0\)가 거짓인데도 불구하고 이를 기각하지 못하는 확률임.
(3) 즉, 검정력이 클수록 실제로 대립가설이 참일 때 이를 더 잘 탐지할 수 있음.
2) 검정력의 중요성
(1) 검정력이 낮다면 대립가설이 참일 때도 \(H_0\)를 기각하지 못할 확률이 높아짐(즉, 제2종 오류가 증가).
(2) 특히, 실험 연구에서 효과를 발견해야 하는 경우 검정력이 충분히 커야 함.
(3) 임상시험, 공정관리, 품질검사 등에서는 낮은 검정력이 문제를 야기할 수 있음.
(4) 통상적으로 검정력은 \(0.8\) 이상을 권장하며, 이는 연구자가 대립가설이 참일 때 \(H_0\)를 기각할 확률이 최소 80% 이상이 되도록 설정하는 것을 의미함.
2. 검정력에 영향을 미치는 요인
1) 유의수준 (\(\alpha\))
(1) \(\alpha\)가 증가하면 검정력이 증가하지만, 제1종 오류(\(\alpha\))도 증가하게 됨.
(2) 따라서 적절한 \(\alpha\) 값을 설정하는 것이 중요함.
2) 효과 크기 (Effect Size, \(\delta\))
(1) 효과 크기는 귀무가설에서 주장하는 평균 \(\mu_0\)와 실제 평균 \(\mu_1\)의 차이를 나타냄.
\[
\delta = \frac{|\mu_1 - \mu_0|}{\sigma}
\]
(2) 효과 크기가 클수록 검정력이 증가함.
(3) Cohen(1988)은 효과 크기를 다음과 같이 분류함.
- 작은 효과 (\(\delta = 0.2\))
- 중간 효과 (\(\delta = 0.5\))
- 큰 효과 (\(\delta = 0.8\))
3) 표본 크기 (\(n\))
(1) 표본 크기가 클수록 표본 평균의 변동성이 감소하여 검정력이 증가함.
(2) 검정력을 증가시키기 위해 가장 흔히 사용하는 방법 중 하나가 표본 크기를 증가시키는 것임.
(3) 표본 크기를 계산할 때는 다음 관계를 이용할 수 있음.
\[
n = \left(\frac{(Z_{\alpha} + Z_{\beta}) \sigma}{\mu_1 - \mu_0}\right)^2
\]
- \(Z_{\alpha}\)는 유의수준에 해당하는 Z-값.
- \(Z_{\beta}\)는 제2종 오류에 해당하는 Z-값.
- \(\sigma\)는 모집단의 표준편차.
- \(\mu_1 - \mu_0\)는 효과 크기.
4) 모집단 변동성 (\(\sigma\))
(1) 모집단의 표준편차 \(\sigma\)가 크면 검정력이 감소함.
(2) 변동성이 크면 효과 크기가 작아지고, 그만큼 신뢰구간이 넓어지면서 \(H_0\)를 기각하기 어려워짐.
(3) 변동성을 줄이기 위해 더 정밀한 측정 방법을 사용하거나, 데이터 수집 방법을 개선할 필요가 있음.
3. 검정력 계산 예제
1) 문제
(1) 정규분포 \(N(\mu, \sigma^2)\)에서 모집단 표준편차가 \(\sigma = 10\)이고, 귀무가설이 \(H_0: \mu = 100\), 대립가설이 \(H_1: \mu = 105\)라고 하자.
(2) 표본 크기가 \(n = 25\)일 때, 검정력(\(1 - \beta\))을 구하라.
(3) 유의수준은 \(\alpha = 0.05\)로 설정한다.
2) 풀이
(1) 검정통계량 \(Z\)는 다음과 같다.
\[
Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}
\]
(2) 유의수준 \(\alpha = 0.05\)에서 \(H_0\) 기각 기준:
\[
Z_{0.05} = 1.645
\]
(3) \(H_1\)이 참일 때 \(\beta\) 계산:
- \(H_1\)이 참이면 모집단 평균이 \(\mu_1 = 105\)임.
- \(\bar{X}\)의 분포는 \(N(105, 10^2 / 25)\)을 따름.
- \(H_0\) 기각 임계값:
\[
X_{\text{critical}} = 100 + 1.645 \times \frac{10}{\sqrt{25}} = 103.29
\]
- 제2종 오류 확률 \(\beta\):
\[
\beta = P\left(\bar{X} < 103.29 \mid H_1\text{ 참일 때 } \mu_1 = 105\right)
\]
\[
= P\left( Z < \frac{103.29 - 105}{10 / \sqrt{25}} \right)
\]
\[
= P\left( Z < \frac{-1.71}{2} \right) = P(Z < -0.855)
\]
\[
= 0.195
\]
- 검정력:
\[
1 - \beta = 1 - 0.195 = 0.805
\]
- 따라서, 검정력은 80.5%로 충분히 높은 수준임.
4. 요약 정리
1) 검정력은 대립가설이 참일 때 \(H_0\)를 올바르게 기각할 확률을 의미함.
2) 검정력을 증가시키려면 유의수준을 높이거나, 효과 크기를 키우거나, 표본 크기를 늘리거나, 변동성을 줄여야 함.
3) 연구 설계 시 검정력을 80% 이상으로 설정하는 것이 일반적이며, 검정력이 너무 낮으면 효과를 검출하기 어려움.
표본 크기(\(n\))를 증가시키면 제2종 오류(\(\beta\))는 감소하지만, 제1종 오류(\(\alpha\))에는 직접적인 영향이 없음.
1. 표본 크기 증가와 검정력
표본 크기를 증가시키면 검정력(\(1 - \beta\))이 증가한다.
즉, 대립가설(\(H_1\))이 참일 때 \(H_0\)를 더 쉽게 기각할 수 있다.
- 표본 크기 증가의 효과
- 표본 크기가 커질수록 표본 평균 \(\bar{X}\)의 표준오차(\(\sigma_{\bar{X}}\))가 작아진다.
- 즉, 표본 평균의 변동성이 줄어들고, 분포가 좁아지며 정밀도가 증가한다.
- 결과적으로 대립가설(\(H_1\))의 분포가 더 분리되어 제2종 오류(\(\beta\))가 줄어든다.
2. 표본 크기와 제1종 오류 (\(\alpha\))
- 제1종 오류(\(\alpha\))는 연구자가 미리 설정하는 값이며, 이는 검정 방법(유의수준 \(\alpha\))에 따라 결정됨.
- 표본 크기를 증가시켜도 \(\alpha\) 값 자체는 변하지 않음.
- 하지만, 표본 크기를 증가시키면 같은 효과 크기에서도 \(p\)-값이 더 작아질 가능성이 높아지므로, 유의수준을 초과하는 결과가 나올 확률이 증가할 수 있음.
- 즉, \(\alpha\) 자체는 변화하지 않지만, 같은 효과라도 더 쉽게 유의미한 결과로 판정될 수 있음.
3. 표본 크기와 제2종 오류 (\(\beta\))
- 표본 크기를 늘리면 제2종 오류(\(\beta\))는 감소한다.
- 표본 크기가 증가하면 표본 평균의 분포가 더 좁아지고, 검정력이 증가하여 \(H_1\)을 더 잘 탐지할 수 있음.
- 즉, 대립가설이 참일 때, \(H_0\)를 기각할 확률(검정력)이 증가하고, 따라서 \(\beta\)는 감소함.
4. 표본 크기 증가에 따른 변화 요약
| 변화 요소 | 표본 크기 증가 시 효과 |
| 제1종 오류 (\(\alpha\)) | 변화 없음 (유의수준은 연구자가 결정) |
| 제2종 오류 (\(\beta\)) | | 감소 (검정력이 증가) |
| 검정력 (\(1 - \beta\)) | 증가 |
| 표본 평균의 변동성 | 감소 (더 정밀한 추정 가능) |
| 효과 검출 가능성 | 증가 (작은 효과도 더 쉽게 탐지 가능) |
5. 요약 정리
- 표본 크기를 늘리면 제2종 오류(\(\beta\))는 줄어들고 검정력(\(1 - \beta\))은 증가한다.
- 하지만 제1종 오류(\(\alpha\))는 유의수준에 의해 결정되므로 표본 크기에 의해 직접적으로 변화하지 않는다.
- 그러나 같은 효과 크기에서도 유의미한 결과를 얻을 확률이 높아지므로, 작은 효과라도 유의미한 것으로 판정될 가능성이 커짐.
- 따라서 연구 설계 시 적절한 표본 크기와 유의수준을 설정하는 것이 중요함.
'통계' 카테고리의 다른 글
| 8.3 Tests About Proportions (0) | 2025.01.03 |
|---|---|
| 8.2 Tests of the Equality of Two Means (0) | 2025.01.03 |
| 7.7 Resampling Methods (0) | 2025.01.03 |
| 7.6 More Regression (0) | 2025.01.03 |
| 7.5 Distribution-Free Confidence Intervals for Percentiles (0) | 2025.01.03 |