* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다
1. 이론 정리
1) 개요
(1) 두 모집단 평균 비교의 필요성
- 연구자는 두 개의 독립적인 모집단이 동일한 평균을 갖는지 검정하기 위해 통계적 가설 검정을 수행한다.
- 모집단 \(X\)와 \(Y\)가 각각 정규분포 \(N(\mu_X, \sigma^2_X)\) 및 \(N(\mu_Y, \sigma^2_Y)\)를 따른다고 가정한다.
- 가설 검정을 통해 두 모집단이 동일한지 여부를 통계적으로 분석한다.
2) 등분산 가정 하의 t-검정
(1) 검정 통계량 유도
- 모집단 \(X\)와 \(Y\)에서 각각 크기가 \(n\)과 \(m\)인 표본을 추출하고, 표본 평균을 \(\bar{X}, \bar{Y}\)로 정의한다.
- 두 모집단의 차이를 검정하는 검정통계량 \(T\)는 다음과 같이 정의된다.
\[
T = \frac{\bar{X} - \bar{Y}}{S_P \sqrt{\frac{1}{n} + \frac{1}{m}}}
\]
- 여기서 \(S_P\)는 두 표본의 공통 표준편차이며, 식은 다음과 같다.
\[
S_P^2 = \frac{(n-1)S_X^2 + (m-1)S_Y^2}{n + m - 2}
\]
- 자유도는 \( df = n + m - 2 \)로 정의되며, 검정통계량 \(T\)는 자유도가 \(df\)인 t-분포를 따른다.
(2) 검정 과정
- 귀무가설(\(H_0\)): \( \mu_X = \mu_Y \)
- 대립가설(\(H_1\)): \( \mu_X \neq \mu_Y \) (양측 검정), \( \mu_X > \mu_Y \) 또는 \( \mu_X < \mu_Y \) (단측 검정)
- 유의수준 \(\alpha\)를 설정한 후, \( t_{\alpha}(n+m-2) \)의 임계값과 비교하여 가설을 검정한다.
3) 등분산을 가정하지 않는 경우: 웰치 t-검정
(1) 분산이 다를 경우 t-검정 방법
- 등분산 가정을 하지 않을 경우, 검정통계량은 다음과 같다.
\[
T = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{S_X^2}{n} + \frac{S_Y^2}{m}}}
\]
- 자유도는 다음과 같이 근사적으로 계산된다.
\[
df = \frac{\left( \frac{S_X^2}{n} + \frac{S_Y^2}{m} \right)^2}{\frac{\left( S_X^2/n \right)^2}{n-1} + \frac{\left( S_Y^2/m \right)^2}{m-1}}
\]
- 이 경우에도 검정통계량 \(T\)는 근사적으로 자유도가 \(df\)인 t-분포를 따른다.
2. 검정통계량 \(T\) 유도 과정
1) 가정
- 두 모집단이 정규분포를 따른다고 가정한다.
- 표본 크기가 충분히 크다면 중심극한정리에 의해 정규성 가정이 완화될 수 있다.
2) 표본 평균의 분포
- 표본 평균 \(\bar{X}\)과 \(\bar{Y}\)는 각각 다음과 같은 정규분포를 따른다.
\[
\bar{X} \sim N\left(\mu_X, \frac{\sigma_X^2}{n}\right), \quad \bar{Y} \sim N\left(\mu_Y, \frac{\sigma_Y^2}{m}\right)
\]
- 따라서 두 평균의 차이 \(\bar{X} - \bar{Y}\)는 다음의 정규분포를 따른다.
\[
\bar{X} - \bar{Y} \sim N\left(\mu_X - \mu_Y, \frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}\right)
\]
3) 등분산 가정 하의 공통 표준편차 도출
- 두 모집단의 분산이 같다면, 즉 \( \sigma_X^2 = \sigma_Y^2 = \sigma^2 \)이라면,
\[
\bar{X} - \bar{Y} \sim N\left(\mu_X - \mu_Y, \sigma^2\left(\frac{1}{n} + \frac{1}{m}\right)\right)
\]
- 이때, 모집단의 분산 \( \sigma^2 \)을 알 수 없으므로 표본 분산을 이용하여 추정한다.
- 표본 분산 \( S_X^2 \)과 \( S_Y^2 \)는 각각 다음과 같이 정의된다.
\[
S_X^2 = \frac{\sum(X_i - \bar{X})^2}{n-1}, \quad S_Y^2 = \frac{\sum(Y_j - \bar{Y})^2}{m-1}
\]
- 두 표본의 정보를 결합하여 모집단의 분산을 추정한 값이 공통 표준편차 \( S_P^2 \)이다.
\[
S_P^2 = \frac{(n-1)S_X^2 + (m-1)S_Y^2}{n+m-2}
\]
- 이를 이용하면 표본 평균 차이를 정규화한 검정통계량 \(T\)는 다음과 같이 표현된다.
\[
T = \frac{\bar{X} - \bar{Y}}{S_P \sqrt{\frac{1}{n} + \frac{1}{m}}}
\]
- 이때, \( T \)는 자유도가 \( df = n+m-2 \)인 t-분포를 따른다.
3. 예제
1) 문제
- 한 연구에서 남성과 여성의 평균 키 차이를 검정하고자 한다.
- 남성 표본: 평균 175cm, 표준편차 5cm, 표본 크기 30
- 여성 표본: 평균 165cm, 표준편차 6cm, 표본 크기 25
- 유의수준 \( \alpha = 0.05 \)에서 평균 차이가 있는지 검정하라.
2) 답안
- 등분산 가정 검정 통계량:
\[
S_P = \sqrt{\frac{(30-1)(5)^2 + (25-1)(6)^2}{30+25-2}} \approx 5.48
\]
\[
T = \frac{175 - 165}{5.48 \sqrt{\frac{1}{30} + \frac{1}{25}}} \approx 7.49
\]
- 자유도 \( df = 30 + 25 - 2 = 53 \)
- t 임계값 (양측, \( \alpha=0.05 \)) ≈ 2.006
- \( |T| > 2.006 \)이므로 귀무가설 기각. 즉, 남성과 여성의 평균 키는 유의미한 차이가 있음.
공통 표준편차 \( S_P^2 \)는 두 개의 독립적인 모집단에서 추출한 두 표본의 분산을 결합하여 모집단의 분산을 추정하는 방법입니다.
이를 유도하는 과정은 다음과 같습니다.
1. 두 표본 분산의 정의
표본 분산은 모집단 분산 \(\sigma^2\)를 추정하는 값이며, 각각의 표본에서 다음과 같이 정의됩니다.
\[
S_X^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2
\]
\[
S_Y^2 = \frac{1}{m-1} \sum_{j=1}^{m} (Y_j - \bar{Y})^2
\]
여기서,
- \( X_1, X_2, \dots, X_n \)은 표본 \( X \)의 개별 값
- \( \bar{X} \)는 표본 \( X \)의 평균
- \( S_X^2 \)는 표본 \( X \)의 분산
- \( Y_1, Y_2, \dots, Y_m \)은 표본 \( Y \)의 개별 값
- \( \bar{Y} \)는 표본 \( Y \)의 평균
- \( S_Y^2 \)는 표본 \( Y \)의 분산
중요한 점: \( S_X^2 \)와 \( S_Y^2 \)는 각각 모집단 분산 \( \sigma^2 \)의 불편추정량(unbiased estimator)입니다. 따라서, \( S_X^2 \)와 \( S_Y^2 \)을 결합하면 전체 모집단 분산 \( \sigma^2 \)에 대한 더 좋은 추정량을 얻을 수 있습니다.
2. 풀링된(공통) 표준편차 \( S_P^2 \) 유도
만약 두 모집단이 같은 분산을 가진다고 가정하면, 즉 \( \sigma_X^2 = \sigma_Y^2 = \sigma^2 \), 두 표본에서 얻은 분산을 합쳐서 모집단 분산을 더 잘 추정할 수 있습니다. 이때, 각 표본의 크기만큼 가중치를 고려하여 풀링된(공통) 표본 분산을 계산합니다.
두 표본의 자유도는 각각 \( n-1 \), \( m-1 \)이며, 전체 자유도는 \( (n-1) + (m-1) = n+m-2 \)가 됩니다. 따라서, 두 표본의 정보를 결합하여 모집단의 공통 분산을 추정하는 식은 다음과 같이 정의됩니다.
\[
S_P^2 = \frac{(n-1)S_X^2 + (m-1)S_Y^2}{n + m - 2}
\]
이 식을 유도하는 과정은 다음과 같습니다.
1) 각 표본의 변동량 합 구하기
표본 \(X\)와 표본 \(Y\)에서 각각의 분산을 계산할 때 사용하는 분자는 아래와 같습니다.
\[
(n-1) S_X^2 = \sum_{i=1}^{n} (X_i - \bar{X})^2
\]
\[
(m-1) S_Y^2 = \sum_{j=1}^{m} (Y_j - \bar{Y})^2
\]
이는 각각의 표본에서 개별 값들이 평균 주변에서 얼마나 퍼져 있는지를 나타냅니다.
2) 두 표본의 변동량을 합산하기
전체 데이터를 하나의 모집단으로 고려할 경우, 총 변동량은 두 표본의 변동량을 합한 값으로 표현됩니다.
\[
\sum_{i=1}^{n} (X_i - \bar{X})^2 + \sum_{j=1}^{m} (Y_j - \bar{Y})^2
\]
3) 전체 자유도로 나누어 분산 추정
위에서 구한 전체 변동량을 전체 자유도 \( n+m-2 \)로 나누면, 모집단의 공통 분산에 대한 불편추정량을 얻을 수 있습니다.
\[
S_P^2 = \frac{\sum_{i=1}^{n} (X_i - \bar{X})^2 + \sum_{j=1}^{m} (Y_j - \bar{Y})^2}{n + m - 2}
\]
위 식을 다시 쓰면,
\[
S_P^2 = \frac{(n-1)S_X^2 + (m-1)S_Y^2}{n + m - 2}
\]
이렇게 계산된 \( S_P^2 \)는 두 표본이 같은 모집단에서 왔다고 가정할 때 모집단의 공통 분산을 더 잘 추정하는 값이 됩니다.
3. 풀링된 표준편차 \( S_P \)의 의미
\( S_P \)는 두 표본의 분산을 결합하여 계산한 추정된 공통 표준편차입니다. 이 값은 검정통계량을 계산하는 데 필수적으로 사용됩니다.
\[
T = \frac{\bar{X} - \bar{Y}}{S_P \sqrt{\frac{1}{n} + \frac{1}{m}}}
\]
즉, \( S_P \)를 사용하면 두 표본이 동일한 모집단에서 왔을 가능성을 검정할 수 있으며, t-검정에서 신뢰할 수 있는 분산 추정값을 제공합니다.
4. 예제
문제
- 두 그룹에서 학생들의 시험 점수를 비교하고자 한다.
- 그룹 A: 평균 80점, 표준편차 10점, 표본 크기 30
- 그룹 B: 평균 85점, 표준편차 12점, 표본 크기 35
- 유의수준 \( \alpha = 0.05 \)에서 평균 차이가 유의미한지 검정하라.
풀이
1) 공통 표준편차 계산
\[
S_P = \sqrt{\frac{(30-1)(10)^2 + (35-1)(12)^2}{30 + 35 - 2}}
\]
\[
= \sqrt{\frac{(29)(100) + (34)(144)}{63}}
\]
\[
= \sqrt{\frac{2900 + 4896}{63}}
\]
\[
= \sqrt{\frac{7796}{63}} \approx 11.12
\]
2) 검정통계량 계산
\[
T = \frac{80 - 85}{11.12 \sqrt{\frac{1}{30} + \frac{1}{35}}}
\]
\[
= \frac{-5}{11.12 \times \sqrt{0.0333 + 0.0286}}
\]
\[
= \frac{-5}{11.12 \times \sqrt{0.0619}}
\]
\[
= \frac{-5}{11.12 \times 0.2488}
\]
\[
= \frac{-5}{2.766} \approx -1.81
\]
3) 임계값 비교
- 자유도 \( df = 30 + 35 - 2 = 63 \)
- 유의수준 \( \alpha = 0.05 \)에서 t-분포의 양측 임계값 \( t_{0.05,63} \approx 2.000 \)
- \( |T| = 1.81 < 2.000 \), 따라서 귀무가설 채택.
결론
두 그룹 간 평균 점수 차이는 유의하지 않으며, 교육 방법의 차이가 성적에 영향을 미친다고 볼 수 없다.
5. 요약
- 공통 표준편차 \( S_P^2 \)는 두 표본의 분산을 합하여 모집단의 공통 분산을 추정하는 방법이다.
- 이는 두 표본의 자유도를 고려하여 가중 평균 방식으로 계산된다.
- t-검정에서 \( S_P \)를 이용하여 검정통계량을 계산하고, 귀무가설을 검정한다.
- 이 개념은 등분산 가정 하의 t-검정에서 매우 중요한 역할을 한다.
'통계' 카테고리의 다른 글
| 8.4 The Wilcoxon Tests (0) | 2025.01.03 |
|---|---|
| 8.3 Tests About Proportions (0) | 2025.01.03 |
| 8.1 Tests About One Mean (0) | 2025.01.03 |
| 7.7 Resampling Methods (0) | 2025.01.03 |
| 7.6 More Regression (0) | 2025.01.03 |