* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다
1. 이론 정리
1) 개요
(1) 분포에 대한 가정을 하지 않는 신뢰구간
a) 일반적으로 신뢰구간은 특정 분포(예: 정규분포)를 가정하지만, 본 장에서는 분포 독립적인 신뢰구간을 다룸.
b) 표본의 순서통계를 이용하여 특정 백분위수에 대한 신뢰구간을 설정하는 방법을 제시함.
2) 순서통계량과 백분위수
(1) 순서통계량(Order Statistics)
a) 크기 n의 표본 {Y1, Y2, ..., Yn}에서 Y(i)는 i번째 작은 값.
b) 표본 백분위수를 모집단 백분위수의 추정치로 활용 가능.
(2) 신뢰구간의 정의
a) 특정 백분위수 πp의 신뢰구간은 P(Yi < πp < Yj)로 계산 가능.
b) 신뢰계수는 특정 확률을 가지도록 이항분포를 사용하여 결정됨.
3) 중앙값과 일반 백분위수의 신뢰구간
(1) 중앙값(π0.5)의 신뢰구간
a) 작은 표본의 경우 직접 계산 가능, 예를 들어 n = 5일 때 (Y1, Y5)가 93.75% 신뢰구간.
b) 더 큰 표본의 경우 표 7.5-1을 참조하여 신뢰구간 결정.

(2) 일반 백분위수(πp)의 신뢰구간
a) (Yi, Yn+1−i) 형태로 설정됨.
b) 정확한 신뢰계수를 유지하기 위해 이항분포를 활용.
2. 예제
1) 문제
(1) 크기가 n = 9인 표본에서 중앙값의 95% 신뢰구간을 구하시오.
- 표본: {7.12, 7.22, 6.78, 6.31, 5.99, 6.58, 7.80, 7.40, 7.05}
(2) 크기가 n = 12인 표본에서 중앙값의 96.14% 신뢰구간을 구하시오.
- 표본: {6.0, 6.3, 5.0, 6.0, 5.7, 5.9, 6.8, 5.5, 5.4, 4.8, 5.4, 5.8}
2) 답안
(1) 표본을 정렬하면:
- 5.99 < 6.31 < 6.58 < 6.78 < 7.05 < 7.12 < 7.22 < 7.40 < 7.80
- Y3 = 6.58, Y7 = 7.22이므로, 신뢰구간은 (6.58, 7.22) (95%)
(2) 표본을 정렬하면:
- 4.8 < 5.0 < 5.4 < 5.4 < 5.5 < 5.7 < 5.8 < 5.9 < 6.0 < 6.0 < 6.3 < 6.8
- Y2 = 5.0, Y11 = 6.3이므로, 신뢰구간은 (5.0, 6.3) (96.14%)
3. 연습문제
1) 문제
(1) 크기가 n = 10인 표본에서 중앙값의 94.5% 신뢰구간을 구하시오.
- 표본: {3.2, 4.1, 5.6, 4.9, 2.8, 3.7, 5.0, 6.1, 4.5, 3.9}
(2) 크기가 n = 12인 표본에서 25번째 백분위수(π0.25)의 90% 신뢰구간을 구하시오.
- 표본: {8.1, 7.5, 6.9, 7.8, 6.2, 7.2, 8.4, 6.5, 7.0, 8.0, 7.1, 6.8}
(3) 크기가 n = 14인 표본에서 중앙값(π0.5)의 95% 신뢰구간을 구하시오.
- 표본: {12.5, 11.2, 10.8, 11.5, 12.0, 11.8, 13.1, 10.5, 12.3, 11.9, 12.7, 11.0, 12.2, 13.0}
2) 답안
(1) 중앙값의 94.5% 신뢰구간
- 표본 정렬: 2.8 < 3.2 < 3.7 < 3.9 < 4.1 < 4.5 < 4.9 < 5.0 < 5.6 < 6.1
- Y3 = 3.7, Y8 = 5.0이므로 신뢰구간은 (3.7, 5.0) (94.5%)
(2) 25번째 백분위수의 90% 신뢰구간
- 표본 정렬: 6.2 < 6.5 < 6.8 < 6.9 < 7.0 < 7.1 < 7.2 < 7.5 < 7.8 < 8.0 < 8.1 < 8.4
- Y3 = 6.8, Y10 = 8.0이므로 신뢰구간은 (6.8, 8.0) (90%)
(3) 중앙값의 95% 신뢰구간
- 표본 정렬: 10.5 < 10.8 < 11.0 < 11.2 < 11.5 < 11.8 < 11.9 < 12.0 < 12.2 < 12.3 < 12.5 < 12.7 < 13.0 < 13.1
- Y4 = 11.2, Y11 = 12.5이므로 신뢰구간은 (11.2, 12.5) (95%)
# R code
# 문제 (1)
sample1 <- c(3.2, 4.1, 5.6, 4.9, 2.8, 3.7, 5.0, 6.1, 4.5, 3.9)
sorted1 <- sort(sample1)
conf1 <- c(sorted1[3], sorted1[8])
# 문제 (2)
sample2 <- c(8.1, 7.5, 6.9, 7.8, 6.2, 7.2, 8.4, 6.5, 7.0, 8.0, 7.1, 6.8)
sorted2 <- sort(sample2)
conf2 <- c(sorted2[3], sorted2[10])
# 문제 (3)
sample3 <- c(12.5, 11.2, 10.8, 11.5, 12.0, 11.8, 13.1, 10.5, 12.3, 11.9, 12.7, 11.0, 12.2, 13.0)
sorted3 <- sort(sample3)
conf3 <- c(sorted3[4], sorted3[11])
# 결과 출력
list(conf1, conf2, conf3)
# Python code
import numpy as np
# 문제 (1)
sample1 = [3.2, 4.1, 5.6, 4.9, 2.8, 3.7, 5.0, 6.1, 4.5, 3.9]
sorted1 = sorted(sample1)
conf1 = (sorted1[2], sorted1[7])
# 문제 (2)
sample2 = [8.1, 7.5, 6.9, 7.8, 6.2, 7.2, 8.4, 6.5, 7.0, 8.0, 7.1, 6.8]
sorted2 = sorted(sample2)
conf2 = (sorted2[2], sorted2[9])
# 문제 (3)
sample3 = [12.5, 11.2, 10.8, 11.5, 12.0, 11.8, 13.1, 10.5, 12.3, 11.9, 12.7, 11.0, 12.2, 13.0]
sorted3 = sorted(sample3)
conf3 = (sorted3[3], sorted3[10])
# 결과 출력
print(conf1, conf2, conf3)
'통계' 카테고리의 다른 글
| 7.7 Resampling Methods (0) | 2025.01.03 |
|---|---|
| 7.6 More Regression (0) | 2025.01.03 |
| 7.4 Sample Size (0) | 2025.01.03 |
| 7.3 Confidence Intervals for Proportions (0) | 2025.01.03 |
| 7.2 Confidence Intervals for the Difference of Two Means (0) | 2025.01.03 |