* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다.
3.1 연속형 확률 변수 (Random Variables of the Continuous Type)
정의 및 기본 개념
연속형 확률 변수는 실수 범위에서 정의된 확률 변수로, 값이 이산적이지 않고 연속적으로 분포합니다.
연속형 확률 변수는 다음 두 가지 주요 함수로 정의됩니다:
1. 확률 밀도 함수 (Probability Density Function, PDF): \( f(x) \)
- PDF는 특정 값에서의 "확률"을 직접적으로 나타내지는 않지만, 구간에서의 확률 계산에 사용됩니다.
- \( f(x) \geq 0 \) (모든 \( x \)에 대해),
- \( \int_{-\infty}^\infty f(x) dx = 1 \) (PDF의 적분은 전체 확률이 1임을 보장).
2. 누적 분포 함수 (Cumulative Distribution Function, CDF): \( F(x) \)
- \( F(x) = P(X \leq x) = \int_{-\infty}^x f(t) dt \),
- \( F(x) \)는 단조 증가 함수로, 0에서 1 사이의 값을 가집니다,
- \( f(x) = F'(x) \) (미분 가능할 경우).
연속형 확률 변수의 확률 계산
구간 \( (a, b) \)에서의 확률은 PDF를 이용하여 계산됩니다:
\[P(a < X < b) = \int_a^b f(x) dx\]
PDF와 CDF의 특성
1. PDF:
- 값 자체가 확률이 아님.
- \( P(X = x) = 0 \), 특정 값에서의 확률은 항상 0.
- 구간에서의 확률 계산에 사용.
2. CDF:
- \( F(x) \)는 특정 값 \( x \)까지의 누적 확률을 나타냄.
- 단조 증가: \( x \)가 커질수록 \( F(x) \)는 감소하지 않음.
- \( \lim_{x \to -\infty} F(x) = 0 \), \( \lim_{x \to \infty} F(x) = 1 \).
예제 1: PDF와 CDF 계산
\( Y \)가 PDF \( g(y) = 2y, 0 < y < 1 \)를 따르는 연속형 확률 변수라고 하자.
1. CDF 계산:
\[G(y) = \int_{0}^{y} 2t dt = y^2, \quad 0 \leq y < 1\]
경계 조건을 고려하면:
\[G(y) = \begin{cases}
0, & y < 0 \\
y^2, & 0 \leq y < 1 \\
1, & y \geq 1
\end{cases}
\]
2. 확률 계산:
(a) \( P\left(\frac{1}{2} < Y \leq \frac{3}{4}\right) \):
\[
P\left(\frac{1}{2} < Y \leq \frac{3}{4}\right) = G\left(\frac{3}{4}\right) - G\left(\frac{1}{2}\right) = \left(\frac{3}{4}\right)^2 - \left(\frac{1}{2}\right)^2 = \frac{9}{16} - \frac{4}{16} = \frac{5}{16}
\]
(b) \( P\left(\frac{1}{4} \leq Y < 1\right) \):
\[
P\left(\frac{1}{4} \leq Y < 1\right) = G(1) - G\left(\frac{1}{4}\right) = 1 - \left(\frac{1}{4}\right)^2 = 1 - \frac{1}{16} = \frac{15}{16}
\]
연속형 확률 변수의 기대값과 분산
1. 기대값:
\[
E(X) = \int_{-\infty}^\infty x f(x) dx
\]
2. 분산:
\[
\text{Var}(X) = \int_{-\infty}^\infty (x - \mu)^2 f(x) dx, \quad \mu = E(X)
\]
또는:
\[
\text{Var}(X) = E(X^2) - [E(X)]^2
\]
연속형과 이산형의 차이
- 이산형 확률 변수:
- 확률 질량 함수(PMF): 특정 값에서의 확률을 직접 제공 (\( P(X = x) \)).
- 확률은 값 자체로 정의됨.
- 연속형 확률 변수:
- 확률 밀도 함수(PDF): 특정 값에서의 확률이 아닌, 확률 밀도를 나타냄.
- 구간에 걸친 확률은 PDF를 적분하여 계산.
예제 2: 균등 분포 (Uniform Distribution)
PDF:
\[
f(x) = \frac{1}{b-a}, \quad a \leq x \leq b
\]
CDF:
\[
F(x) =
\begin{cases}
0, & x < a \\
\frac{x-a}{b-a}, & a \leq x < b \\
1, & x \geq b
\end{cases}
\]
기대값과 분산:
\[
E(X) = \frac{a+b}{2}, \quad \text{Var}(X) = \frac{(b-a)^2}{12}
\]
연습문제
1. \( X \sim U(0, 10) \)일 때:
- (a) \( P(X \geq 8) \),
- (b) \( P(2 \leq X < 8) \),
- (c) \( E(X) \),
- (d) \( \text{Var}(X) \).
2. PDF \( f(x) = 3x^2, 0 \leq x \leq 1 \)일 때:
- (a) \( P(0 \leq X \leq \frac{1}{2}) \),
- (b) 기대값과 분산 계산.
결론
연속형 확률 변수는 PDF와 CDF를 통해 확률을 계산하며, 기대값과 분산은 적분을 사용하여 구합니다. 이러한 계산은 특정 값에서의 확률보다는 구간 확률에 초점을 맞춥니다.
연습문제 풀이 및 코드
문제 1: \( X \sim U(0, 10) \)
균등 분포 \( U(0, 10) \)의 PDF는:
\[
f(x) = \frac{1}{10}, \quad 0 \leq x \leq 10
\]
CDF는:
\[
F(x) =
\begin{cases}
0, & x < 0 \\
\frac{x}{10}, & 0 \leq x \leq 10 \\
1, & x > 10
\end{cases}
\]
(a) \( P(X \geq 8) \):
\[
P(X \geq 8) = 1 - F(8) = 1 - \frac{8}{10} = 0.2
\]
b) \( P(2 \leq X < 8) \):
\[
P(2 \leq X < 8) = F(8) - F(2) = \frac{8}{10} - \frac{2}{10} = 0.6
\]
(c) \( E(X) \):
\[
E(X) = \frac{a + b}{2} = \frac{0 + 10}{2} = 5
\]
(d) \( \text{Var}(X) \):
\[
\text{Var}(X) = \frac{(b-a)^2}{12} = \frac{(10-0)^2}{12} = \frac{100}{12} \approx 8.333
\]
문제 2: PDF \( f(x) = 3x^2, \, 0 \leq x \leq 1 \)
(a) \( P(0 \leq X \leq \frac{1}{2}) \):
\[
P(0 \leq X \leq \frac{1}{2}) = \int_{0}^{1/2} 3x^2 \, dx
\]
적분 계산:
\[
\int 3x^2 dx = x^3 + C
\]
\[
P(0 \leq X \leq \frac{1}{2}) = \left[ x^3 \right]_0^{1/2} = \left( \frac{1}{2} \right)^3 - 0^3 = \frac{1}{8}
\]
(b) 기대값 \( E(X) \) 및 분산 \( \text{Var}(X) \):
\[
E(X) = \int_{0}^{1} x \cdot 3x^2 \, dx = \int_{0}^{1} 3x^3 \, dx
\]
적분 계산:
\[
\int 3x^3 dx = \frac{3x^4}{4} + C
\]
\[
E(X) = \left[ \frac{3x^4}{4} \right]_0^1 = \frac{3}{4} - 0 = \frac{3}{4}
\]
분산:
\[
\text{Var}(X) = E(X^2) - [E(X)]^2
\]
\( E(X^2) \) 계산:
\[
E(X^2) = \int_{0}^{1} x^2 \cdot 3x^2 \, dx = \int_{0}^{1} 3x^4 \, dx
\]
\[
\int 3x^4 dx = \frac{3x^5}{5} + C
\]
\[
E(X^2) = \left[ \frac{3x^5}{5} \right]_0^1 = \frac{3}{5} - 0 = \frac{3}{5}
\]
\[
\text{Var}(X) = \frac{3}{5} - \left(\frac{3}{4}\right)^2 = \frac{3}{5} - \frac{9}{16} = \frac{48}{80} - \frac{45}{80} = \frac{3}{80}
\]
# R코드
#Problem 1
#(a) P(X >= 8)
P_geq_8 <- 1 - 8 / 10
print(P_geq_8)
#(b) P(2 <= X < 8)
P_2_to_8 <- 8 / 10 - 2 / 10
print(P_2_to_8)
#(c) E(X)
E_X <- (0 + 10) / 2
print(E_X)
#(d) Var(X)
Var_X <- (10 - 0)^2 / 12
print(Var_X)
#Problem 2
#(a) P(0 <= X <= 1/2)
P_0_to_half <- (1/2)^3 - 0^3
print(P_0_to_half)
#(b) E(X) and Var(X)
E_X <- 3 (1/4)
E_X2 <- 3 (1/5)
Var_X <- E_X2 - E_X^2
print(c(E_X, Var_X))
# Python 코드
# Problem 1
# (a) P(X >= 8)
P_geq_8 = 1 - 8 / 10
print(P_geq_8)
# (b) P(2 <= X < 8)
P_2_to_8 = 8 / 10 - 2 / 10
print(P_2_to_8)
# (c) E(X)
E_X = (0 + 10) / 2
print(E_X)
# (d) Var(X)
Var_X = (10 - 0) 2 / 12
print(Var_X)
# Problem 2
# (a) P(0 <= X <= 1/2)
P_0_to_half = (1 / 2) 3 - 0 3
print(P_0_to_half)
# (b) E(X) and Var(X)
E_X = 3 / 4
E_X2 = 3 / 5
Var_X = E_X2 - E_X2
print(E_X, Var_X)'통계' 카테고리의 다른 글
| 3.3 Continuous Distributions -The Normal Distribution (1) | 2024.12.27 |
|---|---|
| 3.2 Continuous Distributions -The Exponential, Gamma, and Chi-SquareDistributions (1) | 2024.12.27 |
| 2.6 Discrete Distributions -The Poisson Distribution (0) | 2024.12.23 |
| 2.5 Discrete Distributions -The Negative Binomial Distribution (1) | 2024.12.23 |
| 2.4 Discrete Distributions -THE BINOMIAL DISTRIBUTION (0) | 2024.12.23 |