* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다
수정된 포아송 과정: 실패율(Force of Mortality)의 도입
포아송 과정과 실패율 \( \lambda(w) \)
포아송 과정의 수정된 가정에서는 사건 발생률 \( \lambda(w) \)이 위치 \( w \)에 따라 달라질 수 있습니다. 이때 \( \lambda(w) \)는 실패율 또는 사망률(force of mortality)이라고 하며, 특정 위치 \( w \)에서 사건 발생의 강도를 나타냅니다.
1. 기본 가정:
- \( \lambda(w) \)는 일반적으로 증가 함수입니다.
- \( w \)가 클수록(즉, 시스템이 오래될수록) 실패 확률은 더 높아집니다.
- 구간 \( (w, w+h) \)에서 사건이 발생할 확률은 \( \lambda(w)h \)로 근사될 수 있습니다.
2. 지수 분포와의 비교:
- 지수 분포(3.2 절)에서는 \( \lambda(w) \)가 상수로, 시간이 지나도 사건 발생률이 변하지 않는다고 가정합니다:
\[
\lambda(w) = \lambda \quad (\text{constant})
\]
- 수정된 모델에서는 \( \lambda(w) \)가 위치 \( w \)의 함수로, 시간이 지남에 따라 사건 발생률이 증가하거나 감소할 수 있습니다.
검퍼츠(Gompertz) 분포
정의
검퍼츠 분포는 시간에 따라 증가하는 실패율(사망률)을 설명합니다. 이는 생존 분석, 인구 통계학, 그리고 시간이 지남에 따라 성능이 저하되는 시스템의 모델링에 사용됩니다.
수학적 표현
- 실패율 함수:
\[
\lambda(w) = a e^{b w}, \quad a > 0, b > 0
\]
여기서:
- \( a \): 초기 실패율,
- \( b \): 실패율이 증가하는 속도.
- 확률 밀도 함수(PDF):
\[
f(w) = a e^{b w} \exp \left( -\frac{a}{b} e^{b w} + \frac{a}{b} \right), \quad w \geq 0
\]
- 누적 분포 함수(CDF):
\[
F(w) = 1 - \exp \left( -\frac{a}{b} e^{b w} + \frac{a}{b} \right), \quad w \geq 0
\]
특징
- 시간 \( w \)가 증가함에 따라 실패율이 지수적으로 증가합니다.
- 이는 현실적인 시스템(예: 사람의 노화, 부품의 마모 등)을 설명하는 데 적합합니다.
- 지수 분포와의 차이:
- 지수 분포: 실패율 \( \lambda(w) \)가 상수.
- 검퍼츠 분포: 실패율 \( \lambda(w) \)가 \( w \)의 함수로 증가.
와이블(Weibull) 분포
정의
와이블 분포는 생존 분석, 신뢰성 분석, 그리고 고장률을 모델링하는 데 널리 사용됩니다.
PDF는 다음과 같이 정의됩니다:
\[
f(x) =
\begin{cases}
\frac{\alpha}{\beta} \left( \frac{x}{\beta} \right)^{\alpha-1} e^{-(x/\beta)^\alpha}, & x > 0 \\
0, & x \leq 0
\end{cases}
\]
여기서:
- \( \alpha > 0 \): 형상 파라미터(shape parameter),
- \( \beta > 0 \): 척도 파라미터(scale parameter).
특징
1. \( \alpha = 1 \): 와이블 분포는 지수 분포가 됩니다.
2. \( \alpha > 1 \): 고장률이 시간에 따라 증가하는 경우.
3. \( \alpha < 1 \): 고장률이 시간에 따라 감소하는 경우.
기대값과 분산
- 기대값:
\[
E(X) = \beta \Gamma \left( 1 + \frac{1}{\alpha} \right)
\]
- 분산:
\[
\text{Var}(X) = \beta^2 \left[ \Gamma \left( 1 + \frac{2}{\alpha} \right) - \Gamma^2 \left( 1 + \frac{1}{\alpha} \right) \right]
\]
혼합 분포 (Mixed Distributions)
정의
혼합 분포는 이산 확률과 연속 확률을 결합한 형태입니다.
특정 값에서는 확률 질량(probability mass)이 존재하고, 나머지 값에서는 연속적인 확률 밀도(probability density)를 가집니다.
혼합 분포의 특성
1. 특정 점에서 점프(step)가 나타나며, 이는 해당 값의 확률 질량입니다.
2. 연속 구간에서는 일반적인 확률 밀도가 적용됩니다.
예: 혼합 분포의 CDF
다음과 같은 CDF를 고려합니다:
\[
F(x) =
\begin{cases}
0, & x < 0 \\
\frac{x}{2}, & 0 \leq x < 1 \\
\frac{1}{2}, & 1 \leq x < 2 \\
1, & x \geq 2
\end{cases}
\]
여기서:
- \( P(0 \leq X < 1) = \int_0^1 \frac{1}{2} dx = \frac{1}{2} \),
- \( P(X = 1) = \frac{1}{2} - \frac{1}{2} = 0 \).
연습문제
문제 3.4-1: 검퍼츠 분포
사망률 함수 \( \lambda(w) = 0.01 e^{0.1w} \)를 따르는 경우:
1. \( P(W > 80 \mid W > 60) \) 계산.
2. 기대값 \( E(W) \) 구하기.
3. 분산 \( \text{Var}(W) \) 구하기.
문제 3.4-2: 와이블 분포
와이블 분포 \( f(x) = \frac{2}{3} \left( \frac{x}{3} \right) e^{-(x/3)^2} \)에서:
1. \( P(X \leq 2) \) 계산.
2. 기대값 \( E(X) \) 구하기.
3. 분산 \( \text{Var}(X) \) 구하기.
문제 3.4-3: 혼합 분포
혼합 분포의 CDF가 아래와 같이 주어졌을 때:
\[
F(x) =
\begin{cases}
0, & x < 0 \\
\frac{x}{4}, & 0 \leq x < 2 \\
\frac{1}{2}, & 2 \leq x < 3 \\
1, & x \geq 3
\end{cases}
\]
1. \( P(1 \leq X < 2) \) 구하기.
2. 기대값 \( E(X) \) 구하기.
3. 분산 \( \text{Var}(X) \) 구하기.
포아송 과정의 수정된 가정과 증명
1. 수정된 포아송 과정: 기본 가정
수정된 포아송 과정은 위치 의존적 사건 발생률 \( \lambda(w) \)을 고려합니다. 기존 포아송 과정(섹션 2.6)에서는 다음 가정이 주어졌습니다:
1. 비중첩 구간의 독립성:
서로 겹치지 않는 구간에서 사건 발생 횟수는 독립적입니다.
2. 충분히 작은 구간에서 사건 발생 확률:
- \( h \)가 충분히 작을 때:
- 사건이 한 번 발생할 확률은 \( \lambda h \) (상수 \( \lambda \)는 발생률).
- 두 번 이상 발생할 확률은 본질적으로 0입니다.
수정된 모델에서는 \( \lambda \)를 고정된 상수가 아닌 위치 \( w \)의 함수 \( \lambda(w) \)로 정의합니다. 이를 통해 구간마다 사건 발생률이 다를 수 있는 비균일한 포아송 과정을 설명합니다.
2. 수정된 포아송 과정의 수학적 유도
(1) 사건 발생 확률 \( p(x, w) \)
\( p(x, w) \): 구간 \( (0, w) \)에서 사건이 \( x \)번 발생할 확률(추가설명1 참조).
- 사건이 \( x+1 \)번 발생할 확률과 \( x \)번 발생할 확률의 관계는 다음과 같습니다:
\[
p(x + 1, w + h) - p(x, w) \approx \lambda(w) h
\]
(2) 사건이 발생하지 않을 확률 \( p(0, w) \)
구간 \( (0, w+h) \)에서 사건이 발생하지 않을 확률은 다음과 같이 근사할 수 있습니다:
\[
p(0, w + h) \approx p(0, w) \cdot [1 - \lambda(w) h]
\]
여기서:
- \( p(0, w) \): 구간 \( (0, w) \)에서 사건이 발생하지 않을 확률,
- \( [1 - \lambda(w) h] \): 구간 \( (w, w + h) \)에서 사건이 발생하지 않을 확률.
이를 재정리하면:
\[
p(0, w + h) - p(0, w) \approx -\lambda(w) h \cdot p(0, w)
\]
양변을 \( h \)로 나눈 후 \( h \to 0 \)으로 극한을 취하면:
\[
\frac{d}{dw} [p(0, w)] = -\lambda(w) p(0, w)
\]
(3) \( p(0, w) \)의 해석
미분 방정식을 풀면:
\[
\frac{1}{p(0, w)} \frac{d}{dw} [p(0, w)] = -\lambda(w)
\]
양변을 적분하면:
\[
\ln p(0, w) = - \int_0^w \lambda(t) dt + C
\]
양변에 지수를 취하면:
\[
p(0, w) = e^{- \int_0^w \lambda(t) dt + C} = C_2 e^{-H(w)},
\]
여기서:
- \( H(w) = \int_0^w \lambda(t) dt \),
- \( C_2 = e^C \).
(4) 경계 조건을 이용한 상수 결정
구간 길이가 0일 때 \( p(0, 0) = 1 \)이므로:
\[
p(0, 0) = C_2 e^{-H(0)} = C_2 \cdot e^0 = C_2 = 1
\]
따라서:
\[
p(0, w) = e^{-H(w)}
\]
3. 수정된 포아송 과정에서 첫 번째 사건의 분포
(1) 무발생 구간과 첫 번째 사건의 관계
첫 번째 사건이 발생하는 구간을 나타내는 연속형 확률 변수 \( W \)를 정의합니다:
- \( W \): 첫 번째 사건이 발생하기까지의 구간 길이.
- 누적 분포 함수(CDF) \( G(w) \):
\[
G(w) = P(W \leq w) = 1 - P(W > w)
\]
- \( P(W > w) \): 구간 \( (0, w) \)에서 사건이 발생하지 않을 확률이므로:
\[
G(w) = 1 - p(0, w) = 1 - e^{-H(w)}
\]
(2) 첫 번째 사건의 PDF
누적 분포 함수 \( G(w) \)를 미분하면 확률 밀도 함수(PDF) \( g(w) \)를 얻습니다:
\[
g(w) = G'(w) = H'(w) e^{-H(w)}
\]
여기서:
- \( H'(w) = \lambda(w) \)이므로:
\[
g(w) = \lambda(w) e^{-H(w)}, \quad 0 \leq w
\]
4. 실패율 \( \lambda(w) \)와 분포의 관계
실패율 정의
\( \lambda(w) \)는 \( g(w) \)와 \( G(w) \)의 비율로도 나타낼 수 있습니다:
\[
\lambda(w) = \frac{g(w)}{1 - G(w)}
\]
이는 특정 시점 \( w \)에서의 조건부 실패율(즉, 아직 사건이 발생하지 않은 상태에서 다음에 사건이 발생할 확률)을 의미합니다.
결론
1. 수정된 포아송 과정:
- 사건 발생률 \( \lambda(w) \)가 위치에 따라 달라지는 비균일한 포아송 과정.
- 사건이 발생하지 않을 확률은 \( p(0, w) = e^{-H(w)} \), 여기서 \( H(w) = \int_0^w \lambda(t) dt \).
2. 첫 번째 사건의 분포:
- CDF: \( G(w) = 1 - e^{-H(w)} \),
- PDF: \( g(w) = \lambda(w) e^{-H(w)} \).
3. 실패율 \( \lambda(w) \):
- 특정 시점 \( w \)에서의 조건부 실패율로 정의:
\[
\lambda(w) = \frac{g(w)}{1 - G(w)}
\]
추가설명1-\(\lambda(w)\)함수를 사용하여 식을 정리한 것임
구간 \( (0, w+h) \)에서 사건이 발생하지 않을 확률 근사
1. 기본 가정: 사건의 독립성
포아송 과정에서는 다음과 같은 가정을 따릅니다:
- 서로 중첩되지 않는 두 구간에서 사건 발생은 독립적입니다.
즉, 구간 \((0, w)\)와 구간 \((w, w + h)\)에서의 사건 발생은 독립적입니다.
따라서, 구간 \((0, w + h)\)에서 사건이 발생하지 않을 확률은 다음 두 확률의 곱으로 나타낼 수 있습니다:
\[
P(\text{no occurrences in } (0, w + h)) = P(\text{no occurrences in } (0, w)) \cdot P(\text{no occurrences in } (w, w + h)).
\]
이 표현은 독립성으로 인해 가능해집니다.
2. 구간 \((w, w + h)\)에서 사건 발생 확률의 근사
구간 \((w, w + h)\)에서 사건이 발생하지 않을 확률은 구간 길이 \( h \)가 충분히 작을 때 다음과 같이 근사할 수 있습니다:
\[
P(\text{no occurrences in } (w, w + h)) \approx 1 - P(\text{one or more occurrences in } (w, w + h)).
\]
이제, 사건 발생률이 \( \lambda(w) \)라고 가정합니다:
1. 구간 \((w, w + h)\)에서 사건이 1회 발생할 확률은 \( \lambda(w)h \)로 근사됩니다.
2. 구간이 충분히 짧을 경우 사건이 2회 이상 발생할 확률은 무시할 수 있습니다.
따라서:
\[
P(\text{no occurrences in } (w, w + h)) \approx 1 - \lambda(w)h.
\]
3. 전체 구간 \((0, w + h)\)에서의 근사
전체 구간 \((0, w + h)\)에서 사건이 발생하지 않을 확률은:
\[
P(\text{no occurrences in } (0, w + h)) = P(\text{no occurrences in } (0, w)) \cdot P(\text{no occurrences in } (w, w + h)).
\]
여기서:
- \( P(\text{no occurrences in } (0, w)) = p(0, w) \),
- \( P(\text{no occurrences in } (w, w + h)) \approx 1 - \lambda(w)h \).
따라서:
\[
p(0, w + h) \approx p(0, w) \cdot [1 - \lambda(w)h].
\]
검퍼츠 분포의 증명과 평균 및 분산
1. 검퍼츠 분포의 정의
검퍼츠 분포는 시간 \( w \)에 따라 증가하는 사건 발생률(실패율)을 설명하는 분포입니다.
- 실패율 함수:
\[
\lambda(w) = a e^{b w}, \quad a > 0, b > 0
\]
여기서 \( a \)는 초기 실패율, \( b \)는 실패율의 증가 속도를 나타냅니다.
- 확률 밀도 함수(PDF):
\[
f(w) = \lambda(w) e^{-H(w)}, \quad H(w) = \int_0^w \lambda(t) dt,
\]
즉:
\[
f(w) = a e^{b w} \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right), \quad w \geq 0.
\]
- 누적 분포 함수(CDF):
\[
F(w) = 1 - e^{-H(w)} = 1 - \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right), \quad w \geq 0.
\]
2. 검퍼츠 분포의 증명
(1) 실패율 함수에서 \( H(w) \) 도출
\( H(w) \)는 누적 실패율(cumulative hazard rate)로 정의되며, 다음과 같이 구할 수 있습니다:
\[
H(w) = \int_0^w \lambda(t) dt = \int_0^w a e^{b t} dt.
\]
여기서 \( \int e^{b t} dt = \frac{1}{b} e^{b t} \)를 이용하면:
\[
H(w) = \frac{a}{b} e^{b w} - \frac{a}{b}.
\]
(2) 확률 밀도 함수(PDF)의 유도
PDF는 실패율과 누적 실패율을 조합하여 정의됩니다:
\[
f(w) = \lambda(w) e^{-H(w)}.
\]
여기서:
- \( \lambda(w) = a e^{b w} \),
- \( H(w) = \frac{a}{b} e^{b w} - \frac{a}{b} \).
이를 대입하면:
\[
f(w) = a e^{b w} \exp\left(-\left[\frac{a}{b} e^{b w} - \frac{a}{b}\right]\right).
\]
정리하면:
\[
f(w) = a e^{b w} \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right), \quad w \geq 0.
\]
(3) 누적 분포 함수(CDF)의 유도
CDF는 다음과 같이 정의됩니다:
\[
F(w) = \int_0^w f(t) dt.
\]
그러나 검퍼츠 분포의 성질을 활용하면, \( F(w) \)를 다음으로 표현할 수 있습니다:
\[
F(w) = 1 - P(W > w) = 1 - \exp(-H(w)).
\]
여기서 \( H(w) \)를 대입하면:
\[
F(w) = 1 - \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right).
\]
3. 검퍼츠 분포의 평균
(1) 정의
기대값(평균) \( E(W) \)는 다음과 같이 정의됩니다:
\[
E(W) = \int_0^\infty w f(w) dw.
\]
여기서 \( f(w) \)는:
\[
f(w) = a e^{b w} \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right).
\]
(2) 적분의 대칭성
적분 계산은 복잡하므로, 주로 수치적으로 계산됩니다. 검퍼츠 분포의 평균 \( E(W) \)는 다음 형태로 나타납니다:
\[
E(W) = \frac{1}{b} \left[\gamma + \ln\left(\frac{a}{b}\right)\right],
\]
여기서 \( \gamma \)는 오일러-마스케로니 상수(Euler-Mascheroni constant)입니다.
4. 검퍼츠 분포의 분산
(1) 정의
분산은 다음과 같이 정의됩니다:
\[
\text{Var}(W) = E(W^2) - [E(W)]^2.
\]
(2) \( E(W^2) \) 계산
\( E(W^2) \)는 다음과 같습니다:
\[
E(W^2) = \int_0^\infty w^2 f(w) dw.
\]
이 적분 역시 복잡하며, 일반적으로 수치 계산 또는 근사식을 사용합니다.
(3) 분산 표현식
분산은 다음과 같이 나타납니다:
\[
\text{Var}(W) = \frac{\pi^2}{6 b^2},
\]
이는 검퍼츠 분포의 특성을 반영한 간단한 근사식입니다.
5. 요약
- PDF:
\[
f(w) = a e^{b w} \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right), \quad w \geq 0.
\]
- CDF:
\[
F(w) = 1 - \exp\left(-\frac{a}{b} e^{b w} + \frac{a}{b}\right), \quad w \geq 0.
\]
- 기대값(평균):
\[
E(W) = \frac{1}{b} \left[\gamma + \ln\left(\frac{a}{b}\right)\right].
\]
- 분산:
\[
\text{Var}(W) = \frac{\pi^2}{6 b^2}.
\]
와이블(Weibull) 분포: 정의, 증명 및 평균/분산 증명
1. 와이블 분포 정의
와이블 분포는 생존 분석과 신뢰성 분석에서 널리 사용되는 분포로, 시스템의 고장률을 모델링합니다.
- 확률 밀도 함수(PDF):
\[
f(x) =
\begin{cases}
\frac{\alpha}{\beta} \left( \frac{x}{\beta} \right)^{\alpha - 1} e^{-(x / \beta)^\alpha}, & x > 0 \\
0, & x \leq 0
\end{cases}
\]
여기서:
- \( \alpha > 0 \): 형상 파라미터(shape parameter),
- \( \beta > 0 \): 척도 파라미터(scale parameter).
- 누적 분포 함수(CDF):
\[
F(x) =
\begin{cases}
1 - e^{-(x / \beta)^\alpha}, & x > 0 \\
0, & x \leq 0
\end{cases}
\]
- 특성:
1. \( \alpha = 1 \): 와이블 분포는 지수 분포와 동일.
2. \( \alpha > 1 \): 고장률이 시간에 따라 증가.
3. \( \alpha < 1 \): 고장률이 시간에 따라 감소.
2. PDF 유도
CDF의 정의에서 시작
CDF \( F(x) \)는 \( X \leq x \)일 확률로 정의됩니다:
\[
F(x) = P(X \leq x) = 1 - P(X > x).
\]
와이블 분포에서는 \( P(X > x) \)가 다음과 같이 주어집니다:
\[
P(X > x) = e^{-(x / \beta)^\alpha}, \quad x > 0.
\]
따라서:
\[
F(x) = 1 - e^{-(x / \beta)^\alpha}.
\]
PDF의 유도
PDF는 CDF를 \( x \)에 대해 미분하여 얻습니다:
\[
f(x) = \frac{d}{dx} F(x).
\]
\[
f(x) = \frac{d}{dx} \left( 1 - e^{-(x / \beta)^\alpha} \right).
\]
미분하면:
\[
f(x) = \alpha \beta^{-\alpha} x^{\alpha - 1} e^{-(x / \beta)^\alpha}.
\]
이를 정리하면:
\[
f(x) = \frac{\alpha}{\beta} \left( \frac{x}{\beta} \right)^{\alpha - 1} e^{-(x / \beta)^\alpha}, \quad x > 0.
\]
3. 평균 \( E(X) \) 증명
정의
기대값 \( E(X) \)는 다음과 같이 정의됩니다:
\[
E(X) = \int_0^\infty x f(x) dx.
\]
PDF를 대입하면:
\[
E(X) = \int_0^\infty x \cdot \frac{\alpha}{\beta} \left( \frac{x}{\beta} \right)^{\alpha - 1} e^{-(x / \beta)^\alpha} dx.
\]
변수 치환
\( t = \left( \frac{x}{\beta} \right)^\alpha \)로 치환하면:
- \( x = \beta t^{1 / \alpha} \),
- \( dx = \frac{\beta}{\alpha} t^{(1 / \alpha) - 1} dt \).
적분 변환:
\[
E(X) = \int_0^\infty \beta t^{1 / \alpha} \cdot \frac{\alpha}{\beta} \cdot t^{(1 / \alpha) - 1} e^{-t} \cdot \frac{\beta}{\alpha} dt.
\]
정리하면:
\[
E(X) = \beta \int_0^\infty t^{(1 / \alpha)} e^{-t} dt.
\]
감마 함수 사용
\( \Gamma(z) = \int_0^\infty t^{z - 1} e^{-t} dt \)에 따라:
\[
E(X) = \beta \Gamma\left(1 + \frac{1}{\alpha}\right).
\]
4. 분산 \( \text{Var}(X) \) 증명
정의
분산은 다음과 같이 정의됩니다:
\[
\text{Var}(X) = E(X^2) - [E(X)]^2.
\]
\( E(X^2) \) 계산
\( E(X^2) \)는 다음과 같습니다:
\[
E(X^2) = \int_0^\infty x^2 f(x) dx.
\]
PDF를 대입하면:
\[
E(X^2) = \int_0^\infty x^2 \cdot \frac{\alpha}{\beta} \left( \frac{x}{\beta} \right)^{\alpha - 1} e^{-(x / \beta)^\alpha} dx.
\]
변수 치환
\( t = \left( \frac{x}{\beta} \right)^\alpha \)로 치환하면:
- \( x = \beta t^{1 / \alpha} \),
- \( dx = \frac{\beta}{\alpha} t^{(1 / \alpha) - 1} dt \).
적분 변환:
\[
E(X^2) = \int_0^\infty \beta^2 t^{2 / \alpha} \cdot \frac{\alpha}{\beta} t^{(1 / \alpha) - 1} e^{-t} \cdot \frac{\beta}{\alpha} dt.
\]
정리하면:
\[
E(X^2) = \beta^2 \int_0^\infty t^{(2 / \alpha)} e^{-t} dt.
\]
감마 함수 사용
\[
E(X^2) = \beta^2 \Gamma\left(1 + \frac{2}{\alpha}\right).
\]
최종 분산 계산
분산은 다음과 같습니다:
\[
\text{Var}(X) = E(X^2) - [E(X)]^2.
\]
\[
\text{Var}(X) = \beta^2 \Gamma\left(1 + \frac{2}{\alpha}\right) - \left[\beta \Gamma\left(1 + \frac{1}{\alpha}\right)\right]^2.
\]
5. 요약
- 기대값:
\[
E(X) = \beta \Gamma\left(1 + \frac{1}{\alpha}\right).
\]
- 분산:
\[
\text{Var}(X) = \beta^2 \left[\Gamma\left(1 + \frac{2}{\alpha}\right) - \Gamma^2\left(1 + \frac{1}{\alpha}\right)\right].
\]
연습문제 풀이
문제 3.4-1: 검퍼츠 분포
1. \( P(W > 80 \mid W > 60) \)
조건부 확률 \( P(W > 80 \mid W > 60) \)는 다음과 같이 정의됩니다:
\[
P(W > 80 \mid W > 60) = \frac{P(W > 80)}{P(W > 60)}.
\]
\( P(W > w) \): 검퍼츠 분포에서 \( P(W > w) = e^{-H(w)} \),
여기서 \( H(w) = \int_0^w \lambda(t) dt \)입니다.
- \( H(w) = \int_0^w 0.01 e^{0.1t} dt \):
적분 계산:
\[
H(w) = 0.01 \int_0^w e^{0.1t} dt = \frac{0.01}{0.1} \left[e^{0.1w} - 1\right] = 0.1 \left[e^{0.1w} - 1\right].
\]
- \( H(80) = 0.1 \left[e^{0.1 \cdot 80} - 1\right] \):
\( H(60) = 0.1 \left[e^{0.1 \cdot 60} - 1\right] \).
계산:
\[
P(W > 80) = e^{-H(80)} = e^{-0.1[e^{8} - 1]},
\]
\[
P(W > 60) = e^{-H(60)} = e^{-0.1[e^{6} - 1]}.
\]
조건부 확률:
\[
P(W > 80 \mid W > 60) = \frac{e^{-0.1[e^{8} - 1]}}{e^{-0.1[e^{6} - 1]}} = e^{-0.1[e^{8} - e^{6}]}.
\]
2. 기대값 \( E(W) \)
검퍼츠 분포에서 기대값은 다음과 같이 주어집니다:
\[
E(W) = \frac{1}{b} \left[\gamma + \ln\left(\frac{a}{b}\right)\right],
\]
여기서:
- \( a = 0.01, b = 0.1, \gamma \)는 오일러-마스케로니 상수(\(\gamma \approx 0.5772\)).
대입:
\[
E(W) = \frac{1}{0.1} \left[0.5772 + \ln\left(\frac{0.01}{0.1}\right)\right] = 10 \left[0.5772 + \ln(0.1)\right].
\]
\[
E(W) = 10 \cdot (0.5772 - 2.3026) = 10 \cdot (-1.7254) = -17.254.
\]
3. 분산 \( \text{Var}(W) \)
검퍼츠 분포의 분산은 다음과 같이 근사됩니다:
\[
\text{Var}(W) = \frac{\pi^2}{6b^2}.
\]
대입:
\[
\text{Var}(W) = \frac{\pi^2}{6 \cdot (0.1)^2} = \frac{\pi^2}{0.06}.
\]
\[
\text{Var}(W) \approx \frac{9.8696}{0.06} \approx 164.493.
\]
문제 3.4-2: 와이블 분포
1. \( P(X \leq 2) \)
와이블 분포의 CDF는 다음과 같습니다:
\[
F(x) = 1 - e^{-(x/\beta)^\alpha}.
\]
여기서:
- \( \alpha = 2, \beta = 3 \).
대입:
\[
F(2) = 1 - e^{-(2/3)^2} = 1 - e^{-(4/9)}.
\]
\[
F(2) \approx 1 - e^{-0.4444} \approx 1 - 0.6412 = 0.3588.
\]
2. 기대값 \( E(X) \)
기대값은 다음과 같습니다:
\[
E(X) = \beta \Gamma\left(1 + \frac{1}{\alpha}\right).
\]
여기서:
- \( \Gamma(1.5) = \frac{\sqrt{\pi}}{2} \approx 0.8862 \).
대입:
\[
E(X) = 3 \cdot \Gamma(1.5) = 3 \cdot 0.8862 = 2.6586.
\]
3. 분산 \( \text{Var}(X) \)
분산은 다음과 같습니다:
\[
\text{Var}(X) = \beta^2 \left[\Gamma\left(1 + \frac{2}{\alpha}\right) - \Gamma^2\left(1 + \frac{1}{\alpha}\right)\right].
\]
여기서:
- \( \Gamma(2) = 1 \), \( \Gamma(1.5) = 0.8862 \).
대입:
\[
\text{Var}(X) = 3^2 \cdot \left[1 - (0.8862)^2\right] = 9 \cdot \left[1 - 0.7853\right] = 9 \cdot 0.2147 = 1.9323.
\]
문제 3.4-3: 혼합 분포
1. \( P(1 \leq X < 2) \)
CDF에서:
\[
P(1 \leq X < 2) = F(2) - F(1).
\]
- \( F(2) = \frac{2}{4} = 0.5 \),
- \( F(1) = \frac{1}{4} = 0.25 \).
따라서:
\[
P(1 \leq X < 2) = 0.5 - 0.25 = 0.25.
\]
2. 기대값 \( E(X) \)
기대값은 다음과 같습니다:
\[
E(X) = \int_0^\infty x f(x) dx.
\]
여기서 PDF는 \( f(x) = F'(x) \)로, 구간별로 정의됩니다:
- \( f(x) = \frac{1}{4}, \quad 0 \leq x < 2 \),
- \( f(x) = 0, \quad x \geq 2 \).
기대값 계산:
\[
E(X) = \int_0^2 x \cdot \frac{1}{4} dx = \frac{1}{4} \int_0^2 x dx.
\]
\[
E(X) = \frac{1}{4} \cdot \left[\frac{x^2}{2}\right]_0^2 = \frac{1}{4} \cdot \frac{4}{2} = \frac{1}{2} = 0.5.
\]
3. 분산 \( \text{Var}(X) \)
분산은 다음과 같습니다:
\[
\text{Var}(X) = E(X^2) - [E(X)]^2.
\]
1) \( E(X^2) \):
\[
E(X^2) = \int_0^2 x^2 \cdot \frac{1}{4} dx = \frac{1}{4} \int_0^2 x^2 dx.
\]
\[
E(X^2) = \frac{1}{4} \cdot \left[\frac{x^3}{3}\right]_0^2 = \frac{1}{4} \cdot \frac{8}{3} = \frac{2}{3}.
\]
2) 분산 계산:
\[
\text{Var}(X) = \frac{2}{3} - \left(\frac{1}{2}\right)^2 = \frac{2}{3} - \frac{1}{4}.
\]
\[
\text{Var}(X) = \frac{8}{12} - \frac{3}{12} = \frac{5}{12} \approx 0.4167.
\]
# R 코드
# 문제 3.4-1: 검퍼츠 분포
# 사망률 함수 λ(w) = 0.01 e^(0.1w)
# 1. P(W > 80 | W > 60)
H <- function(w) { 0.1 * (exp(0.1 * w) - 1) }
P_conditional <- function(w1, w2) {
exp(-H(w1)) / exp(-H(w2))
}
P_conditional(80, 60) # 조건부 확률
# 2. 기대값 E(W)
gamma <- 0.5772 # Euler-Mascheroni constant
a <- 0.01; b <- 0.1
E_W <- (1 / b) * (gamma + log(a / b))
E_W
# 3. 분산 Var(W)
Var_W <- pi^2 / (6 * b^2)
Var_W
# 문제 3.4-2: 와이블 분포
# f(x) = (2/3) * (x/3) * exp(-(x/3)^2)
alpha <- 2; beta <- 3
# 1. P(X ≤ 2)
P_X_le_2 <- 1 - exp(-(2 / beta)^alpha)
P_X_le_2
# 2. 기대값 E(X)
E_X <- beta * gamma(1 + 1 / alpha)
E_X
# 3. 분산 Var(X)
Var_X <- beta^2 * (gamma(1 + 2 / alpha) - gamma(1 + 1 / alpha)^2)
Var_X
# 문제 3.4-3: 혼합 분포
F <- function(x) {
if (x < 0) return(0)
else if (x < 2) return(x / 4)
else if (x < 3) return(0.5)
else return(1)
}
# 1. P(1 ≤ X < 2)
P_1_to_2 <- F(2) - F(1)
P_1_to_2
# 2. 기대값 E(X)
E_X_mixed <- integrate(function(x) x * (1 / 4), 0, 2)$value
E_X_mixed
# 3. 분산 Var(X)
E_X2_mixed <- integrate(function(x) x^2 * (1 / 4), 0, 2)$value
Var_X_mixed <- E_X2_mixed - E_X_mixed^2
Var_X_mixed
# Python 코드
import numpy as np
from scipy.stats import gamma
from scipy.special import gamma as gamma_func
# 문제 3.4-1: 검퍼츠 분포
# 사망률 함수 λ(w) = 0.01 e^(0.1w)
# 1. P(W > 80 | W > 60)
def H(w):
return 0.1 * (np.exp(0.1 * w) - 1)
P_conditional = np.exp(-H(80)) / np.exp(-H(60))
print("P(W > 80 | W > 60):", P_conditional)
# 2. 기대값 E(W)
gamma_const = 0.5772 # Euler-Mascheroni constant
a = 0.01
b = 0.1
E_W = (1 / b) * (gamma_const + np.log(a / b))
print("E(W):", E_W)
# 3. 분산 Var(W)
Var_W = np.pi**2 / (6 * b**2)
print("Var(W):", Var_W)
# 문제 3.4-2: 와이블 분포
# f(x) = (2/3) * (x/3) * exp(-(x/3)^2)
alpha = 2
beta = 3
# 1. P(X ≤ 2)
P_X_le_2 = 1 - np.exp(-(2 / beta)**alpha)
print("P(X ≤ 2):", P_X_le_2)
# 2. 기대값 E(X)
E_X = beta * gamma_func(1 + 1 / alpha)
print("E(X):", E_X)
# 3. 분산 Var(X)
Var_X = beta**2 * (gamma_func(1 + 2 / alpha) - gamma_func(1 + 1 / alpha)**2)
print("Var(X):", Var_X)
# 문제 3.4-3: 혼합 분포
def F(x):
if x < 0:
return 0
elif x < 2:
return x / 4
elif x < 3:
return 0.5
else:
return 1
# 1. P(1 ≤ X < 2)
P_1_to_2 = F(2) - F(1)
print("P(1 ≤ X < 2):", P_1_to_2)
# 2. 기대값 E(X)
from scipy.integrate import quad
E_X_mixed, _ = quad(lambda x: x * (1 / 4), 0, 2)
print("E(X):", E_X_mixed)
# 3. 분산 Var(X)
E_X2_mixed, _ = quad(lambda x: x**2 * (1 / 4), 0, 2)
Var_X_mixed = E_X2_mixed - E_X_mixed**2
print("Var(X):", Var_X_mixed)