통계

4.3 Bivariate Distributions -CONDITIONAL DISTRIBUTIONS

VirtualJin 2025. 1. 2. 09:57

* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다

 

조건부 분포는 특정 조건이 주어졌을 때 다른 변수의 확률분포를 설명하는 데 사용됩니다. 이는 특정 사건이 이미 발생했다고 가정한 상태에서 새로운 사건이 발생할 확률을 계산하는 방법을 제공합니다.

1. 조건부 확률 (Conditional Probability)  
확률변수 \( X \)와 \( Y \)가 있을 때, \( Y = y_j \)가 주어진 상태에서 \( X = x_i \)의 조건부 확률은 다음과 같이 정의됩니다:  
\[P(X = x_i | Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)}, \quad \text{단, } P(Y = y_j) > 0.\]

2. 조건부 분포 (Conditional Distribution)  
- 이산형 변수:  
  조건부 확률 분포는 \( Y = y_j \)가 주어졌을 때 \( X \)의 분포를 나타냅니다.  
  \[P(X = x_i | Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)}\]
  이는 \( X \)의 조건부 확률 질량 함수(pmf)입니다.

- 연속형 변수:  
  조건부 확률 밀도 함수(pdf)는 \( Y = y_j \)가 주어졌을 때 \( X \)의 분포를 나타냅니다.  
  \[f_{X|Y}(x|y) = \frac{f_{X,Y}(x, y)}{f_Y(y)}, \quad \text{단, } f_Y(y) > 0\]

3. 조건부 기댓값 (Conditional Expectation)  
조건부 기댓값은 조건부 분포를 이용해 기댓값을 계산합니다.  
\[E[X | Y = y_j] = \sum_{x_i} x_i \cdot P(X = x_i | Y = y_j) \quad \text{(이산형)}\]  
\[E[X | Y = y_j] = \int_{-\infty}^\infty x \cdot f_{X|Y}(x|y) \, dx \quad \text{(연속형)}\]

예제
예제 1: 조건부 확률 계산  
다음 결합 확률표에서 \( P(X = 1 | Y = 2) \)와 \( P(X = 2 | Y = 2) \)를 계산하세요.

  Y = 1 Y = 2 Y = 3
X = 1 0.1 0.2 0.1
X = 2 0.2 0.3 0.1


답안  
1. \( P(Y = 2) = 0.2 + 0.3 = 0.5 \)  
2. \( P(X = 1 | Y = 2) = \frac{P(X = 1, Y = 2)}{P(Y = 2)} = \frac{0.2}{0.5} = 0.4 \)  
3. \( P(X = 2 | Y = 2) = \frac{P(X = 2, Y = 2)}{P(Y = 2)} = \frac{0.3}{0.5} = 0.6 \)

예제 2: 조건부 분포  
다음 결합 확률표에서 \( Y = 3 \)가 주어졌을 때 \( X \)의 조건부 확률분포를 구하세요.

  Y = 1 Y = 2 Y = 3
X = 1 0.1 0.2 0.1
X = 2 0.2 0.3 0.2


답안  
1. \( P(Y = 3) = 0.1 + 0.2 = 0.3 \)  
2. \( P(X = 1 | Y = 3) = \frac{P(X = 1, Y = 3)}{P(Y = 3)} = \frac{0.1}{0.3} = \frac{1}{3} \)  
3. \( P(X = 2 | Y = 3) = \frac{P(X = 2, Y = 3)}{P(Y = 3)} = \frac{0.2}{0.3} = \frac{2}{3} \)

예제 3: 조건부 기댓값 계산  
다음 결합 확률표에서 \( Y = 2 \)가 주어졌을 때 \( X \)의 조건부 기댓값 \( E[X | Y = 2] \)를 계산하세요.

  Y = 1 Y = 2 Y = 3
X = 1 0.1 0.2 0.2
X = 2 0.3 0.3 0.1


답안  
1. \( P(Y = 2) = 0.2 + 0.3 = 0.5 \)  
2. \( P(X = 1 | Y = 2) = \frac{0.2}{0.5} = 0.4 \), \( P(X = 2 | Y = 2) = \frac{0.3}{0.5} = 0.6 \)  
3. \( E[X | Y = 2] = 1 \cdot 0.4 + 2 \cdot 0.6 = 1.6 \)

연습문제
문제 1  
다음 결합 확률표에서 \( P(X = 1 | Y = 1) \), \( P(X = 2 | Y = 1) \)를 계산하세요.

  Y = 1 Y = 2 Y = 3
X = 1 0.1 0.2 0.2
X = 2 0.2 0.3 0.1


문제 2  
다음 결합 확률표에서 \( Y = 2 \)가 주어졌을 때 \( X \)의 조건부 분포를 구하세요.

  Y = 1 Y = 2 Y = 3
X = 1 0.15 0.25 0.2
X = 2 0.05 0.15 0.2


문제 3  
다음 결합 확률표에서 \( Y = 1 \)가 주어졌을 때 \( X \)의 조건부 기댓값 \( E[X | Y = 1] \)를 계산하세요.

  Y = 1 Y = 2 Y = 3
X = 1 0.2 0.3 0.1
X = 2 0.1 0.1 0.2

연습문제 답

문제 1: \( P(X = 1 | Y = 1) \), \( P(X = 2 | Y = 1) \) 계산  
조건부 확률 공식:  
\[ P(X = x | Y = y) = \frac{P(X = x, Y = y)}{P(Y = y)} \]

1. \( P(Y = 1) = 0.1 + 0.2 = 0.3 \)
2. \( P(X = 1 | Y = 1) = \frac{P(X = 1, Y = 1)}{P(Y = 1)} = \frac{0.1}{0.3} = \frac{1}{3} \)
3. \( P(X = 2 | Y = 1) = \frac{P(X = 2, Y = 1)}{P(Y = 1)} = \frac{0.2}{0.3} = \frac{2}{3} \)

문제 2: \( X \)의 조건부 분포 (\( Y = 2 \)가 주어짐)  
1. \( P(Y = 2) = 0.25 + 0.15 = 0.4 \)  
2. 조건부 확률 계산:  
   - \( P(X = 1 | Y = 2) = \frac{P(X = 1, Y = 2)}{P(Y = 2)} = \frac{0.25}{0.4} = 0.625 \)
   - \( P(X = 2 | Y = 2) = \frac{P(X = 2, Y = 2)}{P(Y = 2)} = \frac{0.15}{0.4} = 0.375 \)

결과:  
\( P(X = 1 | Y = 2) = 0.625 \), \( P(X = 2 | Y = 2) = 0.375 \)

문제 3: \( E[X | Y = 1] \) 계산  
1. \( P(Y = 1) = 0.2 + 0.1 = 0.3 \)  
2. 조건부 확률 계산:  
   - \( P(X = 1 | Y = 1) = \frac{P(X = 1, Y = 1)}{P(Y = 1)} = \frac{0.2}{0.3} = \frac{2}{3} \)
   - \( P(X = 2 | Y = 1) = \frac{P(X = 2, Y = 1)}{P(Y = 1)} = \frac{0.1}{0.3} = \frac{1}{3} \)
3. 조건부 기댓값 계산:  
   \[ E[X | Y = 1] = \sum_{x} x \cdot P(X = x | Y = 1) \]  
   \[ E[X | Y = 1] = 1 \cdot \frac{2}{3} + 2 \cdot \frac{1}{3} = \frac{2}{3} + \frac{2}{3} = \frac{4}{3} \]

# R code
# 문제 1
p_y1 <- 0.3
p_x1_given_y1 <- 0.1 / p_y1
p_x2_given_y1 <- 0.2 / p_y1
p_x1_given_y1
p_x2_given_y1

# 문제 2
p_y2 <- 0.4
p_x1_given_y2 <- 0.25 / p_y2
p_x2_given_y2 <- 0.15 / p_y2
p_x1_given_y2
p_x2_given_y2

# 문제 3
p_y1 <- 0.3
p_x1_given_y1 <- 0.2 / p_y1
p_x2_given_y1 <- 0.1 / p_y1
e_x_given_y1 <- 1 * p_x1_given_y1 + 2 * p_x2_given_y1
e_x_given_y1
# Python code
# 문제 1
p_y1 = 0.3
p_x1_given_y1 = 0.1 / p_y1
p_x2_given_y1 = 0.2 / p_y1
print(p_x1_given_y1, p_x2_given_y1)

# 문제 2
p_y2 = 0.4
p_x1_given_y2 = 0.25 / p_y2
p_x2_given_y2 = 0.15 / p_y2
print(p_x1_given_y2, p_x2_given_y2)

# 문제 3
p_y1 = 0.3
p_x1_given_y1 = 0.2 / p_y1
p_x2_given_y1 = 0.1 / p_y1
e_x_given_y1 = 1 * p_x1_given_y1 + 2 * p_x2_given_y1
print(e_x_given_y1)