통계

2.1 Discrete Distributions -이산형 확률변수 (Random Variables of the Discrete Type)

VirtualJin 2024. 12. 19. 13:04

* 본 블로그 포스트에서 사용된 표, 이미지 및 기타 관련 자료는 "PROBABILITY AND STATISTICAL INFERENCE 9th Edition"에서 발췌한 것입니다. 이 자료들은 내용을 요약하고 이해를 돕기 위한 참고용으로 제공됩니다. 또한, 해석 과정에서 일부 오류가 있을 수 있으니 원본을 참고하여 확인하시기 바랍니다

 

확률변수의 정의
확률변수(random variable)는 다음과 같이 정의됩니다:

\[X(s) = x \quad \text{for all } s \in S\]

- 여기서 \( X \)는 실수 값을 가지는 함수이며, 확률 실험의 각 결과 \( s \)에 대해 정확히 하나의 실수 \( x \)를 할당합니다.
- \( S \)는 실험의 결과 집합(결과 공간)입니다.

이산형 확률변수의 정의
이산형 확률변수는 다음과 같은 특징을 가집니다:
- 결과 공간 \( S \)는 유한하거나 셀 수 있는 무한 개수의 요소를 포함합니다.
- 확률분포 \( P(X = x) \)는 공간 \( S \)의 각 \( x \)에 대해 정의됩니다.

확률 질량 함수 (Probability Mass Function, PMF)
이산형 확률변수의 확률 질량 함수 \( f(x) \)는 다음 조건을 만족합니다:

1. \( f(x) \geq 0 \) (모든 \( x \)에 대해).
\[\sum_{x \in S} f(x) = 1\]

2. 특정 사건 \( A \subseteq S \)의 확률:
   \[P(X \in A) = \sum_{x \in A} f(x)\]
\( f(x) = 0 \)일 때, \( x \notin S \)임을 나타냅니다.

누적분포함수 (Cumulative Distribution Function, CDF)
누적분포함수 \( F(x) \)는 \( X \leq x \)인 모든 확률의 합으로 정의됩니다:
\[F(x) = P(X \leq x) = \sum_{t \leq x} f(t)\]

- \( F(x) \)는 항상 비감소(non-decreasing) 함수이며, 다음 경계를 가집니다:
  \[\lim_{x \to -\infty} F(x) = 0, \quad \lim_{x \to \infty} F(x) = 1\].

예제
- 주사위를 한 번 던질 때:
  - 결과 공간: \( S = \{1, 2, 3, 4, 5, 6\} \)
  - 확률 질량 함수:
    \[f(x) = \frac{1}{6}, \quad x = 1, 2, 3, 4, 5, 6\]
  - 누적 분포 함수:
    \[F(x) = \begin{cases} 0, & x < 1 \\ \frac{k}{6}, & 1 \leq x \leq 6 \text{에서 } k = \lfloor x \rfloor \\ 1, & x > 6 \end{cases}\].



확률변수를 통해 사건과 실험을 숫자화

확률변수는 사건의 결과를 숫자로 변환하므로, 실험의 전체 결과를 숫자로 취합한 형태가 됩니다.

이를 통해 사건들의 확률과 분포를 분석할 수 있습니다.

예제 1: 동전을 두 번 던지는 실험

결과 공간: S = \{\text{HH, HT, TH, TT}\}

HH: 앞면-앞면, HT: 앞면-뒷면, 등.

확률변수 X: 앞면의 개수를 숫자로 변환.

$X(\text{HH}) = 2$

$X(\text{HT}) = 1$

$X(\text{TH}) = 1$

$X(\text{TT}) = 0$

 

예제 2: 주사위를 두 번 던지는 실험

결과 공간: S = $\{(1,1), (1,2), \dots, (6,6)\}$

각 튜플은 두 번 던진 결과.

확률변수 X: 두 주사위 눈의 합을 숫자로 변환.

X((1,1)) = 2

X((3,4)) = 7

X((6,6)) = 12