-
가능도 함수의 정의
- 가능도 함수는 주어진 데이터에 대해 특정 통계 모델의 적합성을 평가하는 중요한 도구이다.
가능도 함수의 표현식
- \( L(\theta | y) = P(y | \theta) \), 매개변수 \( \theta \)와 관측 데이터 \( y \)를 기반으로 정의된다.
\( \theta \)의 정의
- 모델의 매개변수이다.
\( y \)의 정의
- 관측된 데이터이다.
\( P(y | \theta) \)의 정의
- 매개변수 \( \theta \)가 주어졌을 때 데이터 \( y \)가 관측될 확률이다.
가능도 함수 계산 방법의 첫 번째 단계
- 데이터가 따르는 확률 분포를 가정한다.
가능도 함수 계산 방법의 두 번째 단계
- 연속형 변수의 경우 확률 밀도 함수(PDF)를, 이산형 변수의 경우 확률 질량 함수(PMF)를 사용한다.
가능도 함수 계산 방법의 세 번째 단계
- 데이터 포인트들이 독립적이라고 가정하면 개별 확률의 곱으로 가능도를 계산할 수 있다.
독립 데이터 포인트에 대한 가능도 함수
- \( L(\theta | y_1, y_2, ..., y_n) = \prod_{i=1}^n f(\theta | y_i) \)로 표현된다.
가능도 함수 계산 방법의 네 번째 단계
- 계산의 편의를 위해 로그 가능도를 사용한다.
로그 가능도 함수
- \( \log L(\theta | y_1, y_2, ..., y_n) = \sum_{i=1}^n \log f(\theta | y_i) \)로 표현된다.
동전 던지기 예시에서 가정된 분포
- 이항 분포 \( B(n, p) \)이다.
이항 분포의 확률 질량 함수(PMF)
- \( P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \)로 정의된다.
동전 던지기 예시에서 가능도 함수
- \( L(p | 4) = \binom{10}{4} p^4 (1-p)^6 \)로 표현된다.
가능도 함수의 활용
- 최대 가능도 추정(Maximum Likelihood Estimation, MLE)을 통해 주어진 데이터에 가장 적합한 모델 매개변수를 찾는다.
가능도 함수의 중요성
- 통계적 추론, 모델 선택, 매개변수 추정 등 다양한 분야에서 중요한 역할을 한다.
반응형