본문 바로가기

Study/Lecture - Advance 1

W3.L12-13. Dirichlet Distribution

L12 | Exponential Family


ELBO 더 하기 전에 Dirichlet 분포의 특성에 대해 조금 더 알아보자.
Dirichlet ... Beta distribution 의 연장선
 

 
$ \theta_{i} \sim \textup{Dir}(\alpha) $: $ \theta_{i} $ 라는 것이 이 분포에서 하나 sampling 되어 하나의 경우가 발생
이러한 경우라는 것이 얼마나 자주? 혹은 적게? 발생할 것이냐에 대한 설명이 필요 ... PDF ... $ \textup{P}(\theta_{i} \mid \alpha) $

Dirichlet Dist. 라는 것은 위 조건들을 만족하는 상황에서 정의
Probability Simplex를 잘 만족 ... 이 말은 여기 분포에서 나온 $X$ 는 확률로 잘 사용될 수 있다.
... $X$ 는 multinomial dist. 에서 parameter 로 잘 쓰일 수 있다.
... (압정 위 0.6 / 아래 0.4) ... 0.6 과 0.4 라는 parameters → Dir. 에서 설명할 수 있다.

예를 들어 $(\alpha_{1}, \alpha_{2}, \alpha_{3}) = (1, 1, 1) $ 의 경우 ... 모두 1/3 확률 ... $\alpha$ 에 따라 그 모양이 결정
 

 
위 수식의 형태와 같이 표현되면 "Exponential Family" 
$T(x)$ : Sufficient statistics. 실제 많은 정보 ($x$) 들이 활용되는 부분
$h(x)$ : Underlying measure. 확률로 만들어주기 위한 normalization 성분
$\eta(\theta)$ : Natural parameter. 평균과 같이 특정한 의미 있는 파라미터를 formation 하는 효과
$A(\theta)$ : Log normalizer. 이 또한 normalization 성분
 
Derrivative of log normalizer - Moment of sufficient statitics
Log normalizer 미분은 Sufficient statistics의 기대값! 
 

 

L13 | Derivation of the first term


다시 ELBO 로 돌아와서 첫 번째 Expectation term 유도


$\gamma, \phi, \alpha, \beta$  총 4 가지 ... 우리가 학습을 통해 "최적화" 해야될 parameters





이로서 가장 첫 번째 term derivation 완료

 

 

Reference

문일철 교수님 강의

https://www.youtube.com/watch?v=qBoPMaWxAKc&list=PLzZ7PPT4KK5qpd-1VF4qmFMlpnr1is7Pu&index=50

'Study > Lecture - Advance 1' 카테고리의 다른 글

W3.L16-17. Optimization of ELBO  (0) 2023.11.29
W3.L14-15. Derivation of the other terms  (0) 2023.11.28
W3.L10-11. Latent Dirichlet Allocation (LDA)  (0) 2023.11.07
W2.L6-9. 중간 Summary  (0) 2023.11.05
W2.L6-9. Simple Example Model  (0) 2023.10.26