[Paper] Deriving Language Models from Masked Language Models
Deriving Language Models from Masked Language Models이란 논문에 대한 리뷰로 기존 Masked Language Model(MLM)에서 joint distribution을 계산하기 위해 unary conditional을 이용한 여러 방법들(Markov Random Field 및 기타 다른 방법)을 P-PPL, U-PPL 등의 평가지표를 기준으로 비교하였고, 향후 학습에 있어 MLM에서 conditional independence 가정을 완화하기 위한 regularization을 제안하였습니다.
이를 이해하기 위한 추가적인 포스트도 함께 공유드립니다!
-
Random Field Notion Link
-
Paper Review post Notion Link
댓글남기기