吉 360 網(wǎng)站建設(shè)如何做好精準(zhǔn)營銷
? ? ? ? 直接看paper看得云里霧里,李沐視頻一語道破天機(jī)(建議從30min左右開始看GAN到Diffusion的串講)。VAE的核心思路就是下面:
? ? ? ? 做生成,其實就是從隨機(jī)向量(z)到目標(biāo)圖像(x)的過程,那么z就是先驗,x就是后驗。
? ? ? ? 一些博客講的也挺好的:
VAE的原理和代碼實現(xiàn)_vae代碼_Zero_to_zero1234的博客-CSDN博客
1、目的
? ? ? ? perform efficient inference and learning in directed probabilistic models(有向概率模型,也就是我們的DL網(wǎng)絡(luò)), in the presence of continuous latent variables(連續(xù)隱變量z) with intractable prosterior distributions(輸出x')
2、貢獻(xiàn)
? ? ? ? 重參數(shù)(reparameterization) + 極大似然法(maximum likelihood / maximum a posteriori)?+ 可導(dǎo)變分下界(differentiable variational lower bound,是下界的無偏估計),使得問題可以使用SGD求解
3、方法
? ? ? ? 1)基本假設(shè)
????????從先驗分布中采樣
,從條件概率分布
中采樣
,且兩個分布的概率密度函數(shù)對任意
和z都是可微的。
? ? ? ? 2)網(wǎng)絡(luò)結(jié)構(gòu)
????????encoder是,decoder是
? ? ? ? 3)優(yōu)化目標(biāo)
? ? ? ? 極大似然法,使得網(wǎng)絡(luò)參數(shù)下收集的數(shù)據(jù)集的概率最大,即最大化
????????????????????????
? ? ? ? 而該式可以被寫為
????????????????????????
? ? ? ? 由于KL散度>=0,因此有
?????????????????????????
? ? ? ? 則就是變分下限
?????????????????????????
? ? ? ? 則我們需要做的就是對這個變分下限進(jìn)行優(yōu)化,從而需要求解相對于變分參數(shù)
和生成參數(shù)
的微分
????????4)算法流程
? ? ? ? 5)重參化技巧
????????? ? ? ??
? ? ? ? ? ? ? ? 但這樣的話,先驗z缺少可優(yōu)化參數(shù)。因此改寫為下面的形式:
????????????????
????????????????
? ? ? ? ? ? ? ? 其中和
可以用MLP預(yù)測
4、公式推導(dǎo)
? ? ? ? 可以參考:
快速推導(dǎo) VAE 變分自編碼器,多種寫法,和重要細(xì)節(jié) Variational Autoencoder - 知乎