Ang variational autoencoder (VAE) ay isang uri ng artificial neural network na sinanay upang matuto ng naka-compress na representasyon ng input data, kadalasang mga larawan o text. Ang naka-compress na representasyon, na kilala bilang isang latent variable, ay naglalaman ng mas mababang-dimensional na "buod" ng input data at maaaring gamitin para sa mga gawain tulad ng data compression, data visualization, at data generation.
Ang VAE ay binubuo ng dalawang bahagi: isang encoder at isang decoder. Ang encoder ay nagmamapa ng input data sa isang latent variable, habang ang decoder ay nagmamapa ng latent variable pabalik sa orihinal na data. Sa panahon ng pagsasanay, natututo ang VAE na i-minimize ang pagkakaiba sa pagitan ng orihinal na data at ng muling itinayong data na ginawa ng decoder, habang pinapalaki rin ang pagkakapareho sa pagitan ng pamamahagi ng mga nakatagong variable at isang target na pamamahagi.
Ang pangunahing pagkakaiba sa pagitan ng VAE at ng tradisyunal na autoencoder ay pinipilit ng VAE ang latent variable na sundin ang isang partikular na distribusyon, karaniwang isang Gaussian distribution. Nagbibigay-daan ito sa VAE na makabuo ng bagong data sa pamamagitan ng pagsa-sample mula sa natutunang pamamahagi ng mga latent na variable, na magagamit para sa mga gawain tulad ng pagbuo ng larawan at teksto.
Petsa ng publikasyon: