Minggu, 22 Agustus 2021

Rekonstruksi Citra? Generative Model Architectures pilihan utamanya



Memang di dunia per ML an ini tidak ada yang saklek, hanya mendekati, tidak ada rule of thumb, hanya kebanyakan dari kebiasaan penggunaan sebelumnya. Oke back to topik, karena penelitian saya bidang rekonstruksi citra maka dari pengalaman-pengalaman suhu-suhu sebelumnya cocoknya(saya bilang disini cocoknya ya...) menggunakan arsitektur model generatif. Oke jadi menurut situs ini, generatif model itu terdiri dari :

  1. Generative Adverserial Network (Latent space guys)
  2. Boltzmann machines (nah ini yang menginspirasi Deep Believe Network)
  3. Variational autoencoders (ini sebelumnya kita pakai untuk denoising)
  4. Hidden Markov models
  5. Models that predict the next word in a sequence, like GPT-2

Masing masing model diatas tentu berkembang dong sampai sekarang, makanya saya lengkapi di ujungnya biar kebayang perkembangannya. Okeh untuk GAN, kita lakukan terlebih dahulu training terhadap Diskriminator secara supervised learning, dimana inputan berasal dari real data dan sesekali dari generator untuk fake data dengan label tentunya fake(dari generator) or real(dari inputan data). 

Baru setelah itu kita latih generatornya dengan target luaran masuk ke diskriminator dan memastikan output label real dari generator. lanjut terus iterasi selanjutnya sampai nilainya optimal. Untuk contoh kode bisa kita tengok dengan dataset MNIST.

Gambar di generate dari latent space berupa noise random. Ketika generator belum dilakukan di training seperti gambar diatas, dia akan menghasilkan citra random dengan nilai 0-1(gambar biner) seperti gambar berikut:
Model generator sendiri mendapatkan inputan berupa :
Inputs(Menuju Generator): Point in latent space, e.g. a 100 element vector of Gaussian random numbers.
Untuk target outputnya sendiri keluar dari diskriminator berupa : 
Outputs(Dari diskriminator): Binary classification, likelihood, apakah gambar asli atau palsu.


Tidak ada komentar:

Posting Komentar