Автоэнкодер - нейронная сеть, которая принимает входные данные и кодирует их, затем пытается восстановить их.
На этапе обучения модель кодирует входные данные и подбирает веса такие, чтобы при попытке их восстановления получилось изображение, максимально похожее на исходное. Размеченные данные не требуются.
Автоэнкодер может полезен для уменьшения размерности данных или удаления шума.
В данной работе выбран автоэнкодер VAE (Variational Autoencoder), тип автоэнкодера, который добавляет вероятностный подход к обучению модели. Используется библиотека keras.
архитектура автоэнкодера:
Количество обучаемых параметров: encoder - 234372, decoder - 202256, всего: 436628
Используемые алгоритмы:
Оптимизатор - adam.
Функция потерь:
def vae_loss(x, y):
x = K.reshape(x, shape=(batch_size, 28*28))
y = K.reshape(y, shape=(batch_size, 28*28))
loss = K.sum(K.square(x-y), axis=-1)
kl_loss = -0.5 * K.sum(1 + z_log_var - K.square(z_mean) - K.exp(z_log_var), axis=-1)
return loss + kl_loss
Размеры обучающего, валидационного и тестового наборов данных, соответственно:
(54000, 28, 28, 1), (6000, 28, 28, 1), (6000, 28, 28, 1)
Ошибка, полученная при сравнении оригинального изображения и полученного из автоэнкодера:
30.429147720336914 (ошибка на тренировочном датасете), 30.770627975463867 (на валидационном), 30.37934112548828 (на тестовом)