autoencoder fashion-mnist pytorch huggingface

Энкодер на датасете fashion_mnist

Задача

Построить автоэнкодер для датасета Fashion MNIST, который будет принимать на вход изображение и создавать его же изображение на выходе.

Архитектура

Нейросеть состоит из следующих слоев: 1.Входной слой, принимающий изображение 2.Полносвязный слой с 256 нейронами и функцией активации ReLU 3.Полносвязный слой с 128 нейронами и функцией активации ReLU 4.Скрытый слой, имеющий 50 нейронов и функцию активации ReLU 5.Полносвязный слой с 128 нейронами и функцией активации ReLU 6.Полносвязный слой с 256 нейронами и функцией активации ReLU 7.Выходной слой с функцией активации сигмоид, который производит декодирование изображения 8.Выходной слой, преобразующий выходную карту признаков в изображение Архитектура.png

Общее количество обучаемых параметров

Автоэнкодер содержит 235,978 обучаемых параметров

Функция оптимизации и функция ошибок

Алгоритм оптимизации - Adam, функция ошибок - бинарная кросс-энтропия.

Размеры датасета

Результаты обучения модели на всех трех датасетах

После 50 эпох обучения модели на тренировочном датасете, результаты на трех датасетах такие: