ПРИМЕНЕНИЕ МНОГОЭТАПНОЙ ГЕНЕРАТИВНО-СОСТЯЗАТЕЛЬНОЙ НЕЙРОННОЙ СЕТИ ДЛЯ ГЕНЕРАЦИИ ИЗОБРАЖЕНИЙ ПО ТЕКСТОВОМУ ОПИСАНИЮ

ПРИМЕНЕНИЕ МНОГОЭТАПНОЙ ГЕНЕРАТИВНО-СОСТЯЗАТЕЛЬНОЙ НЕЙРОННОЙ СЕТИ ДЛЯ ГЕНЕРАЦИИ ИЗОБРАЖЕНИЙ ПО ТЕКСТОВОМУ ОПИСАНИЮ
Авторы: Дроздов Д. С., Федоров В. О., Белов Ю. С.
Аннотация:

В данной статье описывается архитектура многоэтапной генеративно состязательной сети, которая используются для генерации изображений по текстовому описанию. Данная модель состоит из многоэтапной композиции блоков, состоящих из генератора и дискриминатора. Первый генератор создает грубую форму изображения на основе текстовых описаний, а второй генератор уточняет детали и создает финальное изображение. Дискриминатор оценивает качество изображений, и обучение происходит путем улучшения качества изображений для их более точной классификации дискриминатором. В процессе обучения генератор старается создать изображение, которое будет максимально близко к своему текстовому описанию, тогда как дискриминатор старается различать настоящие изображения от сгенерированных. Многоэтапная архитектура стековых генеративно состязательных сетей позволяет избежать проблем с градиентным затуханием, что обеспечивает более стабильное обучение и повышение качества сгенерированных изображений.

Ключевые слова: генеративно-состязательные сети, генерация изображений, глубокое обучение
Страницы в выпуске: 186-193

Журнал "Оригинальные исследования (ОРИС)" (включен в РИНЦ) ведет прием статей в ближайший номер до 30 апреля 2026 г.