АНАЛИЗ И ДЕКОМПОЗИЦИЯ АРХИТЕКТУРЫ ТРАНСФОРМЕРА В РАМКАХ РАЗВИТИЯ ГЕНЕРАТИВНО ПАРАМЕТРИЧЕСКИХ МОДЕЛЕЙ НЕЙРОННЫХ СЕТЕЙ

АНАЛИЗ И ДЕКОМПОЗИЦИЯ АРХИТЕКТУРЫ ТРАНСФОРМЕРА В РАМКАХ РАЗВИТИЯ ГЕНЕРАТИВНО ПАРАМЕТРИЧЕСКИХ МОДЕЛЕЙ НЕЙРОННЫХ СЕТЕЙ
Авторы: Павловский Д. В., Кудинов Н. Г.
Аннотация:

В рамках данной работы проанализированы основные компоненты и механизмы архитектуры нейронных сетей по типу архитектуры трансформера, приведена общая схема архитектуры. А также рассмотрены модификации моделей генеративно параметрических трансформерах для решения задач связанных с понимание языка и генерацией текстов. Приведены ключевые различия в архитектуре существующих больших языковых моделей (LLM), и их вклад в развитие архитектуры. Также подобные модели имеют широкий спектр применений, включая генерацию контента, аудио-видео обработку, искусственный дизайн и другие области.

Ключевые слова: искусственный интеллект, нейронные сети, генеративно параметрические сети
Страницы в выпуске: 206-210

Журнал "Оригинальные исследования (ОРИС)" (включен в РИНЦ) ведет прием статей в ближайший номер до 30 апреля 2026 г.