На этом курсе изучают глубокое обучение с нуля до продвинутого уровня. Программа построена логично - от базовых концепций до сложных архитектур.
Курс начинается с введения в глубокое обучение. Студенты узнают, как нейронные сети решают задачи обработки естественного языка и компьютерного зрения. Рассматривают компоненты сети, процесс обучения через градиентный спуск и функции потерь. Сразу же переходят к практике в PyTorch - строят первую нейронную сеть, изучают функции активации и методы регуляризации.
Далее курс сосредотачивается на обработке текста. Студенты осваивают векторные представления слов через Word2Vec и GloVe. Затем переходят к рекуррентным сетям - RNN, LSTM и GRU, которые работают с последовательностями. Этот блок завершается моделями seq-to-seq и трансформерами, включая BERT и GPT-2.
Здесь изучают реальные задачи обработки естественного языка. Студенты учат классифицировать тексты, строить системы ответов на вопросы и семантического поиска. Отдельно рассматривают генеративные модели для перефразирования, суммаризации и работы с большими языковыми моделями.
Вторая половина курса посвящена компьютерному зрению. Начинают со сверточных сетей для классификации изображений. Затем переходят к трансферному обучению на популярных архитектурах - от LeNet до EfficientNet. Далее изучают детекцию объектов через R-CNN и YOLO, семантическую сегментацию с UNet и Mask R-CNN.
Завершающие модули охватывают генеративные модели для работы с изображениями. Студенты работают с автокодерами, GAN-сетями и диффузионными моделями для создания контента. Отдельно изучают техники оптимизации - настройку гиперпараметров, ускорение тренировки и работу со смешанной точностью.
Курс завершается практикой развертывания моделей. Студенты учат упаковывать решения в FastAPI API и организовывать мониторинг моделей в рабочей среде.
Во время обучения доступна поддержка ментора. Основной акцент - практические задания для закрепления материала. После успешного завершения курса выдают сертификат. Главный инструмент работы - фреймворк PyTorch.