На цьому курсі починають з основ комп'ютерного зору. Слухачі дізнаються, які практичні завдання вирішує ця технологія. Встановлюють бібліотеки OpenCV, NumPy та Matplotlib. Вчаться виконувати базові операції з зображеннями. Далі переходять до роботи на рівні пікселів - аналізують гістограми та створюють програму для корекції кольорів.
Тут вивчають принцип згортки та різні типи фільтрів. Слухачі вчаться застосовувати фільтрацію для маніпуляцій з зображеннями. Потім переходять до фільтрів виділення меж - розбираються з градієнтами, алгоритмами контурів та фільтром Canny.
Цей блок охоплює формати зображень raw, PNG, JPEG та відеокодеки H264/H265. Слухачі розбираються в стисненні з втратами та вчаться покращувати якість зображень. Далі переходять до візуальних ознак - вивчають детектор кутів Харріса, алгоритми SIFT та методи опису ознак.
У цій частині курс розглядає основи машинного навчання. Порівнюють класичну обробку даних з ML. Слухачі будують прості моделі з нуля та проводять їх оптимізацію. Визначають відмінності між machine learning та deep learning.
Тут зосереджуються на специфічних ознаках для розпізнавання облич. Вивчають метод Віоли-Джонса та техніку бустингу. Вчаться виявляти обличчя за допомогою OpenCV. Далі переходять до трекінгу - аналізують відео та реалізовують практичне завдання з відстеження об'єктів.
Цей великий блок починається з основ нейронних мереж. Слухачі знайомляться з TensorFlow та Keras, будують і тренують прості моделі. Вчаться прискорювати навчання за допомогою GPU та працювати в Google Colaboratory. Потім переходять до згорткових мереж - вивчають операції згортки, пулінгу та методи боротьби з перенавчанням.
У заключній частині курс заглиблюється в сегментацію зображень та автоматичні енкодери. Слухачі будують моделі для очищення зображень від шуму. Потім переходять до детекції об'єктів - вивчають YOLO, bounding boxes та алгоритми NMS. Застосовують YOLO для розпізнавання об'єктів на власному відео.
Завершують курс аналізом популярних архітектур нейронних мереж, fine-tuning та роботою з model zoo. Слухачі отримують практичні поради щодо вирішення типових проблем при тренуванні мереж. Курс завершується презентацією власних проектів.
Глибоке розуміння комп'ютерного зору через практичні завдання. Доступ до сучасних інструментів та бібліотек. Можливість створити власний проект для портфоліо. Корисні навички для подальшого кар'єрного розвитку в галузі штучного інтелекту.