Курс построен логично - от основ до сложных тем. Каждый модуль дает знания, которые понадобятся в следующих разделах.
На первых занятиях студенты разбираются, что такое машинное обучение и Data Science. Учат основные типы задач и компоненты моделей. Затем переходят к языку Python - изучают синтаксис, типы данных, циклы и ветвления. Это фундамент для всей последующей работы.
Здесь углубленно изучают Python. Студенты осваивают функциональное программирование, генераторы и итераторы. Затем переходят к объектно-ориентированному подходу - разбирают пространство имен, модули и пакеты. Это помогает писать чистый и структурированный код.
Студенты учатся работать с данными с помощью популярных библиотек: Pandas, NumPy, Matplotlib. Затем переходят к подготовке данных - учат решать проблемы с качеством данных, работать с категориальными переменными и масштабированием. Без этого этапа невозможно построить качественную модель.
Сначала студенты изучают регрессионные модели - их виды и оценку качества. Затем переходят к классификации, изучают логистическую регрессию и Байесовский классификатор. Далее идут методы снижения размерности и кластеризации, включая алгоритм DBSCAN.
В этой части рассматривают деревья решений и ансамблевые методы - Random Forest, LightGBM, XGBoost. Студенты учатся настраивать гиперпараметры моделей. Затем переходят к нейронным сетям - изучают Keras, TensorFlow, рекуррентные сети и GAN.
Последние модули посвящены работе с большими данными с помощью PySpark. Студенты учатся улучшать качество моделей через аугментацию данных, кросс-валидацию и борьбу с переобучением. Завершается курс практическим проектом, где применяют все полученные навыки.
После курса вы сможете создавать системы машинного обучения для работы с большими объемами данных. Программа включает работу с фреймворком Spark - это современный инструмент для реальных проектов.
Занятия ведут преподаватели-практики. Доступны различные форматы - корпоративное обучение, занятия в выходные, индивидуальный подход. Выпускники имеют возможность трудоустройства в ведущие IT-компании.