Курс строится по принципу от простого к сложному. Каждый следующий модуль базируется на знаниях из предыдущих.
На этом курсе начинают с основ программирования. Сначала учат, как работать с Python - устанавливают необходимые программы, разбираются с переменными и типами данных. Затем переходят к условным операторам, циклам и функциям. Во втором модуле изучают структуры данных - списки, кортежи и словари. Учат читать данные из файлов и проводить базовое очищение информации.
Третий модуль посвящен библиотеке Pandas. Здесь учат работать с табличными данными - выбирать нужные строки, фильтровать информацию, объединять различные наборы данных. Особое внимание уделяют работе с пропущенными значениями и группировке данных для получения сводных результатов.
В четвертом модуле учат визуализировать данные с помощью библиотек Matplotlib и Seaborn. Студенты создают различные типы графиков - столбчатые, точечные, гистограммы. Пятый модуль охватывает статистический анализ - от базовых показателей до корреляционного и регрессионного анализа. Учат проверять гипотезы и интерпретировать результаты.
Шестой и седьмой модули знакомят с машинным обучением. Сначала рассматривают основные концепции - контролируемое и неконтролируемое обучение, методы оценки моделей. Затем переходят к практической работе с библиотекой Scikit-learn - строят модели классификации и регрессии, обучают алгоритмы и делают прогнозы.
Завершается курс практическим проектом. Студенты применяют все полученные навыки к реальному набору данных - от очистки и анализа до построения моделей машинного обучения. Результаты презентуют в виде отчета с выводами.
Занятия проходят в вечернее время с 19:00 до 22:00 или в выходные с 10:00 до 13:00. Каждый студент получает поддержку ментора на протяжении всего курса. Значительную часть обучения занимает практика на реальных проектах. Система оценки позволяет отслеживать прогресс. Итогом становится дипломный проект, который демонстрирует усвоенные навыки.