Курс построен логично - от основ до сложных тем. Каждый модуль базируется на предыдущем.
Курс начинается с настройки рабочей среды. Участники осваивают Pandas - основную библиотеку для работы с табличными данными. Они научатся создавать таблицы, импортировать данные из различных источников, фильтровать, сортировать и обрабатывать пропущенные значения. Модуль включает группировку данных и объединение таблиц.
В этом модуле изучается библиотека Numpy для эффективной работы с числовыми данными. Участники осваивают создание многомерных массивов, индексацию, арифметические операции и статистические функции. Модуль охватывает методы изменения формы массивов и работу с файлами.
Сначала участники изучают Matplotlib для создания базовых графиков. Они научатся настраивать внешний вид, добавлять легенды и сохранять результаты. Далее курс переходит к Seaborn для создания более сложных визуализаций - тепловых карт, графиков распределения и категориальных диаграмм.
Этот блок охватывает основные задачи анализа данных. Сначала рассматривается регрессия для прогнозирования числовых значений. Затем - классификация для распределения объектов по группам. Далее идет кластеризация для выявления схожих групп в данных. Завершается блок методами поиска аномалий.
Участники изучают основы SQL для работы с реляционными базами данных. Модуль охватывает написание запросов SELECT, фильтрацию, сортировку, агрегацию данных и объединение таблиц через JOIN.
Курс завершается разбором домашних проектов. Преподаватель демонстрирует лучшие работы участников и показывает типичные решения. Последнее занятие посвящено подведению итогов обучения.
После курса участники смогут настраивать рабочую среду для анализа данных. Они освоят обработку таблиц в Pandas, работу с массивами в Numpy и создание визуализаций. Выпускники смогут строить модели машинного обучения, писать SQL-запросы и выявлять аномалии в данных.
Для успешного прохождения нужны базовые знания Python - основные конструкции, циклы и функции. Полезным будет понимание основных статистических понятий. Опыт работы с таблицами не является обязательным, но поможет в обучении.
Курс включает поддержку ментора, практические задания и финальный проект. После успешного завершения участники получают сертификат.