На этом курсе начинают с основ Python в среде Jupyter Notebook. Слушатели учатся проводить базовые операции с числами и структурами данных, использовать циклы for и while. Здесь показывают, как сочетание математики и Python может помочь в реальной работе.
Далее курс охватывает работу с ключевыми библиотеками Python. Слушатели учатся подключать библиотеки, оперировать данными с помощью NumPy и Pandas, а также визуализировать результаты с помощью Matplotlib и Seaborn.
Этот блок включает дескриптивную статистику - работу с модой, медианой, средним значением и среднеквадратическим отклонением. Слушатели учатся визуализировать результаты анализа и описывать данные, используя Matplotlib, Seaborn и Plotly.
Здесь рассматривают теорию множеств, матрицы и векторы для анализа данных с помощью NumPy. Слушатели изучают операции над множествами, математические обозначения и диаграммы Венна для анализа проблем.
Курс охватывает основы теории вероятности, условную вероятность и выполнение простых задач. Слушатели изучают случайные величины, распределения, теорему Байеса, математическое ожидание и дисперсию для анализа рабочих задач.
Этот модуль объясняет разницу между корреляцией и причинностью. Слушатели учатся анализировать корреляцию с помощью диаграмм рассеяния, понимают ковариацию и корреляцию.
Здесь изучают основные распределения и их применение. Слушатели учатся определять, какое распределение описывает конкретную проблему, и используют библиотеку stats для работы с распределениями.
Курс охватывает методы выборки, планирование сбора данных, точечную и интервальную оценку. Слушатели понимают доверительные интервалы, метод максимального правдоподобия и строят доверительные интервалы для простых проблем.
Этот блок включает работу с P-значениями, типами ошибок, формулированием статистических гипотез. Слушатели учатся анализировать качественные данные, строить таблицы сопряженности и проверять адекватность модели с помощью chi-square.
Здесь рассматривают выявление и коррекцию ошибок в анализе, поправку при проверке множеств гипотез. Слушатели учатся формулировать проблемы для линейной регрессии, использовать scikit-learn и проверять адекватность результатов.
Последние модули охватывают логистическую регрессию, проблемы классификации, перекрестную проверку. Слушатели используют scikit-learn для классификации данных. На заключительном занятии рассматривают подходы к решению проблем и уменьшения вероятности ошибок, а также презентуют курсовой проект.
Курс предлагает глубокий контент с актуальными инструментами для работы. Большое внимание уделяется практическим навыкам - аналитической практике и разработке проектов. Программа направлена на улучшение профессиональных навыков и карьерный развитие в сфере анализа данных.