Курс начинается с основ вычислений для Data Science. Здесь рассматривают математический анализ, линейную алгебру, методы оптимизации, теорию вероятностей и математическую статистику. Эти дисциплины дают базовые знания для работы с данными.
Далее студенты изучают машинное обучение. Рассматривают классификацию и регрессию - деревья решений, логистическую регрессию, ансамблевые методы. Затем переходят к кластеризации и специфическим видам обучения - с гарантированной точностью и причинно-следственного. Завершается модуль интеллектуальным анализом данных - снижением размерности и поиском ассоциативных правил.
Третий модуль посвящен нейронным сетям. Начинается с простых сетей с прямым распространением сигнала, затем переходят к самообучающимся и глубоким сетям. Детально изучают сверточные и рекуррентные сети. Рассматривают практическое применение - распознавание диктора, анализ кибератак, проблемы развития нейросетевых решений.
Четвертый модуль охватывает прогнозный анализ. Студенты учатся оценивать полиномиальные и циклические тренды, использовать методы сглаживания и декомпозиции. Работают с регрессионными и авторегрессионными моделями, методами опорных векторов. Изучают нелинейные модели, коинтегрированные временные ряды, усовершенствование прогнозных моделей.
Пятый модуль обучает практическим навыкам. Начинается с основ Python, затем студенты изучают ключевые библиотеки - pandas, numpy, matplotlib, scikit-learn, tensorflow. Обучаются подготовке и обработке данных, использованию API для построения моделей.
Шестой модуль охватывает полный цикл работы с данными. Студенты изучают модели данных, системы хранения, SQL, Master Data Management. Рассматривают движение данных в компании, бизнес-аналитику, визуализацию и data storytelling.
Седьмой модуль посвящен технологиям больших данных. Включает основы облачных вычислений, архитектуру систем для больших данных, платформу Hadoop. Студенты изучают SQL и NoSQL базы данных, программирование на Hive и Pig Latin, потоковую аналитику, управление данными и безопасность.
Восьмой модуль предлагает доменную экспертизу - финансы, CRM, телекоммуникации или маркетинг. Финальный проект позволяет применить все полученные знания на практике. Студент выбирает задачу от Vodafone, проходит полный цикл - от постановки проблемы до тренировки модели. На защите представляет презентацию, код и результаты работы.
Курс отличается уникальной доменной экспертизой и практикой на реальных больших данных. Программа постоянно обновляется, что обеспечивает актуальность материала. Преподаватели имеют мировой уровень квалификации. Можно отдельно пройти подготовительный курс перед основным обучением.