На этом курсе начинают с основ работы с данными. Рассматривают типы данных и их значение для проектов. Узнают, где брать данные - внутри проекта и извне. Разбирают виды Data Science и различия между ролями Data Engineer и Data Analyst. На практике готовят данные для тренировки модели на примере e-commerce.
Далее изучают основы SQL. Рассматривают базы данных, таблицы и атрибуты. Обсуждают Big Data и выбор между SQL и NoSQL. На практике пишут базовые запросы: создают выборки, соединяют таблицы и выполняют агрегацию данных.
Этот блок показывает, как правильно подходить к Data Science проектам. Помогает определить проблемы для решения и формировать гипотезы роста. Рассматривает оценку влияния гипотез на продукт и необходимые бизнес-ресурсы для начала работы.
Здесь переходят к практическому построению моделей. Рассматривают типовую архитектуру ML проектов и строят собственную модель для создания MVP. Оценивают качество моделей и определяют подходы для четырех типов задач: ценообразование, классификация отзывов, распознавание изображений и построение чат-ботов.
Этот модуль посвящен построению Machine Learning команды. Рассматривают, кого нанимать для MVP проекта и как распределять зоны ответственности. Обсуждают Agile практики для управления DS/ML проектами и их отличия от традиционной разработки.
Практический блок о работе с клиентскими данными. Делают прогнозы LTV с помощью статистических методов и DS подходов. Анализируют предсказания оттока клиентов и учат принимать решения на основе churn моделей. Показывают, как сегментирование клиентов помогает в оптимизации бизнеса.
Модуль о применении обработки естественного языка. Рассматривают оптимизацию работы support команды с помощью NLP и active learning. Применяют алгоритмы для определения тем и обработки комментариев. Обсуждают случаи использования алгоритмов обучения без учителя.
Полный цикл работы с визуализацией. Знакомятся с основными инструментами: Excel, Tableau, PowerBI, QlikView, Pentaho, Birst. Затем переходят к практической работе в Power BI: соединяют источники данных, создают диаграммы, используют фильтры, настраивают dashboard и экспортируют результаты.
Завершающий модуль об интеграции NLP в бизнес. Рассматривают стандартный NLP pipeline от постановки бизнес-задачи до выбора компонентов. Покрывают разметку данных, тренинг нейронных сетей и метрики оценки. Показывают, как интегрировать техническое решение с инфраструктурой бизнеса.
Курс рассчитан на проектных менеджеров, продукт менеджеров, бизнес-аналитиков и владельцев бизнеса. Преподаватели имеют опыт работы в разных компаниях. Участники получают персональные консультации по развитию карьеры, помощь с улучшением резюме и поиском вакансий. Возможно возвращение средств после двух занятий.