Курс по машинному обучению построен по принципу от простого к сложному. Каждый модуль логически вытекает из предыдущего.
На первом модуле студенты разбираются с базовыми понятиями машинного обучения. Они узнают о различных типах обучения и получают практические навыки работы с Python. Основное внимание уделяется основным библиотекам - NumPy, SciPy и Pandas, которые станут основным инструментом в дальнейшей работе.
Второй модуль посвящен подготовке данных к анализу. Здесь обучаются собирать, импортировать и очищать данные. Студенты учатся обрабатывать пропуски и выбросы, а также визуализировать информацию для лучшего понимания. Отдельно рассматривается работа с географическими данными.
Третий и четвертый модули охватывают основные алгоритмы машинного обучения. Сначала изучается линейная регрессия - от теории до практического применения в анализе временных рядов. Затем переходят к классификации: деревья решений, случайный лес, градиентный бустинг и другие ансамблевые методы. Важной частью является оценка и валидация качества построенных моделей.
Пятый модуль раскрывает методы кластеризации и уменьшения размерности данных. Студенты работают с алгоритмом PCA, анализируют текстовые и открытые данные. Для визуального анализа используется инструмент Orange, который позволяет лучше понимать структуру данных.
Шестой модуль полностью посвящен нейронным сетям. Он начинается с основ искусственных нейронов и механизмов обучения. Затем подробно разбираются сложные архитектуры - сверточные сети для работы с изображениями, рекуррентные сети для последовательностей, автоэнкодеры и трансформеры.
Седьмой модуль учит анализировать и улучшать результаты работы алгоритмов. Здесь рассматриваются методы диагностики ошибок обучения, анализ кривых обучения и сравнение с человеческой точностью. Особое внимание уделяется правильному распределению данных на обучающие и тестовые выборки.
Восьмой модуль охватывает дополнительные методы машинного обучения. Он включает ассоциативные правила, генетические алгоритмы, нечеткую логику и обучение с подкреплением. Эти технологии расширяют арсенал инструментов для решения сложных задач.
Курс включает серию лабораторных работ с индивидуальными консультациями. Каждое задание закрепляет теоретический материал - от подготовки данных до создания сложных нейронных сетей. Лектор демонстрирует решения на собственных примерах и помогает студентам в случае трудностей.
Помимо основной программы, курс содержит занятия по техническому английскому для работы с профессиональной литературой. Также проводится карьерная консультация с рекрутером, который помогает подготовить резюме и профиль в LinkedIn для поиска работы.
Для успешного прохождения курса нужно знать Python на среднем уровне, понимать основы статистики и иметь опыт работы с библиотеками NumPy, SciPy, Pandas, Matplotlib и Seaborn.
Курс предлагает гибкий график лекций, практическую направленность и обучение в небольших группах. Выпускники получают сертификат об окончании, а лучшим студентам предлагают контракт с IT-компанией.