Главная Школы EPAM Data Software Engineering
EPAM

Data Software Engineering

Безкоштовно
3 месяцев
Для начинающих
Data Engineer / Big Data
Этот курс научит работать с большими данными с помощью Hadoop, Spark, Kafka и других инструментов. Здесь рассматриваются облачные платформы, проектирование систем и основные навыки для Data Software Engineer. Курс включает практические задания и возможность сотрудничества с EPAM Лабораторией.

О курсе

Программа курса

Модуль 1: Фундаментальные технологии

На этом курсе начинают с основ - студенты изучают систему контроля версий Git. Разбирают концепции ветвления, слияния кодов и разрешения конфликтов. Далее идут методологии разработки ПО: водопад, гибкие методологии Agile, Scrum и Kanban, а также разработка через тестирование. Отдельно рассматривают облачные технологии - основные концепции, модели сервисов и обзор платформ. Знакомятся с DevOps: контейнеры Docker, оркестрация Kubernetes, непрерывная интеграция и поставка. Завершается модуль языком Python - от типов данных и функций до работы с коллекциями, условиями, циклами и обработкой ошибок.

Модуль 2: Основы Data Engineering

Второй модуль посвящен базам данных и SQL. Студенты осваивают основы работы с базами данных, языки манипуляции данными (DML), определения данных (DDL), контроля транзакций (TCL) и управления доступом (DCL). Далее переходят к моделированию данных и архитектуре - сравнивают OLAP и OLTP, изучают подходы Kimball и Inmon для построения хранилищ данных, типы измерений и фактов, процессы ETL и ELT. Модуль включает NoSQL базы данных - их отличия от реляционных систем, теорему CAP, а также конкретные технологии: Cassandra, MongoDB, HBase. Завершается рассмотрением концепции Data Lake и ее отличий от традиционных хранилищ данных.

Модуль 3: Практика в EPAM Лаборатории

Финальная часть - практическая работа с реальными инструментами. В лаборатории используют облачные платформы Azure или AWS, фреймворк Spark, платформу Databricks, системы обработки потоков Kafka, распределенное хранилище Hadoop, оркестратор Airflow, поисковую систему Elastic. Студенты обучаются строить и управлять конвейерами данных, настраивать оркестрацию и планирование задач.

Требования к студентам

Для успешного обучения нужен английский язык от уровня B1 и уверенные навыки программирования на Python. Дополнительно потребуется опыт работы с Java или Scala, глубокие знания теории реляционных баз данных, высокий уровень владения SQL. Важно иметь теоретические знания о DWH/Data Lake и инструментах визуализации данных, базовое понимание Linux, Docker и Kubernetes.

Процесс регистрации

Чтобы присоединиться к программе, нужно зарегистрироваться, сдать тест по английскому языку и технический тест на знание Python. После успешного прохождения кандидат получает доступ к учебной платформе Learn.

Условия участия

Обучение доступно только для граждан Украины, которые находятся на территории страны. Формат обучения не имеет жестких дедлайнов, но регистрация может закрыться в любой момент. Активные участники других тренингов EPAM и сотрудники компании не могут принимать участие. На прохождение учебных модулей отводится около 3 месяцев - отсутствие прогресса в течение этого времени приводит к автоматической отмене заявки.

Преимущества обучения

Курс проводится в международной ИТ-компании с использованием профессиональных учебных материалов. Программа имеет практическую направленность и обеспечивает глубокое погружение в специализацию. Лучшие студенты получают возможность попасть в EPAM Лабораторию для дальнейшего развития.

Что включено

Гибкий график