Головна Школи EPAM Data Software Engineering
EPAM

Data Software Engineering

Безкоштовно
3 місяців
Для початківців
Data Engineer / Big Data
Цей курс навчить працювати з великими даними за допомогою Hadoop, Spark, Kafka та інших інструментів. Тут розглядаються хмарні платформи, проектування систем та основні навички для Data Software Engineer. Курс включає практичні завдання та можливість співпраці з EPAM Лабораторією.

Про курс

Програма курсу

Модуль 1: Фундаментальні технології

На цьому курсі починають з основ - студенти вивчають систему контролю версій Git. Розбирають концепції розгалуження, злиття кодів та вирішення конфліктів. Далі йдуть методології розробки ПЗ: водоспад, гнучкі методології Agile, Scrum та Kanban, а також розробка через тестування. Окремо розглядають хмарні технології - основні концепції, моделі сервісів та огляд платформ. Знайомляться з DevOps: контейнери Docker, оркестрація Kubernetes, безперервна інтеграція та поставка. Завершується модуль мовою Python - від типів даних і функцій до роботи з колекціями, умовами, циклами та обробкою помилок.

Модуль 2: Основи Data Engineering

Другий модуль присвячений базам даних та SQL. Студенти освоюють основи роботи з базами даних, мови маніпуляції даними (DML), визначення даних (DDL), контролю транзакцій (TCL) та управління доступом (DCL). Далі переходять до моделювання даних та архітектури - порівнюють OLAP та OLTP, вивчають підходи Kimball та Inmon для побудови сховищ даних, типи вимірів та фактів, процеси ETL та ELT. Модуль включає NoSQL бази даних - їх відмінності від реляційних систем, теорему CAP, а також конкретні технології: Cassandra, MongoDB, HBase. Завершується розглядом концепції Data Lake та її відмінностей від традиційних сховищ даних.

Модуль 3: Практика в EPAM Лабораторії

Фінальна частина - практична робота з реальними інструментами. У лабораторії використовують хмарні платформи Azure або AWS, фреймворк Spark, платформу Databricks, системи обробки потоків Kafka, розподілене сховище Hadoop, оркестратор Airflow, пошукову систему Elastic. Студенти навчаються будувати та керувати конвеєрами даних, налаштовувати оркестрацію та планування завдань.

Вимоги до студентів

Для успішного навчання потрібен англійська мова від рівня B1 та впевнені навички програмування на Python. Додатково знадобиться досвід роботи з Java або Scala, глибокі знання теорії реляційних баз даних, високий рівень володіння SQL. Важливо мати теоретичні знання про DWH/Data Lake та інструменти візуалізації даних, базове розуміння Linux, Docker та Kubernetes.

Процес реєстрації

Щоб долучитися до програми, потрібно зареєструватися, скласти тест з англійської мови та технічний тест на знання Python. Після успішного проходження кандидат отримує доступ до навчальної платформи Learn.

Умови участі

Навчання доступне лише для громадян України, які перебувають на території країни. Формат навчання не має жорстких дедлайнів, але реєстрація може закритися у будь-який момент. Активні учасники інших тренінгів EPAM та співробітники компанії не можуть брати участь. На проходження навчальних модулів відводиться близько 3 місяців - відсутність прогресу протягом цього часу призводить до автоматичного скасування заявки.

Переваги навчання

Курс проводиться в міжнародній ІТ-компанії з використанням професійних навчальних матеріалів. Програма має практичну спрямованість та забезпечує глибоке занурення в спеціалізацію. Найкращі студенти отримують можливість потрапити до EPAM Лабораторії для подальшого розвитку.

Що включено

Гнучкий графік