На цьому курсі починають з основ - розбирають, що таке дані і як бізнес може їх використовувати. Слухачі зрозуміють різницю між Data Scientist, Data Analyst та іншими суміжними професіями. Визначать власні сильні сторони для роботи з даними. Одночасно знайомляться з Python - основним інструментом у цій галузі. Вивчають базовий синтаксис, принципи ООП та функціонального програмування. Вчаться працювати в Jupyter Notebook та використовувати бібліотеки для Data Science.
Далі курс охоплює математичну підготовку - лінійну алгебру, вектори, матриці та теорію ймовірностей. Це допомагає формалізувати задачі математичною мовою. Паралельно вивчають роботу з базами даних - як правильно зберігати інформацію та отримувати її за допомогою SQL-запитів. Слухачі вчаться використовувати оператори SELECT, WHERE, JOIN для витягування потрібних даних.
Тут переходять до практичного машинного навчання. Вивчають регресію, класифікацію, кластеризацію та прогнозування. Працюють з різними алгоритмами - від дерев рішень до нейронних мереж. Вчаться оцінювати якість моделей за допомогою метрик. На цьому етапі будують першу нейронну мережу та працюють з фреймворками TensorFlow і PyTorch.
Цей модуль присвячений підготовці даних до аналізу. Слухачі вчаться зчитувати дані з різних форматів, обробляти пропуски та будувати зрозумілі візуалізації. Розбирають EDA та Feature Engineering. Далі переходять до роботи з великими даними - вивчають Spark, PySpark та принципи розподілених систем. Працюють у Databricks Notebooks та опановують паралельні обчислення.
На завершальних заняттях формують професійний підхід до роботи. Вчать формулювати гіпотези, розуміти потреби бізнесу та презентувати результати. Фінальна частина - практичний проект з реальними даними. Слухачі обробляють інформацію, будують візуалізації, створюють пайплайн та тренують модель для прогнозування. Захищають свій проект перед колегами.