На цьому курсі розкажуть, що таке веб-скрапінг і які бібліотеки використовують для створення скраперів. Студенти дізнаються, де можна застосовувати отримані навички, а також про етичні та юридичні нюанси роботи з парсингом.
Учні опрацюють основні мови розмітки - HTML, XML та JSON. Вони створять віртуальне середовище і встановлять необхідні бібліотеки для майбутньої роботи з даними.
Курс навчить будувати XPath для доступу до будь-яких тегів у документі. Студенти опанують регулярні вирази та CSS-селектори для пошуку та витягування потрібної інформації з веб-сторінок.
Учні дізнаються про типи запитів та відповідей, опрацюють інструмент Postman і навчаться використовувати бібліотеку Requests для відправлення запитів на сервер.
На курсі навчать зберігати дані локально та в бази даних. Студенти зможуть вибирати оптимальний формат збереження інформації для подальшого аналізу та писати SQL-запити для роботи з даними.
Учні навчаться використовувати бібліотеку Beautiful Soup для парсингу сайтів, працювати з потоками (Threads) і знаходити потрібні HTML-теги. Також вони опанують фреймворк Scrapy, познайомляться з поняттям Spider і навчаться зберігати отримані дані в різних форматах.
Курс розбере бібліотеку Selenium для парсингу складних сайтів. Студенти навчаться працювати з CSS-селекторами та XPath, а також використовувати Selenium для заповнення форм і кліків на сторінці.
Учні попрактикують підходи до імітації поведінки реального користувача, щоб успішно отримувати контент з захищених сторінок.
На заключних заняттях пройде Q&A-сесія з лектором, де студенти отримають відповіді на питання та поради щодо виконання курсового проекту. Завершенням курсу стане презентація готових проєктів.