На этом курсе расскажут, что такое веб-скрапинг и какие библиотеки используют для создания скраперов. Студенты узнают, где можно применять полученные навыки, а также про этические и юридические нюансы работы с парсингом.
Ученики освоят основные языки разметки - HTML, XML и JSON. Они создадут виртуальное окружение и установят необходимые библиотеки для будущей работы с данными.
Курс научит строить XPath для доступа к любым тегам в документе. Студенты освоят регулярные выражения и CSS-селекторы для поиска и извлечения нужной информации с веб-страниц.
Ученики узнают о типах запросов и ответов, освоят инструмент Postman и научатся использовать библиотеку Requests для отправки запросов на сервер.
На курсе научат сохранять данные локально и в базы данных. Студенты смогут выбирать оптимальный формат сохранения информации для последующего анализа и писать SQL-запросы для работы с данными.
Ученики научатся использовать библиотеку Beautiful Soup для парсинга сайтов, работать с потоками (Threads) и находить нужные HTML-теги. Также они освоят фреймворк Scrapy, познакомятся с понятием Spider и научатся сохранять полученные данные в разных форматах.
Курс разберет библиотеку Selenium для парсинга сложных сайтов. Студенты научатся работать с CSS-селекторами и XPath, а также использовать Selenium для заполнения форм и кликов на странице.
Ученики попрактикуют подходы к имитации поведения реального пользователя, чтобы успешно получать контент с защищенных страниц.
На заключительных занятиях пройдет Q&A-сессия с лектором, где студенты получат ответы на вопросы и советы по выполнению курсового проекта. Завершением курса станет презентация готовых проектов.