Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
10.769
Автор: Udemy

Название: Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4 (2021)

1633292777497-png.87856


Описание:

В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.

Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.

После прохождения курса студенты будут знать:

-Как найти и установить необходимые библиотеки для парсинга данных.

-Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.

-Для чего нужен файл robots.txt.

-Каким образом получать HTML сайта для извлечения необходимой информации.

-Как пользоваться xpath для указания точного расположения элементов на странице.

-Как переходить по страницам на многостраничном сайте.

-Как создавать проект и запускать «пауков» Scrapy.

-Как парсить всю информацию о каждом товаре на сайте.

-Как осуществлять переход на страницу каждого товара.

-Каким образом парсить сайты, использующие jаvascript при загрузке.

-Как авторизовываться на сайте, используя фреймворк Selenium.

-Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху