[Udemy] Улучшенный парсинг веб-страниц с помощью Asyncio и Python (2021)

Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
11.084
Автор: Udemy

Название: Улучшенный парсинг веб-страниц с помощью Asyncio и Python (2021)

1643569701898-png.93488


Описание:

Изучите основы асинхронного парсинга веб-страниц и интеллектуального анализа данных в Python, чтобы значительно повысить скорость извлечения.

Веб-скрапинг - это просто автоматическое открытие любого веб-сайта и сбор данных, которые вы считаете важными на этом веб-сайте. Это фундаментально для Интернета, поисковых систем, Data Science, автоматизации, машинного обучения и многого другого.

Открытие веб-сайтов и извлечение данных - это только часть того, что делает веб-парсинг отличным. В этом и заключается значение анализа данных.

Этот проект будет охватывать:

- Базовый парсинг веб-страниц с помощью Python
- Веб-парсинг с помощью Selenium
- Синхронизация против асинхронной
- Асинхронный парсинг веб-страниц с помощью Asyncio

Но почему асинхронный код? Что это? Чем это нам выгодно?

Асинхронный код - это способ выполнять сразу несколько функций. Это не совсем то же самое время, но это близко. (На самом деле они работают одновременно). Это означает, что мы можем делать больше за меньшее время, и, когда дело доходит до интеллектуального анализа или очистки данных, эта экономия времени является абсолютно значительной.

Представьте на мгновение, что вы воссоздаете поисковую систему Google. Вам придется регулярно очищать триллионы (если не больше) веб-страниц, чтобы улучшить результаты поиска. Конечно, вы не собираетесь очищать все триллионы страниц одновременно, но идея состоит в том, что очистка событий 1000 страниц займет очень много времени, выполняя это синхронно (например, с использованием запросов Python и / или просто селена).

Если вы раньше много раз занимались парсингом веб-страниц, но никогда не использовали Python aysncio, этот курс поможет вам лучше понять основы и вывести вашу парсинг-игру на новый уровень.

Материал на английском языке

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху