Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
11.084
Автор: Udemy

Название: Инженерия данных для начинающих с использованием Google Cloud и Python (2021)

1637591775189-png.89886


Описание:

Data Engineering for Beginner using Google Cloud & Python

Udemy

«Данные - новая нефть».

Возможно, вы слышали эту цитату раньше. Данные в цифровую эпоху так же ценны, как нефть в индустриальную эпоху. Однако сами по себе необработанные данные, как и нефть, непригодны. Скорее, ценность создается, когда она собирается полностью и точно, связана с другими соответствующими данными и делается это своевременно.

Инженеры по обработке данных проектируют и создают конвейеры, которые преобразуют и транспортируют данные в удобный для использования формат. Другая роль, например, специалист по обработке данных или инженер по машинному обучению, может использовать данные для получения ценной информации о бизнесе. Так же, как сырая нефть превращается в бензин для использования в сложном процессе.

Чтобы быть инженером по обработке данных, требуется много знаний и практики. Этот курс - первый шаг для вас, кто хочет узнать об инженерии данных. В этом курсе мы познакомимся с теориями и практическими занятиями, чтобы познакомить вас с инженерией данных. Поскольку поле данных очень широкое, этот курс покажет вам базовые знания начального уровня о процессе и инструментах инженерии данных.

Этот курс очень подходит для создания основы для перехода к полю данных. В этом курсе мы узнаем о:

- Введение в инженерию данных
- Реляционная и нереляционная база данных
- Реляционная и нереляционная модель данных
- Нормализация таблицы
- Таблицы фактов и измерений
- Денормализация таблиц для хранилища данных
- ETL (Extract Transform Load) и постановка данных с использованием pyhton pandas
- Elasticsearch базовый
- Хранилище данных
- Цифры, которые должен знать каждый инженер, и как это связано с большими данными
- Hadoop
- Кластер Spark в Google Cloud DataProc
- Озеро данных

Важные заметки

Поле данных ОГРОМНОЕ! Этот курс будет постоянно обновляться, но на данный момент он содержит введение в концепцию и примеры практических занятий по инженерии данных.

На данный момент этот курс предназначен для новичков в области инженерии данных.

Если у вас есть некоторый опыт программирования и вас интересует инженерия данных, этот курс для вас.

Если у вас есть опыт работы в области инженерии данных, этот курс может быть для вас слишком базовым (хотя я очень рад, если вы все же купите курс)

Если вы никогда раньше не писали Python или SQL, этот курс не для вас. Чтобы понять курс, вы должны иметь базовые знания SQL и pyhton.

Для кого этот курс:

- Начинающий разработчик Python, интересующийся инженерией данных
- Инженер-программист, который хочет стать инженером по данным
- Технический архитектор, технический менеджер, который хочет знать обзор инженерии данных

Требования

- Понимание основных операторов sql (достаточно выбрать, вставить, обновить, удалить)
- Понимание базового Python / pandas
- В курсе используется облачная платформа Google. Если вы хотите заниматься на практике, вам необходимо предоставить данные кредитной карты для оплаты в облаке Google. Если вы этого не сделаете, вы все равно можете посмотреть видео курса

Материал на английском языке

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху