Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
11.084
Автор: skillfactory

Название: Курс по Data Engineering (2023)

1683012998170-png.106609


Описание:

Научитесь строить пайплайны данных в реальном времени.

В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или модели прогнозирования. Data Engineer - это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.

Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.

Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python. За два месяца вы освоите все важные этапы Data Engineering.

Программа курса

- 1 Введение, практический linux

Кто такой Data Engineer и зачем ему Linux?

- 2 Современные хранилища данных

Разнообразие баз данных и их особенности

- 3 Экосистема Hadoop

Что такое Hadoop, что он умеет и как им пользоваться

- 4 Источники данных и работа с ними

Файлы как источники данных, JDBC - структурированные данные, SQL для выгрузки данных

- 5 Apache Spark и обработка данных

Зачем нужен Apache Spark и как с ним работать

- 6 Hadoop как хранилище данных

Особенности и нюансы hdfs

- 7 Apache Airflow для оркестрации конвейеров

Настройка data pipelines

- 8 Обзор облачных хранилищ

Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху