Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
10.737
Автор: learndataengineering

Название: Современные хранилища данных и Data Lakes (2025)

1750970648906-png.162146


Описание:

Modern Data Warehouses & Data Lakes

learndataengineering

В роли инженера данных вы будете регулярно работать с аналитическими платформами, где компании хранят данные в Data Lakes и Data Warehouses для построения визуализаций и создания моделей машинного обучения.

Современные хранилища данных, такие как AWS Redshift, Google BigQuery и Snowflake, позволяют загружать данные напрямую из файлов в Data Lake. Эта интеграция делает работу с хранилищами гибкой и удобной для аналитических задач.

В этом курсе вы научитесь:

- Как использовать Data Lakes, Data Warehouses и BI-инструменты в единой системе
- Как загружать данные в Data Lakes и визуализировать их в отчётах
- Как строить интеграции в Google Cloud Platform и AWS
- Как работает архитектура ETL/ELT и как её применять в современных хранилищах данных

Основы Data Warehouses и Data Lakes

- Роль хранилищ данных в аналитических платформах
- Как данные загружаются в Data Warehouse через ETL/ELT
- Что такое Data Lakes и как их использовать
- Как работать с файлами напрямую в озере данных

Практика на GCP: Cloud Storage, BigQuery и Data Studio

- Настройка Cloud Storage, создание таблицы в BigQuery
- Визуализация данных в Data Studio
- Понимание общих принципов работы облачных платформ

Практика на AWS: S3, Athena, Glue и Quicksight

- Создание интеграции данных через S3, Athena и Quicksight
- Настройка Glue Data Catalog для управления данными
- Подробная настройка и интеграция Glue

Резюме и бонус-урок: AWS Redshift Spectrum

- Подведение итогов курса
- Дополнительный модуль по работе с Redshift Spectrum, используя подготовленный Data Catalog из AWS-проекта

Необходимые знания

- Основы работы с Data Warehouses (рекомендуется пройти курс «Хранилища данных» в академии)
- Базовые знания AWS Athena и Redshift (для блока с Redshift Spectrum используется подготовленный Data Catalog из проекта AWS)

Этот курс поможет вам освоить современные подходы к построению систем хранения и обработки данных и научиться эффективно использовать возможности Data Lakes и Data Warehouses для аналитики.

Материал на английском языке

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху