Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
11.084
Автор: learndataengineering

Название: Инженерия данных с Hadoop (2025)

1751194169301-png.162344


Описание:

Data Engineering with Hadoop

learndataengineering

Big Data - это не просто модное слово, а реальное явление. Каждый день компании по всему миру собирают и обрабатывают огромные объёмы данных на высокой скорости. Эти данные часто неструктурированы и несогласованы, что делает их обработку с помощью традиционных методов практически невозможной.

Одной из платформ, зарекомендовавших себя для работы с большими данными, является Apache Hadoop. Это фреймворк с открытым исходным кодом на Java, позволяющий обрабатывать и хранить большие объёмы данных в кластерах, используя простые программные модели. Hadoop - это гибкая, быстрая и доступная архитектура, способная обнаруживать и обрабатывать сбои на уровне приложений.

Что вы изучите

В этом курсе под руководством Суйога Нагаокара вы получите всестороннее понимание архитектуры Hadoop и её компонентов:

- HDFS
- YARN
- MapReduce
- Hive
- Sqoop

Курс включает теоретическую базу и практические лабораторные занятия. Вы научитесь:

- Понимать концепцию экосистемы Hadoop
- Использовать основные команды Hadoop
- Реализовывать решения на основе каждого компонента Hadoop для решения реальных бизнес-задач

Вы установите и настроите полноценную среду Hadoop с помощью Cloudera Quickstart VM прямо на своём компьютере. На практике вы научитесь:

- Сохранять и запрашивать данные с помощью Sqoop, Hive и MySQL
- Писать запросы Hive для анализа данных на Hadoop
- Работать с кластерами данных с использованием HDFS, MapReduce и YARN
- Управлять кластерами с помощью Hue

Требования

- ПК с 64-битной версией Windows или Linux и доступом в интернет
- Не менее 8 ГБ свободной (не общей) оперативной памяти для выполнения практических заданий (если памяти меньше, вы сможете следить за обучением, но без практики)
- Базовые навыки программирования, предпочтительно на Python
- Знакомство с командной строкой Linux будет большим плюсом

Курс подойдёт как новичкам, так и тем, кто хочет углубить свои знания в области Big Data и научиться работать с одним из самых популярных фреймворков в индустрии.

Материал на английском языке

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху