- Регистрация
- 22 Февраль 2018
- Сообщения
- 11.084
Автор: learndataengineering
Название: Инженерия данных с Hadoop (2025)
Описание:
Data Engineering with Hadoop
learndataengineering
Big Data - это не просто модное слово, а реальное явление. Каждый день компании по всему миру собирают и обрабатывают огромные объёмы данных на высокой скорости. Эти данные часто неструктурированы и несогласованы, что делает их обработку с помощью традиционных методов практически невозможной.
Одной из платформ, зарекомендовавших себя для работы с большими данными, является Apache Hadoop. Это фреймворк с открытым исходным кодом на Java, позволяющий обрабатывать и хранить большие объёмы данных в кластерах, используя простые программные модели. Hadoop - это гибкая, быстрая и доступная архитектура, способная обнаруживать и обрабатывать сбои на уровне приложений.
Что вы изучите
В этом курсе под руководством Суйога Нагаокара вы получите всестороннее понимание архитектуры Hadoop и её компонентов:
- HDFS
- YARN
- MapReduce
- Hive
- Sqoop
Курс включает теоретическую базу и практические лабораторные занятия. Вы научитесь:
- Понимать концепцию экосистемы Hadoop
- Использовать основные команды Hadoop
- Реализовывать решения на основе каждого компонента Hadoop для решения реальных бизнес-задач
Вы установите и настроите полноценную среду Hadoop с помощью Cloudera Quickstart VM прямо на своём компьютере. На практике вы научитесь:
- Сохранять и запрашивать данные с помощью Sqoop, Hive и MySQL
- Писать запросы Hive для анализа данных на Hadoop
- Работать с кластерами данных с использованием HDFS, MapReduce и YARN
- Управлять кластерами с помощью Hue
Требования
- ПК с 64-битной версией Windows или Linux и доступом в интернет
- Не менее 8 ГБ свободной (не общей) оперативной памяти для выполнения практических заданий (если памяти меньше, вы сможете следить за обучением, но без практики)
- Базовые навыки программирования, предпочтительно на Python
- Знакомство с командной строкой Linux будет большим плюсом
Курс подойдёт как новичкам, так и тем, кто хочет углубить свои знания в области Big Data и научиться работать с одним из самых популярных фреймворков в индустрии.
Материал на английском языке
Подробнее:
Скачать:
Название: Инженерия данных с Hadoop (2025)
Описание:
Data Engineering with Hadoop
learndataengineering
Big Data - это не просто модное слово, а реальное явление. Каждый день компании по всему миру собирают и обрабатывают огромные объёмы данных на высокой скорости. Эти данные часто неструктурированы и несогласованы, что делает их обработку с помощью традиционных методов практически невозможной.
Одной из платформ, зарекомендовавших себя для работы с большими данными, является Apache Hadoop. Это фреймворк с открытым исходным кодом на Java, позволяющий обрабатывать и хранить большие объёмы данных в кластерах, используя простые программные модели. Hadoop - это гибкая, быстрая и доступная архитектура, способная обнаруживать и обрабатывать сбои на уровне приложений.
Что вы изучите
В этом курсе под руководством Суйога Нагаокара вы получите всестороннее понимание архитектуры Hadoop и её компонентов:
- HDFS
- YARN
- MapReduce
- Hive
- Sqoop
Курс включает теоретическую базу и практические лабораторные занятия. Вы научитесь:
- Понимать концепцию экосистемы Hadoop
- Использовать основные команды Hadoop
- Реализовывать решения на основе каждого компонента Hadoop для решения реальных бизнес-задач
Вы установите и настроите полноценную среду Hadoop с помощью Cloudera Quickstart VM прямо на своём компьютере. На практике вы научитесь:
- Сохранять и запрашивать данные с помощью Sqoop, Hive и MySQL
- Писать запросы Hive для анализа данных на Hadoop
- Работать с кластерами данных с использованием HDFS, MapReduce и YARN
- Управлять кластерами с помощью Hue
Требования
- ПК с 64-битной версией Windows или Linux и доступом в интернет
- Не менее 8 ГБ свободной (не общей) оперативной памяти для выполнения практических заданий (если памяти меньше, вы сможете следить за обучением, но без практики)
- Базовые навыки программирования, предпочтительно на Python
- Знакомство с командной строкой Linux будет большим плюсом
Курс подойдёт как новичкам, так и тем, кто хочет углубить свои знания в области Big Data и научиться работать с одним из самых популярных фреймворков в индустрии.
Материал на английском языке
Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.
Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.
Скрытый контент для пользователей All-dar.