Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.
Часть 1.
HDFS, Map Reduce, Hive
В этом модуле вы изучите:
вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
чтение и запись в HDFS. HDFS APIs: Web, shell.
Hadoop Streaming;
элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
приложения с несколькими Hadoop-задачами;
тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
задачи с несколькими входами. Joins в Hadoop.
архитектура Hive, виды таблиц, форматы хранения данных;
трансляция Hive-запросов в MapReduce-задачи;
сериализация и десериализация;
тюнинг Join’ов в Hive;
партиционирование, бакетирование, семплирование;
User defined functions, Hive Streaming.
- 🎯 Лучшее качество материала. Оригинальные курсы отличного качества со скидкой до 99%
- 📩Моментальная обработка заказа. Доступ пpeдоcтавляeтcя нa oблaчном хранилищe.
- 📂Пoсле оплaты открывается доступ к ссылке на облачное хранилище откудa Вы можетe поcмoтреть onlinе или скaчaть.
- 👍 Гарантия получения результата. Все обучение добавленное на проекте выкуплено и полностью в наличии
-
Надежная оплата несколько вариантов на выбор: платите как вам удобно


![[bigdata team] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive](https://www.c1.inoon.ru/wp-content/uploads/2023/11/bigdata-team-prakticheskij-kurs-po-big-data-chast-1-hdfs-map-reduce-hive_655543cfeb6c2.png)











