Курсы по Big Data, big data, cassandra, hadoop, BiData SQL, Hive, Impala, EAS, современные подходы к управлению данными, сибинфоцентр, обучение, новосибирск, обучение в новосибирске, курсы, luxsoft
Ваша корзина пуста
Сумма: 0 руб.

Курсы по Big Data, big data, cassandra, hadoop, BiData SQL, Hive, Impala, EAS, современные подходы к управлению данными, сибинфоцентр, обучение, новосибирск, обучение в новосибирске, курсы, luxsoft

О курсе

Основы Hadoop

Описание:
Этот тренинг дает представление об основах Apache™ Hadoop® и методах разработки приложений, обрабатывающих данные, на его основе. Участники познакомятся с HDFS – стандартом де факто для долговременного надежного хранения больших объемов данных, фреймворком MapReduce, автоматически управляющим параллельным выполнением приложений на кластере, и сопутствующими проектами, составляющими экосистему Hadoop®.



Цели:
  • понимать ключевые концепции и архитектуру Hadoop®;
  • уметь записывать и читать данные в/из HDFS;
  • разрабатывать программы для классического MapReduce и для YARN;
  • работать с данными в HDFS из MapReduce-программ;
  • получить представление об экосистеме, сложившейся вокруг Hadoop® и ее ключевых компонентах.
Целевая аудитория:
Разработчики, архитекторы, разработчики баз данных, администраторы баз данных.
Предварительная подготовка – общее:
Базовые навыки программирования на Java. Умение работать в командной оболочке Unix/Linux (bash). Опыт работы с базами данных желателен, но не обязателен.
Расписание и цены
Этот курс набирает желающих участников. Отправьте заявку на участие, а когда наберётся достаточное количество, мы с вами свяжемся.
Заказать обучение
Программа курса
Разбираемые темы:
  • Основные концепции Hadoop®;
  • Установка и конфигурирование: локально и в облаке;
  • HDFS: Архитектура, репликация, чтение и запись данных;
  • Команды HDFS;
  • Структура классической MapReduce-программы;
  • Форматы данных для MapReduce;
  • Архитектура YARN;
  • Выполнение работ в классическом MapReduce и в YARN;
  • Распределенный кеш и счетчики;
  • Hadoop Streaming;
  • Экосистема и вендоры Hadoop®;
  • Введение в Pig™;
  • Введение в Hive;
  • Введение в Sqoop;
  • Введение в Flume;
  • Введение в Spark™;
  • Введение в Mahout™.