Курсы Сибинфоцентра
Ваша корзина пуста
Сумма: 0 руб.
О курсе

Эксплуатация Arenadata Hadoop

  • Номер курса: ADH
  • Вендор: Arenadata
Тренинг предназначен для системных администраторов Hadoop, которые хотят получить знания по продуктам экосистемы Hadoop и продвинутые навыки по установке, конфигурированию, обслуживанию, восстановлению и управлению кластером Hadoop с использованием дистрибутива Arenadata Hadoop и системы управления Arenadata Cluster Manager.
Расписание и цены
Форма обучения Академ. часы Ближайшая группа Цена
Частные лица Организации
Дистанционная 40
22.12.2025
180 000 руб. 180 000 руб.
Этот курс набирает желающих участников. Отправьте заявку на участие, а когда наберётся достаточное количество, мы с вами свяжемся.
Заказать обучение
Программа курса

Модуль 1. Приветствие.

 

Модуль 2. Введение в экосистему Hadoop.

·        История возникновения Hadoop.

·        Понятия BigData, Data Lake.

·        История проекта.

·        Основные компоненты и экосистема.

·        Основные проекты Hadoop. HDFS, MR, YARN, Hive, Tez, HBase, Phoenix, Solr, Spark, Zookeeper, Impala, HUE, Kyybi..

·        Дистрибутивы Hadoop.

·        Проект ODPi. Arenadata Hadoop.

·        Проект Ambari. ADCM.

·        Архитектура кластера Hadoop

·        HDFS. YARN.

·        Отказоустойчивость.

 

Модуль 3. Подготовка окружения к установке Hadoop.

·        Планирование кластера.

·        Типы узлов. Профили нагрузки.

·        Аппаратное обеспечение. Примеры кластеров.

·        Настройка параметров окружения.

·        Подготовка к установке.

·        Настройка сети и DNS. Лабораторная работа.

·        Монтирование и настройка файловой системы.

 

Модуль 4. Введение в Arenadata Cluster Manager.

·        Основные понятия и компоненты.

·        Развертывание системы управления.

·        Подготовка и настройка инфраструктуры с использованием бандла.

·        Планирование и первичная конфигурация кластера Hadoop.

·        Установка и настройка мониторинга.

·        Установка кластера Hadoop.

·        Мониторинг.

·        Подходы к конфигурированию сервисов экосистемы Hadoop.

·        Основные конфигурационные файлы и описание.

·        Работа с логами сервисов, поиск и выявление проблем работы с сервисами.

·        Обзор возможностей ADCM. Интерпретация статусов тестов, сервисов в системе управления ADCM.

 

Модуль 5. Пост-настройка кластера Hadoop: HDFS, YARN.

·        Файловая система HDFS.

·        Основные операции в HDFS.

·        Работа с файлами и каталогами. Balancer.

·        Распределенное копирование. HttpFS.

·        Обслуживание и дианостика HDFS: DataNodes, NameNodes, HA. HDFS UI.

·        Политики хранения. Tiering. Erasure Coding. Rack Awareness.

·        Компрессия и форматы файлов.

·        Парадигма Map Reduce.

·        Архитектура YARN, HA-режим. Работа с YARN UI.

·        Scheduler YARN.

 

Модуль 6. Проверка работоспособности кластера.

·        ZooKeeper. Основные понятия и операции. Работа с Zookeeper CLI.

·        HBase. Основные понятия и примеры операций. Установка и конфигурирование (GC, Memstore, Compression, Load balancing, Flush). High Availability. Работа с утилитами HBase (check, repair).

·        Phoenix. Основные операции с данными.

·        Примеры запросов Hive. Основные понятия и примеры операций. Установка и конфигурирование. High Availability HiveServer.

·        Работа с утилитами Hive (schema-tool). Работа с Tez UI.

·        Оптимизация запросов Hive.

·        Impala. Архитектура и конфигурирование.

·        Spark. Основные понятия и операции.

·        Установка и конфигурирование. Работа со Spark UI. Примеры кода.

·        Работа с Livy сервером (REST API).

·        Kyuubi. Архитектура, подключение и примеры операций. Установка и конфигурирование.

·        HUE. Установка, конфигурирование и обзор UI.

 

Итоговое тестирование.

Тесты к курсу

Раздел не найден.