Курсы Сибинфоцентра
Ваша корзина пуста
Сумма: 0 руб.

«Эксплуатация Arenadata Hyperwave. Часть 2: Сервисы платформы»

О курсе

«Эксплуатация Arenadata Hyperwave. Часть 2: Сервисы платформы»

  • Номер курса: AD.H
  • Вендор: Arenadata

«Эксплуатация Arenadata Hyperwave» — двухдневный курс для системных администраторов, инженеров по данным и аналитиков, которые хотят получить расширенные знания по сервисам экосистемы Hadoop и научиться работать с компонентами обработки и анализа данных.


В его рамках участники получат теоретические знания и практический опыт по:

- принципам работы, архитектуре и настройкам HBase, Hive, Impala, Spark, Phoenix, Kyuubi, Trino и HUE;

- форматам таблиц Iceberg;

- работе со снепшотами и механизмами Time Travel;

- принципам транзакционной согласованности и оптимизации запросов;

- интеграции сервисов в едином кластере ArenadataHyperwave.


Аудитория курса


Курс актуален:


- системным администраторам и инженерам, уже знакомым с основами Hadoop (прошедшим курс «Эксплуатация Arenadata Hyperwave ч1 Базовые компоненты»);

- специалистам по обработке данных, аналитикам и разработчикам, которые хотят освоить экосистему инструментов анализа и хранения больших данных;

- архитекторам и инженерам, разрабатывающим комплексные решения на платформе Arenadata Hyperwave.


Для успешного освоения курса рекомендуется, чтобы слушатель:


- прошел курс Эксплуатация Arenadata Hyperwave. Часть 1: Базовые компоненты (либо имел знания в сопоставимом объеме);

- имел базовые знания Linux (работа с консолью, файловой системой, пользователями, сетевыми настройками);

- понимал основные принципы сетевых взаимодействий (IP-адресация, DNS, SSH, порты);

- обладал начальными знаниями об архитектуре распределённых систем и принципах хранения данных;

- умел читать и редактировать конфигурационные файлы (YAML, XML, INI);

- имел представление о Big Data-концепциях — что такое Data Lake, Data Warehouse, партиционирование данных, отказоустойчивость;

- имел базовые знания SQL (SELECT, JOIN, фильтрация, агрегирование);

- имел представление о Python на уровне чтения и написания простых скриптов (работа с файлами, логами, API, обработка данных);

- желательно (но не обязательно) имел опыт работы с системами мониторинга (Prometheus, Grafana) или управления кластерами (Ambari, ADCM).

Расписание и цены
Форма обучения Академ. часы Ближайшая группа Цена
Частные лица Организации
Дистанционная 16
16.02.2026
выбрать другую дату
80 520 руб. 80 520 руб.
Этот курс набирает желающих участников. Отправьте заявку на участие, а когда наберётся достаточное количество, мы с вами свяжемся.
Заказать обучение
Программа курса

Модуль 1. HBase

  • Основные понятия и примеры операций.
  • Установка и конфигурирование (GC, Memstore, Compression, Load balancing, Flush).
  • High Availability.
  • Работа с утилитами HBase (check, repair).

Модуль 2. Phoenix

  • Основные операции с данными.

 Модуль 3. Hive

  • Примеры запросов Hive.
  • Основные понятия и примеры операций.
  • Установка и конфигурирование.
  • High Availability HiveServer.
  • Работа с утилитами Hive (schema-tool).
  • Работа с Tez UI.
  • Оптимизация запросов Hive.
  • Лабораторная работа.

 Модуль 4. Impala

  • Архитектура и конфигурирование.

 Модуль 5. Spark

  • Основные понятия и операции.
  • Установка и конфигурирование.
  • Работа со Spark UI.
  • Примеры кода.

 Модуль 6. Работа с Livy сервером (REST API)

 Модуль 7.  Kyuubi

  • Архитектура, подключение и примеры операций.
  • Установка и конфигурирование.

 Модуль 8.  HUE

  • Установка, конфигурирование и обзор UI.

 Модуль 9. Iceberg

  • Основные возможности.
  • Архитектура таблиц Iceberg.
  • Обслуживание таблиц Iceberg.
  • Лабораторная работа.

 Модуль 10. Trino

  • Архитектура.
  • Установка и конфигурирование.
  • Конфигурационные файлы.
  • Коннекторы.
  • Лабораторная работа.

 Модуль 11. Интеграция Ozone с сервисами кластера

 Модуль 12. Взаимодействие сервисов Arenadata Hyperwave на ETL-стенде, демонстрация нагрузки

 Итоговое тестирование

Тесты к курсу

Раздел не найден.