Курсы по Big Data, big data, cassandra, hadoop, BiData SQL, Hive, Impala, EAS, современные подходы к управлению данными, сибинфоцентр, обучение, новосибирск, обучение в новосибирске, курсы, luxsoft
Ваша корзина пуста
Сумма: 0 руб.

Курсы по Big Data, big data, cassandra, hadoop, BiData SQL, Hive, Impala, EAS, современные подходы к управлению данными, сибинфоцентр, обучение, новосибирск, обучение в новосибирске, курсы, luxsoft

О курсе

Современные подходы к управлению данными

Описание:
Этот курс представляет обзор современных способов хранения данных, в том числе хранилищ ключ-значение, документно-ориентированных и графовых систем управления базами данных, систем распределенного хранения и обработки данных на основе MapReduce, аналитических систем на основе многомерных моделей данных, а также методов аналитической обработки больших данных.

Цели:
После завершения обучения слушатели смогут: 
  • понимать, какие характеристики данных и запросов необходимо учитывать на этапе анализа требований и выбора систем управления данными;
  • знать возможности и ограничения современных нереляционных систем управления данными;
  • уметь анализировать требования при выборе систем управления данными;
  • понимать возможности и ограничения статистических методов и методов машинного обучения при аналитической обработке данных.
Целевая аудитория:
Архитекторы, разработчики приложений, аналитики, администраторы баз данных.
Расписание и цены
Этот курс набирает желающих участников. Отправьте заявку на участие, а когда наберётся достаточное количество, мы с вами свяжемся.
Заказать обучение
Программа курса
Разбираемые темы:
  • Классификации источников и потребителей данных, способов хранения и обработки данных.
  • Требования к распределенным системам управления данными. Модели согласованности данных.
  • Ограничения реляционных систем управления базами данных.
  • Модели данных NoSQL: ключ/значение, структуры данных, документно-ориентированная, графовая, колоночная. Memcache, Redis, MongoDB, Neo4j.
  • Распределенные NoSQ-системы. Bigtable®, Dynamo, Cassandra®, Voldemort, PNUTS.
  • Системы MapReduce. Подход Google.
  • Hadoop. Компоненты и инфраструктура Hadoop®. HDFS. Программирование для Hadoop®. Процесс выполнения задач в Hadoop®. Высокоуровневые языки для Hadoop®. Pig. Hive.
  • OLAP и многомерная модель данных. Способы хранения куба ROLAP, MOLAP, HOLAP. Язык запросов к многомерным кубам MDX. Microsoft SQL Server Analysis Services. Pentaho. 
  • Основы статистики для аналитики больших данных. Статистические оценки, тестирование гипотез. 
  • Основы машинного обучения. Регрессия, классификация, кластеризация. Обучение и оценка классификаторов. R, MADLIb, Mahout.