Курсы Сибинфоцентра
Ваша корзина пуста
Сумма: 0 руб.

Современные подходы к управлению данными

О курсе

Современные подходы к управлению данными

  • Оригинальное название: Product management
  • Номер курса: УД
  • Вендор:
  • Профессия: Менеджер
Описание:
Этот курс представляет обзор современных способов хранения данных, в том числе хранилищ ключ-значение, документно-ориентированных и графовых систем управления базами данных, систем распределенного хранения и обработки данных на основе MapReduce, аналитических систем на основе многомерных моделей данных, а также методов аналитической обработки больших данных.

Цели:
После завершения обучения слушатели смогут:
понимать, какие характеристики данных и запросов необходимо учитывать на этапе анализа требований и выбора систем управления данными;
знать возможности и ограничения современных нереляционных систем управления данными;
уметь анализировать требования при выборе систем управления данными;
понимать возможности и ограничения статистических методов и методов машинного обучения при аналитической обработке данных.
Расписание и цены
Этот курс набирает желающих участников. Отправьте заявку на участие, а когда наберётся достаточное количество, мы с вами свяжемся.
Заказать обучение
Программа курса
  • Классификации источников и потребителей данных, способов хранения и обработки данных. 
  • Требования к распределенным системам управления данными. Модели согласованности данных. 
  • Ограничения реляционных систем управления базами данных. 
  • Модели данных NoSQL: ключ/значение, структуры данных, документно-ориентированная, графовая, колоночная. Memcache, Redis, MongoDB, Neo4j. 
  • Распределенные NoSQ-системы. Bigtable®, Dynamo, Cassandra®, Voldemort, PNUTS. 
  • Системы MapReduce. Подход Google. 
  • Hadoop. Компоненты и инфраструктура Hadoop®. HDFS. Программирование для Hadoop®. Процесс выполнения задач в Hadoop®. Высокоуровневые языки для Hadoop®. Pig. Hive. 
  • OLAP и многомерная модель данных. Способы хранения куба ROLAP, MOLAP, HOLAP. Язык запросов к многомерным кубам MDX. Microsoft SQL Server Analysis Services. Pentaho. 
  • Основы статистики для аналитики больших данных. Статистические оценки, тестирование гипотез. 
  • Основы машинного обучения. Регрессия, классификация, кластеризация. Обучение и оценка классификаторов. R, MADLIb, Mahout.
Преподаватели
Преподаватель Алексей Шангин