Курсы по Big Data, big data, cassandra, hadoop, BiData SQL, Hive, Impala, EAS, современные подходы к управлению данными, сибинфоцентр, обучение, новосибирск, обучение в новосибирске, курсы, luxsoft
Этот курс представляет обзор современных способов хранения данных, в том числе хранилищ ключ-значение, документно-ориентированных и графовых систем управления базами данных, систем распределенного хранения и обработки данных на основе MapReduce, аналитических систем на основе многомерных моделей данных, а также методов аналитической обработки больших данных.
Цели:
После завершения обучения слушатели смогут:
понимать, какие характеристики данных и запросов необходимо учитывать на этапе анализа требований и выбора систем управления данными;
знать возможности и ограничения современных нереляционных систем управления данными;
уметь анализировать требования при выборе систем управления данными;
понимать возможности и ограничения статистических методов и методов машинного обучения при аналитической обработке данных.
Целевая аудитория:
Архитекторы, разработчики приложений, аналитики, администраторы баз данных.
Hadoop. Компоненты и инфраструктура Hadoop®. HDFS. Программирование для Hadoop®. Процесс выполнения задач в Hadoop®. Высокоуровневые языки для Hadoop®. Pig. Hive.
OLAP и многомерная модель данных. Способы хранения куба ROLAP, MOLAP, HOLAP. Язык запросов к многомерным кубам MDX. Microsoft SQL Server Analysis Services. Pentaho.
Основы статистики для аналитики больших данных. Статистические оценки, тестирование гипотез.
Основы машинного обучения. Регрессия, классификация, кластеризация. Обучение и оценка классификаторов. R, MADLIb, Mahout.
Заказ добавлен в корзину
Вы можете продолжить выбор курсов или перейти в Корзину