Образовал
Сложность
Сложность
Продвинутый
Тип обучения
Тип обучения
Курс
Формат обучения
Формат обучения
С проверкой домашнего задания
Трудоустройство
Трудоустройство
Содействие
Сертификат
Сертификат
Да

Стоимость курса

32 400 ₽
есть рассрочка
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или модели прогнозирования. Data Engineer - это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.
Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.
Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python. За два месяца вы освоите все важные этапы Data Engineering.

Что вы получите после обучения

Приобретаемые навыки
2
Hadoop
4
Apache Spark
5
Apache Airflow
Сертификат, ссылками на который можно делиться с другими людьми

Образовательная организация

Школа по работе с данными SkillFactory обучение Big Data, Data Science, Machine Learning, Data Engineering и AI
Обучение в школе SkillFactory построено на большом количестве практики. В программах курсов добавлено только, что приведет вас к цели обучения: получить навыки и знания для того, чтобы успешно устраиваться на новую работу, или повышать свои скиллы.
SkillFactory – это онлайн-школа, которая готовит специалистов по работе с данными и IT-продуктами.

Мы предлагаем краткосрочные и годовые курсы для подготовки специалистов с нуля и даем уверенный старт для того, чтобы начать путь в современных IT-профессиях.

Наши программы обучения составлены при участии ведущих специалистов из крупных российских и зарубежных компаний, таких как NVIDIA, Amazon, Яндекс, BON Games, Lamoda.

Направления обучения:
— Data Science
— Machine Learning
— Big Data
— анализ данных с применением Python
— веб-разработка
— геймдизайн
— управление IT-продуктами

По завершении курса вы получаете сертификат, портфолио из реализованных проектов, опыт участия в хакатонах и путевую карту дальнейшего развития

Программа курса

Модуль 1. Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?

Модуль 2. Современные хранилища данных
Разнообразие баз данных и их особенности

Модуль 3. Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться

Модуль 4. Источники данных и работа с ними
Файлы как источники данных, JDBC - структурированные данные, SQL для выгрузки данных

Модуль 5. Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать

Модуль 6. Hadoop как хранилище данных
Особенности и нюансы hdfs

Модуль 7. Apache Airflow для оркестрации конвейеров
Настройка data pipelines

Модуль 8. Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure

Рейтинг курса

4.4
рейтинг
0
0
0
0
0
обновлено 05.10.2022 06:25

Data Engineer

Оставить отзыв
Поделиться курсом с друзьями