Дата-инженер с нуля до middle

4.6

15 месяцев,

начало 27 июля

Сложность

Начинающий

Тип обучения

Профессия

Формат обучения

С проверкой домашнего задания

Трудоустройство

Содействие

Сертификат

Да

Стоимость курса

120 000 ₽

есть рассрочка

Кому будет полезен этот курс
Системным и сетевым администраторам
Сможете масштабировать инфраструктуру, выбирать из множества разных специфических инструментов, внедрять в продакшн решения коллег
Backend и Fullstack-разработчикам
Сможете вырасти в деньгах и получить интересные задачи. Станете незаменимым сотрудником, погрузитесь в ключевой продукт и его метрики
Новичкам, желающим войти в сферу Data Science
Сможете влиться в новую сферу и приобрести базу, с которой можно постоянно развиваться — в любых компаниях и продуктах

Что вы получите после обучения

Приобретаемые навыки

MLOps

ETL

Pentaho BI

Python

Data Lake

Apache Airflow

Машинное обучение

Apache

Apache Spark

Backend

Cassandra

ClickHouse

Data Science

DevOps

Docker

Fullstack

Google Cloud Platform

Hadoop

HBase

MongoDB

PostgreSQL

Сертификат, ссылками на который можно делиться с другими людьми

Вас будут обучать

Андрей Серебрянский

курса

Старший разработчик в команде Streaming Data Platform, Райффайзен Банк

Максим Золотарёв

курса

Senior Data Engineer, Tabby

Преподаёт «Продвинутые методы работы с данными»

Проекты: DataPlatform для XsollaGeo, Data Models для FindMyKids

Дмитрий Турченков

курса

IT Cluster Lead, СберЭксперт программы. Преподаёт «Продвинутые методы работы с данными»

Опыт более 10 лет в области BigData: Machine Learning, Data Science, DWH Автор более 30 научных публикаций по мат. моделированию и численным методам, кандидат физико-математических наук

Образовательная организация

Нетология

3.9

999 отзывов

«Нетология» — это быстрый способ научиться интернет-продвижению и управлению проектами онлайн. Открытые занятия, онлайн-интенсивы и интерактивные курсы для быстрого обучения.

Нетология – это онлайн-университет по подготовке и дополнительному обучению специалистов в области самых востребованных интернет-профессий. Преподают в этом университете высококлассные специалисты, работающие в таких компаниях как Google, Яндекс, Mail.ru, Альфа-Банк и других крупнейших компаниях. Многие из них являются владельцами собственных успешных онлайн-бизнесов.

Нетология была основана в 2011 году. Сооснователями площадки являются предприниматель Максим Спиридонов, являющийся генеральным директором Нетологии, и его жена Юлия Спиридонова-Микеда, которая, собственно, и придумала концепцию проекта.

О Нетологии писали такие издания, как РБК Daily, Ведомости, Аргументы и Факты, Лайфхакер, Lenta.ru, Slon и многие другие.

Сам Максим Спиридонов ведёт колонку в Forbes, является автором и ведущим аналитической программы «Рунетология», гостями которой являются крупные эксперты в области онлайн-бизнеса. Максим принимал участие в создании и руководил десятками крупнейших веб-проектов, среди которых такие проекты, как подкаст-терминал Pod.fm, журнал «ШколаЖизни.ру», сервис «БобрДобр.ру», сайт социальных закладок Memori.ru, интернет-энциклопедия Calend.ru и форекс-брокер FreshForex. Является автором книги «Кто управляет русским интернетом». В общем, ясно, что человек является крутейшим знатоком своего дела.

Нетология является резидентом Сколково и имеет лицензию государственного образца (№037356 от 06 апреля 2016 г.)

Yandex Cloud

0 отзывов

Yandex Cloud — облачная платформа, где каждый может создавать и совершенствовать свои цифровые сервисы, используя инфраструктуру и уникальные технологии Яндекса.Студенты Нетологии получат возможность бесплатно использовать мощности платформы Yandex Cloudв течение всего периода обучения.

Программа курса

SQL и получение данных
• Основы баз данных
• Работа с базами данных
• Основы SQL
• Продвинутый SQL
• Углубление в SQL
• Работа с PostgreSQL
• Работа с MongoDB

Data Warehouse
Научим работать с классическим хранилищем данных.
• Введение в хранилища данных
• Проектирование хранилища данных
• Знакомство с Pentaho
• Pentaho как инструмент ETL
• ETL-pro
• Общие рекомендации по разработки ETL
• Смежные темы
• DWH в облаке

Business Intelligence решения и многомерная модель данных
• BI как сердце аналитики
• Многомерные модели
• Real-time отчётность
• Современные подходы

Python
• Основы Python
• Введение в анализ данных на Python
• Статистика в Python
• Предобработка данных
• Feature Selection

Data Lake & Hadoop
Познакомим с основным инструментом обработки больших данных.
• Основы Hadoop
• HDFS
• MapReduce
• MapReduce 2
• Yarn
• Pig & Hive
• HBase & Cassandra
• Кластер. Управление и администрирование

Продвинутые методы работы с данными
• Apache Spark
• Работа со Spark
• Spark SQL
• Продвинутый Spark
• Airflow
• Работа с Airflow
• Продвинутый Airflow
• Dbt как инструмент ETL

Работа с потоковыми данными
Научим работать с потоковыми данными.
• ClickHouse
• Kafka
• Kafka Streams
• Kafka Streams 2
• Spark Streaming
• Spark Streaming 2

Работа с данными в облаке
• Google Cloud Platform — хранение данных
• Spark в GCP
• Managed ETL в GCP
• Обработка real-time данных в GCP
• Поиск инсайтов в данных при помощи ML
• Другие облачные провайдеры

Введение в DS & ML
• Введение в машинное обучение
• Задача классификации
• Задача кластеризации
• Ансамблевые методы решения задачи классификации
• Feature engineering
• Нейронные сети

MLOps
• Зачем нужен DevOps
• Docker и микросервисная архитектура
• K8S
• Орекстраторы
• CI/CD
• Мониторинг
• Инструменты DevOps для обучения ML-моделей
• Deploy ML-моделей

Дипломный проект
Разработка и документирование ETL-процессов заливки данных в хранилище