Сложность
Сложность
Продвинутый
Тип обучения
Тип обучения
Профессия
Формат обучения
Формат обучения
С проверкой домашнего задания
Трудоустройство
Трудоустройство
Содействие
Сертификат
Сертификат
Да

Стоимость курса

66 300 ₽
есть рассрочка
Что это за курс:
Это курс о методах и инструментах, которые обеспечивают быструю, надежную и возобновляемую доставку данных, готовых к аналитике и эксплуатации моделей data science. DataOps-инженер — тот специалист, который может развернуть и конфигурировать все эти инструменты там, где остро встает вопрос масштабирования и гибкости.
Курс предназначен для тех, кто уже знает, как строятся базы данных и работает ETL-процесс, кто уже прошел путь первичных построений и нуждается в расширенных методах обработки потоковых данных и хранения огромных массивов.

Что вы получите после обучения

Приобретаемые навыки
1
ETL
3
DevOps
4
Google Cloud Platform
5
Apache
6
Apache Spark
8
Hadoop
9
HBase
10
Cassandra
11
Apache Airflow
12
ClickHouse
Сертификат, ссылками на который можно делиться с другими людьми

Вас будут обучать

Старший разработчик в команде Streaming Data Platform, Райффайзен Банк

Senior Data Engineer, Tabby

Преподаёт «Продвинутые методы работы с данными»

Проекты: DataPlatform для XsollaGeo, Data Models для FindMyKids

IT Cluster Lead, СберЭксперт программы. Преподаёт «Продвинутые методы работы с данными»
Опыт более 10 лет в области BigData: Machine Learning, Data Science, DWH Автор более 30 научных публикаций по мат. моделированию и численным методам, кандидат физико-математических наук

Образовательная организация

«Нетология» — это быстрый способ научиться интернет-продвижению и управлению проектами онлайн. Открытые занятия, онлайн-интенсивы и интерактивные курсы для быстрого обучения.

Нетология – это онлайн-университет по подготовке и дополнительному обучению специалистов в области самых востребованных интернет-профессий. Преподают в этом университете высококлассные специалисты, работающие в таких компаниях как Google, Яндекс, Mail.ru, Альфа-Банк и других крупнейших компаниях. Многие из них являются владельцами собственных успешных онлайн-бизнесов.

Нетология была основана в 2011 году. Сооснователями площадки являются предприниматель Максим Спиридонов, являющийся генеральным директором Нетологии, и его жена Юлия Спиридонова-Микеда, которая, собственно, и придумала концепцию проекта.

О Нетологии писали такие издания, как РБК Daily, Ведомости, Аргументы и Факты, Лайфхакер, Lenta.ru, Slon и многие другие.

Сам Максим Спиридонов ведёт колонку в Forbes, является автором и ведущим аналитической программы «Рунетология», гостями которой являются крупные эксперты в области онлайн-бизнеса. Максим принимал участие в создании и руководил десятками крупнейших веб-проектов, среди которых такие проекты, как подкаст-терминал Pod.fm, журнал «ШколаЖизни.ру», сервис «БобрДобр.ру», сайт социальных закладок Memori.ru, интернет-энциклопедия Calend.ru и форекс-брокер FreshForex. Является автором книги «Кто управляет русским интернетом». В общем, ясно, что человек является крутейшим знатоком своего дела.

Нетология является резидентом Сколково и имеет лицензию государственного образца (№037356 от 06 апреля 2016 г.)

Программа курса

Python
• Основы Python
• Введение в анализ данных на Python
• Статистика в Python
• Предобработка данных
• Feature Selection

Data Lake & Hadoop
Познакомим с основным инструментом обработки больших данных.
• Основы Hadoop
• HDFS
• MapReduce
• MapReduce 2
• Yarn
• Pig & Hive
• HBase & Cassandra
• Кластер. Управление и администрирование

Продвинутые методы работы с данными
• Apache Spark
• Работа со Spark
• Spark SQL
• Продвинутый Spark
• Airflow
• Работа с Airflow
• Продвинутый Airflow
• Dbt как инструмент ETL

Работа с потоковыми данными
Научим работать с потоковыми данными.
• ClickHouse
• Kafka
• Kafka Streams
• Kafka Streams 2
• Spark Streaming
• Spark Streaming 2

Работа с данными в облаке
• Google Cloud Platform — хранение данных
• Spark в GCP
• Managed ETL в GCP
• Обработка real-time данных в GCP
• Поиск инсайтов в данных при помощи ML
• Другие облачные провайдеры

Введение в DS & ML
• Введение в машинное обучение
• Задача классификации
• Задача кластеризации
• Ансамблевые методы решения задачи классификации
• Feature engineering

MLOps
• Зачем нужен DevOps
• Docker и микросервисная архитектура
• K8S
• Оркестраторы
• CI/CD
• Мониторинг
• Инструменты DevOps для обучения ML-моделей
• Deploy ML-моделей
• Название занятия

Дипломный проект
Разработка и документирование ETL-процессов заливки данных в хранилище

Рейтинг курса

4.6
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 24.03.2023 03:28
DataOps-инженер

DataOps-инженер

Оставить отзыв
Поделиться курсом с друзьями