Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Профессия
Формат обучения
Формат обучения
С проверкой домашнего задания
Трудоустройство
Трудоустройство
Содействие
Сертификат
Сертификат
Да

Стоимость курса

120 000 ₽
есть рассрочка
Кому будет полезен этот курс
Системным и сетевым администраторам
Сможете масштабировать инфраструктуру, выбирать из множества разных специфических инструментов, внедрять в продакшн решения коллег
Backend и Fullstack-разработчикам
Сможете вырасти в деньгах и получить интересные задачи. Станете незаменимым сотрудником, погрузитесь в ключевой продукт и его метрики
Новичкам, желающим войти в сферу Data Science
Сможете влиться в новую сферу и приобрести базу, с которой можно постоянно развиваться — в любых компаниях и продуктах

Что вы получите после обучения

Приобретаемые навыки
1
ETL
3
DevOps
5
Google Cloud Platform
6
Data Science
7
Apache
8
Apache Spark
9
MongoDB
11
Hadoop
12
HBase
13
Cassandra
14
Apache Airflow
16
ClickHouse
18
Pentaho BI
19
MLOps
21
Data Lake
Сертификат, ссылками на который можно делиться с другими людьми

Вас будут обучать

Старший разработчик в команде Streaming Data Platform, Райффайзен Банк

Senior Data Engineer, Tabby

Преподаёт «Продвинутые методы работы с данными»

Проекты: DataPlatform для XsollaGeo, Data Models для FindMyKids

IT Cluster Lead, СберЭксперт программы. Преподаёт «Продвинутые методы работы с данными»
Опыт более 10 лет в области BigData: Machine Learning, Data Science, DWH Автор более 30 научных публикаций по мат. моделированию и численным методам, кандидат физико-математических наук

Образовательная организация

«Нетология» — это быстрый способ научиться интернет-продвижению и управлению проектами онлайн. Открытые занятия, онлайн-интенсивы и интерактивные курсы для быстрого обучения.

Нетология – это онлайн-университет по подготовке и дополнительному обучению специалистов в области самых востребованных интернет-профессий. Преподают в этом университете высококлассные специалисты, работающие в таких компаниях как Google, Яндекс, Mail.ru, Альфа-Банк и других крупнейших компаниях. Многие из них являются владельцами собственных успешных онлайн-бизнесов.

Нетология была основана в 2011 году. Сооснователями площадки являются предприниматель Максим Спиридонов, являющийся генеральным директором Нетологии, и его жена Юлия Спиридонова-Микеда, которая, собственно, и придумала концепцию проекта.

О Нетологии писали такие издания, как РБК Daily, Ведомости, Аргументы и Факты, Лайфхакер, Lenta.ru, Slon и многие другие.

Сам Максим Спиридонов ведёт колонку в Forbes, является автором и ведущим аналитической программы «Рунетология», гостями которой являются крупные эксперты в области онлайн-бизнеса. Максим принимал участие в создании и руководил десятками крупнейших веб-проектов, среди которых такие проекты, как подкаст-терминал Pod.fm, журнал «ШколаЖизни.ру», сервис «БобрДобр.ру», сайт социальных закладок Memori.ru, интернет-энциклопедия Calend.ru и форекс-брокер FreshForex. Является автором книги «Кто управляет русским интернетом». В общем, ясно, что человек является крутейшим знатоком своего дела.

Нетология является резидентом Сколково и имеет лицензию государственного образца (№037356 от 06 апреля 2016 г.)

Yandex Cloud — облачная платформа, где каждый может создавать и совершенствовать свои цифровые сервисы, используя инфраструктуру и уникальные технологии Яндекса.Студенты Нетологии получат возможность бесплатно использовать мощности платформы Yandex Cloudв течение всего периода обучения.

Программа курса

SQL и получение данных
• Основы баз данных
• Работа с базами данных
• Основы SQL
• Продвинутый SQL
• Углубление в SQL
• Работа с PostgreSQL
• Работа с MongoDB

Data Warehouse
Научим работать с классическим хранилищем данных.
• Введение в хранилища данных
• Проектирование хранилища данных
• Знакомство с Pentaho
• Pentaho как инструмент ETL
• ETL-pro
• Общие рекомендации по разработки ETL
• Смежные темы
• DWH в облаке

Business Intelligence решения и многомерная модель данных
• BI как сердце аналитики
• Многомерные модели
• Real-time отчётность
• Современные подходы

Python
• Основы Python
• Введение в анализ данных на Python
• Статистика в Python
• Предобработка данных
• Feature Selection

Data Lake & Hadoop
Познакомим с основным инструментом обработки больших данных.
• Основы Hadoop
• HDFS
• MapReduce
• MapReduce 2
• Yarn
• Pig & Hive
• HBase & Cassandra
• Кластер. Управление и администрирование

Продвинутые методы работы с данными
• Apache Spark
• Работа со Spark
• Spark SQL
• Продвинутый Spark
• Airflow
• Работа с Airflow
• Продвинутый Airflow
• Dbt как инструмент ETL

Работа с потоковыми данными
Научим работать с потоковыми данными.
• ClickHouse
• Kafka
• Kafka Streams
• Kafka Streams 2
• Spark Streaming
• Spark Streaming 2

Работа с данными в облаке
• Google Cloud Platform — хранение данных
• Spark в GCP
• Managed ETL в GCP
• Обработка real-time данных в GCP
• Поиск инсайтов в данных при помощи ML
• Другие облачные провайдеры

Введение в DS & ML
• Введение в машинное обучение
• Задача классификации
• Задача кластеризации
• Ансамблевые методы решения задачи классификации
• Feature engineering
• Нейронные сети

MLOps
• Зачем нужен DevOps
• Docker и микросервисная архитектура
• K8S
• Орекстраторы
• CI/CD
• Мониторинг
• Инструменты DevOps для обучения ML-моделей
• Deploy ML-моделей

Дипломный проект
Разработка и документирование ETL-процессов заливки данных в хранилище

Рейтинг курса

4.6
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 13.08.2023 03:16
Дата-инженер с нуля до middle

Дата-инженер с нуля до middle

Оставить отзыв
Поделиться курсом с друзьями