MLOps

MLOps

4.6

5 месяцев,

начало 01 августа

Сложность

Продвинутый

Тип обучения

Курс

Формат обучения

С проверкой домашнего задания

Трудоустройство

Содействие

Сертификат

Да

Стоимость курса

80 000 ₽

есть рассрочка

Вы освоите все необходимые навыки машинного обучения для потоковых данных и распределенной среды. В программу включены необходимые знания из областей Data Science и Data Engineering, которые позволят вам обрабатывать большие данные и писать распределенные алгоритмы на Spark.
Каждый модуль вы будете закреплять на практике, выполняя домашнее задание. В конце обучения вас ждет финальный проект, который позволит обобщить все полученные знания и пополнить портфолио. Он может быть выполнен в рамках рабочих задач на вашем датасете или быть учебным проектом, основанным на данных, предоставляемых OTUS.

Для кого этот курс?
Для специалистов по Машинному обучению или Software инженеров, которые хотят научиться работать с большими данными. Обычно такие задачи имеются в крупных IT-компаниях с масштабным цифровым продуктом.
Для Data Scientist, которые хотят усилить свой скиллсет инженерными навыками. Благодаря курсу вы будете уметь обрабатывать данные и самостоятельно выводить результаты ML-решений в продакшн.
Для обучения вам понадобятся базовые навыки работы с данными. Предлагаем посмотреть Карту курсов направления Data Science в OTUS, чтобы сориентироваться в необходимом уровне подготовки.

Вы научитесь:
- Использовать стандартные инструменты ML-конвейеров в распределенной среде;
- Разрабатывать собственные блоки для ML-конвейеров;
- Адаптировать ML-алгоритмы к распределенной среде и инструментам big data;
- Использовать Spark, SparkML, Spark Streaming;
- Разрабатывать алгоритмы потоковой подготовки данных для машинного обучения;
- Обеспечивать контроль качества на всех этапах движения ML-решений в промышленную эксплуатацию.

Востребованность специалистов
Навыки, которые вы освоите, максимально прикладные и перспективные. На рынке появляется все больше цифровых продуктов, для развития которых необходима работа с большими данными и потоковую обработку. Уже сейчас специалисты с таким пулом навыков и некоторым опытом работы могут претендовать на зарплату от 270 тыс. рублей. Другой тренд — автоматизация процессов обучения и валидации, напротив, в некотором роде обесценивает работу классического Data Scientist. Все движется к тому, что даже неспециалист сможет сделать fit-predict. Поэтому уже сейчас в цене те, кто имеют хотя бы поверхностные инженерные навыки.

Особенности курса
Много практики работы с данными
Широкий спектр навыков от распределенного ML и потоковой обработки данных до вывода в продакшн
Актуальные инструменты и технологии: Scala, Spark, Python, Docker
Живое общение с экспертами на вебинарах и в чате Slack

Что вы получите после обучения

Приобретаемые навыки

Kubernetes

Docker

MLOps

CI/CD

HDFS

DVC

Apache Airflow

Apache Kafka

MLFlow

AutoML

A/B-тестирование

Security and K8s

Prometheus

Apache Spark

Сертификат, ссылками на который можно делиться с другими людьми

Вас будут обучать

Николай Степанов

курс

В роли Data Science специалиста решал задачи, направленные на персонализацию предложений для абонентов Мегафона в различных каналах коммуникации. Работал с большими объемами данных, используя Hadoop стек. Тесно взаимодействовал с бизнес-заказчиком при составлении требований к сервису. Самостоятельно ставил ML модели в production при помощи CI/CD, Docker, Airflow и MLFlow. Руководил небольшой командой ML инженеров, где мы совместно развивали внутреннюю MLOps платформу компании, которая включает большое число различных сервисов.Интересы: MLOps, Developing, улучшение процессов внутри ML команд;Образование: МИЭМ НИУ ВШЭ, Инфокоммуникационные технологии и системы связи. Преподаватель

Павел Филонов

курса

Занимается развитием Data Science команды, которая предоставляет для продуктов и сервисов компании функционал на основе машинного обучения.В роли Data Scientist участвовал в разработке Kaspersky MLAD и MDR AI Analyst. В роли разработчика C++ участвовал в создании MaxPatrol SIEM.В течение многих лет преподает computer science дисциплины в МГТУ ГА.Автор серии докладов про ML, С++, управление DS проектами и развитии команды. Член ПК конференции C++ Russia. Руководитель программы

Данила Слепов

курс

Проектирует AI-системы, разрабатывает архитектуру MLOps платформ, помогает создавать инструменты и налаживать процессы для Data Scientist-ов и аналитиков.С 2002 года выводил на рынок и развивал IT/Telecom решения в международных компаниях: IPG-Photonics (ИРЭ-Полюс), Ciena, Т-Платформы, Netcracker, Huawei, Glowbyte. Опыт дизайна и разработки новых продуктов, технической поддержки продаж, управления сложными IT-проектами в крупных компаниях и стартапах. Консультировал финансовые организации, страховые компании, ритейл по вопросам методологии разработки и внедрения продуктов на базе моделей машинного обучения. MLE-консультант InterXФизтех с красным дипломомОбладатель сертификатов ITIL и Certified Integrator Secure Cloud Services Преподаватель

Образовательная организация

Otus

4.2

286 отзывов

Otus.ru - высокотехнологический стартап в области образования. Наша миссия - делать образование осмысленным, реализуя связь между работодателями, специалистами и преподавателями. Приходите к нам учиться!

OTUS сегодня – это более 80 авторских курсов для IT-специалистов из разных направлений таких как программирование, тестирование, инфраструктура, информационная безопасность, управление и Data Science. И что важно, у нас есть программы для разных уровней подготовки от новичков до профессионалов, которые хотят освоить продвинутые навыки.
Наша миссия — делать обучение осмысленным, реализуя взаимосвязь между ожиданиями работодателей, компетенциями специалистов и возможностями преподавателей.

Программа курса

Базовые вводные для старта курса
-Тема 1.Градиентный спуск и линейные модели
-Тема 2.Обзор основных методов и метрик машинного обучения
-Тема 3.Эволюция подходов работы с данными
-Тема 4.Основы программирования на Scala

Технологические основы распределенной обработки данных
-Тема 5.Распределенные файловые системы
-Тема 6.Менеджеры ресурсов в распределенных системах
-Тема 7.Эволюция фреймворков массивно-параллельного и распределенного вычисления
-Тема 8.Основы Apache Spark 1
-Тема 9.Основы Apache Spark 2

Основы распределенного МL
-Тема 10.Перенос МЛ-алгоритмов в распределенную среду
-Тема 11.ML в Apache Spark
-Тема 12.Разработка собственных блоков для SparkML
-Тема 13.Оптимизация гиперпараметров и AutoML

Потоковая обработка данных
-Тема 14.Потоковая обработка данных
-Тема 15.Сторонние библиотеки для использования со Spark
-Тема 16.Spark Streaming
-Тема 17.Структурный и непрерывный стриминг в Spark
-Тема 18.Альтернативные потоковые фреймворки

Целеполагание и анализ результатов
-Тема 19.Определение цели МЛ-проекта и предварительный анализ
-Тема 20.Долгосрочные ML-цели на примере задачи уменьшения оттока
-Тема 21.А/Б тестирование
-Тема 22.Дополнительные темы

Вывод результатов ML в продакшн
-Тема 23.Подходы к выводу ML-решений в продакшн
-Тема 24.Версионирование, воспроизводимость и мониторинг
-Тема 25.Онлайн-сервинг моделей
-Тема 26.Паттерны асинхронного потокового ML и ETL
-Тема 27.Если надо Python

ML на Python в продакшне
-Тема 28.Production Code на Python. Организация и Packaging кода
-Тема 29.REST-архитектура: Flask API
-Тема 30.Docker: Структура, применение, деплой
-Тема 31.Kubernetes, контейнерная оркестрация
-Тема 32.MLOPS инструменты для Kubernetes: KubeFlow, Seldon Core. Особенности эксплуатации гетерогенных систем в проме.
-Тема 33.Amazon Sagemaker
-Тема 34.AWS ML Service

Продвинутые топики
-Тема 35.Нейросети
-Тема 36.Распределенное обучение и инференс нейросетей
-Тема 37.Градиентный бустинг на деревьях
-Тема 38.Обучение с подкреплением

Проектная работа
-Тема 39.Выбор темы и организация проектной работы
-Тема 40.Консультация по проектам и домашним заданиям
-Тема 41.Защита проектных работ