Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Курс
Формат обучения
Формат обучения
С проверкой домашнего задания
Трудоустройство
Трудоустройство
Гарантия
Сертификат
Сертификат
Да

Стоимость курса

129 600 ₽
есть рассрочка
  • Трудоустроим в процессе обучения или вернем деньги
  • Создатели и спикеры курса - эксперты из Amazon, Yandex и Skyeng
  • Длительность: 10 мес. (есть возможность интенсивного обучения)
  • Уровень: с нуля
  • Выбор специализации
  • Стажировки в компаниях-партнерах

Чему вы научитесь

  • Использовать Python для анализа данных
    Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных

  • Работать с SQL
    Научитесь писать запросы, работать с базами данных, извлекать и обрабатывать информацию

  • Строить модели машинного обучения
    Подготавливать данные и быстро строить на них ML-модели. Проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных

  • Использовать сложную математику для Data Science
    Освоите математические функции для работы с моделями данных, машинным обучением и нейронными сетями

 

Как проходит обучение

  1. Изучение темы
    Изучаете тему с помощью видеоуроков, которые доступны на обучающей платформе

  2. Выполнение ДЗ
    Выполняете домашнее задание в том темпе, в котором Вам удобно это сделать

  3. Наставничество
    Общаетесь с наставником, закрепляете знания и исправляете ошибки

  4. Защита проекта
    Защищаете проект и дополняете им свое портфолио

 

Что вы получите после обучения

Приобретаемые навыки
1
Big Data
2
CI/CD
4
Keras
5
MapReduce
9
Data Science
10
Hadoop
12
GitLab
13
NLP
16
Моделирование
19
Метрики
21
Прогнозирование
22
Линейная регрессия
23
Жизненный цикл ПО
24
Деревья
25
Бинарная классификация
26
GIt
27
Программирование на R
28
Бейзлайны
29
Скоринг
30
Metric learning
31
Data Warehouse
Сертификат, ссылками на который можно делиться с другими людьми

Вас будут обучать

Консультант по Data Science
 

Руководитель направления по исследованию данных, Сбер

Data Scientist, Сбер

Образовательная организация

ProductStar — онлайн-университет с экспертизой в продуктовом менеджменте, аналитике, маркетинге и программировании: более 10 лет обучаем IT-профессиям. Компания ProductStar выросла из ProductCamp - это международная крупнейшая конференция по продакт менеджменту. Мы сотрудничаем с Google developers group и являемся организатором крупной конференции в мире разработки - Devscamp. Среди наших спикеров специалисты из Google, Amazon, Epam, Booking, Яндекса, Сбера. Обучение построено на прикладных кейсах российских и международных компаний. Также есть собственный карьерный центр, который помогает в трудоустройстве студентов как в российские, так и в зарубежные компании. 

Честные обещания по трудоустройству и качеству курсов:

— Мы уверены в качестве программы, наших спикеров и партнёрств карьерного центра
— Мы полностью вернём деньги, если у вас не получится найти работу, в рамках изучения профессии
— Собственный карьерный центр с базой стажировок: более 80% наших студентов устраиваются на работу в процессе обучения
— Средний срок трудоустройства студентов – 2,5 месяца
—  В течение первых 20 дней действует гарантия полного возврата.  Это как раз то время, чтобы понять, хотите ли вы развиваться в данной профессии

Корпоративное обучение:
— 30% студентов учатся за счёт компании
— Соберём программу обучения под задачи вашей компании.
— Бесплатно поможем с наймом студентов наших курсов

 

Программа курса

Ступень 1. "База BigData-инструментария"

Практика на кейсах реальных компаний, помощь со стажировкой и первыми собеседованиями.

Блок 1: "Python для анализа данных"

  • Введение в Python
  • Переменные и типы данных.
  • Строки. Условия и циклы
  • Списки и словари в Python
  • Функции
  • Библиотеки
  • Структуры данных в Python
  • Пакеты и модули
  • Ошибки и исключения

Блок 2. Технические нюансы и работа с Git

  • Системы контроля версий
  • Git & GitHub
  • Git, основные понятия. Знакомство с GitLab
  • Введение в GitLab CI
  • Linux: введение и основные концепты ОС

Блок 3. Подгрузка данных

  • Введение в блок SQL
  • Извлечение и фильтрация данных (часть 1)
  • Извлечение и фильтрация данных (часть 2)
  • Преобразование и сортировка данных (часть 1)
  • Преобразование и сортировка данных (часть 2)
  • Группировка данных
  • Введение в базы данных
  • Объединение таблиц
  • Подзапросы SELECT и FROM
  • Подзапросы JOIN и WHERE
  • Обновление, добавление и удаление данных
  • Создание, изменение и удаление таблиц
  • Операции с текстом и оконные функции
  • Ускорение и оптимизация запросов, табличные выражения
  • Итоговый проект LEGO
  • Обзор программ и настройка дашборова
  • Веб-скрейпинг

Блок 4. Математика, статистика и теория вероятности для Data Science

  • Множества и функции. Предел, непрерывность и производная
  • Введение в статистику
  • Статистические критерии
  • Дисперсионный анализ
  • Корреляционный анализ
  • Регрессионный анализ
  • Факторный анализ
  • Основы линейной алгебры и теории множеств
  • Методы математической оптимизации
  • Введение в теорию вероятности и случайные событий
  • Функция распределение вероятностей
  • Основные типы распределений
  • Условная вероятность и теорема Баеса
  • Проверка гипотез
  • Центральная предельная теорема и бутстреппинг
  • Метод максимального правдоподобия

 

Ступень 2: "Алгоритмы Machine Learning"

Блок 5: "Классические модели Machine Learning"

  • Знакомство с машинным обучением
  • Линейная регрессия
  • Бинарная классификация
  • Валидация. Почему это важно
  • Решающие деревья
  • Бутстрап, Бэггинг и случайный лес
  • Feature Engineering, Feature Selection
  • Градиентный бустинг
  • A/B тестирование
  • Обучение без учителя

Блок 6: "Построение рекомендательных систем"

  • Введение в рекомендательные системы
  • Метрики и бейзлайны
  • Матричное разложение
  • Рекомендации через поиск ближайших соседей
  • Гибридные рекомендательные системы

Блок 7: "Построение прогнозных моделей"

  • Прогнозные модели: построение и описание
  • Воркшоп: предсказание оттока клиентов и прогноз продаж

Блок 8: "Построение моделей для скоринга"

  • Введение в скоринг. Моделирование и анализ
  • Воркшоп: скоринг кредитного портфеля

Блок 9: "Создание BigData-продуктов"

  • Определение бизнесовых точек роста компании, в которых может помочь ML
  • AI-продукты и машинное обучениеЧек-лист внедрения ML-задач в компании и команде
  • Лучшие практики работы с BigData/ML-командой
  • Работа с датасетами и моделями. Выбор фичей
  • Workshop: создание и запуск датасета
  • Валидация бизнес-результатов запуска AI/ML функциональности
  • Извлечение данных и операторы
  • Фильтрация данных и условия

Блок 10: "Подготовка портфолио и участие в соревнования на Kaggle"

  • Финализируем проекты для портфолио, оформляем их и участвуем в конкурсах на Kaggle

 

Ступень 3: "Специализация и погружение в прикладные задачи"

Блок 11: "Специализация: AI & Deep Learning Engineer (нейронные сети)"

  • Введение в AI & Deep Learning Engineer (нейронные сети)
  • Обучение нейросетей
  • Основы Data Engineering
  • Экономическая оценка эффектов и разработка MVP
  • AI, Deep Learning в бизнесе
  • Продвинутые hard skills для погружения в специализацию

Блок 12: "Специализация: NLP-разработчик (построение DataScience-систем анализа текста и голоса)"

  • Введение в нейронные сети
  • Обучение нейросетей
  • Глубокое обучение на практике
  • Дополнительные возможности Tensorflow + Keras
  • Свёрточные нейронные сети
  • Введение в NLP, понятие ембеддинга
  • Рекурентные нейронные сети
  • Нейросети с вниманием, трансформеры
  • Metric learning, обучение без учителя
  • Обучение с подкреплением в нейросетях

Блок 13: "Специализация: Cloud Data Engineer (Linux, Hadoop, AWS, работа "в облаке")"

  • Методологии анализа больших данных и организации команды. CRISP-DM
  • Культура сбора и источники данных.
  • Улучшение качества работы с данными
  • Современные инструменты визуализации данных
  • Машинные методы для обработки данных на распределенном окружении
  • Основы работы в Hadoop и MapReduce
  • Основы архитектуры хранения и обработки больших данных, виды обработки и масштабирования
  • Data Lake, Data Warehouse и прочее
  • Работа с облачными платформами: AWS, GCP, Azure и другие
  • Объектные хранилища на примере AWS S3
  • Работа с AirflowРабота в pyspark
  • Машинное обучение в PySpark

Рейтинг курса

4.4
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 22.03.2024 15:50
Профессия: Data-Scientist

Профессия: Data-Scientist

Оставить отзыв
Поделиться курсом с друзьями