Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Курс
Формат обучения
Формат обучения
Записанные лекции
Трудоустройство
Трудоустройство
Отсутствует
Сертификат
Сертификат
Да

Стоимость курса

3 900 ₽
нет рассрочки

После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.

Важно! Курс находится в процессе наполнения.

Что вы получите после обучения

Приобретаемые навыки
2
AutoML
3
Линейная регрессия
4
Градиентный спуск
5
Линейные модели классификации
6
Многоклассовая классификация
7
Решающее дерево

Вас будут обучать

Data Scientist / Machine Learning Engineer Специалист по машинному обучению в области обработки естественного языка и временных рядов.
Data Scientist / Machine Learning Engineer

Специалист по машинному обучению в области обработки естественного языка и временных рядов.

Академический руководитель магистратуры "Машинное обучение и высоконагруженные системы" Факультета компьютерных наук ВШЭ.

Доцент департамента больших данных и информационного поиска ФКН ВШЭ.

Кандидат физико-математических наук, выпускница школы анализа данных Яндекса (ШАД).

Образовательная организация

Stepik — образовательная платформа и конструктор онлайн-курсов.

Мы разрабатываем алгоритмы адаптивного обучения, сотрудничаем с авторами MOOC, помогаем в проведении олимпиад и программ переподготовки.

Наша цель — сделать образование открытым и удобным.

Stepik — широко известная российская образовательная платформа, основанная в 2013 году. На Stepik зарегистрировано более миллиона пользователей из России и стран СНГ. В настоящее время на Stepik представлены несколько тысяч учебных курсов на самые разные темы.

Платформа Stepik включает в себя конструктор бесплатных занятий и уроков. Создать интерактивный обучающий курс может любой зарегистрированный пользователь. При этом авторы обучающих материалов сохраняют авторские права. Сервис не имеет ограничений по числу обучающихся на курсе.

Stepik имеет обширные возможности по созданию онлайн-курсов, обучающих занятий и уроков с использованием текстов, видео, картинок, тестовых задач, в процессе выполнения которых можно вести обсуждения с остальными обучающимися, а также с преподавателем. Всего в Stepik присутствует 20 типов заданий, проверка которых может осуществляться как в автоматическом, так и в ручном режиме.

Большим преимуществом данной платформы является возможность встраивать созданные материалы на сторонние сайты, например, Moodle и Canvas.

Кроме того, Stepik может использоваться в качестве площадки для проведения разнообразных мероприятий, таких как олимпиады и конкурсы.

Интерфейс платформы полностью русскоязычный, достаточно дружественный и интуитивно понятный. Платформа полностью бесплатна.

За каждый пройденный курс в Stepik обучающийся получает сертификат о прохождении. Получение сертификата также бесплатно.

Программа курса

Организация курса
1. О курсе
2. Инструменты
3. Kaggle
4. Глоссарий
Знакомство с машинным обучением
1. Введение
2. Основные понятия машинного обучения
3. Типы задач в машинном обучении
4. Схема проекта по машинному обучению
5. Оценка обобщающей способности модели
6. Домашнее задание
7. Разведочный анализ данных
Линейные модели регрессии
1. Основы линейной регрессии
2. Регуляризация
3. Практические особенности линейной регрессии
4. Feature engineering
5. Метрики качества регрессии
6. Домашнее задание
Градиентный спуск
1. Градиентный спуск для функции одной переменной
2. Градиентный спуск в общем случае
3. Стохастический градиентный спуск
4. Домашнее задание
Линейные модели классификации - 1
1. Переход от регрессии к классификации
2. Задача оценивания вероятностей, логистическая регрессия
3. Базовые метрики классификации
4. Домашнее задание
Линейные модели классификации - 2
1. Метод опорных векторов
2. Ядровой метод опорных векторов
3. Продвинутые (интегральные) метрики классификации
4. Домашнее задание
Многоклассовая классификация
1. Многоклассовая и multilabel-классификация
2. Метод ближайших соседей
3. Быстрый поиск соседей
4. Домашнее задание
Промежуточное тестирование - 1
1. Тестирование
Решающие деревья и их композиции
1. Решающее дерево
2. Тонкости решающих деревьев
3. Разложение ошибки на смещение и разброс
4. Бэггинг. Случайный лес
5. Бустинг. Градиентный бустинг над решающими деревьями
6. Современные имплементации градиентного бустинга
Обработка признаков и работа с выбросами
1. Работа с пропущенными значениями
2. Поиск аномалий
3. Кодирование категориальных признаков
Пайплайн ML-модели
1. Постановка задачи
2. Разведочный анализ и обработка данных
3. Построение базового решения
4. Поиск наилучшей модели
5. Что дальше?
6. Соревнование
Снижение размерности данных
1. Методы отбора признаков
2. Метод главных компонент
3. Сингулярное разложение
4. Линейный дискриминантный анализ
5. Методы визуализации данных
Кластеризация данных
1. K-means
2. Иерархическая кластеризация
3. DBSCAN, HDBSCAN
4. Метрики качества кластеризации
5. Графовая кластеризация
Промежуточное тестирование - 2
1. Тестирование
Интерпретируемость ML-моделей
1. Калибровка вероятностей
2. SHAP
3. LIME
Рекомендательные системы и ранжирование
1. Коллаборативная фильтрация
2. Матричные разложения
3. Факторизационные машины
4. ML-подход
5. Метрики качества ранжирования и рекомендаций
6. Ранжирование
AutoML
1. Автоматический подбор гиперпараметров: Optuna
2. Фреймворк для AutoML – H2O
3. Обзор других фреймворков (TPOT, auto-sklearn, MLBox)
Прогнозирование временных рядов
1. Особенности работы с временными рядами
2. Статистические методы прогноза временных рядов
3. Адаптивные модели
4. Прогнозирование временных рядов с помощью ML
5. Библиотеки для анализа временных рядов: prophet
Итоговое тестирование
1. Тестирование
Подготовка к собеседованию

Рейтинг курса

4
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 13.12.2023 13:10
Практический Machine Learning

Практический Machine Learning

Оставить отзыв
Поделиться курсом с друзьями