Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Курс
Формат обучения
Формат обучения
Записанные лекции
Трудоустройство
Трудоустройство
Отсутствует
Сертификат
Сертификат
Да

Стоимость курса

3 900 ₽
нет рассрочки

После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.

Важно! Курс находится в процессе наполнения.

Что вы получите после обучения

Приобретаемые навыки
2
Линейная регрессия
3
Градиентный спуск
4
Линейные модели классификации
5
Многоклассовая классификация
6
Решающее дерево
7
AutoML

Вас будут обучать

Data Scientist / Machine Learning Engineer Специалист по машинному обучению в области обработки естественного языка и временных рядов.
Data Scientist / Machine Learning Engineer

Специалист по машинному обучению в области обработки естественного языка и временных рядов.

Академический руководитель магистратуры "Машинное обучение и высоконагруженные системы" Факультета компьютерных наук ВШЭ.

Доцент департамента больших данных и информационного поиска ФКН ВШЭ.

Кандидат физико-математических наук, выпускница школы анализа данных Яндекса (ШАД).

Образовательная организация

Stepik — образовательная платформа и конструктор
онлайн-курсов. Мы разрабатываем алгоритмы адаптивного обучения, сотрудничаем с авторами MOOC, помогаем
в проведении олимпиад и программ переподготовки.
Наша цель — сделать образование открытым и удобным.

Помогаем учиться, а также создавать свои курсы и обучать


Первые учебные материалы были размещены на платформе в 2013 году. Сегодня среди охваченных курсами тем: программирование, информатика, математика, статистика
и анализ данных, биология и биоинформатика, инженерно-технические и естественные науки. Онлайн-курсы, размещенные на Stepik, неоднократно становились призерами конкурсов онлайн-курсов, а система автоматизированной проверки задач используется в ряде курсов на платформах Coursera и edX. Также Stepik активно развивает направление адаптивного обучения, где каждый сможет изучать материал, подобранный индивидуально под свой уровень знаний.

 

Stepik является также площадкой для проведения конкурсов и олимпиад — среди мероприятий — отборочный этап Олимпиады НТИ, онлайн-этап акции Тотальный диктант, международная олимпиада по биоинформатике.

 

Stepik — многофункциональная и гибкая платформа для создания образовательных материалов. Вы можете создавать онлайн курсы, интерактивные уроки с видео и различными типами заданий для учащихся, приватные курсы для ограниченной аудитории, проводить олимпиады и конкурсы, запускать программы профессиональной переподготовки и повышения квалификации, а также обучать своих сотрудников и клиентов.

Программа курса

Организация курса
1. О курсе
2. Инструменты
3. Kaggle
4. Глоссарий
Знакомство с машинным обучением
1. Введение
2. Основные понятия машинного обучения
3. Типы задач в машинном обучении
4. Схема проекта по машинному обучению
5. Оценка обобщающей способности модели
6. Домашнее задание
7. Разведочный анализ данных
Линейные модели регрессии
1. Основы линейной регрессии
2. Регуляризация
3. Практические особенности линейной регрессии
4. Feature engineering
5. Метрики качества регрессии
6. Домашнее задание
Градиентный спуск
1. Градиентный спуск для функции одной переменной
2. Градиентный спуск в общем случае
3. Стохастический градиентный спуск
4. Домашнее задание
Линейные модели классификации - 1
1. Переход от регрессии к классификации
2. Задача оценивания вероятностей, логистическая регрессия
3. Базовые метрики классификации
4. Домашнее задание
Линейные модели классификации - 2
1. Метод опорных векторов
2. Ядровой метод опорных векторов
3. Продвинутые (интегральные) метрики классификации
4. Домашнее задание
Многоклассовая классификация
1. Многоклассовая и multilabel-классификация
2. Метод ближайших соседей
3. Быстрый поиск соседей
4. Домашнее задание
Промежуточное тестирование - 1
1. Тестирование
Решающие деревья и их композиции
1. Решающее дерево
2. Тонкости решающих деревьев
3. Разложение ошибки на смещение и разброс
4. Бэггинг. Случайный лес
5. Бустинг. Градиентный бустинг над решающими деревьями
6. Современные имплементации градиентного бустинга
Обработка признаков и работа с выбросами
1. Работа с пропущенными значениями
2. Поиск аномалий
3. Кодирование категориальных признаков
Пайплайн ML-модели
1. Постановка задачи
2. Разведочный анализ и обработка данных
3. Построение базового решения
4. Поиск наилучшей модели
5. Что дальше?
6. Соревнование
Снижение размерности данных
1. Методы отбора признаков
2. Метод главных компонент
3. Сингулярное разложение
4. Линейный дискриминантный анализ
5. Методы визуализации данных
Кластеризация данных
1. K-means
2. Иерархическая кластеризация
3. DBSCAN, HDBSCAN
4. Метрики качества кластеризации
5. Графовая кластеризация
Промежуточное тестирование - 2
1. Тестирование
Интерпретируемость ML-моделей
1. Калибровка вероятностей
2. SHAP
3. LIME
Рекомендательные системы и ранжирование
1. Коллаборативная фильтрация
2. Матричные разложения
3. Факторизационные машины
4. ML-подход
5. Метрики качества ранжирования и рекомендаций
6. Ранжирование
AutoML
1. Автоматический подбор гиперпараметров: Optuna
2. Фреймворк для AutoML – H2O
3. Обзор других фреймворков (TPOT, auto-sklearn, MLBox)
Прогнозирование временных рядов
1. Особенности работы с временными рядами
2. Статистические методы прогноза временных рядов
3. Адаптивные модели
4. Прогнозирование временных рядов с помощью ML
5. Библиотеки для анализа временных рядов: prophet
Итоговое тестирование
1. Тестирование
Подготовка к собеседованию

Рейтинг курса

4
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 12.06.2024 09:43
Практический Machine Learning

Практический Machine Learning

Оставить отзыв
Поделиться курсом с друзьями