Программа курса по математике
Часть 1 - Линейная алгебра
- Изучаем вектора и виды матриц
- Учимся проводить операции над матрицами
- Определяем линейную зависимость с помощью матриц
- Изучаем обратные, вырожденные и невырожденные матрицы
- Изучаем системы линейных уравнений, собственные и комплексные числа
- Осваиваем матричное и сингулярное разложение
- Решаем задачи линейной зависимости с помощью матриц
- Оптимизируем с помощью метода главных компонент
- Закрепляем математические основы линейной регрессии
Часть 2 - Основы матанализа
- Изучаем функции одной и многих переменных и производные
- Осваиваем понятие градиента и градиентного спуска
- Тренируемся в задачах оптимизации
- Изучаем метод множителей Лагранжа, метод Ньютона и имитацию отжига
- Решаем задачи предсказания и поиска выигрышной стратегии с помощью производных и численных методов оптимизации
- Закрепляем математические основы градиентного спуска и имитации отжига
Часть 3 - Основы теории вероятности и статистики
- Изучаем общие понятия описательной и математической статистики
- Осваиваем комбинаторику
- Изучаем основные типы распределений и корреляции
- Разбираемся в теореме Байеса
- Изучаем наивный байесовский классификатор
- Решаем задачи комбинаторики, валидности и прогнозирования методами статистики и теории вероятности
- Закрепляем математические основы классификации и логистической регрессии
Часть 4 - Временные ряды и прочие математические методы
- Знакомимся с анализом временных рядов
- Осваиваем более сложные типы регрессий
- Прогнозируем бюджет с помощью временных рядов
- Закрепляем математические основы классических моделей машинного обучения
Краткая программа курса по Machine Learning
Помощь наставника на протяжении обучения
Модуль 1 - Введение в машинное обучение
Знакомимся с основными задачами и методами machine learning, изучаем практические кейсы и применяем базовый алгоритм работы над ml-проектом
Решаем 50+ задач на закрепление темы
Модуль 2 - Методы предобработки данных
Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering
Решаем 60+ задач на закрепление темы
Модуль 3 - Регрессия
Осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию. Обучаем модели регрессии
Решаем 40+ задач на закрепление темы
Модуль 4 - Кластеризация
Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML
Решаем 50+ задач на закрепление темы
Модуль 5 - Tree-based алгоритмы: введение в деревья
Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии
Решаем 40+ задач на закрепление темы
Модуль 6 - Tree-based алгоритмы: ансамбли
Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии
Решаем 40+ задач на закрепление темы
Участвуем в соревновании на kaggle по обучению tree-based модели
Модуль 7 - Оценка качества алгоритмов
Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения
Оцениваем качество нескольких моделей ML
Решаем 40+ задач на закрепление темы
Модуль 8 - Временные ряды в машинном обучении
Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров
Решаем 50+ задач на закрепление темы
Модуль 9 - Рекомендательные системы
Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели
Решаем 50+ задач на закрепление темы
Модуль 10 - Финальный хакатон
Применяем все изученные методы для получения максимальной точности предсказаний модели на Kaggle