Построение модели
Узнаете, что такое библиотека Sklearn и как ею пользоваться. Изучите алгоритмы кластеризации и сможете строить ансамбли моделей. Научитесь оценивать модели и работать с переобучением. Узнаете, как использовать в работе GridSearch и RandomizedSearch, Model Specific CV, Out of Bag approach.
• Библиотека Sklearn
• Алгоритмы классификации: линейные методы, логистическая регрессия и SVM
• Алгоритмы классификации: деревья решений
• Алгоритмы регрессии: линейная и полиноминальная
• Алгоритмы кластеризации
• Ансамблирование
• Оценка точности модели, переобучение, регуляризация
• Улучшение качества модели
• Организация проекта, составление отчётов по исследованиям
• Лабораторная работа
• Сдача промежуточного проекта
Работа с заказчиком
Вы научитесь планировать разработку data science проектов, а также грамотно рассказывать заказчикам о результатах исследований.
• Организация проекта
• Составление отчётов по исследованиям
Рекомендательные системы
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
• Введение и классификация рекомендательных систем
• Content-based рекомендации
• Collaborative Filtering
• Неперсонализированные рекомендательные системы
• Гибридные алгоритмы
Компьютерное зрение
Вы освоите основные техники машинного зрения: извлечение признаков, поиск по картинкам, сегментирование, детекция объектов, а также научитесь строить нейросети.
• Поиск по картинкам
• Сегментация изображений, детекция объектов
• Применение сверхточных нейронных сетей для задач сегментации и детекции
• Применение рекуррентных сетей в задачах обработки изображений
• Генеративные конкурирующие сети (GAN)
Обработка естественного языка (NLP)
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
• Морфологический и синтаксический анализ
• Методы снижения размерности в векторной модели. Информационный поиск
• Тематическое моделирование (LSA, LDA, HDP)
• Дистрибутивная семантика (word2vec, GloVe, AdaGram)
• Счётные языковые модели и вероятностные языковые модели. LSTM. Машинный перевод
• Генерация текстов (Natural Language Generation)
• Задача классификации в АОТ
Временные ряды
На этом интенсивном блоке вы научитесь выявлять происхождение и структуру временного ряда, прогнозировать будущие значения для эффективного принятия решений при построении моделей машинного обучения. Поймёте, что «под капотом» у популярных методик и библиотек.
• Алгоритмы обработки временных рядов
• Модели ARIMA и GARCH
• Марковские случайные процессы
Итоговый хакатон
Завершим обучение состязанием с товарищами по курсу: в составе миникоманды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе. Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
Дипломный проект
В рамках дипломного проекта вы построите ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста, и т. д. Если в моменте у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний. Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.