Программа курса «Data Scientist»
Блок 1: "Получение и подготовка данных: SQL"
Введение в блок SQL
Извлечение и фильтрация данных
Преобразование и сортировка данных
Группировка данных
Введение в базы данных
Объединение таблиц
Вложенные запросы
Обновление, добавление и удаление данных
Создание, изменение и удаление таблиц
Advanced
Обзор основных программ
Блок 2. "Основы Python"
Введение в Python
Переменные и типы данных.
Строки. Условия и циклы
Практическое занятие: строки
Практическое занятие: циклы
Списки и словари в Python
Функции
Практическое занятие: функции
Библиотеки
Практическое занятие: библиотеки
Структуры данных в Python
Пакеты и модули
Менеджер пакетов Pip
Ошибки и исключения
Практическое занятие: ошибки и исключения
Блок 3. Система контроля версий Git. Flask
Системы контроля версий
Знакомство с Git и GitLab
Разработка API на Flask
Практический проект на flask
Блок 3: "Построение Machine Learning моделей"
Знакомство с машинным обучением
Линейная регрессия
Бинарная классификация
Построение надежных стратегий валидации - важность локальной валидации
Решающие деревья
Бутстрап, Бэггинг и случайный лес
Feature Engineering, Feature SelectionГрадиентный бустинг
Воркшоп: предсказание оттока и прогноз продаж
А/B тестирование в машинном обучении
Обучение без учителя
Воркшоп: скоринг кредитного портфеля
Блок 4: "Нейронные сети и NLP"
Введение в нейронные сети
Обучение нейросетей
Глубокое обучение на практике
Дополнительные возможности Tensorflow + Keras
Свёрточные нейронные сети
Введение в NLP, понятие ембеддинга
Рекурентные сети
Нейросети с вниманием, трансформеры
Metric learning, обучение без учителя
Обучение с подкреплением в нейросетях
Итоговый проект
Блок 5: "Рекомендательные системы"
Введение
Метрики и бейзлайны
Матричное разложение
Рекомендации через поиск ближайших соседей
Гибридные рекомендательные системы
Итоговый проект
Блок 6: Дипломная работа и помощь с трудоустройством
Работа над дипломным проектом для портфолио
Подготовка резюме
Подготовка к собеседованию
Финальная защита и консультации