Полная программа курса по Data Science
Мы обновляем её регулярно, чтобы она соответствовала запросам индустрии и работодателей. Иными словами, вы учитесь только тому, что точно пригодится в работе.
Основы Python и анализа данных: бесплатный вводный курс:
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science. Решите пять кейсов по работе с данными из разных областей:
- выясните причину массовой поломки гаджетов,
- проверите окупаемость рекламы мобильного приложения,
- найдёте лучшее место для нового магазина,
- поможете выбрать стратегию развития ИИ-стартапа,
- оцените эффективность роботов в службе поддержки.
Решая кейсы, вы изучите азы Python и библиотеки pandas, научитесь строить некоторые графики и верно их трактовать.
Введение в профессию «Специалист по Data Science»
Кто такой специалист по Data Science.
Как мы учим.
Базовый Python:
Глубже погрузитесь в язык программирования Python и работу с библиотекой pandas.
+1 проект в портфолио
Сравните данные пользователей Яндекс.Музыки по городам и дням недели.
Предобработка данных:
Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.
+1 проект в портфолио
Проанализируете данные о клиентах банка и определите долю кредитоспособных.
Исследовательский анализ данных:
Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками scipy и matplotlib. Отрисуете диаграммы, поупражняетесь в анализе графиков.
+1 проект в портфолио
Исследуете архив объявлений о продаже объектов недвижимости в Санкт-Петербурге и Ленинградской области.
Теория вероятностей. Дополнительный курс
Вспомните или узнаете базовые термины в теории вероятностей: независимые, противоположные, несовместные события и т. д. На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения.
Это необязательный спринт. Значит, каждый студент сам выбирает один из вариантов прохождения:
- Освоить дополнительный курс из десяти коротких уроков, освежить в памяти теорию и решить задачи.
- Открыть только блок с задачами для собеседований, вспомнить практику без теории.
- Пропустить курс совсем или вернуться к нему, когда будет время и необходимость.
Итоговый проект первого модуля
Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы.
+1 проект в портфолио
Найдёте закономерности, которые определяют успешность игры.
Введение в машинное обучение:
Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.
+1 проект в портфолио
Разработаете систему рекомендаций тарифов для оператора мобильной связи.
Обучение с учителем:
Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Узнаете, как обращаться с несбалансированными данными.
+1 проект в портфолио
Спрогнозируете вероятность ухода клиента из банка.
Машинное обучение в бизнесе:
Узнаете, как машинное обучение (сокр. МО) помогает бизнесу, как собирать данные и как продуктовые метрики связаны с показателями МО. Научитесь запускать новую функциональность сервиса, применяя МО. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование.
+1 проект в портфолио
Обучите модель, которая помогает определить новое место для добычи нефти с наименьшим риском убытков.
Итоговый проект второго модуля:
Подготовите данные для машинного обучения. С помощью модели оцените её качество.
+1 проект в портфолио
Смоделируете процесс плавления золотой руды, чтобы улучшить работу предприятия.
Линейная алгебра:
Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.
+1 проект в портфолио
Методом преобразования данных защитите личную информацию клиентов страховой компании.
Численные методы:
Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Освоите приближённые вычисления, оценки сложности алгоритма, градиентный спуск. Узнаете, как обучаются нейронные сети и что такое градиентный бустинг.
+1 проект в портфолио
Разработаете модель для определения стоимости автомобиля с пробегом.
Временные ряды:
Временные ряды описывают, как меняются параметры, например, объём потребления электроэнергии или количество заказов такси, с течением времени. Вы научитесь анализировать ряды, искать тренды и выявлять сезонность. Узнаете, как создавать табличные данные и задачу регрессии из временных рядов.
+1 проект в портфолио
Построите модель и спрогнозируете пиковые нагрузки в такси.
Машинное обучение для текстов:
Научитесь делать числовые векторы из текстов и решать для них задачи классификации и регрессии. Узнаете, как вычисляются признаки TF-IDF и познакомитесь с языковыми представлениями word2vec и BERT.
+1 проект в портфолио
Ускорите модерацию комментариев в сообществе, автоматизировав оценку их токсичности.
Базовый SQL:
Изучите основы языка запросов SQL и реляционной алгебры для работы с базами данных. Познакомитесь с особенностями работы в PostgreSQL — популярной системе управления базами данных (сокр. СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL.
Вы будете работать с базой данных онлайн-магазина, который специализируется на фильмах и музыке.
+1 проект в портфолио
Напишите ряд запросов разной сложности к базе данных, в которой хранятся данные по венчурным инвесторам, стартапам и инвестициям в них.
Компьютерное зрение:
Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras. Познакомитесь с Deep learning.
+1 проект в портфолио
Построите модель для определения приблизительного возраста человека по фотографии.
Обучение без учителя:
Обучение без учителя — это один из способов машинного обучения, при котором система решает задачу без размеченных заранее данных на основе их особенностей и структуры. Познакомитесь с задачами кластеризации и поиска аномалий.
Выпускной проект:
В последнем проекте подтвердите, что освоили новую профессию. Уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — всё как на реальной работе.
+1 проект в портфолио
Проект на выбор:
- Построите модель, прогнозирующую отток клиентов из телекоммуникационной компании.
- Построите модель, предсказывающую параметры технологического процесса на металлургическом комбинате.