Будете анализировать большие объёмы данных и применять машинное обучение для разных задач. Специалист по Data Science строит на основе данных модели, которые помогают принимать решения в науке, бизнесе и повседневной жизни. С помощью машинного обучения вы будете предсказывать события, прогнозировать значения и искать неочевидные закономерности в данных.
Бесплатная часть 20 часов Вводный курс: основы Python и анализа данных
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science
1 спринт 1 неделя Базовый Python
Глубже погрузитесь в язык программирования Python и работу с библиотекой pandas
2 спринт 1 неделя Предобработка данных
Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных
3 спринт 1 неделя Исследовательский анализ данных
Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками SciPy и Matplotlib. Создадите диаграммы, поупражняетесь в анализе графиков.
4 спринт 1 неделя Статистический анализ данных
Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.
5 спринт 1 неделя Итоговый проект первого модуля
Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы
6 спринт 1 неделя Введение в машинное обучение
Освоите основные концепции машинного обучения. Познакомитесь с библиотекой Scikit-Learn и примените её для создания первого проекта с машинным обучением.
7 спринт 1 неделя Обучение с учителем: классификация и регрессия
Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Узнаете, как обращаться с несбалансированными данными.
8 спринт 1 неделя Машинное обучение в бизнесе
Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы
9 спринт 1 неделя Итоговый проект второго модуля
Смоделируете процесс плавления золотой руды, чтобы улучшить работу предприятия
10 спринт 1 неделя Линейная алгебра
Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.
11 спринт 1 неделя Численные методы
Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.
12 спринт 1 неделя Временные ряды
Научитесь анализировать временные ряды. Узнаете, как создавать табличные данные из временных рядов и решать для них задачу регрессии.
13 спринт 1 неделя Машинное обучение для текстов
Научитесь делать числовые векторы из текстов и решать для них задачи классификации и регрессии. Узнаете, как вычисляются признаки TF-IDF, и познакомитесь с языковыми представлениями word2vec и BERT.
14 спринт 1 неделя Базовый SQL
Изучите основы структурированного языка запросов SQL и операции реляционной алгебры. Познакомитесь с PostgreSQL — популярной системой управления базами данных (СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL.
Также вы познакомитесь с PySpark — библиотекой с открытым исходным кодом, которая применяется для распределённой обработки больших объёмов данных.
15 спринт 1 неделя Компьютерное зрение
Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras. Одним глазком заглянете в Deep learning.
16 спринт 1 неделя Выпускной проект
Уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — всё как на реальной работе.