Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Курс
Сертификат
Сертификат
Да

Стоимость курса

990 ₽
нет рассрочки

Цель курса - не просто рассказать, а научить вас работе с библиотеками Numpy и Pandas.

За кадром сидит не скучный лектор, а специалист по анализу данных, который каждый день работает с этими библиотеками. В формате живого общения (автор как-бы общается с вами через камеру) мы будем учиться работать в Pandas.  

Мы ставим цель научить вас вещам, которые обязательно будут на вашем пути:

  • основы Numpy
  • основы Pandas: структуры данных, базовый функционал, описательная статистика
  • Pandas в действии: взаимодействие с источниками данных; чистка данных и предобработка; сведение данных из разных источников; визуализация данных; агрегация; time series;

Что вы получите после обучения

Приобретаемые навыки
1
Основы Numpy
2
Основы Pandas
3
Работа с источниками данных
4
Чистка и подготовка данных к анализу
5
Объединение данных и преобразование формы

Вас будут обучать

Работаю аналитиком данных в Центре налоговых доходов (Правительство города Москвы) Проходил обучение в аспирантуре Института космических исследований РАН.

Образовательная организация

Stepik — образовательная платформа и конструктор онлайн-курсов.

Мы разрабатываем алгоритмы адаптивного обучения, сотрудничаем с авторами MOOC, помогаем в проведении олимпиад и программ переподготовки.

Наша цель — сделать образование открытым и удобным.

Stepik — широко известная российская образовательная платформа, основанная в 2013 году. На Stepik зарегистрировано более миллиона пользователей из России и стран СНГ. В настоящее время на Stepik представлены несколько тысяч учебных курсов на самые разные темы.

Платформа Stepik включает в себя конструктор бесплатных занятий и уроков. Создать интерактивный обучающий курс может любой зарегистрированный пользователь. При этом авторы обучающих материалов сохраняют авторские права. Сервис не имеет ограничений по числу обучающихся на курсе.

Stepik имеет обширные возможности по созданию онлайн-курсов, обучающих занятий и уроков с использованием текстов, видео, картинок, тестовых задач, в процессе выполнения которых можно вести обсуждения с остальными обучающимися, а также с преподавателем. Всего в Stepik присутствует 20 типов заданий, проверка которых может осуществляться как в автоматическом, так и в ручном режиме.

Большим преимуществом данной платформы является возможность встраивать созданные материалы на сторонние сайты, например, Moodle и Canvas.

Кроме того, Stepik может использоваться в качестве площадки для проведения разнообразных мероприятий, таких как олимпиады и конкурсы.

Интерфейс платформы полностью русскоязычный, достаточно дружественный и интуитивно понятный. Платформа полностью бесплатна.

За каждый пройденный курс в Stepik обучающийся получает сертификат о прохождении. Получение сертификата также бесплатно.

Программа курса

О курсе
1. Информация
Основы Numpy
1. Зачем при изучении Pandas нужен Numpy? 
2. Практика: shape, dtype, ndim, zeros, ones, arange 
3. Типы данных и их преобразование, арифметика, доступ к элементам 
4. Практика: арифметика, преобразование типов, доступ к элементам
5. Двумерные и трехмерные массивы. Учимся применять индексы 
6. Практика: закрепляем работу с индексами 
7. Маска и слайсинг вместе, прихотливая индексация, а еще reshape 
8. Практика: учимся изменять форму массива 
9. Еще о reshape, транспонирование, унарные и бинарные функции 
10. Практика: закрепляем знания про унарные и бинарные функции 
11. Логические функции и функция в функции, а еще where и статистика 
12. Практика: доводим до мастерства работу с полезными функциями 
13. Функции any, all, sort, unique, in1d. Обзор линейной алгебры 
14. Функции permutation и shuffle. Сохранение массива в файл 
Введение в Pandas
1. Первое знакомство с Series 
2. Практика: проверяем свои знания о серии 
3. Поподробнее про серии: идексы, сложение, проверка на NaN 
4. Практика: тонкости при работе с сериями 
5. Первое знакомство с DataFrame 
6. Поподробнее про DataFrame: индексы, вложенные словари, del и .T 
7. Практика: особенности индексации 
8. Функции reindex, drop и индексация в датафрейме 
9. Практика: вытягиваем нужное, удаляем ненужное 
10. Операторы loc, iloc, at, iat. Сложение нескольких датафреймов 
11. Сложение датафреймов, сортировки, арифметика с пропусками 
12. Описательные статистики. Уникальные значения 
13. Контрольная работа 
14. Контрольная работа (продолжение) 
Pandas: работа с источниками данных
1. Что такое формат CSV и как его приручить?
2. Поподробнее про обработку пропусков 
3. Учимся читать большие файлы кусочками 
4. Кто такой JSON и как с ним подружиться? 
5. Знакомимся с форматами HTML, XML, PICKLE, HDF5 
6. Старый добрый Excel и немного про базы данных
Pandas: чистка и подготовка данных к анализу
1. Учимся обрабатывать пропуски 
2. Проверяем данные на дубликаты и избавляемся от них 
3. Про замену значений и дискретизацию 
4. Определяем выбросы и грамотно устраняем их 
5. Создаём матрицы фиктивных переменных 
6. Работа со строками - проще чем кажется!
Pandas: объединение данных и преобразование формы
1. Знакомство с иерархической индексацией
2. Действия с мультииндексами в датафреймах
3. Учимся соединять датафреймы с помощью merge
4. Аналог merge; конкатенация датафреймов через concat
5. Комбинирование данных и преобразование формы

Рейтинг курса

4
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 31.03.2024 02:17
Основы Pandas для начинающих

Основы Pandas для начинающих

Оставить отзыв
Поделиться курсом с друзьями