Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Курс
Сертификат
Сертификат
Да

Стоимость курса

1 490 ₽
нет рассрочки

Цель курса - не просто рассказать, а научить вас работе с библиотеками Numpy и Pandas.

За кадром сидит не скучный лектор, а специалист по анализу данных, который каждый день работает с этими библиотеками. В формате живого общения (автор как-бы общается с вами через камеру) мы будем учиться работать в Pandas.  

Мы ставим цель научить вас вещам, которые обязательно будут на вашем пути:

  • основы Numpy
  • основы Pandas: структуры данных, базовый функционал, описательная статистика
  • Pandas в действии: взаимодействие с источниками данных; чистка данных и предобработка; сведение данных из разных источников; визуализация данных; агрегация; time series;

Что вы получите после обучения

Приобретаемые навыки
1
Основы Numpy
2
Основы Pandas
3
Работа с источниками данных
4
Чистка и подготовка данных к анализу
5
Объединение данных и преобразование формы

Вас будут обучать

Работаю аналитиком данных в Центре налоговых доходов (Правительство города Москвы) Проходил обучение в аспирантуре Института космических исследований РАН.

Образовательная организация

Stepik — образовательная платформа и конструктор
онлайн-курсов. Мы разрабатываем алгоритмы адаптивного обучения, сотрудничаем с авторами MOOC, помогаем
в проведении олимпиад и программ переподготовки.
Наша цель — сделать образование открытым и удобным.

Помогаем учиться, а также создавать свои курсы и обучать


Первые учебные материалы были размещены на платформе в 2013 году. Сегодня среди охваченных курсами тем: программирование, информатика, математика, статистика
и анализ данных, биология и биоинформатика, инженерно-технические и естественные науки. Онлайн-курсы, размещенные на Stepik, неоднократно становились призерами конкурсов онлайн-курсов, а система автоматизированной проверки задач используется в ряде курсов на платформах Coursera и edX. Также Stepik активно развивает направление адаптивного обучения, где каждый сможет изучать материал, подобранный индивидуально под свой уровень знаний.

 

Stepik является также площадкой для проведения конкурсов и олимпиад — среди мероприятий — отборочный этап Олимпиады НТИ, онлайн-этап акции Тотальный диктант, международная олимпиада по биоинформатике.

 

Stepik — многофункциональная и гибкая платформа для создания образовательных материалов. Вы можете создавать онлайн курсы, интерактивные уроки с видео и различными типами заданий для учащихся, приватные курсы для ограниченной аудитории, проводить олимпиады и конкурсы, запускать программы профессиональной переподготовки и повышения квалификации, а также обучать своих сотрудников и клиентов.

Программа курса

О курсе
1. Информация
Основы Numpy
1. Зачем при изучении Pandas нужен Numpy? 
2. Практика: shape, dtype, ndim, zeros, ones, arange 
3. Типы данных и их преобразование, арифметика, доступ к элементам 
4. Практика: арифметика, преобразование типов, доступ к элементам
5. Двумерные и трехмерные массивы. Учимся применять индексы 
6. Практика: закрепляем работу с индексами 
7. Маска и слайсинг вместе, прихотливая индексация, а еще reshape 
8. Практика: учимся изменять форму массива 
9. Еще о reshape, транспонирование, унарные и бинарные функции 
10. Практика: закрепляем знания про унарные и бинарные функции 
11. Логические функции и функция в функции, а еще where и статистика 
12. Практика: доводим до мастерства работу с полезными функциями 
13. Функции any, all, sort, unique, in1d. Обзор линейной алгебры 
14. Функции permutation и shuffle. Сохранение массива в файл 
Введение в Pandas
1. Первое знакомство с Series 
2. Практика: проверяем свои знания о серии 
3. Поподробнее про серии: идексы, сложение, проверка на NaN 
4. Практика: тонкости при работе с сериями 
5. Первое знакомство с DataFrame 
6. Поподробнее про DataFrame: индексы, вложенные словари, del и .T 
7. Практика: особенности индексации 
8. Функции reindex, drop и индексация в датафрейме 
9. Практика: вытягиваем нужное, удаляем ненужное 
10. Операторы loc, iloc, at, iat. Сложение нескольких датафреймов 
11. Сложение датафреймов, сортировки, арифметика с пропусками 
12. Описательные статистики. Уникальные значения 
13. Контрольная работа 
14. Контрольная работа (продолжение) 
Pandas: работа с источниками данных
1. Что такое формат CSV и как его приручить?
2. Поподробнее про обработку пропусков 
3. Учимся читать большие файлы кусочками 
4. Кто такой JSON и как с ним подружиться? 
5. Знакомимся с форматами HTML, XML, PICKLE, HDF5 
6. Старый добрый Excel и немного про базы данных
Pandas: чистка и подготовка данных к анализу
1. Учимся обрабатывать пропуски 
2. Проверяем данные на дубликаты и избавляемся от них 
3. Про замену значений и дискретизацию 
4. Определяем выбросы и грамотно устраняем их 
5. Создаём матрицы фиктивных переменных 
6. Работа со строками - проще чем кажется!
Pandas: объединение данных и преобразование формы
1. Знакомство с иерархической индексацией
2. Действия с мультииндексами в датафреймах
3. Учимся соединять датафреймы с помощью merge
4. Аналог merge; конкатенация датафреймов через concat
5. Комбинирование данных и преобразование формы

Рейтинг курса

4
рейтинг
0
0
0
0
0

Может быть интересно

обновлено 06.10.2024 02:25
Основы Pandas для начинающих

Основы Pandas для начинающих

Оставить отзыв
Поделиться курсом с друзьями