Python для работы с данными
> Установка Python и основные инструменты разработки: Anaconda, Jupyter Notebook, PyCharm.
> Синтаксис языка: переменные, типы данных, операторы, функции.
> Условные конструкции и циклы: if-else, for, while.
> Структуры данных: списки, кортежи, множества, словари.
> Работа с файлами и директориями: чтение, запись, перемещение и удаление.
> Обработка исключений: try-except.
> Модули и пакеты: создание, импорт и использование.
> ООП в Python: классы, объекты, наследование.
> Линейная алгебра. Вспоминаем
> Работа с библиотекой NumPy:
> Создание массивов NumPy
> Операции над массивами
> Индексирование и срезы массивов
> Функции для работы с массивами
> Работа с библиотекой Pandas
> Введение в Pandas и структуры данных
> Создание DataFrame и Series
> Обработка и очистка данных
> Сводные таблицы и агрегирование данных
> Применение линейной алгебры в машинном обучении
> Работа с данными с помощью NumPy и Pandas
Git
> Определение командной строки и ее роли.
> Основные команды (cd, ls, mkdir, rm, cp, mv).
> Системы контроля версий
> Концепции системы контроля версий.
> Основные команды (init, add, commit, status, log).
> Работа с удаленными репозиториями (clone, remote, push, pull).
Теория вероятностей и статистика
> Определение понятий статистики и вероятности
> Общие принципы статистической обработки данных
> Основные принципы теории вероятностей
> Описательная статистика
> Расчет основных характеристик данных: среднее, медиана, мода, дисперсия, стандартное отклонение
> Вероятность
> Определение понятия вероятности
> Расчет вероятности событий
> Условная вероятность и формула Байеса
> Распределения вероятностей: дискретные и непрерывные
> Гипотезы и их проверка
> Уровень значимости и p-value
> Корреляционный анализ
> Корреляция и коэффициент корреляции
> Построение корреляционной матрицы
А/В-тесты
> Введение в A/B тестирование
> Определение A/B тестирования и его цели.
> Основные термины: контрольная группа, тестовая группа, конверсия, p-значение и т. д.
> Примеры успешных A/B тестов и их влияние на бизнес.
> Определение целей теста и выбор метрик успеха.
> Разработка гипотез и создание вариаций страницы/продукта.
> Размер выборки и его расчеты для достижения статистической значимости.
> Статистический анализ результатов: t-тест, z-тест и др.
> Интерпретация показателей: p-значение, доверительные интервалы.
> Принятие решений на основе результатов теста: внедрение изменений, отклонение или повторное тестирование.
> Практические задания и кейсы для закрепления материала.
> Обзор инструментов для проведения A/B тестирования
Визуализация данных:
> Основные принципы визуализации данных
> Знакомство с библиотеками Matplotlib и Seaborn
> Построение первых графиков: scatter plot, line plot, bar plot
> Загрузка и предварительная обработка данных для визуализации
> Очистка и преобразование данных
> Разведочный анализ данных
> Настройка осей и меток
> Добавление заголовков и подписей
> Использование различных цветов и стилей
> Создание множественных графиков
> Использование различных типов диаграмм: pie chart, histogram, box plot
> Настройка внешнего вида графиков
> Использование Seaborn для создания более сложных и красивых графиков
> Работа с категориальными данными
> Использование статистических графиков
> Создание собственного проекта визуализации данных
> Презентация результатов и обсуждение лучших практик
SQL
> Знакомство с языком SQL
> Создание баз данных и таблиц
> Операторы SELECT, INSERT, UPDATE, DELETE
> Основные функции SQL (COUNT, SUM, AVG, MAX, MIN)
> Операторы WHERE и AND/OR
> Сортировка данных с помощью ORDER BY
> Использование DISTINCT для удаления дубликатов
> Использование оператора IN и BETWEEN для фильтрации данных
> Практические задания
> Использование оператора JOIN для объединения таблиц
> Внутренние, внешние, левые и правые соединения
> Использование подзапросов
> Практические задания на объединение таблиц
> Использование оператора GROUP BY для группировки данных
> Использование агрегатных функций с GROUP BY
> Фильтрация групп данных с помощью оператора HAVING
> Практические проекты для применения изученных навыков
Развитие продукта
> Определение продуктового видения и его роль в развитии продукта.
> Понимание бизнес-анализа и его влияние на принятие решений в компании.
> Формирование продуктового видения
> Исследование рынка и аудитории продукта.
> Выявление потребностей пользователей и определение ключевых функциональных требований.
> Роль продакт-менеджера в продуктовом развитии.
> Как аналитику данных работать в тесном сотрудничестве с продакт-менеджерами.
> Использование данных для развития бизнеса
> Сбор и анализ данных о продукте и пользовательском поведении.
> Применение данных для выявления возможностей для улучшения продукта и достижения бизнес-целей.
> Организация работы команд в IT-продуктах
> Методологии управления продуктами: Agile, Scrum, Kanban.
> Работа в команде аналитиков данных в рамках IT-продукта: роли, процессы, коммуникация.
Продуктовая аналитика
> Значение аналитики данных для бизнеса
> Основные принципы анализа данных и их применение в бизнесе
> Как объяснить ценность аналитики данных бизнесу
> Понимание потребностей пользователей продукта
> Методы и техники определения потребностей пользователей
> Сегментация пользователей и её значение для продуктового развития
> Практические кейсы по определению потребностей пользователей и сегментации
> Основы юнит-экономики и её роль в анализе данных
> Выбор и расчёт ключевых продуктовых метрик
> Практические задания по расчёту юнит-экономики и метрик
Airflow
> Обзор задач, которые можно автоматизировать с помощью Airflow.
> Основные понятия и термины: DAGs (Directed Acyclic Graphs), Operators, Tasks, Executors.
> Установка и настройка Airflow.
> Создание первого DAG:
> Определение DAG и его структура.
> Использование Operators для определения задач.
> Конфигурация и планирование DAGs.
> Определение зависимостей между задачами.
> Использование контроля выполнения (execution_date) для управления временем задач.
> Планирование и мониторинг:
> Использование планировщика (Scheduler) для автоматического выполнения задач по расписанию.
> Мониторинг выполнения задач через веб-интерфейс Airflow.
> Создание собственных операторов для выполнения специфических задач.
> Использование переменных и шаблонов для динамической конфигурации DAGs.
> Передача параметров между задачами.
> Масштабирование и оптимизация
> Конфигурация и использование различных Executor'ов для оптимизации выполнения задач.
> Работа с очередями и параллельным выполнением задач.
Работа над курсовым проектом
Подготовка к собеседованию