Образовал

Data Scientist: с нуля до middle

Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Профессия
Формат обучения
Формат обучения
С проверкой домашнего задания
Трудоустройство
Трудоустройство
Содействие
Сертификат
Сертификат
Да
Стоимость курса
169 800 ₽
есть рассрочка

Кому будет полезен этот курс
Новичкам в Data Science
С нуля овладете знаниями и навыками, необходимыми для работы Data Scientist, и получите новую востребованную профессию.
Разработчикам
Курс даёт хорошую базу для перехода из программирования в Data Science и анализ больших данных. Вас ждёт много практической работы, разбор кейсов и новые полезные знакомства.
Аналитикам
Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Освоите новые инструменты и перейдёте на новый уровень в сфере Data Science.

Что вы получите после обучения
Приобретаемые навыки
2
Компьютерное зрение
3
NLP
5
Визуализация данных
6
Data Science
7
Kaggle
8
Scikit-learn
9
OpenCV
11
NLTK
Сертификат, ссылками на который можно делиться с другими людьми
Вас будут обучать

 IT- аудитор в Сбербанке, преподаватель курса «Python-разработчик»

Фрилансер, lead data scientist

Опыт работы: более 6 лет

Data Scientist, Google
Data Scientist в ДомКлик.ру
Владельцы курса

«Нетология» — это быстрый способ научиться интернет-продвижению и управлению проектами онлайн. Открытые занятия, онлайн-интенсивы и интерактивные курсы для быстрого обучения.

Нетология – это онлайн-университет по подготовке и дополнительному обучению специалистов в области самых востребованных интернет-профессий. Преподают в этом университете высококлассные специалисты, работающие в таких компаниях как Google, Яндекс, Mail.ru, Альфа-Банк и других крупнейших компаниях. Многие из них являются владельцами собственных успешных онлайн-бизнесов.

Нетология была основана в 2011 году. Сооснователями площадки являются предприниматель Максим Спиридонов, являющийся генеральным директором Нетологии, и его жена Юлия Спиридонова-Микеда, которая, собственно, и придумала концепцию проекта.

О Нетологии писали такие издания, как РБК Daily, Ведомости, Аргументы и Факты, Лайфхакер, Lenta.ru, Slon и многие другие.

Сам Максим Спиридонов ведёт колонку в Forbes, является автором и ведущим аналитической программы «Рунетология», гостями которой являются крупные эксперты в области онлайн-бизнеса. Максим принимал участие в создании и руководил десятками крупнейших веб-проектов, среди которых такие проекты, как подкаст-терминал Pod.fm, журнал «ШколаЖизни.ру», сервис «БобрДобр.ру», сайт социальных закладок Memori.ru, интернет-энциклопедия Calend.ru и форекс-брокер FreshForex. Является автором книги «Кто управляет русским интернетом». В общем, ясно, что человек является крутейшим знатоком своего дела.

Нетология является резидентом Сколково и имеет лицензию государственного образца (№037356 от 06 апреля 2016 г.)

Программа курса

Аналитическое мышление
Научитесь думать как аналитик и формулировать гипотезы для проверки. Поймёте, что аналитика строится вокруг данных. Познакомитесь с базовым инструментом аналитика и сможете проводить в нём простой анализ данных.
• Что такое аналитическое мышление
• Введение в Google-таблицы
• Продвинутые Google-таблицы
• Основы статистики
• Откуда берутся данные
• Продвинутая визуализация данных
• Python как инструмент анализа данных
• Машинное обучение для жизни

Основы визуализации данных
Поймёте, как создавать наглядные визуализации, откуда берутся данные для визуализации и как с ними работать. Узнаете, как создавать истории с помощью данных.
• Как донести информацию с помощью изображений
• Инструменты, источники и предподготовка данных
• Исследование данных и основы статистики
• Продвинутая визуализация данных
• Сторителлинг в визуализации

SQL и получение данных
В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
• Архитектура и структура баз данных (БД)
• Простые запросы, join`ы, агрегаты
• Базовые команды в SQL и встроеные аналитические функции
• Импорт и экспорт данных посредством SQL и ETL программ
• Принципы работы с различными БД
• Основные библиотеки для подключения к БД из Python
• Функции SQL и их аналоги в pandas
• Консоль (знакомство, основные операторы, утилита psql)
• Архитектура и проектирование
• Нормализация
• Зависимости
• Подготовка и сдача итогового проекта

Аналитика больших данных
Узнаете, как собрать и управлять командой Big Data-проекта. Освоите подход CRISP-DM, определите компетенции и состав команды. Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под Big Data в своей компании. Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность.
• Что такое большие данные
• Монетизация больших данных
• Характеристики и источники данных
• Культура сбора данных
• Основы реализации проектов больших данных. Кейс-стади
• Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
• NoSQL-подход
• MapReduce-подход
• Введение в Hadoop
• Практическое задание (лабораторная работа) по аналитике данных и его разбор

Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
• Базовые типы данных и циклы
• Функции и классы
• Продвинутые типы данных: массивы, множества, словари
• Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
• Визуализация в Python
• Базовые понятия статистики
• Случайные события. Случайные величины
• Логистическая регрессия и дискриминационный анализ
• Корреляция и корреляционный анализ
• Доверительные интервалы. Статистическая проверка гипотез

Математика для анализа данных
Изучите основные операции с векторами, матричными операциями. Рассмотрите генетические алгоритмы, алгоритм дифференциальной эволюции. Узнаете, что такое математическое ожидание, дисперсия и моменты старших порядков. Изучите закон больших чисел.
• Линейная алгебра. Вектора
• Линейная алгебра. Матрицы
• Продвинутая линейная алгебра
• Математический анализ. Производная
• Производная функции нескольких аргументов
• Теория оптимизации
• Теория вероятности. Дискретные и непрерывные случайные величины
• Центральная предельная теорема и закон больших чисел

Машинное обучение
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.
• Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
• Классификация: логистическая регрессия и SVM
• Функции потерь и оптимизация
• Оценка точности модели, переобучение, регуляризация
• Проблема качества данных
• Работа с пропусками и переменными

Рекомендательные системы
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
• Неперсонализированные рекомендательные системы
• Сontent-based-рекомендации
• Collaborative Filtering
• Гибридные алгоритмы

Временные ряды
Вы изучите элементарные алгоритмы обработки временных рядов, модели ARIMA и GARCH, прогнозирование значений на их основе. Узнаете, что такое марковские случайные процессы и марковские модели для временных рядов.
• Знакомство с временными рядами
• Элементарные методы анализа временных рядов
• Модели ARMA
• Модели авторегрессии условной гетероскедастичности
• Сингулярный спектральный анализ
• Случайные марковские процессы
• Нейронные сети в анализе временных рядов
• Поиск изменений во временном ряде

Нейронные сети
Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP.
• Введение в нейронные сети и библиотеку Keras
• Углубление в нейронные сети и библиотеку Keras
• Введение в свёрточные нейронные сети
• Введение в рекуррентные сети
• Автокодировщики
• Введение в генеративно-состязательные сети

Компьютерное зрение
Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов.
• Выделение признаков и поиск похожих изображений
• Сегментация и детекция объектов
• Свёрточные нейронные сети
• Обучение свёрточной сети на практике
• Задачи детекции и сегментации
• Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
• Порождающие модели

Обработка естественного языка
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
• Введение в автоматическую обработку текста
• Структура слова. Морфология
• Синтаксический анализ
• Дистрибутивная семантика
• Извлечение ключевых слов
• Словари. Подкрепление знаний
• Тематическое моделирование
• Информационный поиск
• Классификация в АОТ
• Языковые модели
• Извлечение информации

Deep Learning
Научитесь работать с многомерными свёртками, овладеете конкурентным преимуществом в задачах с использованием Beam-Search и Teacher Forcing, сможете реализовывать NLP с нуля. Сможете отличать дескриминатор от генератора и обучать генератор выбирать данные из линейной регрессии. Реализуете сеть генерации покемонов и обучите её.
• Регрессия и персептрон
• Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
• Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
• Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
• Внимание: Dense Attention и Beam search
• Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
• Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
• GAN'ы: дискриминатор, генератор, продвинутые архитектуры

Data Scientist.
Менеджмент data-проектов
Овладеете методологиями управления Data Science-проектами. Научитесь формулировать идеи и гипотезы, выбирать подходящие методы и алгоритмы, планировать решение задачи.
• Требования в data-проектах
• Методология ведения data-проектов
• Разработка отчётов по исследованию
• Сохранение результатов эксперимента

Эффективные коммуникации и эмоциональный интеллект
Научитесь понимать картину мира окружающих и на основе этого строить коммуникацию. Разберётесь, как управлять своими эмоциями, как реагировать на эмоции окружающих в процессе общения и развивать эмоциональный интеллект. Узнаете, как управлять эмоциями в переговорах. Научитесь заводить полезные связи и деловые знакомства и правильно презентовать себя.
• Фасилитация
• Личная эффективность
• Планирование
• Расстановка приоритетов
• Управление временем
• Делегирование
• Концентрация и восстановление ресурсов
• Самомотивация
• Эмоциональный интеллект. Модель и этапы развития
• Распознавание эмоций

Переговоры
Научитесь грамотно организовывать деловые встречи и эффективно проводить переговоры, добиваясь взаимовыгодных договорённостей.
• Нетворкинг
• Как вести неравные переговоры
• Возражения и аргументы
• Подготовка к переговорам
• Уверенное ведение переговоров
• Управленческие поединки
• Манипуляции в переговорах
• Сила переговоров
• Структура переговоров
• Переговоры онлайн и офлайн
• Внутренние переговоры

Публичные выступления
Узнаете, как презентовать идею или отчёт. Научитесь получать удовольствие от выступлений и перестанете их бояться.
• Подготовка к публичному выступлению
• Типовые структуры выступления
• Выступление перед коллегами
• Взаимодействие с аудиторией и подача

Финальный хакатон и Kaggle Competitions
В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе. Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.

Рейтинг
4.8
рейтинг
2
0
0
0
0
Отзывы
2 отзыва
по рейтингу по дате
E
evzvereva
4 месяца, полет нормальный!)
Достоинства: Программа построена для новичков Недостатки: Чтобы не забывать инфу, которую учил ранее, сделать промежуточные работы по изученным блокам. Иначе есть вероятность забывать, если не практиковать. Учусь на профессии Data...
A
Algea
Отличная программа, современные пособия. Качественный, быстрый фидбэк. Подробные вебинары. Воодушевляющие эксперты-преподаватели и координаторы.
Достоинства: Быстрая подробная обратная связь, современная программа, много практики, квалифицированный преподавательский и координирующий состав. Недостатки: Не всегда понятный материал для новичков. В январе 2021 года записалась на курс Нетологии: "Data...
Data Scientist: с нуля до middle
Оставить отзыв
Поделиться курсом с друзьями