Если вы уже немного знакомы с Data Science и хотите продолжить обучение, восполнить пробелы и получить больше практики, этот курс - для вас. В рамках программы вы углубитесь в направление Data Science - познакомитесь с архитектурой MapReduce и экосистемой Apache Hadoop, разберетесь с устройством Apache Spark и Apache Parquet, освоите основы нейронных сетей и их архитектур. А еще узнаете, как проводить бизнес-аналитику с Power BI и какие soft skills нужны руководителю проектов.
Цель курса - привлечь ваше внимание к Big Data и Data Science, поэтому все материалы курса имеют ознакомительный характер без погружения во все тонкости. Если вас интересует глубокое погружение, то воспользуйтесь дополнительными материалами модулей.
Курс состоит из пяти модулей, которые помогут вам планомерно расти в области Data Science и своевременно тренировать полученную теорию на практике:
1. Погружение в науку о данных.
Вспомните, какие процессы включает в себя анализ данных. Научитесь основам функционирования долговременных хранилищ. Поработаете с SQL на примере СУБД Oracle и создадите свою первую базу данных. Познакомитесь с архитектурой MapReduce и экосистемой Apache Hadoop.
2. Инструменты обработки, анализа данных и визуализации данных.
Узнаете, что такое Power BI и какие задачи можно решать с его помощью. Научитесь получать, моделировать, анализировать данные и строить визуализации.
3. Инструменты работы с большими данными.
Разберетесь, как устроен инструмент для работы с большими данными Apache Spark. Изучите формат хранения данных Apache Parquet и его особенности. А еще рассмотрите примеры работы с Pyspark в Jupyter тетрадке.
4. Системы машинного обучения.
Узнаете, что такое p-value, зачем нужные статистические критерии, и в каких задачах они помогают. Изучите понятие нейронных сетей, их особенности и основные архитектуры. А еще поймете, как сформировать бережливый и прагматичный подход к использованию больших данных.
5. Soft Skills и управление проектами.
Изучите принципы и методы управления проектами. Рассмотрите, как устроен жизненный цикл проекта, управляемого в парадигме Agile. А еще узнаете, какие ключевые soft skills необходимы эксперту для развития навыков лидерства и управления проектами.
Для кого этот курс
Курс направлен на всех, кто обладает базовыми знаниями в Data Science и хочет изучать направление дальше. Также курс подойдет специалистам в IT и смежных областях, которых интересует применение машинного обучения в бизнесе и выпускникам курса "Big Data и Data Science: начни погружение с нуля", желающим продолжить обучение.
Начальные требования
Чтобы обучение на курсе было понятным и полезным, необходимо обладать продвинутыми навыками компьютерной грамотности и базовыми знаниями программирования и SQL. Получить их можно на предыдущем курсе нашего проекта - «Big Data и Data Science: начни погружение с нуля».