Скидки на курсы ждут в личном кабинете. Нажмите тут
Есть рассрочка Поддержка куратора Стажировка

Data Engineer с нуля до Junior

от Skillbox
Data Engineer с нуля до Junior
Формат
Онлайн
Длительность
12 месяцев
Уровень
Для новичков
Документ
Нет
Трудоустройство
Да
Программа

Курс предназначен новичкам, программистам и начинающим аналитикам. Вы научитесь использовать инструменты анализа, обрабатывать данные и тестировать код.

Программа длится 12 месяцев и состоит из 17 блоков. Курс включает в себя блоки: «Python. LVL 2» и «Основы алгоритмов Machine Learning». В конце курса вы презентуете итоговую работу и получите 2 проекта на основе реальных данных в портфолио.

  • Введение в Data Science

    Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Освоите базовые инструменты для работы: Python, SQL, Excel, Power Bi, Airflow.

  • Основы математики для Data Science

    Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и векторы. Научитесь работать с математическими сущностями в Python-библиотеке SymPy.

  • Основы статистики и теории вероятностей

    Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез.

  • Возможность стажировки

    Базовых знаний и навыков хватит, чтобы устроиться на стажировку — сможете продолжить учиться на курсе и в компании одновременно.

  • Вводный блок

    Узнаете, чем занимается Data Engineer, какую роль играет в Data Science проекте и какие у него пути карьерного развития. Поймёте, как построен курс и какие темы вы будете изучать.

  • SQL

    • Научитесь манипулировать данными в существующих таблицах, выполнять операции вставки, очистки и обновления данных. Сможете сохранять данные из БД в различные форматы;
    • Познакомитесь с оконными функциями и основами подготовки витрин данных, использующих SQL. Научитесь обеспечивать корректную вставку информации в режиме транзакции. Сможете читать и понимать лог транзакций;
    • Узнаете, что такое индексы и архитектура индексов, где они применяются. Изучите методы ускорения запросов.
  • Python. LVL 2

    Рассмотрите типы данных, возможности их преобразования и принцип совместной работы Python и SQL — получение данных из БД, работа с данными и выполнение запросов. Изучите основные понятия схем данных JSON и XML. Сможете настраивать отладку приложений, писать тесты, обезличивать и шифровать данные.

  • Библиотеки для Python

    Узнаете, что такое библиотеки для работы с графиками, обучение с учителем, визуализация метрик и источники датасетов. Научитесь использовать Python и библиотеки для работы с данными. Сможете продолжить изучение Pandas.

  • Airflow

    Рассмотрите ключевые понятия и практики по работе с Airflow. Изучите архитектуру и основы взаимодействия от UI до CLI. Построите свой первый data pipeline.

  • Основы Spark

    • Освоите Spark: узнаете, какими ресурсами вычислений он оперирует, как хранит данные и работает с памятью и диском. Развернёте свой первый локальный стенд;
    • Изучите основы RDD: базовые концепции, работу с источниками, actions. Научитесь работать с Dataframe API. Изучите вопросы производительности и оптимизации при использовании Dataframe, источники и типы данных, работу с валидными/невалидными данными, обработку ошибок, UDF, взаимодействие с Python и SQL.
  • Основы алгоритмов Machine Learning

    Разберёте основные виды моделей машинного обучения, ключевые термины и определения. Изучите алгоритмы регрессии и алгоритмы кластеризации.

  • Deployment

    • Изучите основные этапы подготовки модели к деплою, подходы к построению API и способы обработки ошибок и отладки приложений. Сможете устранять проблемы при деплое и освоите основные инструменты swagger;
    • Познакомитесь с ключевыми процессами bash: написанием скриптов, работой с переменными и текстовыми редакторами sed и awk.
  • Введение в Data Science

    Закрепите новые знания на индивидуальном проекте — пройдёте путь от загрузки данных до внедрения модели. Решите задачи дата-инженера, ML-инженера и дата-аналитика, чтобы определиться со специализацией.

  • Data Engineer

    Итоговый проект уровня Junior. Проведёте когортный анализ и выгрузите справочники по API. Построите дашборды по полученным данным.

  • Карьера разработчика: трудоустройство и развитие

    Узнаете, как выбрать подходящую вакансию, подготовиться к собеседованию и вести переговоры с работодателем. Сможете быстрее получить должность, которая соответствует вашим ожиданиям и умениям.

  • Система контроля версий Git

    Научитесь версионировать изменения в коде, создавать и управлять репозиториями, ветками, разрешать конфликты версий. Узнаете полезные правила работы с Git.

  • Английский для IT-специалистов

    Получите языковые навыки, которые помогут пройти собеседование в иностранную компанию и комфортно общаться в смешанных командах.

Чему научат на курсе
Разворачивать Data Science проект
Тестировать код
Использовать инструменты анализа
О школе
Skillbox
рейтинг 4.5
71 отзыв
446 курсов
Skillbox

Платформу онлайн-образования Skillbox основали в 2016 году предприниматели Дмитрий Крутов, Сергей Попков и Игорь Коропов. В школе создают возможности для учёбы и развития без ограничений по географии и возрасту студента. 

Все образовательные программы составлены на основе актуальных тем и практических заданий, близких к рабочим задачам. Школа часто проводит бесплатные вебинары для знакомства с профессиями и обучением. Также на портале Skillbox студенты регулярно размещают отзывы о курсах.

Оставить отзыв
Оставьте свой отзыв
Так вы сделаете рейтинг школ более точным и поможете другим выбрать хороший курс

Информация носит ознакомительный характер и может отличаться от указанной на сайтах школ-партнёров. Актуальную стоимость и описание программ вы можете узнать на сайте школы.