Главная
/
Каталог
/
Анализ данных на языке Python

Анализ данных на языке Python

Познакомьтесь с языком Python, научитесь анализировать большие объёмы данных с его помощью, освойте основы машинного обучения

120 000
Анализ данных на языке Python
Ближайший старт
1 октября
Формат обучения
Онлайн (с преподавателем)
Длительность программы
10 месяцев
Занятость
2-4 раза в неделю по 4 ак. часа

Аналитик данных (или дата-аналитик) — специалист, который занимается сбором, обработкой и анализом больших объемов данных для получения новых знаний и решений.
Он использует методы машинного обучения, статистики и других областей науки для создания моделей, которые могут предсказывать поведение данных или выявлять закономерности. Аналитик данных может работать в различных областях: финансы, медицина, маркетинг, производство.

  1. Диплом Санкт-Петербургского политехнического университета Петра Великого — ведущего вуза страны
  2. Преподаватели-практики с большим опытом
  3. Обучение заканчивается защитой собственного проекта на основе реальных данных

Кому подойдет программа

Новичкам в анализе данных

Чтобы начать работу в сфере анализа больших данных или машинного обучения

Специалистам из смежных профессий

Маркетологам, бизнес-аналитикам, менеджерам и продуктовым аналитикам - всем, кто работает с данными

Студентам технических и экономических специальностей

Чтобы получить дополнительную специальность, знания Python, Data Science и Machine Learning

Что вы будете уметь по окончании программы?

1
Сбор, обработка, анализ и визуализация данных с помощью Python
2
Опыт работы с библиотеками Pandas, NumPy, Plotly, Matplotlib, Seaborn
3
Проводить исследовательский анализ и применять статистические тесты
4
Применение основных моделей и алгоритмов машинного обучения для работы с данными

Специальности и направления деятельности выпускников программы

Аналитик данных
Маркетинговый аналитик
Финансовый аналитик

Программа

Основы программирования на языке Python
40

Тема 1. Введение в программирование на языке Python в среде Jupyter Notebook
Тема 2. Логические операторы и операции над строками.
Тема 3. Модули.
Тема 4. Методы.
Тема 5. Списки и преобразование типов.
Тема 6. Циклы и обработка входных данных.
Тема 7. Множества, кортежи, словари.
Тема 8. Обработка исключений и работа с файлами.
Тема 9. Основы объектно-ориентированного программирования.
Тема 10. Открытые данные.

Основы баз данных
32

Тема 1. Введение в базы данных и СУБД.
Тема 2. Основы языка SQL. Написание простых запросов.
2.1 Основы языка SQL.  Написание простых запросов. 
2.2 Базовые типы данных PostgreSQL. Встроенные функции.
Тема 3. Запросы к нескольким таблицам.
3.1 Фильтрация записей.
3.2 Запросы к нескольким таблицам.
Тема 4. Запросы с группировкой.
Тема 5. Использование подзапросов.
Тема 6. Использование оконных функций.

Инструменты анализа данных
24
Тема 1. Работа с NumPy и Pandas.
Тема 2. Описательная статистика данных.
Тема 3. Типы переменных в данных.
Тема 4. Проверка статических гипотез.
Методы машинного обучения
40
Тема 1. Линейная регрессия.
Тема 2. Градиентный спуск, метрики для задач регрессии.
Тема 3. Полиномиальная регрессия, переобучение/недообучения моделей, L1 и L2 регрессии.
Тема 4. Логистическая регрессия, метрики для задач классификации, экспоненциальное семейство распределений, обобщенная линейная модель.
Тема 5. Теорема Байеса, наивный байесовский классификатор.
Тема 6. Дерево решений, машина опорных векторов.
Тема 7. Ансамбли (войтинг, бекинг, бустинг, стейкинг).
Тема 8. Сверточные нейронные сети.
Тема 9. Рекуррентные нейронные сети.
Тема 10. Трансформеры.
Тема 11. Методы кластеризации.
Конструирование признаков и оптимизация моделей машинного обучения
32
Тема 1. Методы трансформации признакового пространства (метод главных компонент, случайные проекции, Manifold learning).
Тема 2. Методы уменьшения признакового пространства (дисперсионный анализ, корреляционный анализ, отбор признаков, SHAP-анализ).
Тема 3. Подбор гиперпараметров моделей машинного обучения.
Прогнозирование временных рядов
32
Тема 1. Стационарность временных рядов, авторегрессия.
Тема 2. Модели экспоненциального сглаживания (модель Хольта, модель Унтирса, модель Тейла-Вейджа).
Тема 3. Классические модели временных рядов (ARIMA, SARIMA, SARIMAX, VAR, ARCH).
Тема 4. Современные модели временных рядов (модель пророка, модель LSTM).
Тема 4. Деплой моделей МО на локальном сервере.

Диплом о профессиональной переподготовке Санкт-Петербургского политехнического университета Петра Великого

Документ об окончании курса

Санкт-Петербургский политехнический университет Петра Великого — крупнейший технический вуз страны, опирающийся на традиции сильнейших научных школ, создающий прорывные технологии для российской экономики и промышленности. В рейтинге университетов России СПбПУ неизменно занимает ведущие позиции. Политехнический университет стремится с максимальной ответственностью реализовывать ключевую цель в сфере высшего образования — создание новой экономики: экономики знаний, лидерства и инноваций. И ключевым звеном здесь становятся высококвалифицированные кадры, владеющие передовыми мировыми технологиями, способные решать новые комплексные задачи промышленности и готовые вывести российскую экономику на новый уровень развития.

Мы всегда на связи
Румянцева Екатерина
Румянцева Екатерина
Специалист