Нейросети [Stepik] Машинное обучение - Подготовка данных (Модуль 1) (2024)

All-dar 220

All-dar

главный Администратор
Администратор
Регистрация
Февраль 19, 2018
Сообщения
4.025
Реакции
8.806
Автор: Stepik
Название: Машинное обучение - Подготовка данных (Модуль 1) (2024)

1745535930738.png

Описание

Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.

Программа курса

1. Введение

О курсе
Среда разработки

2. Сбор данных с использованием парсинга
Выбор источника данных
Выбор метода парсинга
Определение целевых данных
Разработка скрипта парсинга
Библиотека прасинга датасета

3. Обзор данных
Обзор датасета
Библиотеки для анализа данных

4. Очистка данных
Важность и цель очистки данных.
Устранение дубликатов
Методы заполнения пропущенных данных.
Целевая переменная
Входные параметры

5. Валидация данных
Проверка качества данных после очистки и обработки
Проверка точност на моделях
Анализ важности признаков

6. Кластерный анализ
Понижение размерности
Кластерный анализ
Добавление новых параметров
Оценка качества модели после применения кластеризации

7. Нормализация и стандартизация данных
Приведение данных к единообразному формату.
Преобразование категориальных признаков.
Оценка качества модели после нормализации модели

8. Балансировка данных
Статистический анализ
Балансировка данных

Автор: Алексей Кожакин
Мне очень нравится помогать ученикам, изучающим Python, разбираться в сложных моментах и показывать наилучший путь изучения программирования, чтобы они могли стать успешными разработчиками.

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.