Ho Lee Fuk

Сенсей
🛡 МОДЕРАТОР 🛡
Регистрация
22 Февраль 2018
Сообщения
11.084
Автор: stepik

Название: Практический Machine Learning (2023)

1690078705099-png.108862


Описание:

Чему вы научитесь

- Изучите классические и современные алгоритмы машинного обучения
- Повторите или освоите математические подходы, необходимые для анализа данных

О курсе

После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.

Важно! Курс находится в процессе наполнения.

Программа курса

Организация курса

- О курсе
- Инструменты
- Kaggle

Знакомство с машинным обучением

- Введение
- Основные понятия машинного обучения
- Типы задач в машинном обучении
- Схема проекта по машинному обучению
- Оценка обобщающей способности модели
- Домашнее задание
- Разведочный анализ данных

Линейные модели регрессии

- Основы линейной регрессии
- Регуляризация
- Практические особенности линейной регрессии
- Feature engineering
- Метрики качества регрессии
- Домашнее задание

Линейные модели классификации - 1

- Переход от регрессии к классификации
- Задача оценивания вероятностей, логистическая регрессия
- Базовые метрики классификации
- Домашнее задание

Линейные модели классификации - 2

- Метод опорных векторов
- Ядровой метод опорных векторов
- Продвинутые (интегральные) метрики классификации
- Домашнее задание

Многоклассовая классификация

- Многоклассовая и multilabel-классификация
- Метод ближайших соседей
- Быстрый поиск соседей
- Калибровка вероятностей

Решающие деревья и их композиции

- Решающее дерево
- Тонкости решающих деревьев
- Разложение ошибки на смещение и разброс
- Бэггинг. Случайный лес
- Бустинг. Градиентный бустинг над решающими деревьями
- Современные имплементации градиентного бустинга

Обработка признаков и работа с выбросами

- Работа с пропущенными значениями
- Поиск аномалий
- Кодирование категориальных признаков

Снижение размерности данных

- Методы отбора признаков
- Метод главных компонент
- Сингулярное разложение
- Линейный дискриминантный анализ
- Методы визуализации данных

Кластеризация данных

- K-means
- Иерархическая кластеризация
- DBSCAN, HDBSCAN
- Метрики качества кластеризации
- Графовая кластеризация

Интерпретируемость ML-моделей

- SHAP
- LIME

Рекомендательные системы и ранжирование

- Коллаборативная фильтрация
- Матричные разложения
- Факторизационные машины
- ML-подход
- Метрики качества ранжирования и рекомендаций
- Ранжирование

AutoML

- Автоматический подбор гиперпараметров: Optuna
- Фреймворк для AutoML – H2O
- Обзор других фреймворков (TPOT, auto-sklearn, MLBox)

Прогнозирование временных рядов

- Особенности работы с временными рядами
- Статистические методы прогноза временных рядов
- Адаптивные модели
- Прогнозирование временных рядов с помощью ML
- Библиотеки для анализа временных рядов: prophet

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.

Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.


Скрытый контент для пользователей All-dar.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Сверху