089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев


Дата: 20.06.2020 20:37:52 Просмотров: 72510 Длительность: 01:26:07
Поделиться:

Категории: Наука
089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев фото

PyData Moscow, 13 октября 2018 г.

Градиентный бустинг — метод машинного обучения, появление которого привело к прорыву в решении многих задач, включая поиск в интернете, создание рекомендательных систем и прогнозирование погоды. На протяжении многих лет он остаётся основным методом работы с неоднородными признаками, зашумлёнными данными и сложными зависимостями.

CatBoost — это библиотека градиентного бустинга с открытым исходным кодом. Она превосходит по качеству аналоги и имеет дополнительные преимущества. CatBoost поддерживает работу с категориальными признаками (например, жанрами музыки, ID устройства, URL и т. д.) без предобработки данных. У него очень хорошие дефолтные параметры, поэтому их не нужно настраивать для получения качественных моделей. А GPU-реализация CatBoost — самая быстрая среди общедоступных реализаций градиентного бустинга.

С возможностями библиотеки мы будем знакомиться на примере решения задачи классификации. Вместе мы пройдём все этапы построения модели прогнозирования и рассмотрим следующие темы:

- Выбор подходящих функций потерь и метрик для оптимизации.

Обучение модели.

- Визуализация процесса обучения и кросс-валидации.

- Работа со встроенным детектором переобучения.

- Выбор оптимального порога принятия решения.

- Важность признаков и интерпретация прогнозов модели.

- Применение обученной модели к тестовым данным.

Для участия мастер-классе нужен настроенный Jupyter Notebook с установленными библиотеками: catboos, ipywidgets, sklearn, matplotlib, shap.

Никита Дмитриев

Окончил механико-математический факультет МГУ и Школу анализа данных. В Яндексе занимается разработкой систем машинного обучения.

Другие материалы PyData Moscow –

Написать комментарий




Комментарии

vi wa
17.03.2019 20:18:27
Респект.
Jean Miklau
17.04.2019 12:41:54
43:20 roc-curve
Jean Miklau
11.03.2019 13:07:37
Для тех, кто хочет поиграться с параметрами -мотайте на 1:06:00
Олег Доход
30.12.2018 11:16:57
Мы получили число-границу принятия решений при помощи Trashhold. Как ее передать в модель?
Игорь Петров
12.03.2019 20:22:43
Где ноутбук взять? В репозитории CatBost не правильный лежит
Еще по теме
© 2019video.ru