Новый метод машинного обучения CatBoost, позволяет обучать модели на разнородных данных, таких как местонахождение пользователя, тип устройства, история операций и т.д.
Библиотека машинного обучения выложена в открытый доступ и ее могут использовать все желающие.
CatBoost является усовершенствованной версией метода Матрикcнет, задействованного почти во всех сервисах «Яндекса». Также как и Матрикснет, в CatBoost используется механизм градиентного бустинга, который хорошо подходит для работы с разнородными данными. Однако в отличие от метода-предшественника, CatBoost учитывает не только числовые данные - например, виды облаков или типы зданий. Если раньше такие данные приходилось переводить в цифровой формат, что могло изменить их суть и повлиять на точность работы модели, то теперь они могут использоваться в первоначальном виде. Благодаря этому новый метод дает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. При этом CatBoost можно применять в самых разных областях – от банковской сферы до промышленности, сообщается в пресс-релизе компании.
Чтобы начать работу с библиотекой, достаточно установить ее на свой компьютер. Она поддерживает операционные системы Linux, Windows и macOS, доступна на языках программирования Python и R.
Также «Яндекс» разработал программу визуализации CatBoost Viewer, которая позволяет отслеживать процесс обучения на графиках. Скачать CatBoost и CatBoost Viewer можно на GitHub.
«Яндекс» выложил в открытый доступ новую библиотеку машинного обучения
См. также
Не найдено ни одной записи.
Комментарии
Сортировка:
Древо развёрнутое
Свернуть все