«Яндекс» выложил в открытый доступ новую библиотеку машинного обучения

18.07.2017      20512
Новый метод машинного обучения CatBoost, позволяет обучать модели на разнородных данных, таких как местонахождение пользователя, тип устройства, история операций и т.д.

Библиотека машинного обучения выложена в открытый доступ и ее могут использовать все желающие.

CatBoost является усовершенствованной версией метода Матрикcнет, задействованного почти во всех сервисах «Яндекса». Также как и Матрикснет, в CatBoost используется механизм градиентного бустинга, который хорошо подходит для работы с разнородными данными. Однако в отличие от метода-предшественника, CatBoost учитывает не только числовые данные -  например, виды облаков или типы зданий. Если раньше такие данные приходилось переводить в цифровой формат, что могло изменить их суть и повлиять на точность работы модели, то теперь они могут использоваться в первоначальном виде. Благодаря этому новый метод дает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. При этом CatBoost можно применять в самых разных областях – от банковской сферы до промышленности, сообщается в пресс-релизе компании. 

Чтобы начать работу с библиотекой, достаточно установить ее на свой компьютер. Она поддерживает операционные системы Linux, Windows и macOS, доступна на языках программирования Python и R.

Также «Яндекс» разработал программу визуализации CatBoost Viewer, которая позволяет отслеживать процесс обучения на графиках. Скачать CatBoost и CatBoost Viewer можно на GitHub.



Автор:
Редактор ленты новостей


См. также

Не найдено ни одной записи.
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. milkers 2894 18.07.17 16:42 Сейчас в теме
Где бы найти побольше информации по CatBoost, желательно с примерами сборки и обучения
2. Stepa86 1530 18.07.17 17:15 Сейчас в теме
(1) Пока нигде похоже, судя по хабру
3. ph_1984 21 18.07.17 17:44 Сейчас в теме
4. ccserg 64 19.07.17 09:37 Сейчас в теме
ничего не понял , что сие за штука
5. bubus 19.07.17 11:12 Сейчас в теме
в CatBoost используется механизм градиентного бустинга - спасибо! Теперь все стало понятно.
Оставьте свое сообщение