Компания открыла доступ к алгоритму SmartCaptcha, который защищает сайт от спама и DDoS-атак, а также к проекту YaLM 100B, способному писать тексты на английском и русском языках.
Защита от роботов
SmartCaptcha – сервис для предотвращения активности ботов, фиктивных регистраций, рассылки спама и DDoS-атак. Ранее его использовали только во внутренних проектах «Яндекса». Сейчас компания открыла доступ к «капче» для сторонних компаний – в Yandex Cloud новую функцию уже тестируют 30 клиентов. Для подключения сервиса нужно отправить запрос и дождаться его одобрения. Превью-версия – бесплатная.
Работа «капчи» основана на алгоритме машинного обучения. По словам разработчиков, сервис не приводит к падению трафика на сайте из-за отказа посетителей проходить тест – более 50% пользователей не увидят окно для ввода текста, достаточно будет отметить пункт «Я не робот».
Для дополнительной верификации SmartCaptcha генерирует случайные словосочетания. В отличии от других аналогичных сервисов, алгоритм не использует реальные картинки с текстом. «Капча» составляется из слов, используемых в сказках, чтобы сделать тесты «проще и добрее для пользователей».
Владельцам сайтов доступна кастомизация защиты – можно настроить уровень сложности текста, изменить фон, рамки и метки в интерфейсе.
Свободная генерация
«Яндекс» открыл доступ к еще одному продукту, основанному на машинном обучении – нейросети YaLM 100B, которая генерирует тексты на русском и английском языках. Разработчики утверждают, что это самая большая GPT-подобная модель, которая распространяется в свободном формате. Она содержит 100 млрд параметров. Проект выпущен под открытой лицензией Apache 2.0 и доступен на GitHub, поэтому его могут использовать все разработчики.
YaLM 100B обучена на суперкомпьютерах «Яндекса». Во время тренировки нейросеть обработала около 2 ТБ текстов на английском и русском языках из открытых источников. Подобные языковые модели можно использовать для генерации идей для рекламных кампаний, создания описаний для товаров и видеороликов, написания стихов и поздравлений, а также классификации их по стилю речи.
Нейросети семейства YaLM «Яндекс» использует в 20 собственных проектах. Результат работы нейросети можно встретить в «Поиске», голосовом помощнике «Алисе» и других сервисах.