Исходный код модели Facebook XLS-R выложили в интернет

27.01.2022      12770

Одна из самых мощных многоязычных моделей распознавания речи XLS-R теперь доступна всем разработчикам. Facebook опубликовала исходный код решения на GitHub и Hugging Face.

Зачем нужна модель

Технологии перевода с одного языка на другой в режиме реального времени уже появились в Google Translate, Skype и других приложениях. Но пока они доступны для небольшого количества языков, ведь модели искусственного интеллекта, которые лежат в основе таких технологий, обычно обучают на ограниченных наборах данных.

Появление XLS-R в открытом доступе может изменить ситуацию, считают в Facebook. Модель включает более 2 млрд параметров. Для адекватного представления многих языков количество параметров имеет решающее значение – это улучшает производительность и точность распознавания даже сильнее, чем тщательное предварительное обучение на одном языке.

Как устроена XLS-R

Основа модели с самопроверкой – технология wav2vec 2.0. Она умеет анализировать аудиозаписи и определять структуру разговора.

XLS-R получила для обучения 128 языков – это вдвое больше, чем у прошлой модели XLSR-53, представленной год назад. Новое решение обучали на открытых данных: 436 тыс. часов записей речи – от аудиокниг до парламентских заседаний. Это примерно в десять раз превосходит базу предшественницы.

XLS-R успешно протестировали в системах BABEL, CommonVoice и VoxPopuli для распознавания речи, CoVoST-2 по переводу с иностранного языка на английский и VoxLingua107 для определения языка. Это позволило измерить качественные характеристики модели на разных этапах обработки речи и в различных ситуациях.

Разработчики показали результаты тестов для разных языков в системе BABEL. Новая модель ощутимо уменьшила количество ошибок (серым показаны итоги тестирования для прошлогодней XLSR-53, зеленым – для новой XLS-R ):

Масштабирование межъязыкового предварительного обучения модели XLS-R в будущем позволит сделать точнее переводы на редкие языки, например, лаосский, суахили или тагальский. Для них доступно не так много аудиозаписей, а структура речи очень сильно отличается от английского, с которым работает большинство моделей.

В результате подобные решения смогут действительно понимать человеческую речь, переводить не слово в слово, а смысл в смысл – как профессиональные переводчики. В Facebook заявили, что смогут работать с 7 тыс. языков – и это позволит общаться людям из любых уголков планеты.


Автор:
Обозреватель


См. также

Новость ИТ-Новость

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024    678    user1915669    0       

2

Новость ИТ-Новость

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев IPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024    904    AnastasiaKl    0       

3

Новость ИТ-компания ИТ-Новость

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024    948    user1915669    2       

2

Новость Искусственный интеллект ИТ-Новость

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    601    user1915669    0       

2

Новость Дата-центры Искусственный интеллект ИТ-Новость

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    725    AnastasiaKl    0       

1

Новость ИТ-Новость

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    804    user1915669    0       

1

Новость Законодательство ИТ-Новость

Депутаты Госдумы работают над законопроектом по ужесточению контроля за электросамокатами. Среди мер: обязательная регистрация СИМ (средств индивидуальной мобильности) и разработка системы отслеживания их перемещений.

10.07.2024    772    AnastasiaKl    2       

1

Новость Искусственный интеллект ИТ-Новость

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    1658    AnastasiaKl    3       

3
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Оставьте свое сообщение