Mozilla представила систему распознавания речи с открытым исходным кодом

Представленная технология работает на движке DeepSpeech с использованием одноименной архитектуры Baidu и платформы машинного обучения TensorFlow от Google.
Для обучения модели была использована база из 400 тыс. сообщений, общая продолжительность которых составила около 500 часов. База была собрана в рамках проекта CommonVoice, который привлек более 20 тыс. добровольцев. Собранный материал содержал большое количество голосовых фраз с различным речевым поведением, что позволило обучить систему распознавать речь на уровне, близком к человеческим показателям.
Как сообщается на официальном сайте Mozilla, коэффициент ошибок в словах в тестовом массиве данных LibriSpeech составил 6,5%. При этом уровень ошибок Google Speech составляет 6,64%, у Apple Dictation – 14,24%, а человек делает ошибки в среднем в 5,83% случаев.
В компании отметили, что идея проекта не только в создании новой модели для распознавания речи, но и в создании большого речевого корпуса с открытым исходным кодом, который затем можно будет использовать в крупных проектах.
Помимо модели по распознаванию речи система включает в себя модули для Python и NodeJS, упрощающие интеграцию системы в программные продукты, а также инструменты для командной строки.
Пока система распознает только английский язык, однако в первой половине 2018 года планируется начать формирование базы с примерами произношения фраз из других языков.
См. также
«Сбер» начнет использовать российские TLS-сертификаты для платежного шлюза
30.01.2023 1667 VKuser24342747 1
Минцифры подготовило правила отказа от передачи биометрических данных
24.01.2023 1133 VKuser24342747 0
Банки смогут получить право на передоверие полномочий по электронной подписи
20.01.2023 980 VKuser24342747 0
Минцифры подготовило правила аккредитации госорганов на владение информсистемами для биометрии
19.01.2023 1081 VKuser24342747 0
Национальная система пространственных данных начала работу в России
12.01.2023 1923 VKuser24342747 0
Оператором Единой биометрической системы стал «Центр Биометрических Технологий»
22.12.2022 2513 VKuser24342747 2
GitHub к концу 2023 года введет обязательную двухфакторную аутентификацию
21.12.2022 2154 VKuser24342747 0
«Яндекс» открыл доступ к фреймворку Yatagan для сборки Android-приложений
16.12.2022 2623 VKuser24342747 1
В России появится национальная издательская система вместо иностранных аналогов
15.12.2022 1846 VKuser24342747 0
Google рассказала о проблемах и преимуществах поддержки разработки на Rust в Android 13
14.12.2022 1899 VKuser24342747 0
Банки обяжут принимать оплату по картам «Мир» с QR-кодом в смартфоне
14.12.2022 2114 VKuser24342747 1
Госдума рассмотрит законопроект о создании Национального удостоверяющего центра
09.12.2022 1939 VKuser24342747 0
Госдума планирует отложить срок обязательного перехода на машиночитаемые доверенности
08.12.2022 2045 VKuser24342747 0
В декабре начнут действовать новые правила регистрации доменов .RU и .РФ
23.11.2022 2312 VKuser24342747 1
В ноябре начнется создание российского государственного аналога GitHub
19.10.2022 3490 VKuser24342747 14