Mozilla представила систему распознавания речи с открытым исходным кодом

Представленная технология работает на движке DeepSpeech с использованием одноименной архитектуры Baidu и платформы машинного обучения TensorFlow от Google.
Для обучения модели была использована база из 400 тыс. сообщений, общая продолжительность которых составила около 500 часов. База была собрана в рамках проекта CommonVoice, который привлек более 20 тыс. добровольцев. Собранный материал содержал большое количество голосовых фраз с различным речевым поведением, что позволило обучить систему распознавать речь на уровне, близком к человеческим показателям.
Как сообщается на официальном сайте Mozilla, коэффициент ошибок в словах в тестовом массиве данных LibriSpeech составил 6,5%. При этом уровень ошибок Google Speech составляет 6,64%, у Apple Dictation – 14,24%, а человек делает ошибки в среднем в 5,83% случаев.
В компании отметили, что идея проекта не только в создании новой модели для распознавания речи, но и в создании большого речевого корпуса с открытым исходным кодом, который затем можно будет использовать в крупных проектах.
Помимо модели по распознаванию речи система включает в себя модули для Python и NodeJS, упрощающие интеграцию системы в программные продукты, а также инструменты для командной строки.
Пока система распознает только английский язык, однако в первой половине 2018 года планируется начать формирование базы с примерами произношения фраз из других языков.
См. также
Российский разработчик создал неофициальную версию Clubhouse для Android
вчера в 13:27 1666 VKuser24342747 0
Масштабное обновление Trello: пять новых видов досок и интеграция с Google Docs
25.02.2021 2625 user1015646 0
Видеоигра на базе нейросетевого генератора текстов стала бизнес-консультантом
25.02.2021 1608 VKuser24342747 1
В ближайшие годы возрастет потребность в персонале центров обработки данных
24.02.2021 1858 SKravchenko 0
Rustоманы из Долины: Google, Microsoft, Huawei, Mozilla и AWS основали фонд поддержки языка программирования
16.02.2021 1584 user1015646 0
Украинская команда FireWay одержала победу в хакатоне NASA Space Apps Challenge 2020
05.02.2021 1924 SKravchenko 2
Microsoft участвует в разработке цифрового паспорта вакцинации от Covid-19
02.02.2021 1727 capitan 3
Что нового в Chrome 88: проверка надежности паролей и поддержка профилей
01.02.2021 2187 user1015646 0
280 символов для науки: Twitter откроет доступ ученым к архиву твитов
29.01.2021 1468 VKuser24342747 1