ИИ от Microsoft заговорил по-человечески

ИИ от Microsoft заговорил по-человечески
28.09.2018
10527

В Microsoft сделали записи компьютерного голоса, который имитирует человеческую речь. Добиться результата удалось с помощью нейронных сетей. В будущем нейросеть обучат 49 языкам и внедрят технологию создания собственных голосов.

Синтез речи

Для того, чтобы ИИ заговорил по-человечески, нейронные сети сравнивают ударение, протяженность речи говорящего и синтезируют это в компьютерный голос. Обычно синтез происходит в два этапа: сначала производится акустический анализ, затем лингвистический, далее результаты объединяются. Но в Microsoft решили объединить два процесса в один, что позволило избавиться от «механичности» в голосе нейросети. Синтез осуществляли на базе вычислительных мощностей облачной платформы Azure.

Сейчас доступно лишь два голоса – мужской Guy и женский Jessa.

Разработчики и предприниматели уверены, что новый синтез позволит сделать общение человека и ИИ (виртуальных собеседников и электронных помощников) более естественным. Уже появились предложения об использовании технологии Microsoft для конвертации электронных книг в аудиокниги.

Напомним, что решение от Microsoft – не единственное в своем роде. В августе корпорация Google также представила функцию облачного синтеза речи Cloud Speech-to-Text: технология умеет расшифровывать аудиозапись и переводить ее в текст.

 

Сравнение синтеза речи от Microsoft с традиционным

 

Другие наработки Microsoft

Одним из первых творений Microsoft в сфере ИИ стала система распознавания эмоций в речи. Она способна анализировать текст и оценивать его по шкале от 0 до 100% – от негативных окрасок до самых позитивных.

Но были у корпорации и промахи. Например, в 2016 году в Microsoft представили искусственный интеллект, способный общаться с людьми. Чтобы ИИ чему-то научился у человека, его загрузили в Twitter, но через несколько часов технологию из соцсети пришлось убрать. Люди научили ИИ слишком плохому. Тау, как назвали разработку в корпорации, начала поддерживать Гитлера, нацизм и грязно обругала американское правительство.

Что ИИ умеет еще?

В университете имени Джона Хопкинса (США) собираются использовать искусственный интеллект для определения первичных стадий рака. Нейросети помогут оперативно и точно поставить диагноз пациенту, чтобы назначить соответствующее лечение.

Исследователи из Индии и Англии разработали специальный алгоритм распознавания лиц. Он настолько хорош, что способен узнать человека, даже если его лицо будет замаскировано. Система работает на машинном обучении и нейронных сетях, которые идентифицируют людей с помощью определения ключевых точек – уголков губ, бровей и т.д. После этого ведется поиск открытого лица в базе данных.

В Германии разработали систему EnhanceNet-PAT, которая позволяет улучшить качество фотографий в несколько раз. Искусственный интеллект подбирает схожие пиксели и подставляет их в изображение. Если картинка получается нечеткой, начинается поиск схожих изображений. Для ИИ ученые загрузили огромное количество картинок-примеров как в низком разрешении, так и в высоком, чтобы компьютер смог учиться на своих ошибках и больше их не допускать.

Автор:
Обозреватель

См. также

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    878    user1915669    0       

2

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    992    AnastasiaKl    0       

1

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    2218    AnastasiaKl    3       

3

ИИ-помощник для разработчиков GitHub Copilot теперь не только в реальном времени анализирует код, предлагает варианты для его улучшения и помогает найти решение проблем в разработке, но и  показывает ссылки на репозитории, из которых взят код. 

17.08.2023    1568    VKuser24342747    0       

1

JetBrains представила нейросеть Ask AI для онлайн-блокнота Datalore. Виртуальный ассистент способен генерировать код на нескольких языках, предлагать доработки и упрощать процесс аналитики данных. 

16.08.2023    1141    VKuser24342747    0       

1

Чат-бот OpenAI ошибается в 52% случаев, когда отвечает на вопросы по программированию. Однако делает это так убедительно, что пользователи не замечают ошибки. 

14.08.2023    3800    VKuser24342747    5       

3

«Сбер» предоставил свободный доступ к языковой модели ruGPT-3.5, предназначенной для генерации текста на русском языке. Кроме того, стала доступна нейросеть mGPT, поддерживающая 61 язык, включая языки СНГ и малых народов России.

25.07.2023    1418    VKuser24342747    1       

2

GitLab представила собственную нейросеть Code Suggestions, способную генерировать код по запросу на естественном языке. ИИ-помощник поддерживает работу с 13 языками программирования.

10.07.2023    1758    VKuser24342747    0       

1

В каких сферах применение ИИ будет для вас наиболее полезным?


Медицина (57.89%, 11 голосов)
57.89%
Автоматизация производства (47.37%, 9 голосов)
47.37%
Транспорт и логистика (36.84%, 7 голосов)
36.84%
Информационные технологии (36.84%, 7 голосов)
36.84%
Развлечения (26.32%, 5 голосов)
26.32%
Образование (21.05%, 4 голосов)
21.05%
Бытовые услуги (15.79%, 3 голосов)
15.79%
Наука (10.53%, 2 голосов)
10.53%
Другое (в комментарии) (5.26%, 1 голосов)
5.26%

Комментарии

Инфостарт бот
1. пользователь 28.09.18 14:41
Сообщение было скрыто модератором.
...
2. PerlAmutor 28.09.18 17:26 Сейчас в теме

Оставьте свое сообщение