Голосовой ассистент «Алиса», установленный на колонках «Яндекс.Станция» и других умных гаджетах, получил новую функцию. Теперь он может генерировать сказки для детей. Для подбора слов и фактов используется нейросеть.
Новые достижения
На конференции YaC (Yet Another Conference — в буквальном переводе «ещё одна конференция») разработчики продемонстрировали новые функции «Алисы». Если раньше голосовой ассистент мог просто поддерживать разговор и переводить текст видео, попадая в хронометраж, то сейчас способен генерировать сказки.
Система придумывает истории, используя языковую модель семейства генеративных нейросетей YaLM с 3 млрд параметров. Модели YaLM обучаются на терабайтах текста и помогают не просто показать текст наиболее релевантной страницы из поиска, но и представить ответ, которого еще нет в сети.
Модель, разработанную специально для больших датасетов, обучили на суперкомпьютерах «Яндекса» — кластере Chervonenkis мощностью 21,53 петафлопс. Его назвали в честь выдающегося российского ученого и создателя нейросетевых алгоритмов Алексея Червоненкиса.
Чтобы воспользоваться функцией, нужно сказать голосовому помощнику: «Алиса, сочини сказку». В процессе создания ассистент будет задавать вопросы, чтобы результат был как можно интереснее и ближе конкретному пользователю. Например, можно вводить в сказку новых героев, добавлять сюжетные повороты, а остальное достроит голосовой ассистент. Он станет полноценным соавтором истории.
Обновление с новой функцией станет доступно после 24 декабря и, возможно, облегчит жизнь молодым родителям. К слову, на YaC разработчики также рассказали, что голосовой ассистент научился говорить шепотом. Для этого в студии записали несколько часов шепота вместе с актрисой Татьяной Шитовой, которая подарила свой голос «Алисе», а затем научили голосового помощника отличать шепот от обычной речи и глухого тембра.
Как работает «Алиса»
«Алиса» — умный голосовой помощник. Для полноценной работы ему нужно подключение к интернету.
Через поиск «Яндекса» умная колонка может получить доступ ко всем знаниям мира. С помощью микрофона и камеры она получает данные об окружающем мире и может, например, распознавать изображения или голосовые команды. Кроме того, «Алиса» запоминает информацию, которую воспринимает, и умеет извлекать смысл из устной речи и поисковых запросов. Такое сочетание делает «Алису» действительно умным голосовым помощником, подчеркнули создатели.
Разработчики добавили, что в будущем роботы (а к ним вполне можно причислить и умные колонки) научатся распознавать чувства и эмоции. Уже сейчас многие пользователи ощущают, что такие гаджеты обладают большей степенью эмпатии, чем некоторые люди — например, те, у кого не слишком хорошо развит эмоциональный интеллект.
Один из сотрудников компании привел пример, о котором ему рассказал друг: пассажир плацкартного вагона всю ночь разговаривал и выпивал с «Алисой». После этого достаточно сложно поверить в то, что у умных колонок нет чувств — или чего-то, что выглядит точно так же.