«Яндекс» представил обновление «Вега» для своей системы поиска. В сервисе появилось более 1500 нововведений и улучшений. Главная особенность – функция экспертного поиска.
Не алгоритм, а человек
«Яндекс» и раньше привлекал энтузиастов для оценки качества выдачи по определенным вопросам. Чаще всего этими людьми были удаленные работники поисковика или пользователи «Толоки». Новое обновление делает шаг вперед в «очеловечивании» поиска – на некоторые запросы ответы будут писать приглашенные эксперты. Результаты выдачи со сторонних сайтов при этом никуда не пропадут.
Изменение коснется «сложных» вопросов, с которыми пользователи обращаются к «Яндексу». По словам Максима Загребина, руководителя сервиса «Поиск», для составления ответов компания будет привлекать практикующих медиков, юристов, ИТ-специалистов. Покрыты будут почти все интересы пользователей поисковика. Система опросов и других методов анализа позволит понять, насколько глубокого эксперт разбирается в своей теме.
В декабре 2019 года привлеченные специалисты обработали около 15% поисковых запросов. Загребин отмечает, что на базе ответов экспертов на сложные вопросы создается модель машинного обучения для более простых запросов, и благодаря этому возрастает качество результатов поиска в целом.
Кроме того, в выдачу будут включены ответы из сервиса «Яндекс.Кью», который образовался после слияния проектов «Яндекс.Знатоки» и TheQuestion.
Еще больше контекста
Обновление «Вега» изменило алгоритмы ранжирования результатов выдачи. Два года назад «Яндекс» представил систему «Королев», которая позволила поисковику учитывать контекст запросов пользователей. Сейчас эти факторы начали влиять в три раза сильнее.
К примеру, поисковая система научилась распознавать часть запроса, которую нельзя игнорировать при формировании выдачи. Если пользователь обращается к системе с вопросом «Какая норма давления у людей в 50 лет», то алгоритм учтет возрастные ограничения и понизит приоритет информации, которая касается людей младше или старше. Другой вариант использования усиленного ранжирования – предоставление более точного расписания движения транспорта, которое зависит от направления движения, указанного в запросе.
Подобный алгоритм недавно добавлен и в Google.
Семантический поиск
База «Яндекса», в которой хранятся результаты работы поисковых ботов, представляет собой контент-систему, разбитую на несколько частей. Когда пользователь обращается к ней с запросом, поиск происходит одновременно в нескольких сегментах.
Затем более сложный и ресурсоемкий алгоритм фильтрует полученные результаты и отбирает из них наиболее подходящий контент. При этом учитывается около 1000 факторов ранжирования, которые и формируют окончательные 10 ссылок, которые видит пользователь.
«Вега» значительно обновила эту систему, добавив в нее сортировку документов по семантической близости. Базовый поиск происходит только в близких по смыслу частях базы. Такой подход уменьшает количество результатов, которые попадают на обработку «тяжелому» алгоритму, и снижает нагрузку на сервер. Это позволяет хранить на нем в два раза больше контента.
Гиперлокальность
Сервис «Яндекс.Район», предназначенный для обсуждения местных событий, выходит из бета-теста. Он помогает жителям соседних домов решать в онлайне свои проблемы: искать пропавших животных, размещать частные объявления, знакомиться. Теперь содержимое «Района» будет показываться и в результатах поиска.
Аналогичным образом начнет работать сервис «Яндекс.Услуги». После обновления объявления пользователей начнут отображаться на карте и учитываться при формировании выдачи.
Другие обновления:
- более быстрое формирование быстрых ответов на простые вопросы;
- предзагрузка результатов выдачи по поисковым подсказкам;
- ускоренная генерация «турбо-страниц», которая позволяет пользователю быстрее загрузить содержимое веб-ресурса из выдачи;
- улучшенная обработка часто меняющегося контента на сайте, например, комментариев.