Google начал учитывать контекст слов при русскоязычном поиске

Google начал учитывать контекст слов при русскоязычном поиске
13.12.2019
13066

Компания Google обновила алгоритмы для поиска по русскоязычным сайтам. Это крупнейший апдейт системы за последние пять лет. Его главная цель – улучшить результаты выдачи. 

Значительное нововведение

Google сообщил, что добавил алгоритм BERT в свою поисковую систему для веб-ресурсов на русском языке. Технология усовершенствует механизмы машинного обучения поисковика и позволит лучше понимать запросы пользователей благодаря комплексному анализу вводимых слов. По словам Панду Найака, вице-президента Google, это обновление стало крупнейшим за последние пять лет, а разработка самого алгоритма – грандиозный успех для всей компании. 

Технология BERT (Bidirectional Encoder Representations from Transformers) представлена Google в прошлом году. Она использует возможности нейросетей для предварительного обучения обработке текста на естественном языке. Алгоритм годится не только для формирования поисковой выдачи, но и создания любых других сервисов, работающих с пользовательским контентом по формуле «вопрос-ответ». 

С декабря этого года возможности BERT начали использоваться и для обработки русскоязычного сегмента Google. 

Как работает технология

Результат поиска зависит от того, какие ключевые слова заданы системе. Чаще всего поисковики просто формируют выдачу по релевантности контента сайтов в базе запросу пользователя. Однако такой подход достаточно ограничен в своих возможностях и не учитывает контекст используемых фраз.  

«Когда люди открывают страницу Google Поиска, они не всегда знают, как лучше сформулировать запрос: иногда они не могут подобрать нужные слова или не помнят, как пишутся те или иные термины», – поясняет проблему Панду Найк. 

Алгоритм BERT – это двунаправленная технология обработки языка. Она способна не только анализировать отдельные слова в поисковом запросе, но и учитывать порядок, интерпретировать их по отношению друг к другу. Подобная система гораздо лучше понимает, какая именно информация нужна пользователю вне зависимости от того, каким образом была составлена фраза. Алгоритм одинаково хорошо справляется с запросом и в формате набора ключевых слов, и в виде простых вопросов. 

В качестве примера работы технологии Google приводит результаты выдачи по запросу «Может ли преподаватель выгнать студента с занятия?». Старый алгоритм давал ответ на вопрос «Имеет ли преподаватель право не пустить студента на пару?», что имеет другой смысл. BERT обрабатывает фразу пользователя более правильно, помещая на первую строку подходящий контент. 

 

Что изменится для сайтов

Представители Google никак не прокомментировали влияние нового алгоритма на поисковый трафик для сайтов. Однако они уточнили, что результаты работы BERT должны повысить эффективность поиска по непопулярным низкочастотным запросам. Также технология будет задействована для формирования «нулевой» выдачи – случая, когда Google не может найти релевантные сайты и выводит наиболее близкие к запросу результаты. 

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:
Аналитик

См. также

Google выпустила новую версию мобильной ОС Android 14. Изменения затронули настройки внешнего вида и безопасности. Были расширены возможности камеры и инструментов для хранения данных.

12.10.2023    1293    VKuser24342747    0       

1

В версии Google Chrome 116 появится поддержка алгоритмов шифрования, устойчивых к попыткам дешифрации при помощи квантовых вычислений. Технология объединяет преимущества классической и инновационной криптографии.

24.08.2023    891    VKuser24342747    0       

1

По итогам внедрения поддержки разработки на Rust снизилось число уязвимостей, связанных с управлением памятью. Инженеры считают, что основное внимание нужно уделить написанию нового кода, а не переписыванию старого.

14.12.2022    7590    VKuser24342747    0       

3

Информационная система позволит российским сайтам получать сертификаты безопасности без участия иностранных организаций. Для их выдачи будет применяться отечественная криптография.

09.12.2022    6372    VKuser24342747    0       

0

Microsoft прекратила выпуск обновлений для своего браузера Internet Explorer, а с августа начнет удалять приложение из актуальных версий Windows. Эксперты полагают, что из-за этого пострадает много бизнес-пользователей.

17.06.2022    10203    VKuser24342747    4       

1

Российская компания BrandAnalytics запустила платформу «Детектор сбоев», предназначенную для отслеживания работоспособности сайтов и сервисов, в том числе русскоязычных.

16.06.2022    8370    VKuser24342747    0       

2

Информационная система под названием «Антифишинг» способна обнаруживать мошеннические веб-ресурсы, которые выглядят как официальные сайты госорганов, компаний и соцсетей.

14.06.2022    8686    VKuser24342747    0       

1

Национальный удостоверяющий центр (НУЦ) предложил владельцам сайтов получить сертификаты безопасности с поддержкой технологии прозрачности. Они работают в российских браузерах.

25.05.2022    7641    VKuser24342747    1       

2

Комментарии

Инфостарт бот
1. DenisCh 13.12.19 10:45 Сейчас в теме
Интересно, что он теперь будет выдавать на слово "сказочный" ? ))
MikhailDr; dimisa; mrChOP93; Dmitri93; +4 Ответить
3. MikhailDr 16.12.19 07:59 Сейчас в теме
(1)я даже знаю какая там будет картинка в выдаче
2. VmvLer 13.12.19 11:00 Сейчас в теме
Главная цель совсем другая и не только у гугла

Оставьте свое сообщение