Главная Компания Статьи Как лингвистика помогает поисковой системе понять пользователя?

Как лингвистика помогает поисковой системе понять пользователя?

Darvin Studio статьи - Лингвистика и поисковые системыВ рамках встречи в Европейском университете в Санкт-Петербурге один из основателей компании «Яндекс» Илья Сегалович провел семинар на тему «Как лингвистика помогает поисковой системе понять пользователя?».

Перед поисковой системой, во время обработки запроса пользователя, встает две задачи: правильно его понять и подобрать наиболее релевантные документы. Принципу выполнения первой из них и был посвящен доклад.

Приоритетной задачей, в таком случае, является помощь в составлении запроса. Для этого используется система поисковых подсказок, основной задачей которой является «понять» намерения пользователя и после того, как он введет уже 2-3 буквы в поисковую строку подбирать наиболее вероятные запросы. Над этой опцией в «Яндексе» работает целая команда лингвистов.

По словам Ильи, такие запросы на данный момент уже хорошо структурированы (касаемо вариантов с: «купить», «цена», «скачать»). Поэтому для системы в большинстве случаев не составляет проблемы подобрать необходимую выдачу. Далее следует подразделение запросов «по интересам». Для человека, проводящего много времени в соцсетях, при введении буквы «В» в поисковом окне первым результатом будет ссылка именно на популярную социальную сеть, а для увлекающегося музыкой — на исполнителей или музыкальные группы, названия которых начинаются с этой буквы. На данный момент существует 400 тысяч подразделений интересов и для каждого из них предусмотрен свой способ показа результатов.

Следующим этапом является определение языка запроса. Учитывается использование спецсимволов, ip адрес пользователя,  и язык интерфейса на его компьютере. Комплекс этих факторов помогает поисковику определить язык выдачи.

Третьим камнем преткновения является несовпадение языка запроса с языком искомого документа. Примером может быть песня, название которой на испанском, а текст — на английском языках.

Суть понимания поискового запроса по словам Ильи — в использовании всего комплекса его возможных интерпретаций, но и эта схема в некоторых случаях не может быть реализована (например, при поиске цитат).

Наверх