Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих …
Разборы патентов
Яндекс патентует механизм кросс-ресурсного ранжирования. Система анализирует, как пользователь (или похожие на него пользователи) взаимодействовал с другими ресурсами (например, поисковой выдачей), чтобы определить его предпочтения. Затем эти данные используются для …
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, …
Google использует поведенческие данные для определения семантической связи между запросами и изображениями. Если пользователи часто кликают на одни и те же изображения в ответ на два разных запроса (даже на …
Патент Google описывает, как система определяет лучший способ отображения результатов поиска (карта, таймлайн, галерея) на основе свойств сущностей в Knowledge Graph. Также раскрывается механизм ранжирования результатов по «модифицирующим концепциям» — …
Google использует метод Latent Collaborative Retrieval (LCR) для персонализации поиска. Система создает векторные представления (эмбеддинги) для текущего запроса пользователя и его долгосрочного профиля (история, предпочтения). Эти векторы приводятся к единой …
Google использует анализ «избыточных запросов» (тем, которые ищут в регионе значительно чаще, чем в среднем по стране) для определения поведенческой схожести географических локаций, независимо от расстояния. Это позволяет Google переносить …
Google использует систему для автоматического извлечения пар Вопрос-Ответ из веб-документов, форумов и логов чатов. Система создает два репозитория: один для точных совпадений вопросов, другой для ключевых слов. Это позволяет предоставлять …
Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может …
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие …
Google использует статистическую модель, обученную на исторических данных (например, CTR/CVR), для переоценки релевантности параметров контента (ключевых слов, тем). Система не оценивает параметры изолированно, а анализирует их взаимодействие и совместную встречаемость …
Google использует анализ уточнений запросов (refinements) для определения тематической категории и интента. Система анализирует дополнительные слова (мета-термины), которые пользователи добавляют к исходному запросу. Если разные запросы уточняются схожим образом, система …
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или …
Google использует распределенную сеть агентов (браузеры, тулбары, скрипты на сайтах) для сбора детальной навигационной статистики и данных о поведении пользователей после перехода из поиска. Ключевым показателем является частота «завершения поисковой …
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой …
Google использует систему для индексации контента внутри нативных мобильных приложений (App Indexing). Для этого приложение запускается в виртуальной машине, которая эмулирует операционную систему устройства. Система перехватывает данные, отправляемые в процесс …
Анализ патента Google, описывающего систему ранжирования видеоконтента. Система вычисляет оценку релевантности, используя не только стандартные метаданные (название, описание), но и специфические "видео-ориентированные характеристики". К ним относятся данные о трансляциях (источник, …
Google классифицирует синонимы по степени надежности. Если синоним считается ненадежным или зависящим от контекста (Restricted-Locality Synonym), он вносит вклад в ранжирование, только если находится в документе в непосредственной близости к …
Google анализирует, какие изображения пользователи выбирают совместно в ответ на один и тот же запрос (co-click data) и что они ищут сразу после просмотра изображения (subsequent queries). На основе этих …
Яндекс патентует метод ранжирования, основанный на анализе визуального представления («Снимка») веб-страницы. Система использует модель машинного обучения (в частности, нейронные сети), обученную на оценках асессоров или поведении пользователей, для расчета «Коэффициента …

