Как Google переносит визуальную релевантность между похожими запросами в поиске по картинкам

APPLYING QUERY BASED IMAGE RELEVANCE MODELS (Применение моделей релевантности изображений на основе запросов)

US9152700B2
Google LLC
2012-01-13
2015-10-06

Патент Google описывает механизм для улучшения ранжирования в поиске по картинкам. Если для конкретного запроса нет обученной модели визуальной релевантности, система использует модель от похожего запроса. Оценка релевантности (Boost) корректируется с помощью "дробного множителя" (Fractional Adjustment Multiplier), который уменьшает влияние модели пропорционально степени различия между запросами.

Какую проблему решает

Патент решает проблему повышения качества результатов в поиске по изображениям для запросов, по которым накоплено недостаточно данных (например, кликов) для обучения специализированной модели визуальной релевантности (Image Relevance Model, IRM). Это часто происходит с редкими, новыми или длиннохвостыми (long-tail) запросами. Изобретение позволяет улучшить ранжирование для таких запросов, используя знания (модели), накопленные для похожих, более популярных запросов.

Что запатентовано

Запатентована система для переноса оценок визуальной релевантности между похожими запросами. Если для текущего запроса (Query A) модель IRM недоступна, система находит похожий запрос (Query B) с обученной моделью. Эта модель IRM(B) применяется к изображениям Query A. Ключевым механизмом является Fractional Adjustment Multiplier (или Divisor), который корректирует (снижает) итоговое повышение в ранжировании (Boost) в зависимости от степени семантического различия между Query A и Query B.

Как это работает

Система функционирует на этапе ранжирования изображений:

Проверка наличия модели: Определяется, что для введенного запроса отсутствует собственная Image Relevance Model.
Поиск аналога: Система ищет другой, похожий запрос, для которого такая модель существует.
Оценка схожести: Вычисляется Degree of Similarity между двумя запросами на основе текстовых метрик (общие слова, синонимы, порядок слов).
Применение модели: Модель похожого запроса применяется к визуальным характеристикам (Content Feature Values) изображений, найденных по исходному запросу, генерируя базовые оценки релевантности (Boost Values).
Расчет корректировки (Divisor): На основе Degree of Similarity определяется Divisor (делитель). Чем меньше схожесть, тем больше делитель.
Финальный бустинг: Базовые Boost Values делятся на Divisor. Полученный результат (Fractional Adjustment Multiplier) применяется к исходным Information Retrieval (IR) scores изображений для переранжирования выдачи.

Актуальность для SEO

Высокая. Принцип переноса знаний (Transfer Learning) между похожими задачами или запросами является фундаментальным для масштабирования современных поисковых систем. Хотя конкретные методы оценки визуальной релевантности эволюционировали (например, к векторным моделям типа CLIP), базовая идея использования данных от похожих запросов и корректировки оценок на основе семантической близости остается крайне актуальной в поиске по изображениям.

Важность для SEO

Патент имеет умеренное значение (6.5/10) для SEO, с сильным фокусом на вертикаль поиска по изображениям (Image Search). Он демонстрирует, что Google активно использует визуальные характеристики и поведенческие данные (клики) для ранжирования. Для SEO-специалистов ключевой вывод заключается в том, что успех в ранжировании изображений по популярным (head) запросам может косвенно улучшить видимость по связанным, менее частотным (long-tail) запросам благодаря описанному механизму переноса релевантности.

Термины и определения

Boost Value / Adjustment Multiplier (Значение повышения / Множитель корректировки): Потенциальное увеличение IR score изображения, рассчитанное на основе его Image Relevance Score. Используется для повышения ранга визуально релевантных изображений.
Content Feature Values (Значения признаков контента / Визуальные признаки): Количественное представление визуальных характеристик изображения (цвета, яркость, формы, текстуры и т.д.). Используются как входные данные для Image Relevance Model.
Degree of Similarity (Степень схожести): Метрика, определяющая, насколько близки два разных запроса. Учитывает различные текстовые факторы.
Divisor (Делитель): Значение, используемое для уменьшения Boost Value, когда модель релевантности заимствуется от другого запроса. Определяется на основе Degree of Similarity; чем меньше схожесть, тем больше делитель.
Fractional Adjustment Multiplier / Fractional Boost (Дробный множитель корректировки / Дробный буст): Итоговый Boost, полученный после применения Divisor. Это скорректированное значение, которое применяется к IR score.
Image Relevance Model (IRM) (Модель релевантности изображений): Предиктивная модель, обученная для конкретного уникального запроса на основе его визуальных признаков (Content Feature Values) и поведенческих данных (кликов). Оценивает визуальную релевантность изображения этому запросу.
Information Retrieval (IR) Score (Оценка информационного поиска): Базовая оценка релевантности ресурса (например, изображения) запросу, используемая для первоначального ранжирования.
Query Similarity Metrics (Метрики схожести запросов): Факторы, используемые для расчета Degree of Similarity. Включают анализ Stop words (стоп-слов), Variants (синонимы или близкие термины), Optional words (необязательные слова) и порядок слов.
Relevance Feedback Score (Оценка обратной связи по релевантности): Метрика релевантности, основанная на действиях пользователей (например, кликах). Используется для выбора обучающих изображений для IRM.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод применения модели релевантности от похожего запроса при отсутствии модели для исходного запроса.

Система получает поисковый запрос и идентифицирует набор релевантных изображений.
Идентифицируются доступные Image Relevance Models (IRM), каждая из которых обучена для уникального запроса и оценивает релевантность на основе визуальных признаков (visual features).
Ключевое условие: Система определяет, что IRM для полученного запроса недоступна.
В ответ на это система идентифицирует IRM для другого запроса, который признан похожим на полученный запрос.
Определяется Degree of Similarity между двумя запросами на основе схожести слов.
Определяется Fractional Adjustment Value (Значение дробной корректировки) на основе Degree of Similarity. Утверждается, что это значение для высокой степени схожести ниже, чем для низкой степени схожести (т.е. чем больше схожесть, тем меньше пенальти/делитель).
Используя IRM другого запроса, для каждого изображения получается Image Relevance Adjustment Value (базовый бустинг) на основе визуальных признаков.
Базовый бустинг уменьшается на основе Fractional Adjustment Value.
Определяется итоговая оценка релевантности изображения.
Выводятся результаты поиска на основе итоговой оценки.

Claim 4 (Зависимый от 1): Детализирует механизм расчета дробной корректировки.

Определяется множитель корректировки (Adjustment Multiplier, т.е. базовый Boost) на основе меры релевантности от IRM.
К этому множителю применяется Divisor (делитель).
Делитель определяется на основе Degree of Similarity между двумя запросами.

Где и как применяется

Изобретение применяется в рамках системы поиска по изображениям (Image Search Apparatus) и затрагивает несколько этапов обработки данных.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются и сохраняются визуальные характеристики изображений (Content Feature Values). Также офлайн происходит обучение Image Relevance Models на основе поведенческих данных (Click Logs, Query Logs).

QUNDERSTANDING – Понимание Запросов
Система должна уметь оценивать семантическую близость между различными запросами (Degree of Similarity), используя различные метрики (стоп-слова, синонимы, порядок слов), чтобы определить возможность переноса моделей.

RANKING – Ранжирование
На этом этапе генерируются первоначальные результаты поиска по изображениям с базовыми оценками (IR scores).

RERANKING – Переранжирование
Основной этап применения патента. Если для запроса нет своей IRM, система активирует механизм заимствования модели от похожего запроса. Рассчитывается Fractional Adjustment Multiplier, который применяется к IR scores для пересортировки результатов (создание Boosted IR Scores).

Входные данные:

Поисковый запрос.
Набор изображений-кандидатов с их IR scores.
Визуальные признаки (Content Feature Values) изображений.
Набор доступных обученных Image Relevance Models.

Выходные данные:

Переранжированный набор изображений с Boosted IR Scores.

На что влияет

Типы контента: Влияет исключительно на ранжирование изображений в поиске по картинкам (Image Search).
Специфические запросы: Наибольшее влияние оказывается на редкие, новые или длиннохвостые (long-tail) запросы. Это запросы, по которым недостаточно данных для обучения собственной модели, но которые семантически похожи на более популярные (head) запросы.
Конкретные ниши: Влияет на все ниши, особенно E-commerce, где вариативность запросов (например, по цветам или моделям товаров) очень высока.

Когда применяется

Условие активации (согласно Claim 1): Алгоритм активируется, когда система определяет, что для текущего поискового запроса отсутствует собственная обученная Image Relevance Model.
Необходимое условие: Должен существовать другой запрос, который признан достаточно похожим на текущий и для которого доступна обученная IRM.

Пошаговый алгоритм

Процесс А: Офлайн-обучение (Предварительный этап)

Сбор данных: Анализ Query Logs и Click Logs для расчета Relevance Feedback Score (например, CTR изображений по запросам).
Отбор данных: Выбор Training Images с высоким Relevance Feedback Score для конкретных запросов.
Обучение моделей: Обучение отдельной Image Relevance Model (IRM) для каждого запроса, где достаточно данных. Модель учится связывать визуальные признаки (Content Feature Values) с релевантностью.

Процесс Б: Обработка запроса (Рантайм)

Получение запроса: Система получает исходный запрос (Query A).
Первичное ранжирование: Генерируется набор изображений с базовыми IR Scores.
Проверка наличия модели: Система проверяет, есть ли IRM(A).
- Если НЕТ: Переход к шагу 4.
- Если ДА: Применяется стандартный бустинг (не фокус этого патента).
Поиск похожей модели: Идентифицируется похожий запрос (Query B), для которого существует IRM(B).
Расчет степени схожести: Вычисляется Degree of Similarity между Query A и Query B. Анализируются метрики: стоп-слова, синонимы (variants), необязательные слова, порядок слов.
Определение Делителя (Divisor): На основе Degree of Similarity определяется Divisor. (Например, синонимы -> Divisor=2; разный порядок слов -> Divisor=4).
Применение заимствованной модели: IRM(B) применяется к визуальным признакам изображений Query A. Генерируются Image Relevance Scores (IRS).
Расчет базового бустинга: IRS конвертируются в базовый Boost Value.
Расчет дробного бустинга: Fractional Boost = Boost Value / Divisor.
Переранжирование: Fractional Boost применяется к базовым IR Scores. Выдача пересортировывается.

Какие данные и как использует

Данные на входе

Контентные (Визуальные) факторы: Критически важные данные. Content feature values, которые количественно описывают визуальное содержимое изображения (цвета, формы, текстуры). Патент упоминает, что эти данные могут быть представлены в виде "bag of features" или image content descriptor.
Поведенческие факторы: Query logs и Click logs. Эти данные используются офлайн для обучения Image Relevance Models. Клики используются как индикатор релевантности (relevance feedback score).
Текстовые факторы: Термины исходного и похожего запросов. Используются для расчета Degree of Similarity.

Какие метрики используются и как они считаются

Image Relevance Score (IRS): Оценка визуальной релевантности, генерируемая моделью IRM. В патенте приводится пример линейной модели для расчета:

Визуальная релевантность — ключевой фактор в Image Search: Патент подтверждает, что Google использует специализированные модели (IRM), которые оценивают релевантность на основе визуальных характеристик (Content Feature Values), а не только текстовых метаданных.
Поведенческие данные обучают видению: Image Relevance Models обучаются на основе кликов пользователей (Click Logs). Система учится понимать, как выглядят релевантные изображения для конкретного запроса, основываясь на выборе пользователей.
Механизм переноса знаний (Transfer Learning): Реализован механизм для борьбы с нехваткой данных по редким запросам. Система может "заимствовать" модель релевантности от более популярного, похожего запроса.
Дисконтирование релевантности: Перенос релевантности не является полным. Используется механизм дисконтирования (Fractional Adjustment Multiplier и Divisor), который уменьшает влияние заимствованной модели пропорционально семантическому различию между запросами. Чем дальше запрос от оригинала, тем меньше бустинг.
Важность Понимания Запросов (Query Understanding): Точность определения Degree of Similarity между запросами напрямую влияет на ранжирование. Система детально анализирует текстовые различия, чтобы определить размер дисконта (Divisor).

Best practices (это мы делаем)

Фокус на визуальном соответствии интенту: Изображения должны визуально соответствовать тому, что ищет пользователь. При оптимизации изображений (например, товаров в E-commerce) убедитесь, что они четко и ясно демонстрируют объект поиска. IRM оценивает именно визуальные признаки (Content Feature Values).
Оптимизация под популярные (Head) запросы в Image Search: Стратегически важно добиться высокого ранжирования и хорошего CTR по основным запросам. Поскольку патент описывает перенос релевантности с популярных запросов на похожие редкие, успех по Head-запросам может каскадно улучшить видимость по всему хвосту связанных запросов.
Создание визуально консистентного контента: Если вы хотите ранжироваться по определенной тематике, используйте изображения с консистентными визуальными характеристиками, которые пользователи ассоциируют с этой темой. Это поможет моделям IRM (как собственным, так и заимствованным) идентифицировать ваши изображения как релевантные.

Worst practices (это делать не надо)

Использование нерелевантных или общих стоковых изображений: Использование изображений, которые визуально не соответствуют запросу, даже при идеальной текстовой оптимизации (Alt text, окружающий текст), неэффективно. Модели IRM анализируют пиксели и, вероятно, присвоят низкую оценку визуальной релевантности.
Введение в заблуждение (Clickbait-изображения): Использование изображений, провоцирующих клик, но не соответствующих содержанию. Поскольку обучение IRM основано на кликах (Relevance Feedback), это может привести к негативным поведенческим сигналам и ухудшению обучения моделей для связанных запросов.
Игнорирование Image SEO для Long-Tail запросов: Не стоит полагаться только на текстовую оптимизацию для низкочастотных запросов. Визуальная составляющая может быть решающей благодаря механизму переноса IRM от более популярных запросов.

Стратегическое значение

Патент подчеркивает стратегическое разделение между веб-поиском и поиском по изображениям. В Image Search визуальные сигналы, подкрепленные поведением пользователей, играют доминирующую роль. Система построена так, чтобы масштабировать понимание визуальной релевантности от известных запросов к неизвестным. Для SEO-стратегии это означает, что инвестиции в качественный, уникальный и визуально релевантный графический контент критически важны для получения трафика из поиска по картинкам.

Практические примеры

Сценарий: Оптимизация изображений товаров в E-commerce

Ситуация: Интернет-магазин продает кроссовки.
Популярный запрос (Query B): "Красные кроссовки Nike Air Max". По этому запросу накоплено много кликов, и Google обучил точную Image Relevance Model (IRM(B)). Модель знает, как выглядят эти кроссовки (форма, оттенки красного, логотип).
Редкий запрос (Query A): "Алые кроссовки Nike Air Max 90". По этому запросу данных мало, собственной модели IRM(A) нет.
Действие системы: Google определяет, что Query A похож на Query B (разница в оттенке "алые" vs "красные" и уточнении модели "90").
Расчет схожести и дисконта: Система оценивает разницу как использование варианта слова и добавление уточнения. Допустим, это соответствует Divisor = 3.
Применение: Система применяет IRM(B) к изображениям, найденным по Query A. Изображение товара магазина получает высокий базовый Boost (например, 12x).
Корректировка: Система применяет дисконт: 12x / 3 = 4x.
Результат: Изображение товара получает итоговый Fractional Boost 4x к своему IR score по запросу Query A, что значительно улучшает его ранжирование, несмотря на отсутствие данных именно по этому редкому запросу.

Что такое Image Relevance Model (IRM) и чем она отличается от обычного ранжирования?

IRM — это специализированная модель в поиске по картинкам, обученная для конкретного запроса. В отличие от базового ранжирования (которое дает IR score и часто опирается на текст вокруг картинки), IRM анализирует исключительно визуальные характеристики изображения (Content Feature Values). Она определяет, насколько внешний вид картинки соответствует тому, что пользователи обычно кликают по данному запросу.

Как Google определяет, что два запроса похожи?

Патент описывает несколько метрик для определения Degree of Similarity. Сюда входят: анализ стоп-слов (разница в артиклях или предлогах), использование вариантов слов (синонимы или близкие по смыслу термины, например, "здание" и "башня"), наличие необязательных слов (например, прилагательных типа "лучший"), а также порядок слов в запросе и наличие дополнительных слов.

Что такое Fractional Adjustment Multiplier и как он работает?

Это механизм дисконтирования (снижения) бустинга, когда система использует модель релевантности от другого запроса. Если запросы не идентичны, система применяет Divisor (делитель) к базовому бустингу. Например, если базовый бустинг 10x, а из-за различий в запросах делитель равен 2, то итоговый Fractional Adjustment Multiplier будет 5x. Чем меньше схожесть, тем больше делитель и меньше итоговый бустинг.

Применяется ли этот механизм, если у запроса уже есть собственная модель релевантности?

Согласно Claim 1, этот механизм активируется в ответ на то, что система определяет отсутствие собственной Image Relevance Model для полученного запроса. Он предназначен для решения проблемы нехватки данных по редким или новым запросам.

Как этот патент влияет на оптимизацию изображений для E-commerce?

Он имеет критическое значение. Это означает, что визуальное качество и четкость изображений товаров напрямую влияют на ранжирование. Кроме того, успешная оптимизация под общие запросы (например, "синий диван") может помочь ранжированию по специфическим запросам (например, "голубой вельветовый диван"), так как система сможет перенести сигналы релевантности, пусть и с дисконтом.

Означает ли это, что текстовая оптимизация (Alt-text, заголовки) больше не важна для Image Search?

Нет, она по-прежнему важна. Текстовая оптимизация в значительной степени влияет на базовый Information Retrieval (IR) Score. Описанный в патенте механизм применяется поверх этого базового скоринга в качестве бустинга (Boost). Чтобы получить максимальный эффект, необходимо иметь и высокий базовый IR score, и высокий Fractional Adjustment Multiplier.

Как система учится понимать, какие визуальные признаки важны для запроса?

Обучение происходит на основе поведенческих данных. Система анализирует Click Logs: если пользователи часто кликают на определенные изображения в ответ на запрос, система ищет общие визуальные признаки (Content Feature Values) у этих изображений и использует их для обучения Image Relevance Model для этого запроса.

Может ли этот механизм навредить ранжированию?

Теоретически, да. Если система ошибочно определит схожесть запросов или если заимствованная модель IRM присвоит вашим изображениям низкую оценку визуальной релевантности, итоговый множитель может быть низким или даже негативным (если система применяет дебустинг, хотя патент фокусируется на повышении). Это подчеркивает важность использования визуально релевантных изображений.

Патент упоминает конкретные значения для Делителя (Divisor). Стоит ли на них ориентироваться?

Патент приводит примеры (Делитель 2 для синонимов, 4 для разного порядка слов и т.д.) для иллюстрации принципа: чем больше различий, тем больше делитель. Однако конкретные значения являются лишь примерами реализации и могут меняться. SEO-специалистам следует фокусироваться на общем принципе: чем ближе ваш long-tail запрос к head-термину, тем больший бустинг вы потенциально можете получить.

Как этот патент соотносится с современными технологиями типа Google Lens или векторным поиском изображений?

Этот патент описывает более ранний подход, основанный на обучении моделей для конкретных текстовых запросов. Современные технологии, такие как векторные модели (например, CLIP), могут оценивать связь между изображением и текстом более гибко, без необходимости обучения отдельной модели для каждого запроса. Однако базовый принцип — использование визуальных сигналов для ранжирования и корректировка оценок на основе понимания запроса — остается актуальным и в новых системах.

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)

Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.

US8429173B1
2013-04-23

Семантика и интент
Мультимедиа
SERP

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам

Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.

US9152652B2
2015-10-06

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google комбинирует текстовый запрос и изображение-образец для уточнения поиска по картинкам

Google использует механизм для обработки гибридных запросов (текст + изображение). Система находит изображения, которые одновременно релевантны тексту и визуально похожи на образец. Для этого создаются компактные визуальные дескрипторы и используются "визуальные ключи" для быстрого поиска. Финальная выдача ранжируется по степени визуального сходства с образцом.

US9043316B1
2015-05-26

Мультимедиа
Семантика и интент

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени

Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.

US10311096B2
2019-06-04

Мультимедиа
SERP
Поведенческие сигналы

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам

Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.

US8209330B1
2012-06-26

Поведенческие сигналы
SERP
Мультимедиа

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP

Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.

US9275421B2
2016-03-01

Семантика и интент
SERP
Ссылки

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов

Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.

US20170068720A1
2017-03-09

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования

Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.

US7454417B2
2008-11-18

Персонализация
Поведенческие сигналы
SERP

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске

Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").

US8782030B1
2014-07-15

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя

Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.

US7966309B2
2011-06-21

Семантика и интент
Персонализация
SERP

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)

Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.

US9116996B1
2015-08-25

Поведенческие сигналы
Семантика и интент

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов

Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.

US9436709B1
2016-09-06

EEAT и качество
Поведенческие сигналы

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты

Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.

US20150169576A1
2015-06-18

Поведенческие сигналы
SERP
Семантика и интент

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

US8868592B1
2014-10-21

Персонализация
Поведенческие сигналы
Local SEO

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска

Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.

US20150006290A1
2015-01-01

Поведенческие сигналы
Персонализация
Local SEO