SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам

SUB-QUERY EVALUATION FOR IMAGE SEARCH (Оценка подзапросов для поиска изображений)
  • US9152652B2
  • Google LLC
  • 2013-03-14
  • 2015-10-06
  • Поведенческие сигналы
  • Мультимедиа
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.

Описание

Какую проблему решает

Патент решает проблему отсутствия специализированных моделей визуальной релевантности (image relevance models) для огромного количества многословных поисковых фраз (search phrases), особенно для редких или сложных (long-tail) запросов. Поскольку невозможно обучить модель для каждого уникального запроса, изобретение предлагает механизм для использования существующих моделей, обученных на частях исходного запроса (sub-queries), чтобы улучшить ранжирование изображений по полному запросу.

Что запатентовано

Запатентована система для оценки и выбора наилучшей модели подзапроса (sub-query model) в качестве модели релевантности для полной поисковой фразы. Система определяет, какая из доступных моделей подзапросов генерирует ранжирование изображений, наиболее близкое к фактическому ранжированию, основанному на взаимодействиях пользователей (interaction rankings, например, кликах) с этими изображениями по полной поисковой фразе.

Как это работает

Система работает следующим образом:

  • Определение эталона (Ground Truth): Для поисковой фразы (например, "торт на день рождения для мальчиков") система анализирует, на какие изображения пользователи кликают чаще всего. Это формирует "Рейтинг взаимодействий" (Interaction Ranking).
  • Идентификация кандидатов: Система разбивает фразу на подзапросы (например, "торт на день рождения", "мальчики") и находит их предварительно обученные модели (Sub-Query Models).
  • Оценка моделей: Каждая модель подзапроса используется для ранжирования того же набора изображений на основе их визуальных характеристик, формируя "Рейтинг модели подзапроса" (Sub-Query Model Ranking).
  • Сравнение и Выбор: Система сравнивает, насколько Sub-Query Model Ranking похож на Interaction Ranking. Сходство измеряется метрикой Search Phrase Score. Модель с наивысшей оценкой выбирается для ранжирования изображений по исходной фразе.

Актуальность для SEO

Высокая. Проблема обработки длинного хвоста запросов и масштабирования моделей машинного обучения остается критически важной для Google, особенно в визуальном поиске (Image Search, Google Lens). Хотя конкретные модели релевантности эволюционировали с момента подачи патента, базовая концепция использования данных о взаимодействии пользователей в качестве эталона для валидации и выбора моделей остается фундаментальной практикой.

Важность для SEO

Влияние на SEO оценивается как умеренное (6/10), но оно имеет высокое значение для стратегий продвижения в Google Images. Патент раскрывает, что ранжирование изображений по сложным запросам может зависеть от того, насколько хорошо изображение визуально соответствует доминирующей части запроса (подзапросу), для которого у Google есть сильная модель. Это подчеркивает фундаментальную роль пользовательских взаимодействий (кликов) как эталона релевантности.

Детальный разбор

Термины и определения

Anti-sub query term (Анти-подзапросовый термин)
Термин в поисковой фразе, указывающий на то, что модель подзапроса не должна использоваться или должна использоваться для понижения результатов (например, слово "без" в запросе "идеи вечеринки без торта").
Global Sub-query (Глобальный подзапрос)
Подзапрос, чья модель релевантности показала стабильно высокую эффективность (высокий Global Search Phrase Score) для множества различных поисковых фраз, включающих этот подзапрос. Модель глобального подзапроса может использоваться по умолчанию.
Image Relevance Model (Модель релевантности изображений)
Модель машинного обучения, обученная оценивать релевантность изображения конкретному запросу на основе визуальных характеристик изображения (visual features).
Interaction Histogram (Гистограмма взаимодействий)
Представление данных, где изображения упорядочены по Interaction Ranking, а высота столбца соответствует количеству взаимодействий (например, кликов).
Interaction Ranking (Рейтинг взаимодействий)
Ранжирование набора изображений, основанное на количестве пользовательских взаимодействий (кликов, наведений курсора) с этими изображениями, когда они были показаны в ответ на поисковую фразу. Служит как "ground truth".
Search Phrase (Поисковая фраза)
Запрос, состоящий из двух или более терминов.
Search Phrase Score (Оценка поисковой фразы)
Метрика, измеряющая степень сходства между Interaction Ranking и Sub-query Model Ranking. Используется для выбора лучшей модели.
Sub-query (Подзапрос)
Собственное подмножество (proper subset) терминов из исходной поисковой фразы.
Sub-query Histogram (Гистограмма подзапроса)
Представление данных, где те же изображения с тем же количеством взаимодействий переупорядочены в соответствии с Sub-query Model Ranking.
Sub-query Model (Модель подзапроса)
Image Relevance Model, обученная для конкретного подзапроса.
Sub-query Model Ranking (Рейтинг модели подзапроса)
Ранжирование набора изображений, сгенерированное путем применения Sub-query Model к визуальным признакам этих изображений.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора модели релевантности для поисковой фразы.

  1. Система идентифицирует набор релевантных изображений для поисковой фразы (2+ термина).
  2. Определяются Interaction Rankings для этих изображений на основе количества пользовательских взаимодействий.
  3. Создаются два или более подзапроса (собственные подмножества терминов фразы).
  4. Для каждого подзапроса:
    1. Определяются Sub-query Model Rankings. Ранжирование выполняется на основе модели подзапроса (image relevance model для этого подзапроса) и визуальных признаков (visual features) изображений.
    2. Определяется Search Phrase Score — мера сходства между позициями изображений в Interaction Rankings и Sub-query Model Rankings.
  5. На основе Search Phrase Scores выбирается одна из моделей подзапросов в качестве модели для исходной поисковой фразы (та, чей скор удовлетворяет порогу).

Claims 3, 4, 5 (Зависимые): Детализируют механизм сравнения рейтингов с помощью гистограмм.

Система создает Interaction Histogram (изображения упорядочены по взаимодействиям) и Sub-query Histogram (те же изображения переупорядочены по оценке модели). Search Phrase Score определяется на основе "уровня совпадения" (level of match) между этими двумя гистограммами. (В патенте упоминается возможность использования L1 similarity для измерения совпадения/перекрытия).

Claims 6, 7 (Зависимые): Описывают механизм идентификации Глобальных подзапросов.

  1. Для выбранной модели подзапроса собираются дополнительные Search Phrase Scores, полученные при её тестировании на других поисковых фразах.
  2. Вычисляется Global Search Phrase Score — агрегированная мера всех этих оценок.
  3. Если Global Search Phrase Score удовлетворяет порогу (globalization threshold), подзапрос идентифицируется как Global Sub-query.
  4. Модель этого глобального подзапроса используется для ранжирования изображений для других поисковых фраз, содержащих этот подзапрос.

Где и как применяется

Изобретение применяется в рамках вертикали Поиска по картинкам (Image Search) и затрагивает несколько этапов обработки данных, преимущественно в офлайн-режиме для анализа и в реальном времени для ранжирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются и сохраняются визуальные признаки (visual features) изображений, которые позже используются моделями релевантности.

RANKING – Ранжирование (Офлайн-компоненты и Аналитика)
Основная часть работы, описанной в патенте, происходит офлайн:

  • Обучение моделей: Image Relevance Models обучаются для конкретных запросов.
  • Анализ логов и Валидация: Система анализирует логи взаимодействий пользователей (клики). Происходит процесс оценки Sub-query Models, расчет Search Phrase Scores и идентификация Global Sub-queries. Результаты сохраняются для использования в реальном времени.

RANKING – Ранжирование (Онлайн-компоненты)
Во время обработки запроса пользователя в реальном времени:

  • Если для поисковой фразы нет специализированной модели, система использует предварительно выбранную Sub-query Model (из офлайн-анализа) или модель Global Sub-query.
  • Выбранная модель применяется к визуальным признакам изображений-кандидатов для генерации или корректировки оценок релевантности (relevance scores).

Входные данные (для процесса оценки):

  • Поисковая фраза.
  • Набор релевантных изображений и их визуальные признаки.
  • Исторические данные о взаимодействиях пользователей (клики) с этими изображениями для данной фразы.
  • База данных обученных Sub-query Models.

Выходные данные (для процесса оценки):

  • Выбранная Sub-query Model, ассоциированная с поисковой фразой.
  • Идентификация Global Sub-Queries.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на сложные, многословные или редкие (long-tail) запросы в Image Search, для которых маловероятно существование специализированной модели релевантности.
  • Типы контента: Влияет исключительно на ранжирование изображений на основе их визуального соответствия запросу.

Когда применяется

  • Условия работы: Алгоритм выбора модели применяется, когда для точной поисковой фразы отсутствует собственная Image Relevance Model, но существуют модели для её подзапросов.
  • Триггеры активации (Офлайн): Процесс оценки активируется для поисковых фраз, по которым накоплено достаточно данных о пользовательских взаимодействиях для формирования надежного Interaction Ranking.
  • Исключения: Механизм может быть отключен или модифицирован при обнаружении Anti-sub query terms (например, "без", "кроме"). В этом случае модель подзапроса может использоваться для понижения (демоутинга) релевантных ему изображений.

Пошаговый алгоритм

Процесс А: Выбор модели подзапроса для поисковой фразы (Офлайн)

  1. Идентификация изображений: Определяется набор релевантных изображений для поисковой фразы (например, "ABC").
  2. Определение Interaction Ranking: Анализируются данные о взаимодействиях (кликах) пользователей. Изображения ранжируются в порядке убывания количества взаимодействий.
  3. Создание Interaction Histogram: Создается гистограмма на основе Interaction Ranking и количества взаимодействий.
  4. Идентификация подзапросов: Определяются подзапросы поисковой фразы (например, "AB", "BC").
  5. Цикл оценки моделей: Для каждого подзапроса с доступной моделью:
    1. Определение Sub-query Model Ranking: Модель применяется к визуальным признакам изображений. Изображения ранжируются по этим оценкам.
    2. Создание Sub-query Histogram: Создается гистограмма, где изображения упорядочены по Sub-query Model Ranking, но высота столбцов соответствует исходному количеству взаимодействий.
    3. Расчет Search Phrase Score: Определяется степень сходства (например, перекрытие или L1 similarity) между Interaction Histogram и Sub-query Histogram.
  6. Выбор модели: Выбирается Sub-query Model с наивысшим Search Phrase Score (при условии превышения порога) в качестве модели для исходной поисковой фразы "ABC".

Процесс Б: Идентификация Глобальных подзапросов (Офлайн)

  1. Сбор данных: Для конкретной Sub-query Model (например, для "AB") собираются Search Phrase Scores, полученные при её оценке на множестве разных поисковых фраз (например, "ABC", "DAB", "ABE").
  2. Расчет Global Search Phrase Score: Вычисляется агрегированная оценка (например, среднее или взвешенное среднее) собранных Search Phrase Scores.
  3. Сравнение с порогом: Проверяется, удовлетворяет ли Global Search Phrase Score порогу глобализации (globalization threshold).
  4. Идентификация: Если порог превышен, подзапрос ("AB") идентифицируется как Global Sub-query. Его модель может использоваться для других фраз, содержащих этот подзапрос, без предварительной оценки.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании трех основных типов данных:

  • Поведенческие факторы (Критические): Данные о взаимодействиях пользователей (user interactions) с изображениями в ответ на конкретную поисковую фразу. Упоминаются клики (clicks) и наведения курсора (hovers). Эти данные формируют Interaction Ranking, который служит эталоном (ground truth) для оценки моделей.
  • Мультимедиа факторы (Визуальные признаки): Визуальные характеристики изображений (visual features или image feature values). Они являются входом для Image Relevance Models.
  • Системные данные: Поисковые фразы, подзапросы и заранее обученные Sub-query Models.

Какие метрики используются и как они считаются

  • Interaction Ranking: Ранжирование изображений по убыванию количества взаимодействий.
  • Model Relevance Value: Оценка, генерируемая моделью подзапроса. Может рассчитываться как скалярное произведение (dot product) или косинусное расстояние (cosine distance) между вектором модели и вектором признаков изображения.
  • Sub-query Model Ranking: Ранжирование изображений по убыванию Model Relevance Value.
  • Search Phrase Score: Мера сходства между Interaction Ranking и Sub-query Model Ranking. Рассчитывается путем сравнения Interaction Histogram и Sub-query Histogram. Патент упоминает использование L1 similarity measure для измерения степени перекрытия гистограмм.
  • Global Search Phrase Score: Агрегация (например, среднее, взвешенное среднее) нескольких Search Phrase Scores для одной модели, протестированной на разных фразах.
  • Globalization Threshold: Пороговое значение для Global Search Phrase Score.

Выводы

  1. Поведенческие сигналы как эталон релевантности: Ключевой вывод — Google использует данные о кликах пользователей (Interaction Ranking) как эталон (ground truth) для оценки и валидации своих моделей визуальной релевантности в Image Search. Если модель ранжирует изображения не так, как их выбирают пользователи, она считается неэффективной для данного запроса.
  2. Определение доминирующего визуального интента: Механизм позволяет системе определить доминирующий визуальный интент многословного запроса. Например, для "красное винтажное платье" система определит, модель какого подзапроса ("красное платье" или "винтажное платье") лучше соответствует ожиданиям пользователей, и выберет её.
  3. Масштабирование моделей релевантности: Патент описывает инфраструктурное решение для повышения покрытия запросов качественными моделями ранжирования без необходимости обучать модель для каждого уникального long-tail запроса.
  4. Глобальные концепции (Global Sub-queries): Идентификация глобальных подзапросов позволяет автоматически применять проверенные, сильные модели к новым или очень редким запросам, содержащим эти подзапросы, повышая качество ранжирования по умолчанию.
  5. Обработка отрицаний: Система учитывает наличие Anti-sub query terms (например, "без"), что предотвращает некорректное применение моделей подзапросов и может использоваться для понижения нерелевантных изображений.

Практика

Best practices (это мы делаем)

Патент описывает внутренние механизмы Image Search, но из него можно извлечь важные практические рекомендации для SEO-специалистов, фокусирующихся на оптимизации изображений:

  • Стимулирование взаимодействий (Высокий CTR изображений): Поскольку Interaction Ranking является эталоном релевантности, критически важно создавать изображения, которые пользователи захотят кликнуть. Изображения должны быть высокого качества, визуально привлекательными и четко отражать суть запроса.
  • Точное соответствие доминирующему визуальному интенту: Анализируйте выдачу Image Search, чтобы понять, какой визуальный стиль и контент предпочитают пользователи по вашим целевым запросам. Создавайте изображения, которые соответствуют этому доминирующему интенту, так как система выберет модель, которая поддерживает этот тренд.
  • Оптимизация под "ядро" запроса (Core Concepts): Для сложных запросов старайтесь, чтобы изображение было максимально визуально релевантно ключевой сущности запроса (потенциальному Global Sub-query). Если изображение отлично отвечает на запрос «торт на день рождения», оно имеет больше шансов ранжироваться по запросу «синий торт на день рождения для 5-летнего».
  • Использование четких визуальных сигналов: Убедитесь, что изображения содержат ясные визуальные признаки, которые модели машинного зрения могут легко распознать и классифицировать. Это повышает вероятность корректной оценки со стороны Sub-query Models.

Worst practices (это делать не надо)

  • Кликбейт и визуальное несоответствие: Использование изображений, которые привлекают клик, но не соответствуют интенту запроса. Хотя краткосрочно это может дать взаимодействия, в долгосрочной перспективе несоответствие между кликами и оценкой модели, а также другие поведенческие факторы (например, быстрый возврат в выдачу), могут негативно сказаться на ранжировании.
  • Игнорирование визуального контекста: Фокусироваться только на текстовой оптимизации (alt, title, surrounding text) и игнорировать качество и визуальную релевантность самого изображения. Патент показывает, что визуальные признаки обрабатываются специализированными моделями.
  • Переоптимизация под второстепенные части запроса: Создание изображений, которые визуально соответствуют модификаторам запроса, но слабо соответствуют основному объекту поиска. Система, вероятно, предпочтет модель, сфокусированную на основном объекте (ядре).

Стратегическое значение

Патент подтверждает стратегическую важность поведенческих факторов (в данном случае, кликов на изображения) в качестве основного валидатора алгоритмов ранжирования Google. Он демонстрирует, как Google стремится привести работу своих моделей машинного обучения в соответствие с реальными предпочтениями пользователей. Для SEO-стратегии это означает, что долгосрочный успех в Image Search зависит от глубокого понимания визуальных предпочтений аудитории и создания контента, который вызывает положительный отклик и четко соответствует ключевым визуальным концепциям.

Практические примеры

Сценарий: Оптимизация изображения для интернет-магазина

Целевой запрос: "Красное винтажное платье в горошек" (Предположим, для него нет специальной модели).

  1. Анализ интента и данных: Google анализирует клики (Interaction Ranking). Предположим, пользователи чаще всего кликают на изображения, где четко виден узор "горошек".
  2. Тестирование моделей: Система Google тестирует модели для "красное платье", "платье в горошек", "винтажное платье".
  3. Выбор модели: Основываясь на анализе кликов, система определяет, что модель для "платье в горошек" дает ранжирование, наиболее близкое к предпочтениям пользователей. Search Phrase Score для этой модели максимален.
  4. Действия SEO-специалиста: Необходимо убедиться, что основное изображение товара максимально четко демонстрирует узор "горошек". Изображение должно быть визуально привлекательным для максимизации CTR.
  5. Ожидаемый результат: Модель "платье в горошек" используется для ранжирования. Изображение магазина, визуально соответствующее этой модели и имеющее высокий CTR, получает более высокие позиции в Image Search по полному запросу.

Вопросы и ответы

Что такое Interaction Ranking и почему он важен?

Interaction Ranking — это ранжирование изображений, основанное на том, как часто пользователи взаимодействуют с ними (например, кликают) в ответ на конкретный запрос. В контексте данного патента он критически важен, так как служит эталоном (ground truth) пользовательских предпочтений. Google использует его для валидации и выбора своих моделей визуальной релевантности.

Означает ли этот патент, что CTR является главным фактором ранжирования в Image Search?

Не совсем. Патент показывает, что CTR (как форма взаимодействия) используется для *выбора* модели ранжирования, которая будет применена к запросу. Сама модель ранжирует изображения на основе визуальных признаков. Однако, если ваше изображение привлекает клики, это подтверждает для Google релевантность и способствует лучшему ранжированию изображений с похожими характеристиками.

Как Google определяет, какая часть сложного запроса является главной?

Google определяет это эмпирически. Система тестирует модели релевантности для разных частей запроса (подзапросов) и смотрит, какая из них лучше предсказывает поведение пользователей (Interaction Ranking). Та часть запроса, чья модель лучше соответствует кликам пользователей, и считается главной для данного визуального интента.

Что такое Глобальный подзапрос (Global Sub-query)?

Это подзапрос, модель релевантности которого стабильно хорошо работает для множества различных поисковых фраз. Например, если модель для "кроссовки Nike" хорошо ранжирует изображения по запросам "синие кроссовки Nike", "детские кроссовки Nike" и т.д., этот подзапрос может стать глобальным. Это позволяет Google применять эту надежную модель к любым новым запросам, содержащим "кроссовки Nike".

Влияет ли этот патент на ранжирование в основном веб-поиске?

Нет, данный патент описывает механизмы, специфичные для Поиска по картинкам (Image Search) и оценки визуальной релевантности. Он не описывает факторы ранжирования текстового контента в основном веб-индексе.

Как система обрабатывает отрицания, например, запрос "собаки без поводка"?

Патент упоминает Anti-sub query terms (например, "без"). Если такой термин обнаружен, система может отказаться от использования модели подзапроса (например, модели для "поводок") или использовать её для понижения результатов. В данном примере, изображения, которые модель для "поводок" оценила бы высоко, могут быть деприоритезированы.

Как SEO-специалисту использовать информацию о выборе моделей на практике?

Основное применение — это анализ выдачи Image Search для понимания доминирующего визуального интента. Если вы видите, что по сложному запросу ранжируются изображения с определенным стилем или фокусом, это означает, что Google выбрал модель, которая предпочитает эти характеристики. Вам нужно создавать визуально похожие и привлекательные для клика изображения.

Использует ли система текстовые факторы, такие как ALT-текст?

Патент фокусируется исключительно на выборе и применении моделей визуальной релевантности (Image Relevance Models), которые работают с визуальными признаками (visual features) изображений. Текстовые факторы используются в Image Search для начального отбора кандидатов, но данный патент их не обсуждает.

Что такое гистограммы взаимодействий и подзапросов и как они сравниваются?

Это способ сравнения рейтингов. Interaction Histogram упорядочивает изображения по кликам. Sub-query Histogram берет те же изображения с тем же количеством кликов, но переупорядочивает их так, как их ранжирует модель. Сравнивая перекрытие (overlap) этих двух гистограмм (например, используя L1 similarity), система определяет, насколько хорошо модель соответствует поведению пользователей.

Происходит ли выбор модели в реальном времени при запросе пользователя?

Нет. Процесс оценки моделей, сравнения гистограмм и выбора наилучшей Sub-Query Model для конкретной поисковой фразы происходит офлайн. В реальном времени (онлайн) система ранжирования использует уже предварительно выбранную модель для быстрого расчета релевантности изображений.

Похожие патенты

Как Google переносит визуальную релевантность между похожими запросами в поиске по картинкам
Патент Google описывает механизм для улучшения ранжирования в поиске по картинкам. Если для конкретного запроса нет обученной модели визуальной релевантности, система использует модель от похожего запроса. Оценка релевантности (Boost) корректируется с помощью "дробного множителя" (Fractional Adjustment Multiplier), который уменьшает влияние модели пропорционально степени различия между запросами.
  • US9152700B2
  • 2015-10-06
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени
Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.
  • US10311096B2
  • 2019-06-04
  • Мультимедиа

  • SERP

  • Поведенческие сигналы

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Популярные патенты

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

seohardcore