SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам

ORDERING IMAGE SEARCH RESULTS (Упорядочивание результатов поиска изображений)
  • US8209330B1
  • Google LLC
  • 2009-05-29
  • 2012-06-26
  • Поведенческие сигналы
  • SERP
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.

Описание

Какую проблему решает

Патент решает проблему неточности ранжирования в поиске по картинкам, когда стандартные метрики могут давать сбои. Текст, связанный с изображением, может быть обманчивым. Поведенческие данные (например, клики) могут быть зашумлены: пользователи могут кликать на изображение из любопытства (кликбейт, пародия, мем), что не делает его качественным ответом на запрос. Изобретение направлено на повышение качества выдачи путем использования визуального анализа для валидации поведенческих данных.

Что запатентовано

Запатентована система для корректировки ранжирования изображений путем генерации Adjustment Factor (Корректирующего коэффициента). Этот коэффициент рассчитывается на основе двух независимых компонентов: Relevance Data (данные о релевантности, основанные на действиях пользователя, например, кликах) и Image Similarity Data (данные о визуальном сходстве изображения с другими изображениями в выдаче). Ключевым элементом является масштабирование этого коэффициента, если оба компонента согласованы.

Как это работает

Система анализирует набор изображений, найденных по запросу:

  • Сбор данных: Для каждого изображения извлекаются Relevance Data (например, нормализованный CTR) и рассчитывается Image Similarity Data (визуальное сходство с другими результатами).
  • Расчет коэффициента: На основе этих данных генерируется базовый Adjustment Factor.
  • Проверка согласованности:
    • Co-relevance (Совпадение релевантности): Если оба показателя высоки, коэффициент масштабируется с помощью Amplification Factor (значительное повышение).
    • Co-irrelevance (Совпадение нерелевантности): Если оба показателя низки, коэффициент масштабируется с помощью Inverse-Amplification Factor (значительное понижение).
    • Конфликт: Если данные противоречат друг другу (например, много кликов, но низкое сходство), масштабирование не применяется, и влияние коэффициента может быть ограничено.
  • Переранжирование: Итоговый рейтинг (Image Rank Score) пересчитывается с учетом скорректированного Adjustment Factor.

Актуальность для SEO

Высокая. Хотя конкретные алгоритмы визуального анализа, упомянутые в патенте (SIFT, geometric blur), устарели и заменены нейросетями, фундаментальный принцип комбинирования поведенческих сигналов с анализом самого контента (визуальным) остается центральным в современных поисковых системах (включая Google Lens). Механизмы перекрестной валидации сигналов критически важны для борьбы с манипуляциями и кликбейтом.

Важность для SEO

Патент имеет высокое значение (8/10) для стратегий оптимизации изображений (Image SEO). Он четко показывает, что для достижения топовых позиций недостаточно оптимизировать только контекст или только стимулировать клики. Изображение должно быть визуально релевантным консенсусу выдачи по данному запросу. Если изображение визуально не соответствует интенту, оно не получит максимального буста, даже при высоком CTR.

Детальный разбор

Термины и определения

Adjustment Factor (Корректирующий коэффициент)
Числовое значение, представляющее меру качества изображения относительно запроса. Рассчитывается на основе Relevance Data и Image Similarity Data. Используется для корректировки исходного рейтинга.
Amplification Factor (Коэффициент усиления)
Множитель, применяемый к Adjustment Factor, когда выполнено условие Co-relevance. Увеличивает рейтинг.
Click Logs / Query Logs (Логи кликов / Логи запросов)
Хранилища данных о запросах и действиях пользователей (кликах) в ответ на результаты поиска. Источник Relevance Data.
Co-irrelevance Condition (Условие совместной нерелевантности)
Состояние, при котором и Relevance Data, и Image Similarity Data удовлетворяют нижним порогам (низкие клики и низкое визуальное сходство).
Co-relevance Condition (Условие совместной релевантности)
Состояние, при котором и Relevance Data, и Image Similarity Data удовлетворяют верхним порогам (высокие клики и высокое визуальное сходство).
Image Rank Score (Итоговая оценка ранжирования изображения)
Финальная оценка, используемая для упорядочивания результатов поиска изображений. Рассчитывается на основе исходного рейтинга и Adjustment Factor.
Image Similarity Data (Данные о сходстве изображений)
Данные, определяющие относительное визуальное сходство между изображением и другими изображениями, релевантными тому же запросу. Могут быть представлены как Visual Score.
Inverse-Amplification Factor (Обратный коэффициент усиления)
Множитель, применяемый к Adjustment Factor, когда выполнено условие Co-irrelevance. Уменьшает рейтинг.
Relevance Data (Данные о релевантности)
Данные обратной связи, указывающие на релевантность изображения запросу. Включают частоту выбора (клики), явную обратную связь от пользователей.
Visual Distance Matrix (Матрица визуальных расстояний)
Матрица NxN, хранящая попарные визуальные расстояния (меры различия) между N изображениями в выдаче.
Visual Score (Визуальная оценка)
Оценка, генерируемая на основе Visual Distance Matrix, отражающая, насколько изображение похоже на другие изображения в наборе.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод корректировки рейтинга на основе совпадения сигналов релевантности.

  1. Система получает результаты поиска изображений, ранжированные по relevance score (оценка релевантности), которая определена независимо от визуального сходства.
  2. Для конкретного результата система получает image similarity data (данные о визуальном сходстве с другими изображениями в выдаче).
  3. Генерируется adjustment factor на основе relevance score и image similarity data.
  4. Определяется, является ли результат «co-relevant result». Это происходит, если:
    • relevance score соответствует заданному порогу; И
    • image similarity data указывает, что изображение имеет пороговый уровень визуального сходства с пороговым количеством других изображений в выдаче.
  5. Если результат признан «co-relevant», adjustment factor масштабируется (увеличивается) с помощью amplification factor.

Ядро изобретения заключается в том, что значительное повышение рейтинга происходит только тогда, когда независимые сигналы — поведенческий (например, клики) и визуальный — оба подтверждают высокую релевантность изображения.

Анализ механизма Co-irrelevance (Claims 6, 7 и Description): В тексте Claim 6 патента присутствует очевидная ошибка (он утверждает, что inverse-amplification factor применяется, когда результат является co-relevant). Однако, основываясь на Детальном Описании (Description), логике работы системы и Claim 15 (который описывает систему), механизм использует Inverse-Amplification Factor при выполнении условия Co-irrelevance Condition.

Система проверяет Co-irrelevance. Если relevance score ниже нижнего порога И визуальное сходство ниже нижнего порога (Claim 7), то применяется Inverse-Amplification Factor, что приводит к понижению результата.

Claim 12 (Зависимый): Уточняет расчет adjustment factor.

Adjustment Factor может быть рассчитан как произведение relevance score и image similarity data.

Где и как применяется

Изобретение применяется в подсистеме поиска изображений (Image Search Subsystem) и затрагивает несколько этапов поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе система извлекает визуальные характеристики (image features) из изображений (например, с помощью SIFT или geometric blur, как указано в патенте). Эти данные необходимы для последующего расчета визуального сходства.

RANKING – Ранжирование
Генерируется первоначальный набор результатов поиска с использованием стандартных оценок ранжирования (Search Rank Scores или Relevance Scores).

RERANKING – Переранжирование
Основной этап применения патента. Система анализирует результаты этапа RANKING:

  1. Извлекаются Relevance Data (из Click Logs) и рассчитываются Image Similarity Data (например, Visual Score).
  2. Вычисляется Adjustment Factor.
  3. Проверяются условия Co-relevance и Co-irrelevance.
  4. Применяются Amplification Factor или Inverse-Amplification Factor.
  5. Вычисляется финальный Image Rank Score, и результаты переупорядочиваются.

Входные данные:

  • Набор изображений, релевантных запросу, и их исходные оценки.
  • Relevance Data (клики, обратная связь) для каждого изображения по этому запросу.
  • Image Similarity Data (например, Visual Distance Matrix или Visual Scores).

Выходные данные:

  • Переупорядоченный набор результатов поиска изображений с финальными Image Rank Scores.

На что влияет

  • Конкретные типы контента: Влияет исключительно на результаты поиска изображений (Image Search) и блоки с изображениями в универсальном поиске.
  • Специфические запросы: Наибольшее влияние на запросы с четким визуальным интентом (объекты, продукты, знаменитости) и на запросы, подверженные кликбейту или появлению пародий/мемов.

Когда применяется

Алгоритм применяется в процессе обработки запросов к поиску изображений, как правило, к Топ-N результатам (например, Топ-1000).

  • Триггеры активации масштабирования:
    • Усиление (Boost): Активируется только при выполнении Co-relevance (оба показателя выше верхних порогов).
    • Понижение (Demotion): Активируется только при выполнении Co-irrelevance (оба показателя ниже нижних порогов).
  • Исключения (Конфликт сигналов): Если сигналы смешанные (например, много кликов, но низкое визуальное сходство), масштабирование не применяется. В патенте упоминается возможность установки лимита на значение Adjustment Factor в таких случаях, чтобы предотвратить доминирование одного сигнала.

Пошаговый алгоритм

Процесс переранжирования результатов поиска изображений:

  1. Получение исходных данных: Система получает доступ к результатам поиска изображений, отвечающим на запрос.
  2. Извлечение и Нормализация Relevance Data: Для каждого изображения извлекаются данные о кликах. Эти данные нормализуются (например, путем биннинга/распределения по корзинам), чтобы привести значения к стандартному диапазону.
  3. Извлечение и Нормализация Image Similarity Data: Для каждого изображения рассчитывается или извлекается Visual Score (на основе матрицы визуальных расстояний). Эти данные также нормализуются.
  4. Генерация базового коэффициента: Для каждого изображения генерируется Adjustment Factor (например, как произведение нормализованных Relevance Data и Visual Score).
  5. Проверка Co-relevance: Система проверяет, удовлетворяют ли оба показателя верхним порогам.
    • Если ДА: Adjustment Factor масштабируется (умножается) на Amplification Factor. Переход к шагу 8.
    • Если НЕТ: Переход к шагу 6.
  6. Проверка Co-irrelevance: Система проверяет, удовлетворяют ли оба показателя нижним порогам.
    • Если ДА: Adjustment Factor масштабируется (умножается) на Inverse-Amplification Factor. Переход к шагу 8.
    • Если НЕТ: Переход к шагу 7.
  7. Обработка конфликтов: Adjustment Factor не масштабируется. Могут быть применены ограничения на его максимальное значение.
  8. Расчет итогового рейтинга: Вычисляется Image Rank Score как функция от исходного ранга и финального Adjustment Factor.
  9. Упорядочивание: Результаты переупорядочиваются на основе Image Rank Score.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Relevance Data): Критически важные данные. Источник — Click Logs и Query Logs. Включает частоту выбора (клики) изображения по данному запросу. Также может включать явную обратную связь пользователей.
  • Мультимедиа факторы (Image Similarity Data): Визуальные характеристики изображения (image features). Патент упоминает использование алгоритмов типа SIFT (Scale-Invariant Feature Transform) или geometric blur для определения визуального расстояния (Visual Distance) между изображениями.
  • Контентные факторы: Упоминается, что текст, появляющийся рядом с изображением, также может учитываться в составе Relevance Data.

Какие метрики используются и как они считаются

  • Normalized Relevance Score: Метрика, полученная из Relevance Data. Используется нормализация (например, биннинг), чтобы значения находились в определенном диапазоне (например, 1-10) и были сравнимы между новыми и старыми изображениями.
  • Visual Score (Визуальная оценка): Метрика, рассчитанная на основе Visual Distance Matrix. Отражает статистические показатели (среднее, медиана) расстояний изображения до других изображений в выдаче. Также нормализуется.
  • Adjustment Factor: Рассчитывается как функция (часто произведение) от Normalized Relevance Score и Visual Score.
  • Пороги (Thresholds): Используются для активации масштабирования: Верхние пороги для Co-relevance и Нижние пороги для Co-irrelevance.
  • Масштабирующие коэффициенты: Amplification Factor (>1) и Inverse-Amplification Factor (<1).

Выводы

  1. Перекрестная валидация сигналов релевантности: Google не полагается на один тип сигнала в поиске изображений. Система требует согласованности между поведением пользователей (клики) и визуальным анализом контента.
  2. Синергия дает агрессивный бустинг: Изображение получает значительное усиление (Amplification Factor) только тогда, когда оно одновременно популярно у пользователей (высокий CTR) И визуально соответствует консенсусу выдачи (высокое сходство). Это условие Co-relevance.
  3. Защита от манипуляций и кликбейта (Конфликт сигналов): Если изображение получает много кликов, но визуально не похоже на другие результаты (конфликт сигналов), система не применяет усиление и может ограничить его ранжирование. Это эффективно нейтрализует кликбейт.
  4. Активное понижение нерелевантного контента: Механизм Co-irrelevance активно понижает изображения, которые непопулярны и визуально отличаются от основного набора.
  5. Важность «Визуального Консенсуса»: Для успешного ранжирования изображение должно соответствовать устоявшемуся визуальному представлению темы или объекта в индексе Google. Радикальное визуальное отклонение может быть интерпретировано как низкое сходство.

Практика

Best practices (это мы делаем)

  • Обеспечение визуального соответствия интенту: Анализируйте Топ выдачи Image Search, чтобы понять «визуальный консенсус» по вашим целевым запросам. Используйте изображения, которые визуально соответствуют тому, что уже ранжируется. Это максимизирует Visual Score.
  • Оптимизация для достижения Co-relevance: Создавайте высококачественные, привлекательные изображения, которые стимулируют клики (высокий Relevance Score) и одновременно четко отражают суть запроса визуально (высокий Visual Score). Это цель для активации Amplification Factor.
  • Использование четких и репрезентативных изображений: Для товарных запросов или запросов по сущностям используйте четкие изображения, которые однозначно изображают объект. Это облегчает работу систем визуального анализа и повышает сходство с другими релевантными изображениями.
  • Оптимизация контекста для релевантных кликов: Убедитесь, что окружающий текст, alt-атрибуты и заголовок страницы точно описывают изображение для привлечения целевых кликов и повышения Relevance Score.

Worst practices (это делать не надо)

  • Использование кликбейтных изображений: Использование провокационных картинок, которые не соответствуют теме запроса. Они могут собрать клики, но будут иметь низкий Visual Score. Система распознает этот конфликт и не применит Amplification Factor.
  • Применение слишком абстрактных или генерических стоковых фото: Если изображение слишком общее и не похоже на другие специфические изображения в нише, оно может получить низкий Visual Score, что затруднит ранжирование.
  • Манипуляции с CTR: Накрутка кликов на изображении будет неэффективна, если система визуального анализа не подтвердит релевантность изображения (низкое сходство), благодаря описанному механизму валидации.
  • Игнорирование визуального содержания: Фокус только на оптимизации Alt-текста без учета самого изображения. Визуальные признаки являются полноценным фактором ранжирования.

Стратегическое значение

Патент подтверждает стратегию Google по глубокому пониманию контента за пределами текста, используя мультимодальный подход (поведение + компьютерное зрение). Для успешного Image SEO необходимо мыслить категориями визуального представления и соответствия интенту. Долгосрочная стратегия должна включать создание качественного визуального контента, который одновременно привлекателен для пользователей и соответствует визуальному паттерну, который Google считает релевантным для данной темы.

Практические примеры

Сценарий 1: Поиск товара («Кроссовки Nike Air Max 90 белые»)

  1. Изображение А (Четкое фото товара): Фотография нужной модели и цвета на белом фоне. Высокий CTR и высокое сходство с другими фото этого товара.
    • Результат: Co-relevance. Применяется Amplification Factor. Буст в ранжировании.
  2. Изображение Б (Кликбейт): Изображение с текстом «Скидка 90%», но сам товар плохо виден. Высокий CTR, но низкое сходство с эталонными фото товара.
    • Результат: Конфликт сигналов. Бустинг не применяется. Ранжирование ограничено.
  3. Изображение В (Ошибка индексации): Фотография другой модели кроссовок. Низкий CTR и низкое сходство с Air Max 90.
    • Результат: Co-irrelevance. Применяется Inverse-Amplification Factor. Понижение в выдаче.

Сценарий 2: Поиск знаменитости («Джонни Депп»)

  1. Изображение А (Стандартное фото): Качественный портрет. Высокий CTR и высокое визуальное сходство с другими фото актера.
    • Результат: Co-relevance. Буст в ранжировании.
  2. Изображение Б (Карикатура или Мем): Популярная карикатура на актера. Очень высокий CTR, но низкое визуальное сходство с фотографиями.
    • Результат: Конфликт сигналов. Бустинг не применяется. Ранжирование ниже стандартных фото.

Вопросы и ответы

Что важнее для ранжирования изображений согласно этому патенту: клики (CTR) или визуальное сходство?

Оба фактора критически важны, но самое главное — их согласованность. Ни один из факторов по отдельности не гарантирует максимального ранжирования. Значительный буст (Amplification Factor) применяется только тогда, когда и CTR (Relevance Data), и визуальное сходство (Image Similarity Data) высоки одновременно (условие Co-relevance).

Как система определяет визуальное сходство между изображениями?

Система извлекает визуальные признаки (формы, текстуры) из изображения с помощью алгоритмов компьютерного зрения (в патенте упомянуты SIFT и geometric blur). Затем она рассчитывает «визуальное расстояние» (Visual Distance) между признаками разных изображений и сохраняет данные в Visual Distance Matrix. На основе этой матрицы вычисляется Visual Score.

Как этот патент помогает бороться с кликбейтом в поиске по картинкам?

Он вводит механизм защиты через проверку конфликта сигналов. Кликбейтное изображение может собрать много кликов (высокие Relevance Data), но оно обычно визуально отличается от того, что ищут пользователи (низкие Image Similarity Data). Поскольку для бустинга требуется выполнение обоих условий (Co-relevance), кликбейтное изображение не получит усиления ранга.

Может ли уникальное, но релевантное изображение хорошо ранжироваться?

Да, но это сложнее. Если изображение уникально (например, уникальный стиль или ракурс) и визуально сильно отличается от большинства других результатов, оно может получить низкий Visual Score. В этом случае оно не получит бустинг по условию Co-relevance. Ему придется полагаться на очень высокие показатели CTR и сильные контекстуальные сигналы.

Что такое нормализация данных о кликах и зачем она нужна?

Нормализация (например, через биннинг/распределение по корзинам) приводит данные о кликах к единой шкале (например, от 1 до 10). Это необходимо для справедливого сравнения изображений разного возраста. Старое изображение может иметь тысячи кликов, а новое — десятки. Нормализация позволяет оценить их относительную эффективность, не позволяя абсолютным значениям искажать результаты.

Что произойдет, если изображение визуально похоже на другие, но получает мало кликов?

Это сценарий конфликта: высокое визуальное сходство, но низкие Relevance Data. В этом случае система не применяет усиление. Это сигнал для SEO-специалиста, что нужно работать над привлекательностью изображения или улучшать контекст страницы, чтобы стимулировать клики.

Что такое условие Co-irrelevance и как оно влияет на ранжирование?

Co-irrelevance (Совпадение нерелевантности) — это ситуация, когда изображение имеет мало кликов И визуально не похоже на другие результаты. Это сильный индикатор нерелевантности. В этом случае система применяет Inverse-Amplification Factor, активно понижая рейтинг изображения в выдаче.

Как SEO-специалист может улучшить Visual Score изображения?

Для улучшения Visual Score необходимо убедиться, что изображение соответствует «визуальному консенсусу» по запросу. Проанализируйте Топ-10 изображений в выдаче. Обратите внимание на объекты, композицию, цвета и стиль. Ваше изображение должно быть четким, качественным и содержать визуальные элементы, которые система ассоциирует с данной темой.

Актуальны ли упомянутые алгоритмы SIFT и Geometric Blur в 2025 году?

Эти конкретные методы устарели. В 2025 году Google использует гораздо более продвинутые модели машинного зрения (например, на базе Трансформеров) для анализа визуальных признаков и создания эмбеддингов. Однако базовый принцип, описанный в патенте — измерение визуального сходства — остается актуальным.

Применяется ли этот алгоритм только в Google Image Search?

Патент описывает систему для поиска изображений. Однако механизмы, описанные в нем, могут применяться к любым компонентам выдачи, где используются изображения и доступны данные о кликах и визуальном сходстве, например, к каруселям изображений или товарным блокам в основном поиске.

Похожие патенты

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует визуальное сходство и графовый анализ (VisualRank) для валидации и ранжирования меток изображений
Google валидирует текстовые метки изображений (например, Alt-текст или имена файлов) с помощью визуального анализа. Система строит граф, связывающий визуально похожие изображения. Симулируя навигацию пользователя по этому графу (алгоритм, подобный PageRank), Google определяет, какие метки наиболее релевантны фактическому содержанию изображения, отфильтровывая шум и повышая качество поиска по картинкам.
  • US7961986B1
  • 2011-06-14
  • Мультимедиа

  • SERP

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя
Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.
  • US8504547B1
  • 2013-08-06
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Популярные патенты

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске
Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
  • US8782030B1
  • 2014-07-15
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

seohardcore