SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google кластеризует результаты поиска по картинкам и выбирает репрезентативное (каноническое) изображение для показа

GROUPING OF IMAGE SEARCH RESULTS (Группировка результатов поиска изображений)
  • US8352465B1
  • Google LLC
  • 2010-09-03
  • 2013-01-08
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google организует результаты поиска изображений в иерархические кластеры на основе визуального сходства. Для каждого кластера выбирается «каноническое изображение» — часто это изображение с самым высоким исходным рейтингом или наиболее визуально авторитетное (с использованием метрик типа VisualRank). Эта структура определяет, как изображения группируются и какое изображение получает максимальную видимость в интерфейсе Google Images.

Описание

Какую проблему решает

Патент решает проблему неэффективной навигации и представления больших, неструктурированных наборов результатов поиска изображений. Стандартное отображение в виде плоской сетки затрудняет быстрое понимание разнообразия доступных визуальных тем и исследование информационного пространства. Цель — улучшить пользовательский опыт (UX), предоставляя организованный обзор и возможность иерархической навигации по визуально схожему контенту.

Что запатентовано

Запатентована система и метод для иерархической кластеризации результатов поиска изображений и выбора репрезентативного (Canonical Image) изображения для каждого кластера. Суть изобретения заключается в автоматической организации выдачи на основе сходства и использовании показателей ранжирования (Ranking Measure) для определения того, какое изображение будет визуально представлять каждую группу.

Как это работает

Система работает поверх основного ранжирования:

  • Расчет сходства: Вычисляется матрица сходства (Similarity Matrix) для всех изображений в результатах поиска, используя визуальные признаки (например, локальные дескрипторы), метаданные и текст.
  • Иерархическая кластеризация: Изображения группируются в иерархическую структуру (дендрограмму) с помощью методов кластеризации (например, Hierarchical Agglomerative Clustering - HAC).
  • Выбор канонического изображения: Для каждой группы выбирается Canonical Image. Выбор основывается на Ranking Measure, который может быть либо исходным рангом изображения в поиске, либо рассчитанным показателем визуальной авторитетности (например, VisualRank).
  • Представление: Результаты отображаются в интерфейсе, где канонические изображения используются для представления целых кластеров, позволяя пользователю перемещаться по иерархии.

Актуальность для SEO

Средняя/Высокая. Хотя конкретные пользовательские интерфейсы (UI), описанные в патенте (например, масштабируемые интерфейсы ZUI, напоминающие Google Image Swirl), устарели, базовые концепции визуальной кластеризации, расчета визуального сходства и выбора репрезентативных изображений являются фундаментальными для современного Google Images (например, в каруселях, организации изображений товаров) и Google Lens.

Важность для SEO

Патент имеет умеренное значение для SEO, с сильным фокусом на Image SEO. Он не описывает алгоритмы первичного ранжирования, но детально описывает, как организуется выдача и какие изображения получают максимальную видимость. Ключевое значение имеет механизм выбора Canonical Image. Если изображение выбрано в качестве канонического, оно представляет весь кластер, что резко повышает его видимость и потенциальный CTR в поиске по картинкам.

Детальный разбор

Термины и определения

Canonical Image (Каноническое изображение)
Репрезентативное изображение, выбранное для представления целого кластера (группы) визуально схожих изображений. Служит «визуальным резюме» (visual summary) кластера.
Hierarchical Grouping / Clustering (Иерархическая группировка / Кластеризация)
Процесс организации изображений в древовидную структуру (например, дендрограмму), где схожие изображения объединяются в кластеры, которые затем могут объединяться в более крупные кластеры.
HAC (Hierarchical Agglomerative Clustering)
Иерархическая агломеративная кластеризация. Метод кластеризации «снизу вверх», при котором элементы последовательно объединяются на основе их сходства.
Ranking Measure (Показатель ранжирования)
Метрика, используемая для выбора Canonical Image внутри кластера. Это может быть исходный ранг изображения в поиске (Image Search Rank) или рассчитанная оценка, такая как VisualRank.
Similarity Matrix (Матрица сходства)
Матрица N×N, где каждая запись содержит значение сходства (similarity value) между двумя изображениями. Сходство рассчитывается на основе визуальных признаков, метаданных или других сигналов.
VisualRank
Алгоритм ранжирования изображений, основанный на анализе графа визуального сходства (аналог PageRank для визуальных связей). Оценивает визуальную авторитетность изображения на основе его сходства с другими авторитетными изображениями.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс организации и представления результатов поиска изображений.

  1. Система получает запрос и ранжированные результаты поиска.
  2. Генерируется Similarity Matrix для изображений в результатах.
  3. Генерируется иерархическая группировка (Hierarchical grouping) изображений с использованием матрицы сходства.
  4. Для каждой группы идентифицируется Canonical Image с использованием Ranking Measure.
  5. Предоставляется визуальное представление результатов на основе этой иерархии, где канонические изображения представляют свои группы.

Claim 2 (Зависимый от 1): Определяет первый ключевой метод выбора канонического изображения.

Каноническим изображением для группы выбирается то изображение, которое имеет наивысший исходный ранг в поиске (highest image search rank) среди всех изображений в этой группе.

Claim 3 и 4 (Зависимые от 1): Определяют второй ключевой метод выбора канонического изображения.

Каноническим изображением выбирается изображение с наивысшим рейтингом согласно Ranking Measure. Этот показатель рассчитывается для каждого изображения в группе и включает вычисление сходства между изображениями (например, расчет VisualRank).

Claim 5 (Зависимый от 1): Уточняет метод группировки.

Иерархическая группировка использует Hierarchical Agglomerative Clustering (HAC) для группировки результатов в структуру дендрограммы.

Claim 6 (Зависимый от 1): Описывает итеративный процесс кластеризации (рекурсивная кластеризация).

  1. Генерируется первое количество кластеров с использованием всех изображений.
  2. Идентифицируются канонические изображения для этих первых кластеров.
  3. Генерируется второе количество кластеров, используя *только* идентифицированные канонические изображения из предыдущего шага. (Кластеризация кластеров).

Где и как применяется

Изобретение применяется в системе поиска изображений (Google Images) и фокусируется на организации и представлении результатов пользователю.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются и сохраняются визуальные признаки (local descriptors, color histograms и т.д.), которые необходимы для последующего расчета матрицы сходства и VisualRank.

RANKING – Ранжирование
Система получает первичный набор ранжированных результатов. Эти исходные ранги (image search rank) могут использоваться позже как один из вариантов Ranking Measure для выбора канонических изображений.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Презентационный слой)
Основное применение патента. После получения ранжированных результатов система выполняет:

  1. Анализ сходства: Расчет Similarity Matrix.
  2. Кластеризация: Генерация иерархической структуры.
  3. Выбор представителей: Идентификация Canonical Image для каждого кластера.
  4. Организация выдачи: Формирование финального визуального представления (UI) на основе этой структуры.

Входные данные:

  • Ранжированные результаты поиска изображений.
  • Визуальные и текстовые признаки изображений (для расчета сходства).

Выходные данные:

  • Иерархическая структура кластеров изображений.
  • Идентификация канонического изображения для каждого кластера.
  • Данные для построения пользовательского интерфейса.

На что влияет

  • Конкретные типы контента: Влияет исключительно на результаты поиска изображений (статичные графики, фотографии, рисунки).
  • Специфические запросы: Наибольшее влияние оказывается на запросы, которые возвращают большое количество визуально разнообразных результатов (например, общие информационные запросы типа «Эйфелева башня») или коммерческие запросы с множеством вариантов товара («синие кроссовки»).

Когда применяется

Алгоритм применяется при формировании страницы результатов поиска изображений для пользователя. Кластеризация и выбор канонических изображений могут происходить в режиме реального времени на основе полученных результатов ранжирования или быть предварительно рассчитанными.

Пошаговый алгоритм

Процесс организации результатов поиска изображений:

  1. Получение данных: Система получает запрос и набор ранжированных результатов поиска изображений.
  2. Расчет матрицы сходства: Для каждой пары изображений в наборе вычисляется значение сходства (similarity value) на основе визуальных признаков (например, local descriptors) и, возможно, других сигналов (текст, метаданные, co-clicks). Формируется Similarity Matrix.
  3. Иерархическая кластеризация: Используя матрицу сходства, система генерирует иерархическую группировку. Часто используется метод HAC:
    1. Начать с того, что каждое изображение является отдельным кластером.
    2. Объединить два наиболее похожих кластера в один.
    3. Повторять шаг 2, пока не будет достигнута нужная структура или порог сходства.
  4. Выбор канонических изображений: Для каждого кластера на каждом уровне иерархии идентифицируется Canonical Image с использованием Ranking Measure. Существует два основных метода:
    1. Метод А (Исходный ранг): Выбрать изображение в кластере с наивысшим исходным рангом поиска (Claim 2).
    2. Метод Б (Визуальная авторитетность): Рассчитать VisualRank для изображений и выбрать изображение с наивысшим показателем VisualRank (Claim 3, 4).
  5. (Опционально) Итеративная кластеризация: Система может повторить шаги 3 и 4, используя только канонические изображения, выбранные на предыдущем этапе (Claim 6). Это позволяет создать более разреженную и рафинированную иерархию («кластеризация кластеров»).
  6. Представление результатов: Система формирует пользовательский интерфейс, отображая кластеры с помощью их канонических изображений, организуя их иерархически (например, большие изображения для кластеров верхнего уровня, меньшие для дочерних).

Какие данные и как использует

Данные на входе

Патент фокусируется на организации уже полученных результатов и использует следующие типы данных:

  • Данные о ранжировании: Исходные ранги (image search rank) изображений, полученные от основной поисковой системы. Критичны для выбора Canonical Image.
  • Мультимедиа (Визуальные) факторы: Основа для расчета сходства. Упоминаются:
    • Интенсивность (Intensity histograms).
    • Цвет (Color histograms, RGB, YIQ).
    • Края и текстура (Edge and texture information).
    • Локальные дескрипторы (Local descriptors) – ключевой элемент для VisualRank и точного сопоставления. Примеры: Harris corners, SIFT, Shape Context.
    • Сходство лиц (Facial similarity).
  • Контентные (Текстовые) факторы: Используются как дополнительные сигналы для расчета сходства: текстовые аннотации, имена файлов, метки (labels), текст, ассоциированный с изображением.
  • Поведенческие факторы: Упоминается возможность использования данных о совместных кликах (co-click information) как сигнала сходства.
  • Метаданные: Время и место съемки, данные EXIF.

Какие метрики используются и как они считаются

  • Similarity Value (Значение сходства): Метрика, определяющая, насколько похожи два изображения. При использовании локальных дескрипторов она часто вычисляется как общее количество совпадений дескрипторов, нормализованное на среднее количество локальных дескрипторов.
  • Ranking Measure (Показатель ранжирования): Метрика для выбора Canonical Image. Может принимать значение исходного ранга или VisualRank.
  • VisualRank: Оценка визуальной авторитетности. Рассчитывается итеративно на основе графа визуального сходства. Изображения, на которые «ссылаются» (визуально похожи) многие другие авторитетные изображения, получают более высокий VisualRank.
  • Алгоритмы кластеризации: Используются для группировки. Упомянуты Hierarchical Agglomerative Clustering (HAC), K-medoids, Affinity propagation.

Выводы

  1. Организация выдачи отделена от ранжирования: Патент описывает систему, которая работает поверх основного ранжирования. Её цель — не определить релевантность, а организовать уже найденные релевантные результаты для лучшего восприятия пользователем.
  2. Визуальное сходство — основа группировки: Основным фактором для объединения изображений в кластеры является их визуальное сходство, рассчитываемое через Similarity Matrix с использованием сложных визуальных признаков (например, локальных дескрипторов).
  3. Критическая роль «Canonical Image»: Изображение, выбранное в качестве канонического, получает максимальную видимость, так как оно представляет всю группу схожих изображений.
  4. Два пути к каноничности: Патент описывает два ключевых метода выбора Canonical Image:
    1. Приоритет исходного ранга (Claim 2): Выбрать изображение, которое уже имеет самый высокий ранг в поиске среди членов кластера.
    2. Приоритет визуальной авторитетности (Claim 3, 4): Выбрать изображение с наивысшим показателем VisualRank, то есть наиболее визуально репрезентативное и авторитетное в кластере.
  5. Итеративная кластеризация: Система может улучшать организацию выдачи, применяя кластеризацию повторно только к каноническим изображениям (Claim 6), создавая «кластеры кластеров».

Практика

Best practices (это мы делаем)

  • Максимизация исходного ранга изображения: Поскольку самый высокий исходный ранг (image search rank) является одним из двух основных способов стать Canonical Image (Claim 2), все стандартные методы Image SEO критически важны. Необходимо оптимизировать Alt-текст, имя файла, контекст на странице, скорость загрузки и работать над авторитетностью страницы/сайта.
  • Создание высококачественных и четких изображений (Визуальная авторитетность): Изображения должны быть высокого качества, чтобы алгоритмы визуального анализа (используемые в VisualRank) могли корректно извлечь признаки. Четкие, хорошо освещенные, репрезентативные изображения имеют больше шансов быть признанными визуально авторитетными и стать каноническими.
  • Оригинальность и эталонность контента: Создание уникального визуального контента, который может стать эталоном в нише, помогает выделиться. Если ваше изображение является оригиналом, который копируют другие, это может положительно влиять на VisualRank.
  • Стратегия множественных изображений (E-commerce): Для товаров предоставляйте несколько высококачественных изображений с разных ракурсов. Это увеличивает вероятность того, что ваши изображения войдут в разные визуальные кластеры (например, «вид сбоку», «в интерьере»), и повышает шансы одного из них стать каноническим в своем кластере.

Worst practices (это делать не надо)

  • Использование низкокачественных или «шумных» изображений: Зернистые, плохо сжатые или изображения с отвлекающими элементами с меньшей вероятностью будут выбраны в качестве Canonical Image, так как их визуальные признаки сложнее анализировать, и они часто имеют более низкое качество.
  • Игнорирование визуальных характеристик: Фокусировка только на текстовой оптимизации (Alt, Title) при игнорировании качества самого изображения. Патент показывает, что визуальный анализ играет ключевую роль в организации выдачи.
  • Дублирование или незначительное изменение изображений: Использование одного и того же или слегка измененного изображения многократно не дает преимуществ. Они будут сгруппированы в один кластер, и только одно (с наивысшим рангом) станет каноническим.

Стратегическое значение

Патент подчеркивает важность визуального понимания контента поисковыми системами. Для SEO-стратегии это означает, что необходимо учитывать не только то, как алгоритмы интерпретируют метаданные и текст вокруг изображения, но и как они воспринимают само визуальное содержимое (концепция «Визуальной авторитетности»). Видимость в поиске по картинкам зависит от комбинации традиционной оптимизации ранжирования и визуального качества/репрезентативности.

Практические примеры

Сценарий: Поиск товара «Синие беговые кроссовки Модель X»

  1. Запрос и результаты: Пользователь ищет товар. Google возвращает изображения от разных ритейлеров (Nike, Amazon, небольшой магазин).
  2. Кластеризация: Система формирует визуальные кластеры:
    • Кластер А: Кроссовки Модели X на белом студийном фоне.
    • Кластер Б: Кроссовки Модели X на ногах бегущего человека (lifestyle).
  3. Выбор Canonical Image (Кластер А): Система анализирует исходные ранги. Изображение от Nike имеет Ранг 1, Amazon – Ранг 5, магазин – Ранг 20. Система выбирает изображение от Nike как каноническое (согласно Claim 2), так как у него наивысший исходный ранг.
  4. Выбор Canonical Image (Кластер Б): Система анализирует VisualRank (согласно Claim 3). Профессиональное lifestyle-фото от известного блогера оказывается наиболее четким и визуально авторитетным, и система выбирает его как каноническое, даже если его исходный ранг был чуть ниже, чем у любительских фото.
  5. Результат для SEO: Чтобы максимизировать видимость, ритейлер должен стремиться иметь как высокий исходный ранг (для студийных фото), так и предоставлять высококачественные lifestyle-фотографии (для повышения VisualRank).

Вопросы и ответы

Что такое «Canonical Image» в контексте этого патента и почему это важно для SEO?

Canonical Image — это изображение, выбранное системой для представления целого кластера визуально похожих картинок. Для SEO это критически важно, потому что в интерфейсах, использующих кластеризацию, пользователь в первую очередь видит именно канонические изображения. Если ваше изображение выбрано как каноническое, оно получает максимальную видимость для этой группы результатов.

Как Google выбирает Canonical Image для кластера?

Патент указывает, что выбор основан на Ranking Measure. Система анализирует все изображения в кластере и выбирает то, у которого эта метрика наивысшая. Это может быть исходный ранг изображения в поиске (Claim 2) или другая метрика авторитетности, например, VisualRank (Claim 3).

Что такое VisualRank и как он влияет на этот процесс?

VisualRank — это аналог PageRank для изображений, который оценивает авторитетность картинки на основе графа визуального сходства. Если изображение визуально похоже на многие другие авторитетные изображения или само является источником для многих копий, его VisualRank может быть высоким. Патент упоминает его как возможную метрику для выбора Canonical Image, что подчеркивает важность создания качественного и влиятельного визуального контента.

Как система определяет, какие изображения похожи друг на друга?

Система создает Similarity Matrix, рассчитывая оценки сходства для всех пар изображений. Для этого используются различные сигналы: цвет, текстура, форма, но в особенности локальные дескрипторы (Local Descriptors), такие как SIFT. Эти дескрипторы устойчивы к изменениям масштаба и поворота и позволяют эффективно сопоставлять объекты на разных изображениях.

Что такое иерархическая агломеративная кластеризация (HAC)?

Это метод кластеризации «снизу вверх». Сначала каждое изображение считается отдельным кластером. Затем система итеративно находит два наиболее похожих кластера и объединяет их в один больший кластер, пока не будет достигнута нужная структура. Это создает иерархию (дендрограмму) визуальных тем.

Стоит ли создавать много похожих изображений для доминирования в кластере?

Это неэффективная стратегия. Визуально похожие изображения будут объединены в один кластер, и только одно из них (с наивысшим рангом или VisualRank) станет Canonical Image. Лучше сосредоточиться на повышении ранга основного изображения и создании действительно разнообразных визуальных представлений (например, разных ракурсов).

Применяются ли эти механизмы в современном поиске Google (2025)?

Хотя конкретный интерфейс (ZUI), показанный в патенте (похожий на Google Image Swirl), больше не используется, базовые принципы актуальны. Кластеризация визуально схожих изображений используется в Google Images для группировки результатов, в Google Lens, а также при формировании каруселей изображений и других SERP Features. Выбор канонического изображения остается ключевой задачей.

Что означает «итеративная кластеризация» (Claim 6)?

Это означает, что система может выполнять кластеризацию в несколько этапов. Сначала она кластеризует исходные изображения и выбирает канонические для этих кластеров. Затем она может взять только эти канонические изображения и снова кластеризовать их. Это позволяет эффективно строить глубокие иерархические структуры из очень больших наборов данных.

Как этот патент влияет на SEO для eCommerce сайтов?

Он имеет прямое значение. Если в выдаче присутствует много фотографий одного и того же товара от разных продавцов, они будут кластеризованы. Чтобы изображение с вашего сайта стало Canonical Image и получило клик, оно должно иметь более высокий ранг или более высокий VisualRank, чем у конкурентов. Это требует оптимизации карточек товаров и повышения качества изображений.

Если мое изображение визуально похоже на высокоранжированное изображение, улучшит ли это мой рейтинг?

Нет, само по себе сходство не улучшит ваш рейтинг. Согласно патенту, ваше изображение будет помещено в тот же кластер, что и высокоранжированное изображение. Однако именно высокоранжированное изображение, скорее всего, будет выбрано в качестве канонического и получит основную видимость, а ваше останется скрытым внутри кластера.

Похожие патенты

Как Google организует результаты поиска по картинкам в масштабируемый интерфейс с помощью кластеризации по сходству
Google использует систему для визуализации результатов поиска по картинкам. Изображения группируются на основе визуального и семантического сходства и размещаются в двумерной сетке. При уменьшении масштаба система показывает меньше изображений, выбирая одно репрезентативное для каждого кластера. При увеличении масштаба отображается больше детализированных результатов внутри кластера. Это позволяет пользователям эффективно просматривать большие наборы изображений.
  • US20150170333A1
  • 2015-06-18
  • Мультимедиа

  • SERP

  • Семантика и интент

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google оптимизирует поиск по картинкам, обучаясь, какие визуальные атрибуты наиболее важны для конкретного изображения
Google использует механизм для повышения эффективности и релевантности поиска похожих изображений. Система анализирует изображение-запрос и создает эталонный набор высококачественных результатов (используя ресурсоемкую кластеризацию). Затем она тестирует различные визуальные атрибуты (измерения), чтобы определить, какой из них лучше всего воспроизводит этот эталонный набор. Найденный ключевой атрибут сохраняется и используется для быстрого ранжирования в будущем, минуя дорогие вычисления.
  • US8949253B1
  • 2015-02-03
  • Мультимедиа

Как Google агрегирует и ранжирует пользовательские метки для идентификации объектов в Визуальном поиске (Google Lens)
Google использует этот механизм для повышения точности идентификации объектов при поиске по изображению. Система находит множество визуально похожих изображений, загруженных пользователями (UGC), и анализирует их текстовые метки. Метки группируются по смыслу, а затем эти группы ранжируются на основе совокупной визуальной релевантности. Это позволяет определить наиболее вероятное название объекта, опираясь на коллективное мнение.
  • US9424279B2
  • 2016-08-23
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных
Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.
  • US9652462B2
  • 2017-05-16
  • Мультимедиа

  • SERP

  • Семантика и интент

Популярные патенты

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
  • US7308643B1
  • 2007-12-11
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки
Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).
  • US20180357238A1
  • 2018-12-13
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google динамически регулирует влияние фактора близости в локальном поиске в зависимости от тематики запроса и региона
Google использует систему для определения того, насколько важна близость (расстояние) для конкретного поискового запроса и региона. Анализируя исторические данные о кликах и запросах маршрутов, система вычисляет «Фактор важности расстояния». Для запросов типа «Кофе» близость критична, и удаленные результаты пессимизируются. Для запросов типа «Аэропорт» близость менее важна, и качественные результаты могут ранжироваться высоко. Система также учитывает плотность региона (город или село), адаптируя ожидания пользователей по расстоянию.
  • US8463772B1
  • 2013-06-11
  • Local SEO

  • Поведенческие сигналы

seohardcore