SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google организует результаты поиска по картинкам в масштабируемый интерфейс с помощью кластеризации по сходству

GROUPING AND PRESENTING IMAGES (Группировка и представление изображений)
  • US20150170333A1
  • Google LLC
  • 2011-09-15
  • 2015-06-18
  • Мультимедиа
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для визуализации результатов поиска по картинкам. Изображения группируются на основе визуального и семантического сходства и размещаются в двумерной сетке. При уменьшении масштаба система показывает меньше изображений, выбирая одно репрезентативное для каждого кластера. При увеличении масштаба отображается больше детализированных результатов внутри кластера. Это позволяет пользователям эффективно просматривать большие наборы изображений.

Описание

Какую проблему решает

Патент решает задачу эффективного просмотра и навигации по большому количеству результатов поиска изображений. Стандартное представление в виде списка или простой сетки затрудняет быстрое понимание разнообразия результатов и поиск нужного изображения, особенно на устройствах с небольшими экранами. Система призвана облегчить просмотр набора изображений (browsing of an image set) путем создания интуитивно понятной визуальной структуры.

Что запатентовано

Запатентована система визуализации изображений, которая группирует изображения по сходству и представляет их в масштабируемом пользовательском интерфейсе (zoomable user interface). Ключевым элементом является двумерная сетка (two dimensional grid), где похожие изображения расположены рядом. Система позволяет пользователю изменять масштаб: при уменьшении (zoom out) несколько похожих изображений заменяются одним репрезентативным изображением (representative image или canonical image) большего размера, создавая визуальную сводку. При увеличении (zoom in) отображается больше детализированных результатов.

Как это работает

Система работает в два основных этапа: группировка и представление.

  • Группировка (Офлайн или Онлайн): Система получает ранжированные результаты поиска. Вычисляется матрица сходства (Similarity Matrix) между изображениями на основе визуальных признаков (цвет, текстура, форма) и метаданных. Используя методы снижения размерности (например, KPCA и MDS) и кластеризации (например, SOM или иерархическая кластеризация), изображениям назначаются координаты в двумерном пространстве. Для каждого кластера определяется каноническое изображение.
  • Представление (UI): Результаты отображаются в виде сетки. При получении команды изменения масштаба система переключается между уровнями детализации (zoom levels). При переходе на менее детальный уровень (zoom out) гранулярность сетки уменьшается, и группы изображений заменяются их каноническими представителями. Переходы между уровнями реализованы плавно, с использованием масштабирования и прозрачности.

Актуальность для SEO

Средняя. Технологии организации и кластеризации изображений по визуальному сходству остаются критически важными для Google Images и Google Lens. Однако конкретная реализация пользовательского интерфейса с многоуровневым масштабированием, описанная в патенте, может отличаться от текущих интерфейсов Google, которые чаще используют динамическую загрузку и фильтры. Тем не менее, базовые принципы группировки и выбора репрезентативных изображений актуальны.

Важность для SEO

Влияние на SEO минимальное (2/10). Патент описывает преимущественно технологии на стороне клиента (UI/UX) и методы организации уже ранжированных результатов для отображения. Он не раскрывает алгоритмов ранжирования, индексирования или сканирования изображений. Для SEO-специалистов он дает понимание того, как Google анализирует визуальное сходство и группирует контент в поиске по картинкам, но не предлагает прямых рычагов для улучшения позиций в основном поиске.

Детальный разбор

Термины и определения

Canonical Image (Каноническое изображение)
Изображение, выбранное для представления целого кластера похожих изображений. Используется для создания "визуальной сводки" (visual summary) на более общих уровнях масштабирования.
Hierarchical Cluster (Иерархический кластер)
Структура данных, в которой изображения организованы в виде дерева (дендрограммы), где близкие по смыслу или визуально изображения объединяются в группы, которые, в свою очередь, объединяются в более крупные группы.
Image Feature Vector (Вектор признаков изображения)
Математическое представление изображения, содержащее информацию о его характеристиках (цвет, текстура, форма и т.д.). Используется для вычисления сходства.
KPCA (Kernelized Principal Component Analysis / Ядерный метод главных компонент)
Метод снижения размерности. В патенте используется для вычисления части вектора признаков на основе глобального набора данных изображений (из множества предыдущих запросов).
MDS (Multidimensional scaling / Многомерное шкалирование)
Метод снижения размерности и визуализации данных. Используется для вычисления части вектора признаков на основе набора изображений, релевантных текущему запросу.
Similarity Matrix (Матрица сходства)
Матрица размера N×N, где N – количество изображений. Каждая ячейка содержит значение сходства (similarity value) между парой изображений.
SOM (Self-Organizing Map / Самоорганизующаяся карта Кохонена)
Тип нейронной сети, используемый для кластеризации и отображения высокоразмерных данных в низкоразмерное (обычно двумерное) пространство.
Two dimensional grid (Двумерная сетка)
Способ организации интерфейса, в котором каждому изображению присваивается целочисленная координата (x, y) на основе его сходства с другими изображениями.
Zoom Level (Уровень масштабирования)
Определяет гранулярность представления изображений. Низкий уровень (zoomed-out) показывает меньше репрезентативных изображений, высокий уровень (zoomed-in) показывает больше детализированных изображений.

Ключевые утверждения (Анализ Claims)

Патент носит выраженный технический характер и фокусируется на реализации пользовательского интерфейса и методах группировки данных для этого интерфейса.

Claim 1 (Независимый пункт): Описывает метод представления изображений в ответ на поисковый запрос.

  1. Представление пользовательского интерфейса с изображениями в двумерной сетке, где координаты назначены на основе групп сходства.
  2. В ответ на получение ввода для уменьшения масштаба (zoom out):
    • Определение уровня масштабирования (image zoom level).
    • Модификация интерфейса.
  3. Модификация включает:
    • Уменьшение гранулярности двумерной сетки (отображение меньшего количества изображений).
    • Замена множества изображений каждой группы меньшим подмножеством (smaller subset) из этой группы.
  4. Подмножество включает предопределенное количество изображений (больше одного, но меньше общего числа в группе), определяемое уровнем масштаба.
  5. Подмножество содержит репрезентативное изображение (representative image).
  6. Репрезентативное изображение после модификации отображается в большем размере, чем до нее.

Ядро изобретения — это механизм динамического изменения детализации сетки изображений при масштабировании, где при уменьшении масштаба система агрегирует визуальную информацию, показывая меньше изображений, но большего размера, которые представляют целые группы.

Claim 18 (Зависимый от 17): Детализирует процесс группировки ресурсов (в контексте системы Клиент-Сервер, описанной в Claim 17).

  1. Вычисление первых 'n' измерений вектора признаков с использованием KPCA на первом наборе изображений (из множества предыдущих запросов).
  2. Вычисление вторых 'm' измерений вектора признаков с использованием MDS (multidimensional reduction) на втором наборе изображений (релевантных текущему запросу).
  3. Кластеризация изображений второго набора на основе полученного вектора признаков для отображения их в двумерное пространство.
  4. Определение для каждой позиции в сетке: (i) изображения с минимальным расстоянием до этой позиции в 2D пространстве и (ii) приоритета (priority indication) для остальных изображений относительно этой позиции.

Этот пункт описывает конкретную технику группировки, комбинирующую глобальный анализ (KPCA) и локальный анализ (MDS) для определения расположения изображений в интерфейсе и их приоритета для выбора в качестве репрезентативных.

Где и как применяется

Изобретение затрагивает этапы, связанные с анализом результатов ранжирования и их представлением пользователю. Оно не влияет на базовое ранжирование.

INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются визуальные признаки изображений, которые впоследствии могут использоваться для расчета сходства (например, для KPCA).

RANKING – Ранжирование
Система получает на вход уже ранжированные результаты поиска (Ranked Image Query Search Results). Алгоритмы патента не участвуют в определении этого первичного ранжирования.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента происходит после получения базовых результатов. Система анализирует полученный набор изображений, вычисляет сходство между ними, выполняет кластеризацию и определяет канонические изображения и их расположение в сетке. Это можно рассматривать как этап организации результатов перед их финальным представлением в SERP (в данном случае, в интерфейсе поиска по картинкам).

Представление (UI/Frontend)
Значительная часть патента описывает логику работы пользовательского интерфейса: обработку команд масштабирования, переключение между уровнями детализации, плавные переходы и рендеринг сетки.

Входные данные:

  • Поисковый запрос (Image Query).
  • Ранжированные результаты поиска изображений.
  • Векторы признаков и метаданные изображений.

Выходные данные:

  • Матрица сходства изображений.
  • Иерархическая структура кластеров или координаты изображений в 2D пространстве.
  • Приоритеты изображений для выбора в качестве канонических.
  • Код (например, HTML/JavaScript) для отображения масштабируемого интерфейса на устройстве пользователя.

На что влияет

  • Конкретные типы контента: Влияет исключительно на изображения и потенциально видео (упоминается как other visual contents).
  • Специфические запросы: Применяется к запросам в поиске по картинкам. Особенно полезно для общих запросов, возвращающих большое и разнообразное количество визуальных результатов (например, "Эйфелева башня").
  • Определенные форматы контента: Интерфейс предназначен для эффективного просмотра миниатюр (thumbnails).

Когда применяется

  • Условия работы: Применяется при отображении результатов поиска по картинкам или при просмотре больших коллекций изображений (например, фотоальбомов).
  • Триггеры активации: Активируется в ответ на действия пользователя по изменению масштаба (zoom in/out) в интерфейсе. Процесс группировки может запускаться при получении запроса или выполняться заранее для популярных запросов.

Пошаговый алгоритм

Процесс А: Группировка изображений (На основе FIG. 2, 4A, 4B)

  1. Получение данных: Система получает запрос и ранжированные результаты поиска с соответствующими метаданными и векторами признаков.
  2. Вычисление матрицы сходства: Для набора изображений (L), релевантных запросу, вычисляется матрица сходства (A). Сходство учитывает визуальные и семантические признаки.
  3. Снижение размерности (Локальное): Применяется MDS к матрице A для генерации матрицы D (L x m), где каждая строка – это m-мерный вектор признаков для изображения, отражающий его отношение к другим изображениям в этом запросе.
  4. Снижение размерности (Глобальное): Вычисляются n-мерные векторы признаков с помощью KPCA, обученного на глобальном наборе данных (изображения из множества разных запросов).
  5. Комбинирование признаков: m-мерный вектор (из MDS) и n-мерный вектор (из KPCA) объединяются в единый вектор признаков. Это позволяет учитывать как локальные, так и глобальные расстояния на многообразии изображений.
  6. Кластеризация и Маппинг: Применяется SOM (или иерархическая кластеризация) к комбинированным векторам признаков для отображения изображений в двумерное пространство.
  7. Уточнение координат: Поскольку SOM не гарантирует уникальные координаты для каждого изображения, выполняется этап уточнения (Coordinate Refinement). Система последовательно находит пару <изображение, неназначенная ячейка сетки> с минимальным расстоянием и назначает изображение этой ячейке.
  8. Выбор представителей: Для каждой позиции вычисляется приоритет репрезентативности (representativeness priority) для каждого изображения. Это используется для выбора канонических изображений на разных уровнях масштабирования.

Процесс Б: Представление и навигация (На основе FIG. 1, 5, 7)

  1. Отображение сетки: Пользовательский интерфейс отображает изображения в двумерной сетке на текущем уровне масштабирования (z).
  2. Получение ввода: Система получает команду на увеличение или уменьшение масштаба.
  3. Масштабирование и расчет прозрачности: Изображения на текущем уровне масштабируются в соответствии с коэффициентом масштабирования (s). Рассчитывается параметр прозрачности (alpha) для плавного перехода. Например, α=log2(s)−[log2(s)]\alpha = log_2(s) - [log_2(s)]α=log2​(s)−[log2​(s)].
  4. Выравнивание уровней: Если происходит переход между уровнями, система выравнивает (aligning) каноническое изображение на менее детальном уровне с его соответствующей (меньшей) версией на более детальном уровне.
  5. Рендеринг перехода: Интерфейс отрисовывает оба уровня. Более детальный уровень (нижний слой) отрисовывается полностью. Менее детальный уровень (верхний слой) отрисовывается поверх него с рассчитанной прозрачностью (alpha), создавая эффект плавного перехода.
  6. Смена уровня: Когда коэффициент масштабирования пересекает порог (например, когда alpha достигает 0 или 1), происходит смена активного уровня масштабирования (z меняется на z+1 или z-1). Гранулярность сетки изменяется (например, с kz∗kzk^z*k^zkz∗kz до kz+1∗kz+1k^{z+1}*k^{z+1}kz+1∗kz+1).

Какие данные и как использует

Данные на входе

Система использует различные типы данных для расчета сходства и организации интерфейса:

  • Мультимедиа факторы (Визуальные признаки): Интенсивность, цвет (гистограммы в различных цветовых пространствах, например, RGB, YIQ), края (edges), текстура, признаки на основе вейвлет-преобразований (wavelet based techniques), локальные признаки (local features), сходство лиц (facial similarity).
  • Контентные факторы (Текстовые признаки): Текст, ассоциированный с изображением (например, на веб-странице), аннотации, имена файлов, метки (labels).
  • Метаданные: Информация о времени и месте съемки (если доступна), тип файла (bitmap, jpeg, tiff).
  • Поведенческие факторы: Данные о совместных кликах (co-click information) могут использоваться как сигнал сходства.
  • Системные данные: Ранжированные результаты поиска (ranked image search results). Исходный ранг может использоваться для выбора канонического изображения (например, выбор изображения с наивысшим рангом в кластере).

Какие метрики используются и как они считаются

  • Similarity Value (Значение сходства): Оценка, определяющая степень похожести двух изображений. Вычисляется на основе комбинации визуальных, текстовых и поведенческих сигналов. Для локальных признаков сходство может вычисляться как общее количество совпадений, нормализованное на среднее количество признаков.
  • Метрики расстояния: Для кластеризации значение сходства часто трактуется как мера расстояния. Упоминаются различные техники измерения расстояния, такие как Евклидово расстояние, расстояние Манхэттена, максимальная норма, расстояние Махаланобиса или расстояние Хэмминга.
  • Scaling Factor (s) (Коэффициент масштабирования): Параметр, управляющий размером изображений в интерфейсе в ответ на действия пользователя.
  • Zoom Level (z) (Уровень масштабирования): Параметр, определяющий текущий уровень детализации. Может рассчитываться как z=logk(s)z=log_k(s)z=logk​(s), где k > 1 (например, k=2).
  • Transparency (alpha) (Прозрачность): Используется для плавных переходов. Может рассчитываться как α=log2(s)−[log2(s)]\alpha = log_2(s) - [log_2(s)]α=log2​(s)−[log2​(s)].
  • Representativeness Priority (Приоритет репрезентативности): Метрика, используемая для выбора, какое изображение лучше всего представляет группу на определенном уровне масштабирования.

Выводы

Патент описывает внутренние процессы Google по организации результатов поиска изображений без прямых рекомендаций для SEO. Он дает следующее понимание работы системы:

  1. Организация после ранжирования: Описанная система работает с уже ранжированными результатами. Ее цель — не определить релевантность или качество изображений, а организовать их наиболее удобным для просмотра образом.
  2. Критичность визуального и семантического сходства: Google активно использует сложные методы машинного обучения (KPCA, MDS, SOM) для анализа сходства между изображениями. Это сходство основывается не только на визуальных признаках, но и на метаданных, ассоциированном тексте и поведении пользователей (co-click).
  3. Кластеризация и каноникализация: Система стремится группировать похожие изображения и выбирать для них лучшего представителя (Canonical Image). Исходный ранг изображения может использоваться как критерий для выбора этого представителя внутри кластера.
  4. Комбинация глобального и локального контекста: При расчете сходства система учитывает как отношение изображения к другим изображениям по тому же запросу (локальный контекст через MDS), так и его положение в общем пространстве всех известных изображений (глобальный контекст через KPCA).
  5. Фокус на UI/UX: Основное изобретение заключается в создании сложного, масштабируемого интерфейса, который позволяет плавно переходить от общего обзора к детальному просмотру, адаптируя гранулярность выдачи на лету.

Практика

Патент является инфраструктурным и описывает реализацию пользовательского интерфейса. Он не дает практических выводов для влияния на ранжирование в SEO.

Best practices (это мы делаем)

Хотя патент не дает прямых рекомендаций по SEO, он подтверждает важность следующих общих практик для поиска по картинкам:

  • Обеспечение высокого качества и разнообразия изображений: Поскольку система группирует изображения по сходству и выбирает канонические, важно предоставлять высококачественные изображения, которые могут стать представителями кластера. Если исходный ранг используется для выбора канонического изображения, стандартные методы оптимизации изображений (релевантный alt-текст, контекст на странице) остаются важными для достижения высокого ранга.
  • Использование релевантных метаданных и контекста: Сходство вычисляется не только по визуальным признакам, но и по метаданным и окружающему тексту. Наличие точного и релевантного контекста помогает системе правильно интерпретировать и классифицировать изображение, что влияет на его попадание в соответствующие кластеры.

Worst practices (это делать не надо)

  • Массовая публикация почти идентичных изображений: Поскольку система активно кластеризует похожий контент и сводит его к одному каноническому изображению на общих уровнях просмотра, публикация множества дубликатов или незначительно отличающихся изображений не увеличит видимость. Они, скорее всего, будут сгруппированы вместе.

Стратегическое значение

Стратегическое значение патента для SEO заключается в понимании того, насколько глубоко Google анализирует визуальный контент и его взаимосвязи. Это подтверждает долгосрочный тренд на переход от анализа ключевых слов к анализу сущностей и их визуальных представлений. Система демонстрирует способность Google организовывать визуальную информацию в сложные иерархические структуры на основе сходства, что является базой для таких продуктов, как Google Images и Google Lens. Понимание механизмов кластеризации помогает интерпретировать, почему определенные изображения показываются вместе или почему одно изображение выбирается в качестве основного.

Практические примеры

Практических примеров для SEO, направленных на улучшение ранжирования на основе этого патента, нет, так как он описывает UI.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует изображения?

Нет. Патент четко указывает, что система получает на вход уже ранжированные результаты поиска (Ranked Image Query Search Results). Он описывает, как эти результаты группируются по сходству и представляются пользователю в масштабируемом интерфейсе. Алгоритмы первичного ранжирования в этом документе не рассматриваются.

Что такое "Каноническое изображение" (Canonical Image) в контексте этого патента?

Это изображение, которое система выбирает для представления целой группы (кластера) похожих изображений. Когда пользователь уменьшает масштаб (zoom out), он видит меньше изображений, и эти изображения являются каноническими для своих групп. Это позволяет создать краткий визуальный обзор разнообразных результатов.

Как система выбирает, какое изображение станет каноническим?

Патент предлагает несколько механизмов. Один из них — использование исходного ранга в поиске (выбирается изображение с наивысшим рангом в кластере). Другой механизм — использование рассчитанного "приоритета репрезентативности" (representativeness priority), который определяется на этапе кластеризации и маппинга координат.

На основе чего Google определяет сходство изображений согласно патенту?

Сходство определяется на основе комбинации сигналов. К ним относятся визуальные признаки (цвет, текстура, форма, локальные признаки, распознавание лиц), метаданные (время, место), ассоциированный текст (аннотации, текст на странице) и поведение пользователей (например, данные о совместных кликах co-click).

Что такое KPCA и MDS и зачем они используются?

Это методы машинного обучения для снижения размерности данных. KPCA (Ядерный метод главных компонент) используется для анализа глобального контекста (на основе всех известных изображений). MDS (Многомерное шкалирование) используется для анализа локального контекста (на основе изображений, релевантных текущему запросу). Их комбинация позволяет точнее определить сходство и расположение изображений в интерфейсе.

Влияет ли этот патент на то, как нужно оптимизировать изображения для SEO?

Прямого влияния на тактики SEO-оптимизации нет, так как патент не касается ранжирования. Однако он подчеркивает, что Google кластеризует похожие изображения. Это означает, что стандартные практики (качество изображения, релевантный контекст и метаданные) важны для того, чтобы изображение высоко ранжировалось и потенциально стало каноническим представителем своего кластера.

Стоит ли публиковать много вариантов одного и того же изображения?

С точки зрения этого патента, это неэффективно. Система обнаружит высокое сходство и сгруппирует эти изображения в один кластер. На общих уровнях просмотра они будут представлены одним каноническим изображением. Лучше сосредоточиться на качестве и уникальности контента.

Используется ли описанный масштабируемый интерфейс в текущем поиске Google?

Конкретная реализация интерфейса с многоуровневым плавным масштабированием (zoom levels), описанная в патенте 2011 года, может отличаться от того, что мы видим сегодня. Однако базовая технология кластеризации изображений по сходству и выбора репрезентативных картинок активно используется в Google Images для организации выдачи и предложения похожих результатов.

Что означает "уменьшение гранулярности сетки"?

Это означает уменьшение количества отображаемых изображений при уменьшении масштаба. Например, переход от сетки 16x16 изображений к сетке 8x8. При этом оставшиеся изображения становятся крупнее и представляют собой обобщение тех изображений, которые были скрыты.

Какова основная ценность этого патента для SEO-специалиста?

Основная ценность заключается в техническом понимании того, как Google обрабатывает и организует визуальную информацию после этапа ранжирования. Это дает представление о сложности алгоритмов анализа визуального сходства (KPCA, MDS, SOM) и подтверждает важность комплексного подхода к анализу изображений, включающего как визуальные, так и семантические данные.

Похожие патенты

Как Google кластеризует результаты поиска по картинкам и выбирает репрезентативное (каноническое) изображение для показа
Google организует результаты поиска изображений в иерархические кластеры на основе визуального сходства. Для каждого кластера выбирается «каноническое изображение» — часто это изображение с самым высоким исходным рейтингом или наиболее визуально авторитетное (с использованием метрик типа VisualRank). Эта структура определяет, как изображения группируются и какое изображение получает максимальную видимость в интерфейсе Google Images.
  • US8352465B1
  • 2013-01-08
  • Мультимедиа

  • SERP

Как Google оптимизирует поиск по картинкам, обучаясь, какие визуальные атрибуты наиболее важны для конкретного изображения
Google использует механизм для повышения эффективности и релевантности поиска похожих изображений. Система анализирует изображение-запрос и создает эталонный набор высококачественных результатов (используя ресурсоемкую кластеризацию). Затем она тестирует различные визуальные атрибуты (измерения), чтобы определить, какой из них лучше всего воспроизводит этот эталонный набор. Найденный ключевой атрибут сохраняется и используется для быстрого ранжирования в будущем, минуя дорогие вычисления.
  • US8949253B1
  • 2015-02-03
  • Мультимедиа

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя
Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.
  • US8504547B1
  • 2013-08-06
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Как Google определяет текстовое описание изображения для визуального поиска, анализируя похожие картинки и связанные с ними запросы
Google использует систему визуального поиска, которая позволяет пользователям отправлять изображение в качестве запроса. Для этого система создает индекс визуальных признаков и анализирует метаданные (запросы, по которым кликали на картинку, и текст на ссылающихся страницах). При получении изображения система находит визуально похожие картинки в индексе, анализирует связанные с ними текстовые фразы (n-граммы) и выбирает наилучшее описание. Затем выполняется стандартный поиск по этому текстовому описанию.
  • US8761512B1
  • 2014-06-24
  • Индексация

  • Мультимедиа

  • Семантика и интент

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Популярные патенты

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций
Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.
  • US10140286B2
  • 2018-11-27
  • Knowledge Graph

  • Семантика и интент

  • Персонализация

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

seohardcore