SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени

ONLINE IMAGE ANALYSIS (Онлайн-анализ изображений)
  • US10311096B2
  • Google LLC
  • 2013-02-28
  • 2019-06-04
  • Мультимедиа
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.

Описание

Какую проблему решает

Патент решает проблему неоптимального ранжирования в поиске по картинкам, когда оценка релевантности основана преимущественно на офлайн-вычислениях или общих моделях, игнорируя специфику запроса и визуальное содержание. Это может приводить к неточному учету визуальных характеристик контента или игнорированию недавно проиндексированных изображений. Изобретение внедряет механизм онлайн-анализа (в реальном времени, во время обработки запроса), который корректирует ранжирование на основе визуального содержания изображения и его соответствия специфике конкретного запроса.

Что запатентовано

Запатентована система, которая обучает и применяет индивидуальные Image Relevance Models (Модели релевантности изображений) для конкретных популярных запросов. Эти модели оценивают визуальные характеристики изображения (представленные в виде компактного дескриптора) и генерируют Relevance Score Adjustment Factor (Коэффициент корректировки оценки релевантности). Этот коэффициент применяется онлайн (в течение Query Processing Window) для переранжирования результатов, изначально отобранных поисковой системой.

Как это работает

Система работает в двух режимах:

  • Офлайн (Тренировка): Система анализирует историю запросов и идентифицирует Qualified Queries (Квалифицированные запросы) — те, для которых достаточно данных о релевантных изображениях и взаимодействиях пользователей (кликах). Для каждого такого запроса обучается отдельная Image Relevance Model, которая учится связывать визуальные характеристики изображений с их релевантностью этому конкретному запросу.
  • Онлайн (Применение): Когда поступает новый запрос, система определяет его схожесть (Similarity Score) с индексированными запросами, для которых есть модели. Выбирается модель наиболее похожего запроса. Эта модель анализирует визуальные признаки (Image Feature Values) кандидатов и вычисляет Relevance Score Adjustment Factor. Итоговый Relevance Score корректируется (с учетом масштабирования по схожести запросов), и результаты переранжируются.

Актуальность для SEO

Высокая. Визуальный поиск и точное понимание содержания изображений (Computer Vision) являются ключевыми направлениями развития Google (например, Google Lens, MUM). Описанный механизм, позволяющий динамически корректировать ранжирование на основе визуальных сигналов с учетом специфики запроса в реальном времени, полностью соответствует современным тенденциям в Information Retrieval и Image SEO.

Важность для SEO

Патент имеет высокое значение для Image SEO (8.5/10). Он подтверждает, что ранжирование изображений не зависит исключительно от текстовых факторов (alt, surrounding text). Визуальные характеристики изображения напрямую влияют на его позицию через Relevance Score Adjustment Factor. Для достижения успеха критически важно, чтобы визуальное содержание изображения соответствовало тому типу контента, который исторически удовлетворял пользователей (на котором обучалась модель) по данному или похожему запросу.

Детальный разбор

Термины и определения

Image Content Descriptor (Дескриптор содержания изображения)
Компактное представление Image Feature Values (например, 32 байта), оптимизированное для быстрого онлайн-анализа. Генерируется с помощью Hashing, PCA и Delta Encoding.
Image Feature Values / Content Feature Values (Значения признаков изображения)
Числовые значения, описывающие визуальные характеристики изображения или его частей (цвет, текстура, гистограммы, края, углы, геометрическая информация).
Image Relevance Model (Модель релевантности изображений)
Модель машинного обучения (в патенте упоминается PAMIR), обученная для конкретного индексированного запроса. Она принимает на вход визуальные характеристики изображения (дескриптор) и выводит Relevance Score Adjustment Factor.
Indexed Query (Индексированный запрос)
Запрос, сохраненный в Historical Data Store, для которого может быть обучена Image Relevance Model.
PAMIR (Passive-Aggressive Model for Image Retrieval)
Тип линейной модели, упомянутый как возможная реализация Image Relevance Model. Обучается итеративно для ранжирования изображений по текстовым запросам.
Qualified Query (Квалифицированный запрос)
Индексированный запрос, который соответствует критериям для обучения модели: имеет достаточное количество релевантных изображений (выше порога) И достаточное количество взаимодействий пользователей (выше порога).
Query Processing Window (Окно обработки запроса)
Период времени между получением поискового запроса и отправкой результатов пользователю. Ключевой аспект патента — анализ происходит именно в этот период (онлайн).
Relevance Feedback Score (Оценка обратной связи по релевантности)
Метрика релевантности, основанная на действиях пользователей (например, кликах). Используется для обучения Image Relevance Models.
Relevance Score Adjustment Factor (Коэффициент корректировки оценки релевантности)
Значение, генерируемое Image Relevance Model на основе визуальных признаков. Используется для изменения исходного Relevance Score.
Similarity Score (Оценка схожести)
Метрика, определяющая схожесть между двумя запросами (используется для выбора модели) или между двумя изображениями (используется для анализа визуального сходства).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает весь процесс, включающий селективную офлайн-тренировку и онлайн-применение для переранжирования изображений.

  1. Система идентифицирует запросы в историческом хранилище, у которых количество релевантных изображений превышает порог.
  2. Система обучает индивидуальные Image Relevance Models ТОЛЬКО для этих запросов (и не обучает для запросов, не достигших порога). Каждая модель уникальна.
  3. Система получает новый запрос и набор отзывчивых результатов (изображений).
  4. Система выбирает модель для использования. Это включает:
    • Определение (во время Query Processing Window), что полученный запрос наиболее похож на определенный индексированный запрос (для которого есть модель), на основе Similarity Score.
    • Выбор модели этого наиболее похожего индексированного запроса.
  5. Для каждого результата (во время Query Processing Window):
    • Вычисление Relevance Score Adjustment Factor с использованием выбранной модели и Image Feature Values.
    • Корректировка Relevance Score.
  6. Ранжирование результатов на основе скорректированных оценок и их предоставление.

Ядро изобретения — это селективное обучение моделей для конкретных запросов (на основе данных) и применение этих моделей (или моделей похожих запросов) в реальном времени для переранжирования на основе визуальных признаков.

Claim 5 (Зависимый от 1): Уточняет механизм корректировки при использовании модели от похожего запроса.

Система масштабирует (scaling) вычисленный Relevance Score Adjustment Factor пропорционально величине Similarity Score между полученным запросом и индексированным запросом, чья модель была использована.

Если система использует модель запроса, который лишь отдаленно похож на текущий запрос пользователя (низкий Similarity Score), то влияние визуальной модели на итоговое ранжирование будет слабым. Если схожесть высокая или запрос совпадает, влияние будет сильным.

Claim 8 (Зависимый от 1): Определяет критерии для тренировки модели (Qualified Query).

Обучение модели происходит только для запросов, которые удовлетворяют двум условиям: (1) пороговое количество изображений имеют минимальную оценку релевантности для этого запроса И (2) произошло пороговое количество взаимодействий пользователей с результатами этого запроса.

Это подчеркивает важность наличия достаточного объема данных и обратной связи от пользователей для построения надежной модели.

Claim 9 (Зависимый от 1): Описывает технический процесс создания Compressed Image Content Descriptor для обеспечения скорости.

Для каждого изображения генерируется сжатый дескриптор путем: конкатенации признаков, хеширования (для сокращения размера), применения Kernel PCA для генерации вектора чисел с плавающей запятой и применения Delta Encoding к подмножеству этих чисел, имеющих наибольшую вариативность. Этот дескриптор сохраняется в кеше и используется моделью для вычисления корректировки.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая офлайн-обработку данных с онлайн-ранжированием в вертикали поиска по картинкам.

INDEXING – Индексирование и извлечение признаков

  • Извлечение признаков: На этом этапе извлекаются Image Feature Values (цвет, текстура и т.д.).
  • Генерация дескрипторов: Визуальные признаки сжимаются в компактный Image Content Descriptor (с использованием Hashing, PCA, Delta Encoding) и сохраняются в индексе (Indexed Cache).

(Офлайн-процессы, связанные с INDEXING и QUNDERSTANDING)

  • Офлайн-тренировка: Система анализирует Historical Data Store (логи запросов и взаимодействий), идентифицирует Qualified Queries и обучает для них Image Relevance Models. Модели сохраняются в Image Relevance Model Store.

QUNDERSTANDING – Понимание Запросов (Онлайн)

  • Во время обработки запроса система вычисляет Similarity Score между полученным запросом и индексированными запросами, чтобы найти наилучшее соответствие для выбора модели.

RANKING – Ранжирование (Онлайн)

  • На этом этапе генерируется первоначальный набор результатов с исходными Relevance Scores (вероятно, на основе текстовых, ссылочных и других стандартных сигналов).

RERANKING – Переранжирование (Онлайн)

  • Основное применение патента. Происходит онлайн, во время Query Processing Window. Система извлекает Image Content Descriptor для кандидатов, применяет выбранную Image Relevance Model, вычисляет и масштабирует Relevance Score Adjustment Factor, и пересортировывает результаты.

Входные данные:

  • Запрос пользователя.
  • Набор отзывчивых изображений с исходными Relevance Scores.
  • Image Content Descriptor для каждого изображения.
  • База обученных Image Relevance Models.

Выходные данные:

  • Набор изображений, отсортированный по скорректированным Relevance Scores.

На что влияет

  • Типы контента: Влияет исключительно на изображения (Image Search).
  • Специфические запросы: Наибольшее влияние оказывается на запросы, для которых существуют обученные модели (Qualified Queries) — то есть, достаточно популярные запросы с четким визуальным интентом (например, названия продуктов, пород животных, мест, эстетические запросы).
  • Конкретные ниши: Сильное влияние в тематиках, где визуальное соответствие критично: e-commerce, мода, дизайн, путешествия.
  • Новые и редкие запросы: Для редких или новых запросов система будет пытаться найти похожий запрос с моделью, но влияние будет слабее (из-за масштабирования по Similarity Score). Если похожих запросов нет, механизм может не применяться.

Когда применяется

  • Триггеры активации: Получение запроса на поиск изображений.
  • Условия применения: Алгоритм корректировки активируется, если для полученного запроса (или достаточно похожего на него) существует предварительно обученная Image Relevance Model.
  • Временные рамки: Корректировка ранжирования происходит онлайн, в течение Query Processing Window. Обучение моделей происходит офлайн, периодически.

Пошаговый алгоритм

Процесс А: Офлайн-подготовка (Индексирование и Тренировка)

  1. Извлечение и сжатие признаков: Для индексируемых изображений извлекаются Image Feature Values. Они сжимаются через Hashing, PCA и Delta Encoding в Image Content Descriptor и сохраняются.
  2. Анализ исторических данных: Система получает доступ к логам запросов и взаимодействий (кликов).
  3. Идентификация Квалифицированных Запросов: Для каждого индексированного запроса проверяется:
    • Превышает ли количество релевантных изображений порог?
    • Превышает ли количество взаимодействий пользователей порог?
    • Если оба ДА, запрос помечается как Qualified Query.
  4. Обучение Моделей: Для каждого Qualified Query обучается индивидуальная Image Relevance Model (например, PAMIR). Модель учится предсказывать релевантность (основываясь на Relevance Feedback Score) на основе визуальных признаков изображений.
  5. Сохранение Моделей: Обученные модели сохраняются с привязкой к соответствующим запросам.

Процесс Б: Онлайн-обработка запроса (Ранжирование)

  1. Получение запроса и первичных результатов: Система получает запрос и идентифицирует набор отзывчивых изображений с исходными Relevance Scores.
  2. Определение схожести запросов: Вычисляются Similarity Scores между полученным запросом и индексированными запросами, для которых есть модели.
  3. Выбор модели: Идентифицируется индексированный запрос с наивысшим Similarity Score (наиболее похожий). Его Image Relevance Model выбирается для анализа.
  4. Вычисление корректировки: Для каждого изображения в наборе результатов:
    • Извлекается его Image Content Descriptor (и при необходимости декомпрессируется).
    • Выбранная модель применяется к дескриптору для вычисления Relevance Score Adjustment Factor.
  5. Масштабирование корректировки: Каждый Relevance Score Adjustment Factor масштабируется пропорционально Similarity Score (между полученным и индексированным запросом).
  6. Корректировка оценок: Исходный Relevance Score каждого изображения корректируется с помощью масштабированного фактора.
  7. Переранжирование: Изображения ранжируются на основе скорректированных оценок и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании визуальных и поведенческих данных для улучшения ранжирования изображений.

  • Мультимедиа факторы (Визуальные): Ядро изобретения. Image Feature Values — цвет, гистограммы цвета или оттенков серого, текстура, края, углы, геометрическая информация. Эти данные являются основой для анализа моделью и хранятся в виде Image Content Descriptor.
  • Поведенческие факторы: Критически важны для офлайн-обучения. Данные из Historical Data Store (логи запросов и селектов/кликов). Используются для идентификации Qualified Queries и для обучения Image Relevance Models (чтобы понять, какие визуальные признаки коррелируют с выбором пользователя — Relevance Feedback Score).
  • Контентные факторы (Текстовые): Текстовые метки (labels) и связанный текст используются для определения исходной релевантности и могут использоваться при офлайн-отборе кандидатов.

Какие метрики используются и как они считаются

  • Similarity Score (между запросами): Метрика схожести запросов. Может основываться на синонимах, edit distance, transformation cost или данных о совместных кликах (co-click data). Используется для выбора подходящей модели и масштабирования её влияния.
  • Relevance Score Adjustment Factor: Выход модели релевантности. В случае использования PAMIR, это может быть скалярное произведение (dot product) вектора весов модели и вектора признаков изображения (декомпрессированного дескриптора).
  • Пороги Квалификации Запроса:
    • Порог количества релевантных изображений.
    • Порог количества взаимодействий (Interaction threshold).
  • Методы анализа и вычислений:
    • Hashing (Хеширование): Например, Weighted Minhash. Используется для сокращения размерности признаков.
    • PCA (Kernel Principal Component Analysis): Используется для дальнейшего сокращения размерности и преобразования данных в вектор.
    • Delta Encoding (Дельта-кодирование): Используется для финального сжатия вектора в компактный дескриптор (например, 32 байта).

Выводы

  1. Визуальная релевантность является прямым фактором ранжирования: Патент доказывает, что Google использует визуальные характеристики изображения (цвет, текстура, форма) для корректировки ранжирования в Image Search. Это не просто сравнение с эталоном, а применение машинного обучения для оценки релевантности визуального контента.
  2. Интерпретация визуального контента зависит от запроса (Query-Specific): Система не использует одну глобальную модель качества или релевантности изображений. Вместо этого она обучает отдельные Image Relevance Models для конкретных популярных запросов. Визуальные признаки, считающиеся релевантными для запроса А, могут отличаться от признаков для запроса Б.
  3. Пользовательское поведение определяет визуальную релевантность: Модели обучаются на исторических данных о взаимодействиях (кликах). Это означает, что система учится распознавать визуальные паттерны, которые пользователи предпочитали в прошлом для данного запроса. Визуальный интент формируется коллективным поведением пользователей.
  4. Система адаптируется к похожим запросам (Graceful Degradation): Даже если для конкретного запроса нет обученной модели, система использует модель наиболее похожего запроса. Однако влияние этой модели масштабируется (ослабляется) в зависимости от степени схожести (Similarity Score), чтобы избежать неточных корректировок.
  5. Инфраструктура для скорости (Онлайн-анализ): Использование компактных Image Content Descriptors (сгенерированных через PCA, Hashing и Delta Encoding) позволяет проводить сложный визуальный анализ в реальном времени (онлайн), что критично для скорости работы поиска и учета свежего контента.

Практика

Best practices (это мы делаем)

  • Анализ и соответствие визуальному интенту: Ключевая стратегия для Image SEO. Необходимо анализировать, какие типы изображений (стиль, цвет, композиция, объект) доминируют в выдаче по целевым запросам. Создавайте изображения, которые визуально соответствуют этому паттерну. Система, обученная на предпочтениях пользователей (кликах), с большей вероятностью присвоит таким изображениям положительный Relevance Score Adjustment Factor.
  • Фокус на качестве и четкости контента: Высокое качество исполнения (четкость, освещение, резкость) способствует лучшему извлечению Image Feature Values и формированию точного Image Content Descriptor. Это повышает вероятность корректной оценки моделью.
  • Оптимизация под популярные запросы (Head/Mid-Tail): Сосредоточьтесь на запросах, которые с высокой вероятностью являются Qualified Queries (имеют достаточный объем трафика и взаимодействий). Именно для них Google с наибольшей вероятностью обучит и применит специфические визуальные модели.
  • Оптимизация под CTR в Image Search: Создавайте привлекательные изображения, которые мотивируют клики. Поскольку клики (Relevance Feedback Score) используются для обучения моделей, высокий CTR подтверждает визуальную релевантность вашего контента для системы.
  • Текстовая оптимизация остается фундаментом: Не игнорируйте стандартное Image SEO (alt-текст, окружающий текст, имена файлов). Эти факторы отвечают за генерацию исходного Relevance Score и попадание изображения в первичный набор кандидатов, который затем переранжируется визуальной моделью.

Worst practices (это делать не надо)

  • Использование стоковых или генерических изображений, не соответствующих интенту: Размещение нерелевантных изображений в надежде на ранжирование за счет текстовой оптимизации неэффективно. Image Relevance Model, специфичная для запроса, вероятно, понизит такое изображение, если его визуальные признаки не соответствуют ожиданиям.
  • Clickbait и визуальное несоответствие: Использование привлекательных, но нерелевантных изображений приведет к негативным поведенческим сигналам. Это ухудшит ранжирование и негативно повлияет на обучение будущих Image Relevance Models для этой тематики.
  • Низкое качество изображений: Использование размытых, темных или нечетких изображений. Система может некорректно извлечь признаки, что негативно скажется на оценке моделью.

Стратегическое значение

Этот патент подчеркивает переход Google от анализа текстовых меток к глубокому пониманию визуального содержания с помощью Computer Vision и Machine Learning. Стратегия Image SEO должна быть направлена на создание визуального контента, который не просто иллюстрирует текст, но и сам по себе является ответом на запрос пользователя. Понимание визуального интента становится столь же важным, как и понимание текстового интента. Долгосрочная стратегия требует инвестиций в качественный продакшн уникальных изображений, соответствующих ожиданиям аудитории в конкретной нише.

Практические примеры

Сценарий: Оптимизация карточки товара для E-commerce

Задача: Улучшить ранжирование изображения товара "красное вечернее платье с открытой спиной" в Image Search.

  1. Анализ визуального интента: Изучаем выдачу по этому запросу. Предположим, 80% топовых результатов — это фотографии на моделях в полный рост, в интерьере, с хорошим освещением. Фотографии платьев на вешалке ранжируются ниже.
  2. Причина (по патенту): Google, вероятно, обучил Image Relevance Model для этого запроса (он Qualified). Модель научилась ассоциировать Image Feature Values, характерные для фотографий на моделях, с высокой релевантностью, так как пользователи кликали на них чаще.
  3. Действие: Создаем основное изображение товара, соответствующее доминирующему визуальному интенту — фото на модели в полный рост, в интерьере.
  4. Ожидаемый результат: При обработке запроса система активирует модель. Модель анализирует Image Content Descriptor нашего изображения, находит соответствие обученным визуальным паттернам и генерирует высокий положительный Relevance Score Adjustment Factor, повышая изображение в выдаче.

Вопросы и ответы

Означает ли этот патент, что текстовая оптимизация (alt, title) больше не важна для Image SEO?

Нет, она по-прежнему критически важна. Текстовые факторы, скорее всего, используются для генерации исходного набора кандидатов и вычисления первичного Relevance Score. Описанный в патенте механизм отвечает за корректировку этой оценки и переранжирование на основе визуальных признаков. Без текстовой оптимизации изображение может вообще не попасть в набор кандидатов для анализа.

Как система определяет, какие визуальные признаки важны для конкретного запроса?

Система учится на исторических данных о поведении пользователей (Relevance Feedback Score). Если пользователи по запросу "свадебный букет пионы" чаще кликают на изображения с пастельными тонами и крупным планом, Image Relevance Model для этого запроса научится придавать больший вес соответствующим визуальным признакам (цветовой гамме, композиции). Система следует за предпочтениями пользователей.

Что такое "Квалифицированный запрос" (Qualified Query) и почему это важно?

Qualified Query — это запрос, по которому у Google достаточно данных (много релевантных изображений и много кликов пользователей) для надежного обучения модели. Это важно, потому что Google не тратит ресурсы на обучение моделей для редких или неоднозначных запросов. Основное влияние этот механизм оказывает на популярные и среднечастотные запросы.

Как этот механизм работает для совершенно новых или трендовых запросов?

Для совершенно нового запроса обученной модели не существует. Система попытается найти наиболее похожий индексированный запрос (Indexed Query) и использовать его модель. Однако, согласно патенту (Claim 5), влияние этой модели будет ослаблено пропорционально разнице между запросами (Similarity Score). По мере накопления данных по новому запросу, он может стать Qualified, и для него будет обучена собственная модель.

Что такое Image Content Descriptor и как он влияет на SEO?

Image Content Descriptor — это сильно сжатое представление визуальных характеристик изображения (упоминается размер около 32 байт). Он создается с помощью сложных преобразований (PCA, Hashing, Delta Encoding). Для SEO это означает, что Google не анализирует пиксели напрямую в момент запроса, а оперирует этим компактным дескриптором. Важно, чтобы изображение было качественным и четким, чтобы ключевые визуальные признаки были корректно отражены в этом дескрипторе.

Может ли система ошибочно понизить качественное изображение?

Да, если его визуальные характеристики сильно отличаются от того, что пользователи исторически предпочитали для данного запроса. Например, если вы предлагаете инновационный дизайн продукта, а пользователи привыкли к классическому виду, модель, обученная на старых данных, может изначально не распознать новый дизайн как релевантный и понизить его.

Как практически применить знания из этого патента для улучшения позиций в Google Images?

Необходимо проводить анализ визуальной выдачи (Visual SERP Analysis). Определите доминирующие визуальные паттерны (типы изображений, цвета, объекты, фон) в ТОПе по вашим целевым запросам. Создавайте контент, который соответствует этим паттернам, чтобы максимизировать вероятность получения высокого Relevance Score Adjustment Factor от специфичной для запроса модели.

Почему анализ происходит именно онлайн (в реальном времени)?

Онлайн-анализ гарантирует, что даже самые свежие, только что проиндексированные изображения будут оценены с использованием актуальной модели релевантности. Если бы этот анализ проводился только офлайн, новые изображения могли бы ранжироваться неточно до следующего цикла пересчета. Это обеспечивает свежесть и точность выдачи.

Что такое PAMIR, упоминаемый в патенте?

PAMIR (Passive-Aggressive Model for Image Retrieval) — это конкретный тип алгоритма машинного обучения, который может использоваться в качестве Image Relevance Model. Он обучается итеративно корректировать веса для различных визуальных признаков, чтобы максимизировать разницу в оценках между релевантными (на которые кликали) и нерелевантными изображениями для конкретного запроса.

Что важнее для Image SEO в контексте этого патента: визуальное содержание или CTR?

Они неразрывно связаны. Визуальное содержание должно соответствовать запросу, чтобы Image Relevance Model дала высокую оценку. Однако именно CTR (Relevance Feedback Score) используется для обучения этой модели и определения того, какое визуальное содержание считать релевантным. Необходимо и то, и другое: релевантное изображение, которое привлекает клики.

Похожие патенты

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует машинное обучение для ранжирования в Поиске по Картинкам, динамически взвешивая сигналы изображения и посадочной страницы
Google использует модель машинного обучения для ранжирования изображений, которая совместно обрабатывает признаки запроса, самого изображения и посадочной страницы, на которой оно размещено. Это позволяет системе динамически определять важность визуальных характеристик изображения и контекста страницы в зависимости от конкретного запроса, улучшая релевантность выдачи.
  • US20200201915A1
  • 2020-06-25
  • Мультимедиа

  • SERP

Как Google конвертирует визуальные характеристики изображений в текстовые ключевые слова для визуального поиска
Google использует механизм для понимания содержания изображений путем анализа их визуальных характеристик (цвет, текстура, края). Система сопоставляет эти характеристики с текстовыми терминами, используя модели машинного обучения, обученные на истории поиска картинок. Это позволяет Google генерировать релевантные текстовые запросы для любого изображения, что является основой работы визуального поиска (например, Google Lens).
  • US8935246B2
  • 2015-01-13
  • Семантика и интент

  • Мультимедиа

  • Индексация

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Популярные патенты

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов
Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.
  • US20190278836A1
  • 2019-09-12
  • Семантика и интент

  • Персонализация

  • EEAT и качество

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
  • US8121991B1
  • 2012-02-21
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google использует поведение пользователей в веб-поиске для динамической категоризации локальных бизнесов
Google динамически формирует категории для бизнесов, основываясь на том, как пользователи ищут их (используемые ключевые слова и клики) в веб-поиске и голосовом поиске. Эти данные формируют иерархическое понимание типов бизнеса. Эта структура затем используется для повышения точности распознавания названий компаний в голосовых запросах.
  • US8041568B2
  • 2011-10-18
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore