SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует машинное обучение для ранжирования в Поиске по Картинкам, динамически взвешивая сигналы изображения и посадочной страницы

RANKING IMAGE SEARCH RESULTS USING MACHINE LEARNING MODELS (Ранжирование результатов поиска изображений с использованием моделей машинного обучения)
  • US20200201915A1
  • Google LLC
  • 2019-01-31
  • 2020-06-25
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует модель машинного обучения для ранжирования изображений, которая совместно обрабатывает признаки запроса, самого изображения и посадочной страницы, на которой оно размещено. Это позволяет системе динамически определять важность визуальных характеристик изображения и контекста страницы в зависимости от конкретного запроса, улучшая релевантность выдачи.

Описание

Какую проблему решает

Патент решает проблему неоптимального ранжирования в поиске по картинкам, свойственную традиционным системам. Ранее поисковые системы часто генерировали отдельные сигналы для характеристик изображения и характеристик посадочной страницы, а затем объединяли их с использованием фиксированной схемы взвешивания, одинаковой для всех запросов. Это не позволяло учитывать, что для одних запросов важнее само изображение, а для других — контекст страницы. Изобретение улучшает релевантность результатов поиска изображений за счет динамического, зависящего от запроса, комбинирования этих сигналов.

Что запатентовано

Запатентована система ранжирования результатов поиска изображений с использованием модели машинного обучения (image search result ranking machine learning model). Суть изобретения заключается в том, что модель обучена совместно обрабатывать признаки запроса, признаки изображения и признаки посадочной страницы (landing page), на которой размещено изображение. Это позволяет генерировать единую оценку релевантности (Relevance Score), комбинируя сигналы изображения и страницы в зависимости от контекста запроса (query-dependent manner).

Как это работает

Система работает следующим образом:

  • Получение кандидатов: В ответ на поисковый запрос система получает набор кандидатов, каждый из которых представляет собой пару «изображение + посадочная страница».
  • Извлечение признаков: Для каждого кандидата извлекаются признаки запроса (Query features), визуальные признаки изображения (Image features) и признаки посадочной страницы (Landing page features).
  • Совместная обработка: Все три группы признаков подаются как единый вход (single input) в модель машинного обучения (например, нейронную сеть).
  • Генерация оценки: Модель обрабатывает признаки и генерирует Relevance Score. Модель динамически определяет вес признаков изображения и страницы в зависимости от запроса.
  • Ранжирование: Кандидаты ранжируются на основе полученных Relevance Scores (либо напрямую, либо путем корректировки исходных оценок ранжирования).

Актуальность для SEO

Высокая. Применение глубокого машинного обучения для ранжирования является стандартом в современных поисковых системах. Интеграция визуальных сигналов и текстового контекста (мультимодальность) критически важна для улучшения понимания контента, особенно в поиске по картинкам. Описанный механизм соответствует актуальным тенденциям развития поиска.

Важность для SEO

Патент имеет высокое значение для стратегий SEO, особенно для оптимизации под Поиск по Картинкам (Image SEO). Он подтверждает, что Google не оценивает изображение в вакууме. Релевантность определяется комбинацией визуального содержания картинки и качества, авторитетности и контекста посадочной страницы. Для успешного ранжирования необходимо оптимизировать как само изображение, так и страницу, на которой оно размещено, обеспечивая их синергию.

Детальный разбор

Термины и определения

Image features (Признаки изображения)
Характеристики, извлеченные из самого изображения. Включают пиксельные данные (pixel data), эмбеддинги (векторные представления контента, полученные, например, с помощью нейронной сети), а также результаты методов извлечения признаков (обнаружение краев, углов и т.д.).
Image search result ranking machine learning model (Модель машинного обучения для ранжирования результатов поиска изображений)
Модель (например, нейронная сеть, случайный лес, градиентный бустинг), обученная генерировать Relevance Score на основе совместной обработки признаков запроса, изображения и посадочной страницы.
Landing page (Посадочная страница)
Веб-страница, на которой размещено (найдено) изображение.
Landing page features (Признаки посадочной страницы)
Характеристики веб-страницы. Включают контент (текст, ключевые слова, заголовок), метаданные (дата обновления/свежесть, автор, язык), характеристики домена, ссылочные сигналы (анкоры), а также контекст размещения изображения (расположение на странице, размер/значимость, alt-текст, окружающий текст).
Query-dependent manner (Зависящий от запроса способ)
Ключевой аспект изобретения. Означает, что модель машинного обучения комбинирует (взвешивает) признаки изображения и посадочной страницы не по фиксированной формуле, а динамически, основываясь на характеристиках конкретного поискового запроса.
Query features (Признаки запроса)
Характеристики поискового запроса. Включают текст запроса, язык, время и местоположение отправки, данные об устройстве пользователя.
Relevance Score (Оценка релевантности)
Выходные данные модели машинного обучения. Числовое значение, измеряющее релевантность кандидата (пары изображение+страница) поисковому запросу. Может отражать вероятность клика пользователя или прогнозируемую оценку асессора.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования изображений.

  1. Система получает запрос на поиск изображений.
  2. Система получает набор кандидатов (каждый = изображение + посадочная страница).
  3. Для каждого кандидата система обрабатывает (i) признаки изображения и (ii) признаки посадочной страницы с помощью модели машинного обучения.
  4. Модель обучена генерировать Relevance Score путем комбинирования признаков (i) и (ii) способом, зависящим от запроса (query-dependent manner), на основе признаков самого запроса.
  5. Система ранжирует кандидатов на основе сгенерированных Relevance Scores.
  6. Система генерирует и предоставляет результаты поиска.

Ядро изобретения — использование единой ML-модели для совместной обработки разнородных сигналов (визуальных и текстовых/контекстных) и динамическое определение их важности в зависимости от специфики запроса.

Claim 2 (Зависимый от 1): Уточняет процесс ранжирования.

Кандидаты могут иметь исходное ранжирование (initial ranking). Ранжирование на основе Relevance Scores, сгенерированных ML-моделью, заключается в корректировке этого исходного ранжирования.

Это указывает на то, что данная модель может использоваться на поздних этапах ранжирования (L2 или L3) для переранжирования предварительно отобранных кандидатов.

Claims 4, 5, 6 (Зависимые от 1): Приводят примеры признаков.

  • Признаки изображения могут включать пиксельные данные или эмбеддинг изображения (Claim 4).
  • Признаки посадочной страницы могут включать текст, заголовок или URL (resource locator) страницы (Claim 5).
  • Признаки посадочной страницы могут включать характеристику свежести (freshness) страницы (Claim 6).

Claim 7 (Зависимый от 1): Уточняет тип модели.

Модель машинного обучения может быть нейронной сетью.

Claims 8, 9, 10 (Зависимые от 1): Описывают процесс обучения модели.

Модель обучается на тренировочных примерах (Claim 8). Обучение может происходить с использованием парной функции потерь (pair-wise loss function), где тренировочные данные включают запрос, пару результатов и метку их относительной релевантности (Claim 9). Либо обучение может заключаться в генерации оценок, соответствующих целевым оценкам релевантности (например, оценкам асессоров или данным о кликах) (Claim 10).

Где и как применяется

Изобретение применяется в специализированной системе поиска изображений (Image Search System) и затрагивает несколько этапов поисковой архитектуры.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Извлекаются и сохраняются в индексе (Index Database) признаки изображений (например, вычисляются эмбеддинги с помощью визуальных моделей) и признаки посадочных страниц (контент, ссылки, свежесть, качество страницы и домена).

QUNDERSTANDING – Понимание Запросов
На этом этапе извлекаются признаки запроса (Query features), которые затем будут переданы в модель ранжирования. Понимание интента запроса критически важно, так как именно оно определяет, как модель будет взвешивать признаки изображения и страницы (query-dependent manner).

RANKING – Ранжирование
Основной этап применения патента. Модель может использоваться на одном из этапов каскадного ранжирования (например, L2 или L3).

  1. Отбор кандидатов (Retrieval): Отбирается исходный набор кандидатов (изображение + страница).
  2. Глубокое ранжирование (Deep Ranking): Для отобранных кандидатов признаки запроса, изображения и страницы подаются в описанную модель машинного обучения. Модель генерирует Relevance Score.
  3. Финальное ранжирование: Система использует Relevance Score для определения порядка результатов. Это может быть прямая сортировка или использование его как сигнала для корректировки исходных оценок ранжирования (initial ranking scores).

Входные данные:

  • Признаки поискового запроса (Query features).
  • Признаки изображения (Image features) для кандидата.
  • Признаки посадочной страницы (Landing page features) для кандидата.

Выходные данные:

  • Relevance Score для пары изображение-страница относительно запроса.

На что влияет

  • Конкретные типы контента: Влияет на все типы изображений (фотографии, диаграммы, товары, инфографика) и связанные с ними посадочные страницы (статьи, карточки товаров, галереи).
  • Специфические запросы: Механизм оказывает влияние на все типы запросов в поиске по картинкам. Его преимущество (динамическое взвешивание) особенно проявляется в неоднозначных запросах или запросах, где важен контекст.
    • Для запросов с визуальным интентом (например, «красивые обои закат»), модель может придать больший вес Image features.
    • Для запросов, где важен контекст или авторитетность (например, «схема двигателя внутреннего сгорания» или «симптомы кори фото»), модель может придать больший вес Landing page features (качество контента, авторитетность сайта).
  • Конкретные ниши или тематики: Сильное влияние в E-commerce (важность страницы товара) и YMYL-тематиках (важность авторитетности источника изображения).

Когда применяется

Алгоритм применяется при обработке запросов в системе поиска изображений. Он может использоваться как при поиске через специализированный интерфейс (Google Images), так и при генерации блока с картинками в универсальной выдаче.

В патенте не указаны специфические триггеры или пороговые значения для активации этой модели; предполагается, что это основной или один из основных механизмов ранжирования в Image Search.

Пошаговый алгоритм

Процесс ранжирования в реальном времени

  1. Получение запроса: Система получает запрос на поиск изображений от пользователя.
  2. Отбор кандидатов: Система идентифицирует исходный набор кандидатов (пар изображение + посадочная страница), удовлетворяющих запросу.
  3. Извлечение признаков (для каждого кандидата): Система извлекает (или получает из индекса):
    • Признаки поискового запроса.
    • Признаки соответствующего изображения.
    • Признаки соответствующей посадочной страницы.
  4. Обработка моделью (для каждого кандидата): Извлеченные признаки совместно обрабатываются с помощью image search result ranking machine learning model.
  5. Генерация оценки релевантности: Модель генерирует Relevance Score для каждого кандидата. При этом модель определяет важность признаков изображения и страницы в зависимости от признаков запроса.
  6. Ранжирование: Система ранжирует кандидатов на основе полученных Relevance Scores. Это может включать корректировку исходных оценок ранжирования с использованием Relevance Score как модификатора (например, путем сложения или умножения на фактор).
  7. Формирование выдачи: Система генерирует представление результатов поиска в соответствии с итоговым ранжированием.
  8. Предоставление результатов: Результаты отправляются пользователю.

Какие данные и как использует

Данные на входе

Патент детально описывает категории признаков, используемых моделью машинного обучения.

Визуальные факторы (Image features):

  • Пиксельные данные (Pixel data): Непосредственно сырые данные изображения.
  • Эмбеддинги (Embeddings): Векторные представления содержания изображения, сгенерированные с помощью нейронных сетей (embedding neural network).
  • Извлеченные признаки: Результаты техник компьютерного зрения (обнаружение краев, углов, блобов, извлечение форм).

Контентные и Контекстные факторы (Landing page features):

  • Текст страницы: Ключевые слова, текст, заголовок (Title) страницы.
  • Контекст изображения на странице:
    • Alt-текст (alt-text labels) изображения.
    • Текст, окружающий изображение (text surrounding the image).
    • Текстовые описания изображения на странице.
  • Структурные факторы:
    • Расположение изображения на странице (location of the image) (в пикселях, через HTML/XML DOM XPATH или CSS-селекторы).
  • Мультимедиа факторы:
    • Значимость/видимость изображения (prominence of the image), измеряемая через относительный размер изображения при отображении на устройстве.

Технические факторы (Landing page features):

  • URL (resource locator) страницы.

Временные факторы (Landing page features):

  • Свежесть (Freshness): дата первого сканирования или обновления страницы.

Факторы авторитетности (Landing page features):

  • Данные об авторе посадочной страницы.
  • Характеристики домена, к которому принадлежит страница.

Ссылочные факторы (Landing page features):

  • Признаки ссылок на изображение и посадочную страницу (анкорный текст, страница-источник ссылки).

Географические и Языковые факторы:

  • Язык посадочной страницы и запроса.
  • Местоположение отправки запроса.

Пользовательские факторы:

  • Данные об устройстве пользователя (используются, например, для оценки размера/значимости изображения).

Какие метрики используются и как они считаются

Основная метрика, вычисляемая системой, — это Relevance Score.

Relevance Score: Генерируется моделью машинного обучения. Патент не предоставляет конкретную формулу, так как вычисление происходит внутри модели (например, нейронной сети). Эта оценка может быть откалибрована для прогнозирования:

  • Вероятности клика (likelihood of a user... would click on) или взаимодействия пользователя с результатом.
  • Оценки, которую поставил бы результату человек-асессор (human rater).

Методы машинного обучения:

  • Упоминаются нейронные сети (включая глубокие модели), обобщенные линейные модели, случайные леса, деревья решений.

Обучение модели и функции потерь:

Модель обучается на данных с известными (ground truth) оценками релевантности (клики или оценки асессоров). Для обучения могут использоваться различные функции потерь (loss functions):

  • Pairwise loss (Парная функция потерь): Модель обучается правильно определять относительный порядок релевантности двух результатов. Цель — минимизировать инверсии в ранжировании по сравнению с ground truth.
  • Pointwise loss (Поточечная функция потерь): Модель штрафуется за отклонение предсказанной оценки от реальной оценки для одного результата.
  • Listwise loss (Списочная функция потерь): Модель оценивает список результатов и штрафуется за отклонение предсказанного ранжирования всего списка от идеального ранжирования.

Выводы

  1. Критическая важность посадочной страницы для Image SEO: Патент подтверждает, что ранжирование изображения напрямую зависит от характеристик страницы, на которой оно размещено. Изображение не оценивается изолированно. Качество, авторитетность и релевантность посадочной страницы являются ключевыми сигналами.
  2. Совместная обработка сигналов (Joint Processing): Google использует сложные модели машинного обучения (например, нейронные сети) для совместного анализа визуальных признаков изображения и контекстных признаков страницы. Это позволяет системе лучше понять синергию между картинкой и контентом.
  3. Динамическое взвешивание (Query-Dependent Manner): Система не использует фиксированные веса для сигналов. Важность визуальной составляющей по сравнению с контекстом страницы определяется динамически для каждого конкретного запроса. Это требует от SEO-специалистов глубокого понимания интента пользователя.
  4. Важность контекста размещения: Патент явно выделяет признаки, связанные с тем, как изображение размещено на странице: его расположение (location), значимость/размер (prominence), alt-текст и окружающий текст. Оптимизация этих элементов критична.
  5. Разнообразие факторов ранжирования: Модель учитывает широкий спектр признаков, включая свежесть контента (freshness), авторитетность автора и домена, а также визуальные эмбеддинги изображения.
  6. Переранжирование на поздних этапах: Описанный механизм может использоваться для корректировки исходного ранжирования (adjusting the initial ranking), что указывает на его применение на этапах L2/L3 для точной настройки выдачи.

Практика

Best practices (это мы делаем)

  • Оптимизация контекста посадочной страницы: Убедитесь, что страница, на которой размещено изображение, максимально релевантна ему тематически. Текст страницы, заголовки (H1-H6) и Title должны соответствовать содержанию изображения.
  • Оптимизация размещения изображения: Размещайте ключевые изображения на видном месте (location) и в достаточном размере (prominence). Избегайте размещения важных изображений в футере или малозаметных блоках.
  • Детальная проработка текстового окружения: Оптимизируйте alt-текст, подписи к изображению и текст в непосредственной близости от него (text surrounding the image). Эти элементы напрямую используются моделью как Landing page features.
  • Повышение качества и авторитетности страницы (E-E-A-T): Поскольку характеристики домена и автора являются входными данными для модели, работа над общим качеством сайта и E-E-A-T напрямую влияет на ранжирование изображений с этого сайта.
  • Слежение за свежестью контента: Регулярно обновляйте страницы с важными изображениями, так как свежесть (freshness) является учитываемым признаком.
  • Улучшение визуального качества изображений: Используйте уникальные, высококачественные изображения. Хотя патент фокусируется на интеграции сигналов, качество визуального контента необходимо для генерации сильных Image features (например, эмбеддингов).

Worst practices (это делать не надо)

  • Размещение качественных изображений на низкокачественных страницах: Создание дорвеев, страниц с тонким (thin) или автоматически сгенерированным контентом для размещения изображений неэффективно. Модель учтет низкое качество Landing page features.
  • Игнорирование Alt-текста и контекста: Оставление пустых или нерелевантных alt-атрибутов и отсутствие текстового контекста вокруг изображения лишает модель важных сигналов.
  • Манипуляция ключевыми словами (Keyword Stuffing): Попытки переспамить страницу или alt-текст ключевыми словами. Модель машинного обучения способна оценивать качество контента комплексно, и такие манипуляции могут быть распознаны как негативные сигналы.
  • Использование стоковых изображений без добавленной ценности: Размещение неуникальных изображений на типовых страницах создает слабые сигналы как на уровне Image features, так и на уровне Landing page features.

Стратегическое значение

Этот патент подчеркивает стратегический переход Google к мультимодальному анализу контента. Для достижения успеха в Image SEO необходимо применять интегрированный подход, где визуальная оптимизация неотделима от контентной и технической оптимизации посадочной страницы. Стратегия должна фокусироваться на создании высококачественных страниц, где изображение и текст дополняют друг друга, предоставляя исчерпывающий ответ на запрос пользователя. Понимание того, что Google может динамически менять важность страницы и картинки в зависимости от запроса, требует гибкости в SEO-стратегиях для разных ниш и типов интентов.

Практические примеры

Сценарий 1: Оптимизация карточки товара в E-commerce

  • Задача: Улучшить ранжирование фото товара «Красные кроссовки Nike Air Max 270» в Google Images.
  • Действия согласно патенту:
    • Image Features: Загрузить несколько высококачественных уникальных фотографий кроссовок с разных ракурсов.
    • Landing Page Features (Контент): Убедиться, что Title, H1 и описание товара четко указывают на модель, цвет и бренд. Добавить отзывы покупателей (обновление контента, freshness).
    • Landing Page Features (Контекст): Разместить основное фото вверху страницы (location), сделать его крупным (prominence). Прописать alt-текст: «Вид сбоку красных кроссовок Nike Air Max 270». В тексте рядом описать особенности модели.
  • Ожидаемый результат: Модель машинного обучения получит сильные сигналы от изображения и релевантной, качественной страницы. При запросе «купить Nike Air Max 270 красные» модель придаст высокий вес как визуальному соответствию, так и контексту страницы товара, повышая Relevance Score.

Сценарий 2: Оптимизация инфографики в информационной статье

  • Задача: Продвинуть инфографику «Этапы строительства каркасного дома» в Image Search.
  • Действия согласно патенту:
    • Image Features: Создать понятную и визуально качественную инфографику.
    • Landing Page Features (Авторитетность): Разместить инфографику в подробной экспертной статье о строительстве каркасных домов на авторитетном строительном портале (сигналы домена и автора).
    • Landing Page Features (Контекст): Вставить инфографику в середину соответствующего раздела статьи. Добавить заголовок H3 перед инфографикой «Схема этапов строительства». Прописать релевантный alt-текст. После инфографики дать текстовое пояснение к каждому этапу.
  • Ожидаемый результат: При запросе «схема строительства каркасного дома» модель определит, что контекст и авторитетность источника критически важны (query-dependent manner). Сильные Landing page features значительно повысят шансы на высокое ранжирование этой инфографики.

Вопросы и ответы

Что означает «совместная обработка» признаков изображения и посадочной страницы?

Это означает, что система не вычисляет отдельно оценку качества изображения и оценку качества страницы, а затем складывает их. Вместо этого все признаки (визуальные, текстовые, контекстные, ссылочные) подаются в единую модель машинного обучения одновременно. Модель анализирует их взаимосвязи и синергию, чтобы определить итоговую релевантность пары «изображение + страница» запросу.

Что такое «query-dependent manner» (зависящий от запроса способ) комбинирования признаков?

Это ключевая особенность патента. Система динамически решает, что важнее для конкретного запроса: само изображение или страница, на которой оно находится. Например, для запроса «синий фон для рабочего стола» вес визуальных признаков изображения будет выше. Для запроса «фото последствий урагана во Флориде» вес признаков страницы (авторитетность источника, свежесть, контекст новости) будет значительно выше.

Означает ли этот патент, что качество самой посадочной страницы важнее качества изображения?

Не всегда, это зависит от запроса (см. предыдущий ответ). Однако патент четко указывает, что качество посадочной страницы (Landing page features) является неотъемлемой частью ранжирования изображения. Размещение отличного изображения на спамной или нерелевантной странице не приведет к хорошим результатам в Image Search.

Какие конкретно характеристики размещения изображения на странице учитывает Google?

Патент явно упоминает расположение изображения на странице (location), его значимость или видимость (prominence), которая часто измеряется размером изображения при отображении. Также критически важны alt-текст и текст, непосредственно окружающий изображение (text surrounding the image).

Как Google понимает, что изображено на картинке, согласно этому патенту?

Для этого используются Image features. К ним относятся анализ пиксельных данных и, что более важно, эмбеддинги изображения. Эмбеддинги — это векторные представления визуального содержания, обычно создаваемые с помощью нейронных сетей (например, моделей компьютерного зрения), которые позволяют системе понять объекты, сцены и контекст изображения.

Влияет ли свежесть контента на ранжирование в Google Images?

Да, патент (Claim 6) прямо указывает, что характеристика свежести (freshness) посадочной страницы является одним из признаков (Landing page features), которые подаются в модель машинного обучения. Это важно как для новостного контента, так и для «вечнозеленых» тем, где актуальность информации имеет значение.

Как этот патент связан с E-E-A-T?

Связь прямая. В патенте упоминается использование данных об авторе посадочной страницы и характеристик домена как входных признаков для модели ранжирования. Это соответствует сигналам E-E-A-T. Авторитетность источника влияет на оценку релевантности размещенных на нем изображений.

Стоит ли создавать отдельные страницы для каждого изображения (например, страницы вложений в WordPress)?

Исходя из логики патента, это плохая практика. Модель оценивает качество и контекст посадочной страницы. Страницы вложений обычно содержат только изображение и минимум текста («тонкий контент»), что приводит к слабым Landing page features. Лучше размещать изображения в контексте подробных, релевантных статей или карточек товаров.

Используется ли эта модель для всех результатов поиска изображений?

Патент описывает это как механизм ранжирования в системе поиска изображений. Он может применяться на поздних стадиях ранжирования (L2/L3) для переранжирования предварительно отобранных кандидатов (Claim 2). Это стандартный подход для внедрения сложных ML-моделей в высоконагруженные поисковые системы.

Как повлиять на визуальные эмбеддинги моих изображений?

Напрямую повлиять на них нельзя, так как они генерируются моделями Google. Однако можно повлиять на входные данные: используйте четкие, высококачественные, уникальные изображения с хорошо различимыми объектами. Это поможет моделям компьютерного зрения корректно интерпретировать содержание и сгенерировать сильные, релевантные эмбеддинги.

Похожие патенты

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени
Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.
  • US10311096B2
  • 2019-06-04
  • Мультимедиа

  • SERP

  • Поведенческие сигналы

Как Google контекстуально выбирает изображения и отзывы для локаций на основе атрибутов запроса пользователя
Google использует машинное обучение для анализа изображений и отзывов о местах (например, ресторанах) и связывания их с конкретными атрибутами (например, "есть детское меню", "вид на горы"). При поиске система динамически ранжирует этот контент, отдавая приоритет тем изображениям и отзывам, которые наиболее релевантны атрибутам, указанным в запросе пользователя.
  • US10671660B2
  • 2020-06-02
  • Семантика и интент

  • Мультимедиа

  • Local SEO

Как Google использует машинное обучение для распознавания разных смыслов запроса и ранжирования изображений в Image Search
Google использует модель машинного обучения для улучшения ранжирования в поиске по картинкам. Система определяет различные смыслы (senses) неоднозначного запроса (например, "Jaguar" как автомобиль и как животное), проецирует изображения в многомерное пространство признаков и строит гиперплоскости (hyperplanes) для разделения этих смыслов. Итоговый ранг изображения определяется его близостью к любому из релевантных смыслов.
  • US8923655B1
  • 2014-12-30
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Популярные патенты

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта
Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.
  • US9348846B2
  • 2016-05-24
  • Структура сайта

  • SERP

  • Ссылки

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов
Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.
  • US20190278836A1
  • 2019-09-12
  • Семантика и интент

  • Персонализация

  • EEAT и качество

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

seohardcore