
Google использует механизм для определения интента пользователя по редким или новым (long-tail) запросам, когда исторические данные отсутствуют. Система эффективно "прощупывает" вертикальные индексы (например, картинки), чтобы решить, стоит ли проводить полный поиск. Для определения позиции блока с результатами используется "предполагаемый интент", унаследованный от характеристик найденных веб-страниц и сайтов, а не от истории самого запроса.
Патент решает проблему определения пользовательского интента для длиннохвостых (long-tail) запросов — запросов, которые встречаются редко или впервые, и по которым нет достаточной истории поиска. Основные проблемы:
Search Property Ratio).Insertion Score) в основную выдачу без понимания интента.Запатентована система для выборочного и эффективного поиска во вторичных корпусах (например, в индексе картинок) при обработке запроса к основному корпусу (веб-поиск), особенно для long-tail запросов. Система использует механизм "прощупывания" (probing) части вторичного индекса для оценки релевантности запроса этому типу контента (Second Resource Score). Если релевантность высока, запускается полный поиск. Для определения позиции вставки используются предполагаемые коэффициенты интента (Inferred Search Property Ratios), рассчитанные на уровне отдельных ресурсов и сайтов, а не на основе истории самого запроса.
Система работает в двух основных направлениях:
1. Триггер поиска (Эффективность):
Confidence Score).Second Resource Score.2. Позиционирование (Интент):
Inferred Search Property Ratios (ISPR) для страниц и сайтов, основываясь на интенте запросов, которые исторически приводили к ним трафик.Insertion Score, определяющий позицию блока вторичных результатов в основной выдаче.Высокая. Эффективная обработка long-tail запросов и механизмы смешивания вертикальной и основной выдачи (Universal Search/Blending) являются фундаментальными компонентами современных поисковых систем. Описанные методы повышения эффективности (поиск по части индекса) и определения интента на основе характеристик результатов остаются критически важными для масштабирования и качества поиска.
Патент имеет высокое значение (8/10) для понимания механизмов Универсального Поиска. Он демонстрирует, что интент запроса может быть определен не только историей самого запроса, но и характеристиками контента, который ранжируется по этому запросу. Это подчеркивает важность создания контента, который четко соответствует определенному типу интента (визуальному, текстовому и т.д.), так как это влияет на расчет Inferred Search Property Ratios и, следовательно, на видимость сайта в блоках вертикального поиска и общий макет SERP.
Search Property Ratio. Низкая оценка характерна для long-tail запросов.Resource SPR и Website SPR.Proper Subset индекса и используется как триггер для полного поиска.Resource SPR страниц этого сайта. Используется для новых страниц или страниц с недостаточной историей.Claim 1 (Независимый пункт): Описывает основной механизм обработки long-tail запросов для принятия решения о поиске во вторичном корпусе.
Confidence Score) в их Search Property Ratio ниже порога (т.е. long-tail запросы).Second Resource Score (например, Image Score). Эта оценка вычисляется независимо от собственного SPR запроса.Second Resource Score сравнивается с порогом.Insertion Score для позиционирования результатов.Claim 2 (Зависимый от 1): Уточняет метод вычисления Second Resource Score.
Вычисление включает инициацию поиска только по Proper Subset (части) второго корпуса и получение оценок релевантности из этой части. Это механизм экономии ресурсов.
Claim 3 и 4 (Зависимые от 2): Детализируют расчет Second Resource Score как отношение.
Оценка рассчитывается как отношение (A/B), где A — количество веб-страниц, содержащих хотя бы один вторичный ресурс (картинку) из пробного поиска с оценкой выше порога (высококачественная картинка); B — общее количество веб-страниц, содержащих любой вторичный ресурс из пробного поиска (Claim 3) ИЛИ общее количество релевантных веб-страниц (Claim 4).
Claim 7 (Независимый): Описывает механизм определения Insertion Score на основе предполагаемого интента ресурсов.
Определение Insertion Score для long-tail запросов основывается на Resource Search Property Ratio (Resource SPR) топовых результатов из первого корпуса. Система анализирует предполагаемый интент найденных веб-страниц, чтобы определить позицию вставки блока картинок.
Claim 8 (Независимый) и 9 (Зависимый): Описывают механизм взвешивания (blending) для расчета Insertion Score.
Insertion Score определяется на основе взвешенной комбинации двух оценок:
Confidence Score).Resource SPR) топовых результатов.Это позволяет плавно переходить от предполагаемого интента к актуальному по мере накопления истории запроса.
Claim 11 (Независимый): Описывает офлайн-процесс расчета предполагаемых SPR.
Resource SPR для ресурса на основе этих актуальных SPR (например, усреднением).Website SPR на основе Resource SPR его страниц.Изобретение затрагивает несколько этапов поиска, обеспечивая работу Универсального Поиска (Universal Search) для запросов с недостаточной историей.
INDEXING – Индексирование и извлечение признаков
На этом этапе (в офлайн-режиме) происходит анализ исторических логов (Historical Search Data) для расчета и сохранения в индексе предполагаемых коэффициентов интента: Resource SPR и Website SPR. Эти данные аннотируют документы в индексе.
RANKING – Ранжирование
Генерируется первичный набор результатов для основного корпуса (Web). Параллельно может запускаться «пробный» поиск (probing) по части вторичного индекса (Proper Subset), если запрос идентифицирован как long-tail.
METASEARCH – Метапоиск и Смешивание
Основное место применения патента. Система (например, Image Search Results Insertion System) работает здесь:
Second Resource Score (для long-tail запросов), рассчитанном на этапе RANKING/Probing.Insertion Score. Для long-tail запросов это делается путем анализа Resource SPR и Website SPR топовых веб-результатов.Insertion Score.Входные данные:
Confidence Score запроса.Resource SPR и Website SPR для этих результатов (из индекса).Выходные данные:
Insertion Score.Website SPR для изображений.Confidence Score для актуального Search Property Ratio (SPR) запроса не достигает порогового значения. Это указывает на то, что запрос новый или редкий.Confidence Score высок, система использует стандартный подход, базирующийся на актуальном SPR запроса.Процесс А: Обработка запроса в реальном времени (Online)
Confidence Score для его актуального SPR.Insertion Score.Proper Subset (части) вторичного индекса (например, 1-25%).Second Resource Score сравнивается с порогом. Resource SPR и Website SPR. На основе этих предполагаемых интентов вычисляется Insertion Score.Insertion Score рассчитывается как взвешенная сумма оценки на основе актуального SPR (если есть) и оценки на основе предполагаемых SPR. Веса зависят от Confidence Score.Процесс Б: Расчет предполагаемых интентов (Offline)
Historical Search Data).Resource SPR вычисляется как центральная тенденция (например, среднее или медиана) этих значений.Resource SPR его страниц. Website SPR вычисляется как центральная тенденция этих значений.Resource SPR и Website SPR сохраняются в индексе как аннотации к соответствующим ресурсам и сайтам.Query Log) и данные о кликах (Selection data) из Historical Search Data. Эти данные необходимы для офлайн-расчета актуальных SPR частых запросов, а также для расчета Resource SPR и Website SPR путем анализа того, какие запросы приводили к кликам на ресурсы.Second Resource Score.Confidence Score запроса.Resource SPR и Website SPR) на основе того, какие типы запросов исторически приводят к ним трафик. Сайт, на который часто приходят по запросам с высоким «image intent», сам приобретает высокий Website SPR.Proper Subset) для принятия решения о целесообразности полного поиска.Second Resource Score зависит от качества и релевантности медиа-контента (например, изображений), найденного во время пробного поиска. Наличие высококачественного контента является триггером для показа вертикального блока.Resource SPR. Если страница привлекает трафик преимущественно по запросам с высоким визуальным интентом, ее Resource SPR будет высоким.Website SPR. Если сайт посвящен фотографии (высокий визуальный Website SPR), новые страницы этого сайта быстрее наследуют этот показатель, что способствует показу блоков картинок даже по новым запросам.Second Resource Score система анализирует качество изображений, найденных на релевантных веб-страницах. Высокое качество повышает вероятность того, что пробный поиск даст положительный результат и блок картинок будет показан.Website SPR, вы имеете преимущество при ранжировании по Long Tail запросам, так как блок изображений, скорее всего, будет показан выше (высокий Insertion Score).Resource/Website SPR для конкретной вертикали, что затруднит прогнозирование интента.Resource SPR, и Google с меньшей вероятностью покажет блок картинок в выдаче.Second Resource Score. Если изображение не релевантно запросу, оно ухудшает соотношение качественных результатов к общему числу, тем самым уменьшая вероятность показа блока картинок.Патент раскрывает инфраструктуру и логику работы Универсального Поиска для огромного пласта long-tail запросов. Он подтверждает, что Google анализирует и профилирует не только запросы, но и отдельные страницы и целые домены на предмет их исторической связи с различными типами контента. Стратегически это означает, что формат контента и его соответствие определенному типу интента являются факторами, влияющими на структуру всей поисковой выдачи (SERP Features), а не только на ранжирование отдельной страницы.
Сценарий 1: Активация блока изображений (Triggering)
Confidence Score низкий).Second Resource Score высокий.Сценарий 2: Определение позиции вставки (Insertion)
Website SPR и Resource SPR, так как пользователи всегда ищут фото сортов (высокий визуальный интент).Inferred SPR, система рассчитывает высокий Insertion Score.Что такое Search Property Ratio (SPR) и почему он важен?
Search Property Ratio (SPR) — это историческая метрика для конкретного запроса, показывающая, насколько часто его ищут в определенной вертикали (например, в Google Images) по сравнению с основным поиском (Web Search). Если SPR высокий, это сильный сигнал для Google показать блок этой вертикали на высокой позиции. Это ключевая метрика для определения интента частых запросов.
Почему Google не может использовать SPR для всех запросов?
Для длиннохвостых (long-tail) запросов, которые встречаются редко или впервые, просто нет достаточной истории поиска. SPR для них либо отсутствует, либо статистически недостоверен (имеет низкий Confidence Score). Поэтому Google использует альтернативные методы для определения интента таких запросов.
Что такое «прощупывание» (probing) или поиск по Proper Subset?
Это механизм оптимизации ресурсов. Вместо того чтобы проводить дорогостоящий полный поиск по всему вертикальному индексу для каждого long-tail запроса, Google сначала ищет только в малой части индекса (например, в 1-25% шард). Если этот быстрый пробный поиск дает многообещающие результаты, только тогда запускается полный поиск.
Как Google решает, запускать ли полный поиск по картинкам для long-tail запроса?
На основе результатов пробного поиска вычисляется Second Resource Score. Если этот показатель превышает установленный порог, это служит триггером для запуска полного поиска. Этот показатель оценивает качество и количество найденных картинок на релевантных веб-страницах в рамках пробного поиска.
Что такое Resource SPR и как он рассчитывается?
Resource SPR — это предполагаемый интент на уровне отдельной страницы. Он рассчитывается офлайн путем анализа всех запросов, по которым пользователи исторически кликали на эту страницу. Если большинство этих запросов имели высокий актуальный SPR (например, высокий визуальный интент), то и сама страница наследует высокий Resource SPR.
Что такое Website SPR и когда он используется?
Website SPR — это предполагаемый интент на уровне всего сайта, рассчитываемый как среднее значение Resource SPR его страниц. Он используется как запасной вариант для новых страниц или страниц с недостаточной собственной историей кликов. Если сайт в целом имеет сильный визуальный фокус, его новые страницы унаследуют этот интент.
Как Google определяет позицию блока картинок для long-tail запроса?
Если актуальный SPR недоступен, Google анализирует Resource SPR и Website SPR топовых веб-результатов по этому запросу. Если у большинства топовых страниц высокий предполагаемый визуальный интент (высокий ISPR), то и Insertion Score для блока картинок будет высоким, и он будет показан ближе к началу выдачи.
Как этот патент влияет на мою SEO-стратегию по оптимизации картинок?
Он подчеркивает важность не только оптимизации самих изображений, но и контекста веб-страницы. Создание страниц, которые четко удовлетворяют визуальный интент, повышает их Resource SPR. Это увеличивает вероятность того, что Google покажет блок картинок в выдаче по запросам, ведущим на эти страницы, что дает дополнительную видимость и влияет на макет SERP.
Если мой запрос становится популярным, Google перестанет использовать предполагаемый интент (ISPR)?
Да, патент описывает механизм взвешивания. По мере того как запрос набирает историю и его Confidence Score растет, система начинает отдавать больший вес актуальному SPR и меньший вес предполагаемому SPR (Resource/Website SPR). Это обеспечивает плавный переход к более точным историческим данным.
Применим ли этот патент только к картинкам?
Хотя в патенте в качестве примера используются изображения (Image Display), описанные механизмы являются общими и применимы к любым двум различным типам ресурсов. Эта логика может использоваться для определения интента и вставки блоков Видео, Новостей, Товаров или других вертикалей в основную веб-выдачу.

Семантика и интент
SERP

Семантика и интент
Мультимедиа
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Мультимедиа
Персонализация

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
SERP

Ссылки
Структура сайта
Семантика и интент

Knowledge Graph
Ссылки
EEAT и качество

Мультиязычность
Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы

Ссылки
SERP
Свежесть контента

Семантика и интент
Индексация
Структура сайта

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Local SEO
Поведенческие сигналы
