SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет интент и позицию вертикальных результатов (например, картинок) для длиннохвостых (long-tail) запросов

IMAGE DISPLAY WITHIN WEB SEARCH RESULTS (Отображение изображений в результатах веб-поиска)
  • US9183312B2
  • Google LLC
  • 2013-03-12
  • 2015-11-10
  • Семантика и интент
  • SERP
  • Индексация
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для определения интента пользователя по редким или новым (long-tail) запросам, когда исторические данные отсутствуют. Система эффективно "прощупывает" вертикальные индексы (например, картинки), чтобы решить, стоит ли проводить полный поиск. Для определения позиции блока с результатами используется "предполагаемый интент", унаследованный от характеристик найденных веб-страниц и сайтов, а не от истории самого запроса.

Описание

Какую проблему решает

Патент решает проблему определения пользовательского интента для длиннохвостых (long-tail) запросов — запросов, которые встречаются редко или впервые, и по которым нет достаточной истории поиска. Основные проблемы:

  • Неопределенность интента: Невозможно точно определить, ищет ли пользователь веб-страницы, картинки или другой тип контента, полагаясь на стандартные исторические метрики (например, Search Property Ratio).
  • Эффективность ресурсов: Проведение полного поиска по всем вертикальным корпусам (Images, Video и т.д.) для каждого long-tail запроса крайне ресурсозатратно.
  • Позиционирование результатов: Сложно определить оптимальную позицию для вставки результатов из вторичного корпуса (Insertion Score) в основную выдачу без понимания интента.

Что запатентовано

Запатентована система для выборочного и эффективного поиска во вторичных корпусах (например, в индексе картинок) при обработке запроса к основному корпусу (веб-поиск), особенно для long-tail запросов. Система использует механизм "прощупывания" (probing) части вторичного индекса для оценки релевантности запроса этому типу контента (Second Resource Score). Если релевантность высока, запускается полный поиск. Для определения позиции вставки используются предполагаемые коэффициенты интента (Inferred Search Property Ratios), рассчитанные на уровне отдельных ресурсов и сайтов, а не на основе истории самого запроса.

Как это работает

Система работает в двух основных направлениях:

1. Триггер поиска (Эффективность):

  • Система проверяет, достаточно ли истории у запроса (Confidence Score).
  • Если истории мало (long-tail), система запускает поиск только по части вторичного индекса (например, 1-25% шард индекса картинок).
  • На основе результатов этого "пробного" поиска вычисляется Second Resource Score.
  • Только если этот показатель превышает порог, система запускает полный поиск по вторичному индексу.

2. Позиционирование (Интент):

  • Офлайн система рассчитывает Inferred Search Property Ratios (ISPR) для страниц и сайтов, основываясь на интенте запросов, которые исторически приводили к ним трафик.
  • При обработке long-tail запроса система анализирует ISPR топовых веб-результатов.
  • На основе этих ISPR вычисляется Insertion Score, определяющий позицию блока вторичных результатов в основной выдаче.
  • Используется взвешенная модель, которая смещает фокус с ISPR на актуальный SPR по мере накопления истории запроса.

Актуальность для SEO

Высокая. Эффективная обработка long-tail запросов и механизмы смешивания вертикальной и основной выдачи (Universal Search/Blending) являются фундаментальными компонентами современных поисковых систем. Описанные методы повышения эффективности (поиск по части индекса) и определения интента на основе характеристик результатов остаются критически важными для масштабирования и качества поиска.

Важность для SEO

Патент имеет высокое значение (8/10) для понимания механизмов Универсального Поиска. Он демонстрирует, что интент запроса может быть определен не только историей самого запроса, но и характеристиками контента, который ранжируется по этому запросу. Это подчеркивает важность создания контента, который четко соответствует определенному типу интента (визуальному, текстовому и т.д.), так как это влияет на расчет Inferred Search Property Ratios и, следовательно, на видимость сайта в блоках вертикального поиска и общий макет SERP.

Детальный разбор

Термины и определения

Confidence Score (Оценка уверенности)
Метрика, определяющая, достаточно ли исторических данных по запросу для точного расчета его Search Property Ratio. Низкая оценка характерна для long-tail запросов.
Corpus (Корпус)
Коллекция ресурсов определенного типа, например, веб-корпус (Web Corpus) или корпус изображений (Image Corpus).
Inferred Search Property Ratio (ISPR) (Предполагаемый коэффициент интента)
Оценка интента, используемая для long-tail запросов, когда актуальный SPR недоступен или ненадежен. Включает Resource SPR и Website SPR.
Insertion Score (Оценка вставки)
Метрика, определяющая ординальную позицию, на которой результаты из вторичного корпуса (например, блок картинок) будут вставлены в ранжирование основного корпуса (веб-результаты).
Long Tail Query (Длиннохвостый запрос)
Запрос, который встречается редко или впервые, и по которому отсутствует достаточная история поиска.
Proper Subset (Надлежащее подмножество / Часть индекса)
Часть индекса вторичного корпуса (например, 1-25% шард), используемая для эффективного "прощупывания" (probing) релевантности long-tail запроса без проведения полного поиска.
Resource Search Property Ratio (Resource SPR)
Предполагаемый интент на уровне отдельного ресурса (страницы). Рассчитывается на основе среднего значения актуальных SPR всех запросов, по которым пользователи исторически кликали на этот ресурс.
Search Property Ratio (SPR) (Коэффициент интента / Актуальный SPR)
Историческая метрика для конкретного запроса. Отношение количества поисков этого запроса во вторичном корпусе (например, Google Images) к количеству поисков в основном корпусе (Google Web Search).
Second Resource Score (Оценка вторичного ресурса)
Метрика, оценивающая связанность long-tail запроса со вторичным типом ресурсов (например, Image Score). Рассчитывается на основе результатов поиска по Proper Subset индекса и используется как триггер для полного поиска.
Website Search Property Ratio (Website SPR)
Предполагаемый интент на уровне сайта. Рассчитывается на основе Resource SPR страниц этого сайта. Используется для новых страниц или страниц с недостаточной историей.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной механизм обработки long-tail запросов для принятия решения о поиске во вторичном корпусе.

  1. Система получает запросы для поиска в первом корпусе (например, Web).
  2. Выбирается подмножество запросов, для которых оценка уверенности (Confidence Score) в их Search Property Ratio ниже порога (т.е. long-tail запросы).
  3. Для этих запросов вычисляется Second Resource Score (например, Image Score). Эта оценка вычисляется независимо от собственного SPR запроса.
  4. Second Resource Score сравнивается с порогом.
  5. Только если порог превышен:
    • Инициируется поиск во втором корпусе (например, Images).
    • Определяется Insertion Score для позиционирования результатов.
    • Генерируется объединенная страница результатов.

Claim 2 (Зависимый от 1): Уточняет метод вычисления Second Resource Score.

Вычисление включает инициацию поиска только по Proper Subset (части) второго корпуса и получение оценок релевантности из этой части. Это механизм экономии ресурсов.

Claim 3 и 4 (Зависимые от 2): Детализируют расчет Second Resource Score как отношение.

Оценка рассчитывается как отношение (A/B), где A — количество веб-страниц, содержащих хотя бы один вторичный ресурс (картинку) из пробного поиска с оценкой выше порога (высококачественная картинка); B — общее количество веб-страниц, содержащих любой вторичный ресурс из пробного поиска (Claim 3) ИЛИ общее количество релевантных веб-страниц (Claim 4).

Claim 7 (Независимый): Описывает механизм определения Insertion Score на основе предполагаемого интента ресурсов.

Определение Insertion Score для long-tail запросов основывается на Resource Search Property Ratio (Resource SPR) топовых результатов из первого корпуса. Система анализирует предполагаемый интент найденных веб-страниц, чтобы определить позицию вставки блока картинок.

Claim 8 (Независимый) и 9 (Зависимый): Описывают механизм взвешивания (blending) для расчета Insertion Score.

Insertion Score определяется на основе взвешенной комбинации двух оценок:

  • Первая оценка основана на актуальном SPR запроса (взвешивается пропорционально частоте запроса – т.е. Confidence Score).
  • Вторая оценка основана на предполагаемых SPR (Resource SPR) топовых результатов.

Это позволяет плавно переходить от предполагаемого интента к актуальному по мере накопления истории запроса.

Claim 11 (Независимый): Описывает офлайн-процесс расчета предполагаемых SPR.

  1. Для каждого ресурса в индексе из логов выбираются запросы, по которым были клики на этот ресурс.
  2. Извлекаются актуальные SPR этих запросов.
  3. Вычисляется Resource SPR для ресурса на основе этих актуальных SPR (например, усреднением).
  4. Для каждого сайта вычисляется Website SPR на основе Resource SPR его страниц.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, обеспечивая работу Универсального Поиска (Universal Search) для запросов с недостаточной историей.

INDEXING – Индексирование и извлечение признаков
На этом этапе (в офлайн-режиме) происходит анализ исторических логов (Historical Search Data) для расчета и сохранения в индексе предполагаемых коэффициентов интента: Resource SPR и Website SPR. Эти данные аннотируют документы в индексе.

RANKING – Ранжирование
Генерируется первичный набор результатов для основного корпуса (Web). Параллельно может запускаться «пробный» поиск (probing) по части вторичного индекса (Proper Subset), если запрос идентифицирован как long-tail.

METASEARCH – Метапоиск и Смешивание
Основное место применения патента. Система (например, Image Search Results Insertion System) работает здесь:

  1. Принятие решения о поиске (Triggering): Система решает, нужно ли проводить полный поиск во вторичном корпусе. Это решение базируется либо на актуальном SPR (для частых запросов), либо на Second Resource Score (для long-tail запросов), рассчитанном на этапе RANKING/Probing.
  2. Расчет позиции вставки (Blending): Система вычисляет Insertion Score. Для long-tail запросов это делается путем анализа Resource SPR и Website SPR топовых веб-результатов.
  3. Смешивание: Результаты основного и вторичного корпусов объединяются, при этом блок вторичных результатов позиционируется согласно Insertion Score.

Входные данные:

  • Запрос пользователя (Q).
  • Confidence Score запроса.
  • Результаты поиска по основному корпусу.
  • Resource SPR и Website SPR для этих результатов (из индекса).
  • (Опционально) Результаты пробного поиска по части вторичного индекса.

Выходные данные:

  • Решение о запуске полного поиска во вторичном корпусе.
  • Insertion Score.
  • Объединенная страница результатов поиска (SERP).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на длиннохвостые (long-tail) запросы, где интент неясен из-за отсутствия истории.
  • Типы контента и форматы: Влияет на видимость вертикальных результатов (картинки, видео и т.д.) внутри основной веб-выдачи. Определяет, получат ли страницы с выраженным вертикальным интентом (например, галереи изображений) соответствующий блок в SERP.
  • Конкретные ниши: Влияет на ниши с высокой долей визуального контента (E-commerce, Дизайн, Рецепты), где сайты часто имеют высокий Website SPR для изображений.

Когда применяется

  • Триггеры активации: Алгоритм активируется при получении запроса к основному корпусу.
  • Условия для Long-Tail логики: Применяется, когда Confidence Score для актуального Search Property Ratio (SPR) запроса не достигает порогового значения. Это указывает на то, что запрос новый или редкий.
  • Условия для стандартной логики: Если Confidence Score высок, система использует стандартный подход, базирующийся на актуальном SPR запроса.

Пошаговый алгоритм

Процесс А: Обработка запроса в реальном времени (Online)

  1. Получение запроса и Оценка уверенности: Система получает запрос и определяет Confidence Score для его актуального SPR.
  2. Ветвление логики:
    • Если Confidence Score высокий (Частый запрос): Используется актуальный SPR для принятия решения о поиске во вторичном корпусе и расчета Insertion Score.
    • Если Confidence Score низкий (Long-tail запрос): Переход к шагу 3.
  3. Инициация пробного поиска (Probing): Запускается поиск по Proper Subset (части) вторичного индекса (например, 1-25%).
  4. Расчет Second Resource Score: На основе результатов пробного поиска вычисляется оценка связанности. Например, как отношение веб-страниц с высококачественными картинками к общему числу релевантных веб-страниц.
  5. Принятие решения о полном поиске: Second Resource Score сравнивается с порогом.
    • Если ниже порога: Полный поиск не проводится.
    • Если выше порога: Инициируется полный поиск во вторичном корпусе (по оставшейся части индекса).
  6. Расчет Insertion Score (для Long-tail): Извлекаются топовые результаты основного корпуса. Анализируются их Resource SPR и Website SPR. На основе этих предполагаемых интентов вычисляется Insertion Score.
  7. Взвешивание и финализация Insertion Score: Финальный Insertion Score рассчитывается как взвешенная сумма оценки на основе актуального SPR (если есть) и оценки на основе предполагаемых SPR. Веса зависят от Confidence Score.
  8. Генерация SERP: Результаты объединяются, блок вторичных результатов вставляется на определенную позицию.

Процесс Б: Расчет предполагаемых интентов (Offline)

  1. Анализ логов: Система анализирует логи запросов и данные о кликах (Historical Search Data).
  2. Расчет Resource SPR: Для каждого ресурса (страницы) идентифицируются все запросы, которые приводили к клику на него. Извлекаются актуальные SPR этих запросов. Resource SPR вычисляется как центральная тенденция (например, среднее или медиана) этих значений.
  3. Расчет Website SPR: Для каждого сайта анализируются Resource SPR его страниц. Website SPR вычисляется как центральная тенденция этих значений.
  4. Сохранение в индексе: Resource SPR и Website SPR сохраняются в индексе как аннотации к соответствующим ресурсам и сайтам.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Критически важные данные. Используются логи запросов (Query Log) и данные о кликах (Selection data) из Historical Search Data. Эти данные необходимы для офлайн-расчета актуальных SPR частых запросов, а также для расчета Resource SPR и Website SPR путем анализа того, какие запросы приводили к кликам на ресурсы.
  • Структурные факторы: Связь между ресурсами разных корпусов (например, какие изображения размещены на каких веб-страницах). Используется при расчете Second Resource Score.
  • Контентные/Мультимедиа факторы: Признаки и метки изображений используются для оценки их релевантности и качества во время пробного и полного поиска.

Какие метрики используются и как они считаются

  • Search Property Ratio (SPR): SPR(Q)=Поиски Q во вторичном корпусеПоиски Q в основном корпусеSPR(Q) = \frac{\text{Поиски Q во вторичном корпусе}}{\text{Поиски Q в основном корпусе}}SPR(Q)=Поиски Q в основном корпусеПоиски Q во вторичном корпусе​.
  • Confidence Score: Оценка точности SPR, основанная на объеме исторических данных.
  • Resource SPR / Website SPR: Вычисляются как центральная тенденция (среднее, медиана) актуальных SPR запросов, исторически связанных с ресурсом или сайтом.
  • Second Resource Score: Рассчитывается на основе пробного поиска. Один из вариантов: Отношение количества веб-страниц, содержащих высококачественное изображение из пробного поиска, к общему количеству релевантных веб-страниц.
  • Insertion Score: Определяет позицию вставки. Патент описывает разные функции:
    • Для частых запросов (Уравнение 1): Insertion_Score(Q)=f(SPR(Q),IR({I}))Insertion\_Score(Q) = f(SPR(Q), IR(\{I\}))Insertion_Score(Q)=f(SPR(Q),IR({I})) (Функция от актуального SPR и качества найденных изображений IR({I})).
    • Для Long Tail запросов (Уравнение 2): Insertion_Score(Q)=f(ISPRs[R,W])Insertion\_Score(Q) = f(ISPRs[R, W])Insertion_Score(Q)=f(ISPRs[R,W]) (Функция от предполагаемых SPR топовых ресурсов [R] и сайтов [W]).
  • Взвешивание Insertion Score: Комбинация оценок из Ур. 1 и Ур. 2 с весами, зависящими от Confidence Score запроса.

Выводы

  1. Определение интента для Long-Tail: Google активно решает проблему неопределенности интента для редких запросов. Вместо того чтобы полагаться на отсутствующую историю запроса, система анализирует характеристики (предполагаемый интент) контента, который ранжируется по этому запросу.
  2. «Наследование Интента» (Intent Inheritance): Ресурсы и сайты накапливают профиль интента (Resource SPR и Website SPR) на основе того, какие типы запросов исторически приводят к ним трафик. Сайт, на который часто приходят по запросам с высоким «image intent», сам приобретает высокий Website SPR.
  3. Эффективность превыше всего (Probing): Патент подчеркивает важность экономии ресурсов. Google не будет проводить полный поиск по вертикальным индексам для всех long-tail запросов. Используется механизм «прощупывания» малой части индекса (Proper Subset) для принятия решения о целесообразности полного поиска.
  4. Качество медиа как триггер: Second Resource Score зависит от качества и релевантности медиа-контента (например, изображений), найденного во время пробного поиска. Наличие высококачественного контента является триггером для показа вертикального блока.
  5. Динамическое взвешивание интента: Система использует гибкую модель взвешивания. Для новых запросов приоритет отдается предполагаемому интенту (ISPR). По мере накопления статистики приоритет смещается к актуальному интенту (Actual SPR).

Практика

Best practices (это мы делаем)

  • Создавайте контент с четким фокусом на типе интента: Если вы хотите, чтобы ваша страница способствовала показу блока картинок (и потенциально ранжировалась в нем), она должна явно удовлетворять визуальный интент. Это повысит ее Resource SPR. Если страница привлекает трафик преимущественно по запросам с высоким визуальным интентом, ее Resource SPR будет высоким.
  • Поддерживайте консистентность интента на уровне сайта: Сайты с четкой форматной направленностью будут иметь более выраженный Website SPR. Если сайт посвящен фотографии (высокий визуальный Website SPR), новые страницы этого сайта быстрее наследуют этот показатель, что способствует показу блоков картинок даже по новым запросам.
  • Оптимизируйте качество и релевантность медиа: Убедитесь, что изображения на странице релевантны ее содержанию и хорошо оптимизированы. При расчете Second Resource Score система анализирует качество изображений, найденных на релевантных веб-страницах. Высокое качество повышает вероятность того, что пробный поиск даст положительный результат и блок картинок будет показан.
  • Фокус на Long-Tail в визуальных нишах: Если ваш сайт работает в нише с высоким Website SPR, вы имеете преимущество при ранжировании по Long Tail запросам, так как блок изображений, скорее всего, будет показан выше (высокий Insertion Score).

Worst practices (это делать не надо)

  • Смешивание разнородных интентов: Страницы или сайты, пытающиеся охватить слишком много разных типов интента без четкой структуры, могут получить нейтральный или низкий Resource/Website SPR для конкретной вертикали, что затруднит прогнозирование интента.
  • Игнорирование медиа-контента в визуальных нишах: Создание чисто текстового контента для тем, где пользователи ожидают визуальной информации. Такие страницы будут иметь низкий Resource SPR, и Google с меньшей вероятностью покажет блок картинок в выдаче.
  • Использование нерелевантных изображений: Добавление стоковых или нерелевантных изображений может снизить Second Resource Score. Если изображение не релевантно запросу, оно ухудшает соотношение качественных результатов к общему числу, тем самым уменьшая вероятность показа блока картинок.

Стратегическое значение

Патент раскрывает инфраструктуру и логику работы Универсального Поиска для огромного пласта long-tail запросов. Он подтверждает, что Google анализирует и профилирует не только запросы, но и отдельные страницы и целые домены на предмет их исторической связи с различными типами контента. Стратегически это означает, что формат контента и его соответствие определенному типу интента являются факторами, влияющими на структуру всей поисковой выдачи (SERP Features), а не только на ранжирование отдельной страницы.

Практические примеры

Сценарий 1: Активация блока изображений (Triggering)

  1. Запрос (Long Tail): Появляется новый мем, например, "Кот в костюме акулы на скейтборде". Истории нет (Confidence Score низкий).
  2. Зондирование (Probing): Система проверяет 15% индекса изображений.
  3. Расчет Second Resource Score: Находится много релевантных изображений с высокими оценками качества на страницах, посвященных мемам. Second Resource Score высокий.
  4. Результат: Система запускает полный поиск по корпусу изображений и решает показать блок изображений в выдаче.

Сценарий 2: Определение позиции вставки (Insertion)

  1. Запрос (Long Tail): "Редкий сорт фиалки АВ-Лягушонок купить". Истории нет. (Предположим, Triggering пройден).
  2. Веб-ранжирование: В топе ранжируются страницы с форумов коллекционеров фиалок и специализированных магазинов.
  3. Анализ ISPR: Эти сайты исторически имеют очень высокий Website SPR и Resource SPR, так как пользователи всегда ищут фото сортов (высокий визуальный интент).
  4. Расчет Insertion Score: Поскольку топовые веб-результаты имеют высокий Inferred SPR, система рассчитывает высокий Insertion Score.
  5. Результат: Блок изображений будет показан на высокой позиции (например, позиция 1 или 2), так как система уверена в визуальном интенте, основываясь на характеристиках ранжирующихся сайтов.

Вопросы и ответы

Что такое Search Property Ratio (SPR) и почему он важен?

Search Property Ratio (SPR) — это историческая метрика для конкретного запроса, показывающая, насколько часто его ищут в определенной вертикали (например, в Google Images) по сравнению с основным поиском (Web Search). Если SPR высокий, это сильный сигнал для Google показать блок этой вертикали на высокой позиции. Это ключевая метрика для определения интента частых запросов.

Почему Google не может использовать SPR для всех запросов?

Для длиннохвостых (long-tail) запросов, которые встречаются редко или впервые, просто нет достаточной истории поиска. SPR для них либо отсутствует, либо статистически недостоверен (имеет низкий Confidence Score). Поэтому Google использует альтернативные методы для определения интента таких запросов.

Что такое «прощупывание» (probing) или поиск по Proper Subset?

Это механизм оптимизации ресурсов. Вместо того чтобы проводить дорогостоящий полный поиск по всему вертикальному индексу для каждого long-tail запроса, Google сначала ищет только в малой части индекса (например, в 1-25% шард). Если этот быстрый пробный поиск дает многообещающие результаты, только тогда запускается полный поиск.

Как Google решает, запускать ли полный поиск по картинкам для long-tail запроса?

На основе результатов пробного поиска вычисляется Second Resource Score. Если этот показатель превышает установленный порог, это служит триггером для запуска полного поиска. Этот показатель оценивает качество и количество найденных картинок на релевантных веб-страницах в рамках пробного поиска.

Что такое Resource SPR и как он рассчитывается?

Resource SPR — это предполагаемый интент на уровне отдельной страницы. Он рассчитывается офлайн путем анализа всех запросов, по которым пользователи исторически кликали на эту страницу. Если большинство этих запросов имели высокий актуальный SPR (например, высокий визуальный интент), то и сама страница наследует высокий Resource SPR.

Что такое Website SPR и когда он используется?

Website SPR — это предполагаемый интент на уровне всего сайта, рассчитываемый как среднее значение Resource SPR его страниц. Он используется как запасной вариант для новых страниц или страниц с недостаточной собственной историей кликов. Если сайт в целом имеет сильный визуальный фокус, его новые страницы унаследуют этот интент.

Как Google определяет позицию блока картинок для long-tail запроса?

Если актуальный SPR недоступен, Google анализирует Resource SPR и Website SPR топовых веб-результатов по этому запросу. Если у большинства топовых страниц высокий предполагаемый визуальный интент (высокий ISPR), то и Insertion Score для блока картинок будет высоким, и он будет показан ближе к началу выдачи.

Как этот патент влияет на мою SEO-стратегию по оптимизации картинок?

Он подчеркивает важность не только оптимизации самих изображений, но и контекста веб-страницы. Создание страниц, которые четко удовлетворяют визуальный интент, повышает их Resource SPR. Это увеличивает вероятность того, что Google покажет блок картинок в выдаче по запросам, ведущим на эти страницы, что дает дополнительную видимость и влияет на макет SERP.

Если мой запрос становится популярным, Google перестанет использовать предполагаемый интент (ISPR)?

Да, патент описывает механизм взвешивания. По мере того как запрос набирает историю и его Confidence Score растет, система начинает отдавать больший вес актуальному SPR и меньший вес предполагаемому SPR (Resource/Website SPR). Это обеспечивает плавный переход к более точным историческим данным.

Применим ли этот патент только к картинкам?

Хотя в патенте в качестве примера используются изображения (Image Display), описанные механизмы являются общими и применимы к любым двум различным типам ресурсов. Эта логика может использоваться для определения интента и вставки блоков Видео, Новостей, Товаров или других вертикалей в основную веб-выдачу.

Похожие патенты

Как Google определяет тематику и интент запроса, анализируя контент уже ранжирующихся страниц в выдаче
Google использует метод классификации запросов, который анализирует не сам текст запроса, а контент (URL, заголовки, сниппеты) страниц, находящихся в топе выдачи по этому запросу. Сравнивая набор терминов из этих результатов с эталонными профилями разных тематик или типов контента (Новости, Видео, Картинки), система определяет интент пользователя и решает, какие вертикали поиска активировать.
  • US8756218B1
  • 2014-06-17
  • Семантика и интент

  • SERP

Как Google определяет намерение поиска изображений, анализируя контент топовых веб-результатов
Google использует систему для определения того, следует ли показывать блок с изображениями в поисковой выдаче. Вместо анализа только текста запроса, система анализирует характеристики контента (например, плотность изображений, соотношение изображений к тексту) на страницах, которые уже ранжируются в топе. Если эти страницы похожи на контент, который обычно удовлетворяет потребность в изображениях, система активирует показ блока картинок.
  • US9195717B2
  • 2015-11-24
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Популярные патенты

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph
Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).
  • US9208229B2
  • 2015-12-08
  • Knowledge Graph

  • Ссылки

  • EEAT и качество

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска
Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).
  • US8706747B2
  • 2014-04-22
  • Мультиязычность

  • Семантика и интент

  • Ссылки

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
  • US9081832B2
  • 2015-07-14
  • Ссылки

  • SERP

  • Свежесть контента

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google динамически регулирует влияние фактора близости в локальном поиске в зависимости от тематики запроса и региона
Google использует систему для определения того, насколько важна близость (расстояние) для конкретного поискового запроса и региона. Анализируя исторические данные о кликах и запросах маршрутов, система вычисляет «Фактор важности расстояния». Для запросов типа «Кофе» близость критична, и удаленные результаты пессимизируются. Для запросов типа «Аэропорт» близость менее важна, и качественные результаты могут ранжироваться высоко. Система также учитывает плотность региона (город или село), адаптируя ожидания пользователей по расстоянию.
  • US8463772B1
  • 2013-06-11
  • Local SEO

  • Поведенческие сигналы

seohardcore