Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует «Индекс Интента» и кластеризацию запросов для определения предпочтительного формата контента (Картинки, Видео, Текст)

    IDENTIFYING CONTENT FORMATS BASED ON SEARCH QUERY INTENT (Идентификация форматов контента на основе интента поискового запроса)
    • WO2025116892A1
    • Google LLC
    • 2025-06-05
    • 2023-11-28
    2023 EEAT и качество Мультимедиа Патенты Google Семантика и интент

    Google определяет, какой формат контента (изображения, видео, текст, аудио) ожидает пользователь, вычисляя «Значение индекса интента» (Intent Index Value). Для этого используются AI-модели или анализ исторических данных (кластеры запросов). Это значение определяет композицию выдачи и может влиять на прогнозы CTR, гарантируя, что результаты соответствуют предпочтениям пользователя по формату.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему несоответствия формата поисковой выдачи ожиданиям пользователя. Часто пользователи вводят запрос, подразумевая определенный формат (например, ищут изображения), но получают стандартную текстовую выдачу. Это вынуждает их вручную переключать вкладки или применять фильтры (например, переходить в «Картинки» или «Видео»). Изобретение направлено на автоматическое определение предпочтительного формата, что улучшает пользовательский опыт и повышает вычислительную эффективность системы за счет сокращения последующих взаимодействий пользователя.

    Что запатентовано

    Запатентована технология для автоматической идентификации и предоставления контента в формате, соответствующем предполагаемому интенту запроса (Query Intent). Центральным элементом системы является вычисление Intent Index Value (Значение индекса интента) — метрики, которая указывает на вероятность того, что запрос направлен на получение контента определенного формата (изображения, видео, текст, аудио). Это значение может вычисляться с помощью AI-моделей (включая LLM) или путем анализа исторических данных и кластеризации запросов.

    Как это работает

    Система определяет Intent Index Value для входящего запроса, используя несколько методов:

    • Кластеризация запросов (Clusters): Запрос сопоставляется с кластером схожих исторических запросов на основе совпадения терминов (для скорости и эффективности). Кластеру уже присвоен Intent Index Value.
    • AI-модель (Intent Index Model): Обученная модель (например, LLM) анализирует запрос и напрямую прогнозирует Intent Index Value.
    • Исторические коэффициенты (Ratios): Расчет на основе того, как часто пользователи выбирали определенный фильтр (например, «Картинки») для данного запроса в прошлом.

    Полученное значение используется как сигнал для Content Identification Model, которая выбирает контент для выдачи, определяет его визуальное представление и может корректировать прогнозы CTR.

    Актуальность для SEO

    Критически высокая. Патент подан в конце 2023 года и опубликован в 2025 году. Понимание интента формата и формирование адаптивной, мультиформатной выдачи (Universal Search) является центральным направлением развития современных поисковых систем. Описанные механизмы напрямую связаны с тем, как Google решает, какие вертикали поиска (Images, Videos, Shopping) активировать для конкретного запроса.

    Важность для SEO

    Влияние на SEO — высокое (85/100). Этот патент критически важен для контент-стратегии и понимания структуры SERP. Он описывает механизм, с помощью которого Google решает, какой тип контента является приоритетным для данного запроса. Если система определяет, что запрос имеет высокий Intent Index Value для изображений, текстовый контент будет иметь меньше шансов на высокие позиции в основной выдаче. SEO-специалистам необходимо понимать предпочтительный формат для своих целевых запросов и оптимизировать соответствующий контент.

    Детальный разбор

    Термины и определения

    Intent Index Value (Значение индекса интента)
    Ключевая метрика. Числовое значение (например, от 0 до 1), указывающее на вероятность (likelihood) или уверенность (confidence value), что поисковый запрос направлен на получение контента определенного формата.
    Cluster / Discrete Cluster (Кластер / Дискретный кластер)
    Группа исторических поисковых запросов, объединенных по схожести. Каждый кластер ассоциирован с определенным Intent Index Value. Используется для быстрого определения интента нового запроса. Сопоставление основано на совпадении терминов для вычислительной эффективности.
    Intent Index Model (Модель индекса интента)
    AI-модель (включая LM или LLM), обученная прогнозировать Intent Index Value для входящего запроса на основе исторических данных и признаков запроса.
    Content Identification Model (Модель идентификации контента)
    AI/ML модель, которая использует Intent Index Value (и/или идентификатор кластера) в качестве входного сигнала для идентификации релевантного контента, определения его формата отображения (например, размера) и корректировки прогнозов CTR.
    Query Intent (Интент запроса)
    Намерение пользователя относительно желаемого формата контента.
    Query Level Features (Признаки уровня запроса)
    Входные данные для обучения AI-моделей: исторические свойства запросов, эмбеддинги (embeddings), строковые признаки, географические данные и язык запроса.
    Search Filter / Labels (Поисковый фильтр / Метки)
    Элементы интерфейса (вкладки, фильтры), такие как «Изображения», «Видео». Исторические данные об их использовании служат метками (labels) для обучения моделей.
    CTR Prediction (Прогноз кликабельности)
    Оценка вероятности клика. Intent Index Value может использоваться для корректировки (up-regulating или down-regulating) этого прогноза.

    Ключевые утверждения (Анализ Claims)

    Патент содержит два основных независимых пункта (Claim 1 и Claim 40), описывающих разные подходы к реализации системы.

    Claim 1 (Независимый пункт): Подход на основе кластеризации.

    1. Система получает поисковый запрос.
    2. На основе запроса идентифицируется Discrete Cluster из множества кластеров.
    3. На основе этого кластера определяется Intent Index Value, указывающее на интент для первого формата.
    4. На основе Intent Index Value идентифицируется релевантный контент.
    5. Контент предоставляется для вывода во втором формате, соответствующем первому формату.

    Claim 40 (Независимый пункт): Общий подход (без обязательной кластеризации).

    1. Система получает поисковый запрос.
    2. На основе запроса (напрямую) определяется Intent Index Value, указывающее на интент для первого формата.
    3. На основе Intent Index Value идентифицируется релевантный контент.
    4. Контент предоставляется для вывода в соответствующем формате.

    Claim 2 (Зависимый от 1): Механизм идентификации кластера.

    Кластер идентифицируется путем сравнения терминов в запросе с терминами исторических запросов в кластерах. Выбирается кластер с совпадающими терминами. (Это подчеркивает фокус на скорости и эффективности по сравнению с семантическим анализом).

    Методы вычисления Intent Index Value (Claims 5, 8, 42, 45):

    • AI-модель: Запрос подается на вход AI-модели (Intent Index Model) для определения значения (Claims 5 и 42).
    • Ratio (Коэффициент): Значение определяется как соотношение количества запросов для первого формата к общему количеству запросов для всех форматов (Claims 8 и 45).

    Claim 12, 13, 49, 50 (Зависимые): Влияние на CTR.

    Система может корректировать предсказание кликабельности (CTR prediction), используя AI-модель (например, Content Identification Model). Если Intent Index Value (или диапазон кластера) выше порога, предсказание CTR повышается (up-regulating). Если ниже порога — понижается (down-regulating).

    Где и как применяется

    Изобретение применяется на нескольких этапах поиска, как в офлайн-режиме, так и в реальном времени.

    INDEXING / QUNDERSTANDING (Офлайн-процессы)

    • Анализ данных: Анализ логов запросов и использования Search Filters.
    • Обучение моделей: Обучение Intent Index Model и Content Identification Model с использованием Query Level Features и меток о выбранных фильтрах.
    • Кластеризация: Группировка исторических запросов в Clusters на основе совпадения терминов и расчет Intent Index Values для этих кластеров.

    QUNDERSTANDING – Понимание Запросов (Онлайн)
    При получении нового запроса система быстро определяет его интент формата:

    • Запрос сопоставляется с кластером (быстрый метод по Claim 1) или обрабатывается Intent Index Model (метод по Claim 40).
    • Вычисляется или извлекается Intent Index Value.

    METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
    Это основная область применения. Intent Index Value используется как сигнал для Content Identification Model, которая определяет:

    • Какие вертикали поиска (Веб, Картинки, Видео) активировать и приоритизировать.
    • Как смешивать результаты разных форматов в единую выдачу.

    RERANKING – Переранжирование
    На финальном этапе Intent Index Value используется для:

    • Корректировки CTR: Прогнозы CTR для результатов могут быть скорректированы (повышены или понижены).
    • Визуального форматирования: Система может изменить визуальное представление результатов (например, увеличить размер блока с картинками, если интент изображений высок).

    На что влияет

    • Типы контента и форматы: Напрямую влияет на баланс между изображениями, видео, текстом, аудио и товарами (Shopping) в поисковой выдаче. Определяет, какой формат будет доминировать.
    • Специфические запросы: Наибольшее влияние оказывается на неоднозначные или широкие запросы, где формат не указан явно, но пользователи исторически предпочитают определенный тип контента (например, визуальные объекты, инструкции, обзоры продуктов).

    Когда применяется

    • Условия работы: Алгоритм применяется при обработке большинства поисковых запросов для определения оптимального состава и макета SERP в рамках Универсального Поиска.
    • Триггеры активации и пороги: Определение Intent Index Value происходит для каждого запроса. Существенное изменение выдачи или корректировка CTR активируется, когда Intent Index Value для определенного формата превышает установленные пороги.

    Пошаговый алгоритм

    Патент описывает несколько вариантов работы. Ниже приведен обобщенный алгоритм.

    Этап 1: Получение запроса

    • Система получает входящий поисковый запрос.

    Этап 2: Определение интента формата (Вычисление Intent Index Value)

    Система использует один из следующих методов:

    • Вариант A (Кластеризация — Оптимизация скорости):
      1. Сравнение терминов запроса с терминами в исторических кластерах (Term Matching).
      2. Идентификация наиболее подходящего Discrete Cluster.
      3. Получение предварительно рассчитанного Intent Index Value, ассоциированного с этим кластером.
    • Вариант B (AI-модель — Оптимизация точности):
      1. Подача запроса на вход обученной Intent Index Model.
      2. Модель прогнозирует Intent Index Value на основе признаков запроса.
    • Вариант C (Соотношение):
      1. Расчет соотношения (Ratio) исторических использований фильтров для данного конкретного запроса.

    Этап 3: Идентификация и ранжирование контента

    • Intent Index Value (и/или идентификатор кластера) передается в качестве входного сигнала в Content Identification Model (модель ранжирования/смешивания).

    Этап 4: Корректировка и формирование выдачи

    Content Identification Model использует сигнал интента для:

    • Выбора и приоритизации контента в предпочтительном формате.
    • Корректировки визуального представления (например, определение размера контента).
    • Корректировки прогнозов CTR (повышение/понижение в зависимости от пороговых значений интента).

    Этап 5: Вывод результатов

    • Система предоставляет сформированную поисковую выдачу пользователю.

    Какие данные и как использует

    Данные на входе

    Система в значительной степени полагается на исторические данные, поведенческие факторы и характеристики запросов.

    • Поведенческие факторы (Исторические данные):
      • Исторические поисковые запросы (используются для кластеризации и обучения).
      • Использование поисковых фильтров (Search Filters): Критически важные данные. Фиксируется, как часто пользователи переключались на вкладки (Изображения, Видео, Покупки и т.д.). Используются как метки (Labels) для обучения AI-моделей и для расчета Ratios.
      • Данные о кликах (используются для обучения моделей прогнозирования CTR).
    • Контентные/Лингвистические факторы (Query Level Features):
      • Текст запроса (query string features).
      • Эмбеддинги запросов (embeddings).
      • Язык запроса (language of the search queries).
    • Географические факторы:
      • Географическая информация, связанная с запросами (geographical features).

    Какие метрики используются и как они считаются

    • Intent Index Value: Основная метрика. Рассчитывается одним из трех способов:
      1. AI-модель: Прогноз Intent Index Model (упоминаются LM/LLM), обученной на Query Level Features.
      2. Соотношение (Ratio): Формула: (Количество запросов с фильтром X) / (Общее количество запросов).
      3. Кластеры: Значение, предварительно рассчитанное для группы схожих запросов.
    • Кластеризация:
    • Метод: Основан на сходстве терминов (Term Similarity) между новым запросом и историческими запросами в кластере (для эффективности).
    • Структура: Упоминается, что кластеры могут быть одинакового размера по количеству исторических запросов.
  • Adjusted CTR Prediction: Скорректированный прогноз кликабельности. Intent Index Value или Кластер используются как сигнал для повышения (up-regulating) или понижения (down-regulating) базового прогноза CTR, если значение интента выше или ниже определенных порогов (Thresholds).
  • Выводы

    1. Формат контента как ключевой элемент интента: Google активно прогнозирует не только тему запроса, но и желаемый формат ответа. Intent Index Value является центральной метрикой для этого прогноза.
    2. Баланс между скоростью и точностью: Патент описывает гибкую систему с несколькими методами определения интента: быстрый и эффективный метод на основе кластеризации и сопоставления терминов, и потенциально более точный, основанный на выполнении AI-моделей (LLM) или расчете соотношений.
    3. Эффективность кластеризации: Для скорости система предпочитает сопоставление терминов, явно указывая, что анализ семантической близости слишком ресурсоемок для этой задачи в реальном времени.
    4. Историческое поведение определяет выдачу: Система обучается на том, как пользователи взаимодействовали с фильтрами поиска (вкладками) в прошлом. Это поведение напрямую формирует будущую композицию SERP.
    5. Интент как сигнал для корректировки CTR: Intent Index Value используется для корректировки прогнозируемого CTR. Если система уверена в формате, она может повысить ожидаемый CTR для этого контента, что напрямую влияет на ранжирование (Up-regulating CTR).
    6. Улучшение Универсального Поиска: Система направлена на автоматическое формирование смешанной выдачи (Universal Search), максимально соответствующей ожиданиям пользователя по формату.

    Практика

    Best practices (это мы делаем)

    • Анализ интента формата для ключевых запросов: Необходимо тщательно анализировать SERP, чтобы понять, какой формат предпочитает Google (т.е. какой Intent Index Value система присваивает этому кластеру запросов). Если доминируют изображения или видео, нужно сосредоточиться на создании и оптимизации именно этого типа контента.
    • Оптимизация под вертикальные поиски (Image SEO, Video SEO): Если интент запроса смещен в сторону определенного формата, необходимо применять лучшие практики оптимизации для соответствующей вертикали. Поскольку соответствие формату может повышать прогноз CTR, качественная оптимизация медиа становится критически важной.
    • Создание мультиформатного контента: Для повышения общей релевантности страницы полезно включать различные форматы контента (текст, релевантные изображения, видео). Это увеличивает шансы на то, что Content Identification Model выберет вашу страницу при различных интерпретациях интента.
    • Мониторинг визуальных изменений в SERP: Отслеживайте изменения в представлении результатов (например, увеличение размера блоков изображений). Это может указывать на сдвиг в оценке Intent Index Value, так как патент упоминает влияние интента на размер отображаемого контента.

    Worst practices (это делать не надо)

    • Игнорирование формата контента: Создание исключительно текстового контента для запросов, где Google явно определил высокий Intent Index Value для визуального контента. Например, писать длинную статью по запросу, где пользователи ищут фотографии или короткие видеоинструкции.
    • Низкое качество медиафайлов: Использование стоковых, нерелевантных или плохо оптимизированных изображений и видео. Если система определит интент на медиа, но ваш контент будет низкого качества, он не получит преимуществ в ранжировании.
    • Противодействие доминирующему интенту: Попытки ранжировать формат контента, который не соответствует определенному системой интенту. Система может применить пониженный прогноз CTR (down-regulating CTR prediction) к таким результатам.

    Стратегическое значение

    Патент подтверждает стратегический курс Google на развитие Универсального Поиска и автоматическое формирование выдачи, управляемое прогнозированием интента. Для SEO это означает, что стратегия не может быть ограничена только текстом. Интент запроса — это сочетание темы и формата. Способность Google корректировать прогнозы CTR на основе соответствия формату подчеркивает, что правильный формат может быть прямым фактором успеха. Долгосрочная стратегия требует гибкости в производстве контента и глубокой оптимизации во всех релевантных форматах.

    Практические примеры

    Сценарий: Оптимизация страницы товара с высоким визуальным интентом

    1. Анализ запроса: SEO-специалист анализирует запрос [Красные кроссовки Nike Air Max]. Выдача показывает большие блоки изображений и карусели товаров (Shopping).
    2. Интерпретация: Google присвоил этому кластеру запросов высокий Intent Index Value для изображений и покупок.
    3. Действия по оптимизации (на основе патента):
      • Приоритет отдается Image SEO. Создаются высококачественные фотографии товара с разных ракурсов.
      • Оптимизируются метаданные изображений (alt, title) и используется структурированная разметка Product.
      • Фокус страницы смещается на визуальное представление, ожидая, что система может отобразить крупные превью.
    4. Ожидаемый результат: Content Identification Model, получив высокий Intent Index Value для изображений, выбирает оптимизированные изображения для показа. Согласно патенту, система может повысить (up-regulate) прогнозируемый CTR для этих результатов, так как они соответствуют интенту, что улучшит их ранжирование.

    Вопросы и ответы

    Что такое «Intent Index Value» и почему это важно для SEO?

    Intent Index Value — это метрика, которую Google рассчитывает для определения вероятности того, что пользователь ищет контент определенного формата (например, видео или изображения). Для SEO это критически важно, потому что этот показатель напрямую влияет на состав поисковой выдачи. Если у запроса высокий показатель для видео, система будет приоритезировать видеоконтент, и текстовые страницы могут ранжироваться ниже.

    Как Google вычисляет этот «Intent Index Value»?

    Патент описывает три основных метода. Первый — использование обученной AI-модели (Intent Index Model), которая прогнозирует интент. Второй — расчет статистического соотношения (Ratio): как часто для этого запроса пользователи выбирали определенный формат в прошлом. Третий — через кластеризацию: новый запрос сопоставляется с кластером похожих исторических запросов, и ему присваивается значение интента этого кластера.

    Что такое «кластеры запросов» и почему Google использует их вместо анализа семантики в реальном времени?

    Кластеры — это группы схожих исторических запросов с общим профилем интента. Google использует их для повышения скорости и вычислительной эффективности. Патент указывает, что анализ семантической близости в реальном времени слишком ресурсозатратен. Сопоставление по терминам и использование готовых кластеров значительно быстрее.

    В патенте упоминается корректировка прогнозов CTR. Что это значит на практике?

    Это очень важный механизм ранжирования. Если система определяет, что контент соответствует предпочтительному формату запроса (и Intent Index Value превышает порог), она может искусственно повысить (up-regulate) прогноз CTR для этого результата. Это означает, что Google ожидает большей кликабельности от результатов, соответствующих интенту формата, что положительно влияет на их позиции.

    Может ли система изменить внешний вид (размер) моих результатов на основе этого патента?

    Да. В патенте указано, что Content Identification Model может определять формат вывода, включая размер контента. На практике это может означать, что если для запроса определен высокий интент на изображение, система может показать более крупные превью изображений в SERP, делая их более заметными.

    На каких данных обучаются модели определения интента?

    Модели обучаются на исторических данных. Ключевыми являются «Признаки уровня запроса» (Query Level Features) — текст, эмбеддинги, география, язык. В качестве меток (ground truth) используются данные о том, какие поисковые фильтры или вкладки (Images, Video, Shopping) пользователи выбирали для этих запросов в прошлом.

    Как SEO-специалисту определить предпочтительный формат для запроса?

    Необходимо анализировать текущую поисковую выдачу. Если в топе доминируют блоки изображений, видеокарусели или результаты покупок, это сильный индикатор того, что Intent Index Value смещен в сторону этих форматов. Также стоит изучать поведение пользователей в нише и данные Google Search Console по разным типам поиска.

    Значит ли это, что текстовый контент больше не важен?

    Нет, текстовый контент по-прежнему критически важен. Однако для запросов, где система определяет доминирующий интент другого формата (визуальный, видео), одного текста будет недостаточно для достижения топа. SEO-стратегия должна быть комплексной и включать оптимизацию контента во всех релевантных форматах.

    Используются ли Большие Языковые Модели (LLM) для определения этого интента?

    Да, патент явно упоминает возможность использования Language Models (LM) и Large Language Models (LLM) в качестве Intent Index Model. Они обучаются на исторических данных, чтобы предсказывать интент формата для новых запросов.

    Может ли интент формата меняться со временем?

    Да. Система использует исторические данные и постоянно переобучает модели и обновляет кластеры (в офлайн-режиме). Если поведение пользователей изменится (например, люди начнут чаще искать видео по теме, где раньше искали текст), Intent Index Value для этой темы также изменится, что отразится на композиции выдачи.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.