
Google использует многофакторную модель для определения, относится ли запрос к медиа-контенту (фильмам, книгам, музыке). Система анализирует результаты товарного поиска, предлагаемые подсказки (candidate queries), частоту запроса в специализированных вертикалях (Search Probability Ratio) и наличие специфичных ключевых слов. Это позволяет точнее определить интент пользователя и показать релевантные специализированные блоки или товарные предложения.
Патент решает задачу точной классификации поисковых запросов для определения, связан ли запрос с конкретным типом медиа-продукта (фильмы, книги, музыка, ТВ-шоу, видеоигры). Цель — отличить общий запрос от запроса с медиа-интентом (Media Query), чтобы поисковая система могла предоставить специализированные результаты, такие как ссылки на покупку, информацию о продукте или релевантную рекламу (result document).
Запатентована система и метод для идентификации медиа-запросов с использованием кросс-вертикальных сигналов и поведенческих данных. Система комбинирует данные из индекса товарного поиска (Products Search Index), анализ предлагаемых вариантов запросов (Candidate Queries, например, подсказки), сравнение с предварительно созданными списками ключевых слов (Keyword Lists) и расчет соотношения вероятности поиска (Search Probability Ratio, SPR) между веб-поиском и специализированными вертикалями.
Система работает в несколько этапов:
Candidate Queries.Candidate Queries и содержат ли Candidate Queries ключевые слова из списка, специфичного для данной медиа-категории (например, "DVD").Search Probability Ratio (SPR), который сравнивает частоту запроса в специализированном поиске (например, по книгам или новостям) с частотой в общем веб-поиске.Overall Score) и принимает решение, является ли запрос медиа-запросом.Media Query, система предоставляет специализированный результирующий документ.Высокая. Классификация запросов и определение интента пользователя (Query Understanding) являются фундаментальными задачами современных поисковых систем. Хотя методы анализа текста эволюционировали (BERT, MUM), общая логика использования перекрестных сигналов из разных индексов (товары, веб) и анализа поведения пользователей (подсказки, логи запросов) для точной классификации остается крайне актуальной.
Патент имеет значительное влияние (7/10) на SEO, особенно для сайтов в нишах развлечений и E-commerce. Он не описывает алгоритмы ранжирования "синих ссылок", но раскрывает механизмы классификации интента, которые напрямую определяют композицию SERP (Metasearch). Понимание этих механизмов критически важно для оптимизации видимости в специализированных блоках и корректной интерпретации запросов, связанных с медиа-контентом.
Second Ratio на First Ratio. First Ratio отражает относительную частоту запроса в веб-поиске. Second Ratio отражает относительную частоту запроса в специализированном поиске.Claim 1 (Независимый пункт): Описывает основной метод идентификации медиа-запроса, комбинирующий данные товарного поиска и анализ частотности.
Products Search Index.Candidate Queries.Candidate Queries.First Ratio (на основе частоты в веб-поиске).Second Ratio (на основе частоты в специализированном поиске, связанном с медиа или новостями).First Ratio и Second Ratio (т.е. SPR).result document.Claim 3 (Зависимый от 1): Добавляет обязательную проверку по списку ключевых слов.
Идентификация происходит, только если выполнены условия Claim 1 И Candidate Queries совпадают со словами в Keyword List для данного типа медиа.
Claim 16 (Независимый пункт): Описывает альтернативную систему, полагающуюся на Keyword List и SPR, без обязательного использования товарного индекса для определения категории.
Candidate Queries.Candidate Queries со словами в Keyword List (связанном с категорией медиа).First Ratio и Second Ratio.Keyword List И основываясь на First Ratio и Second Ratio.result document.Изобретение применяется преимущественно на этапе понимания запроса для классификации интента.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система в реальном времени анализирует входящий запрос, используя данные из различных источников, чтобы классифицировать его как Media Query и определить его тип. Также на этом этапе (в офлайн-режиме) генерируются Media Category Keyword Lists.
INDEXING – Индексирование и извлечение признаков
Система использует данные, хранящиеся в Products Search Index и других специализированных индексах (Книги, Новости). Точность категоризации продуктов в этих индексах критически важна для работы алгоритма. Также собираются и обрабатываются логи запросов для расчета SPR.
METASEARCH – Метапоиск и Смешивание
Результатом работы алгоритма является принятие решения о показе специализированного result document. Это напрямую влияет на смешивание результатов (Universal Search) и формирование SERP, активируя показ товарных блоков, рекламы или других вертикальных результатов.
Входные данные:
Products Search Index и их категории.Candidate Queries (подсказки, уточнения).Media Category Keyword Lists.Выходные данные:
Media Query или нет) и тип медиа.result document в SERP.Overall Score, SPR, количество совпадений с Keyword List, количество распознанных имен в запросе.Патент описывает несколько взаимосвязанных процессов и вариантов реализации.
Процесс А: Офлайн-генерация списка ключевых слов (Media Category Keyword List)
Candidate Queries (подсказки) из веб-поиска.Candidate Queries и сортируются по частоте.Media Category Keyword List.Процесс Б: Онлайн-классификация запроса (Основной вариант)
Products Search Index. Определяется доминирующая Категория.Candidate Queries.Candidate Queries И совпадение Candidate Queries с Keyword List. Если оба условия выполнены, запрос идентифицируется как Media Query или Possible Media Query.Keyword List и Категорией.Search Probability Ratio (SPR).Overall Score (агрегация). Если он превышает порог, запрос идентифицируется как Media Query или Possible Media Query.Media Query, предоставляется специализированный result document.Процесс В: Дополнительная верификация (для Possible Media Queries)
Если уверенность системы недостаточна (Possible Media Query), могут применяться дополнительные проверки:
Keyword Lists.Candidate Queries (подсказки, уточнения). Используются как индикатор коллективного интента.Products Search Index, в частности, категоризация товаров.Candidate Queries с Keyword List. Может быть количеством совпадений или суммой весов совпавших слов (патент упоминает взвешивание).Candidate Queries (подсказки/уточнения) и логи запросов (для SPR) являются критически важными. Они показывают, как пользователи ассоциируют термины и в каком контексте (веб vs. вертикаль) они ищут информацию.Keyword Lists, созданные путем анализа поведения пользователей. Это позволяет системе адаптироваться к изменениям языка и появлению новых терминов, связанных с медиа.Search Probability Ratio является конкретной метрикой для определения того, насколько запрос "принадлежит" определенной вертикали.Products Search Index для определения категории запроса, необходимо передавать точную информацию о категории медиа-продуктов (книги, диски) в Google Merchant Center и использовать детальную разметку Schema.org (Product, Book, Movie и т.д.).Candidate Queries. Например, для фильмов используйте термины "cast", "director", "blu-ray release date". Это помогает контенту соответствовать интенту, определенному через Keyword Lists.Candidate Queries для целевых запросов. Это позволит понять, как Google классифицирует интент и какие термины он ассоциирует с данной медиа-категорией, что поможет в адаптации контент-стратегии.Media Queries.Патент подтверждает стратегию Google на глубокое понимание интента пользователя через анализ поведения и данных из различных вертикалей. Для SEO это означает, что успех в вертикальном поиске (например, качественный продуктовый фид) напрямую влияет на то, как Google интерпретирует и обрабатывает связанные запросы в веб-поиске. Это подчеркивает необходимость комплексной стратегии, охватывающей все релевантные индексы Google.
Сценарий 1: Классификация неоднозначного запроса (Книга vs Фильм)
Products Search Index результаты в категориях "Книги" и "Фильмы". Определяется доминирующая категория на основе баллов, например, "Книги".Keyword List для книг ("book", "author").Media Query (Книга). Google показывает специализированный блок с возможностью покупки книги (Result Document).Сценарий 2: Использование эвристики для фильмов (Распознавание имен)
Possible Media Query (Фильм) на основе анализа подсказок и товарных результатов (например, DVD серии "Lethal Weapon").Media Query (Фильм). В выдаче отображаются результаты о фильмах с участием этих актеров.Что такое Search Probability Ratio (SPR) и почему он важен?
SPR — это метрика, которая сравнивает относительную частоту запроса в специализированном поиске (например, Google Books) с его частотой в общем веб-поиске. Высокий SPR указывает на то, что запрос гораздо чаще используется в контексте этой специализации. Это мощный сигнал для Google, подтверждающий специфический вертикальный интент пользователя, что помогает точно классифицировать запрос как Media Query.
Как Google генерирует списки ключевых слов (Media Category Keyword Lists)?
Это автоматический офлайн-процесс. Google анализирует частые запросы в товарном поиске, относящиеся к определенной категории (например, Фильмам). Затем он собирает поисковые подсказки (Candidate Queries) для этих запросов. Ключевые слова извлекаются из подсказок, сортируются по частоте и фильтруются, чтобы оставить только те, что наиболее характерны и уникальны для этой категории (например, "DVD", "cast").
Что такое Candidate Queries и как они используются?
Candidate Queries — это в первую очередь поисковые подсказки (suggestions) или уточнения (refinements), которые пользователи часто добавляют к исходному запросу. Они используются как источник контекста и индикатор коллективного интента. Если подсказки содержат название категории или ключевые слова из Keyword List, это увеличивает уверенность системы в классификации запроса как медиа-запроса.
Как этот патент влияет на E-commerce сайты, продающие медиа-контент?
Влияние значительное. Система использует Products Search Index как основной источник для определения категории запроса. Это подчеркивает критическую важность качественных и точно категоризированных товарных фидов для Google Merchant Center. Кроме того, успешная идентификация запроса как Media Query запускает показ специализированных результатов, часто включающих товарные предложения (PLA) или рекламу.
Как система обрабатывает неоднозначные запросы (например, книга и фильм с одинаковым названием)?
Система анализирует совокупность сигналов для определения доминирующего интента. Она оценит, какая категория преобладает в товарном поиске, какие Candidate Queries чаще встречаются ("book" или "movie"), и рассчитает SPR для разных вертикалей. В результате она может классифицировать запрос как один из типов или, как указано в патенте, предоставить результат, основанный на обоих типах медиа.
Использует ли Google анализ результатов веб-поиска для классификации медиа-запросов?
Да. В одном из вариантов реализации (в рамках модели скоринга) система анализирует результаты веб-поиска на предмет наличия авторитетных сайтов, ассоциированных с медиа-категорией (например, IMDB для фильмов). Присутствие таких сайтов в выдаче увеличивает уверенность в классификации.
Что означают специализированные эвристики для фильмов и музыки?
Это дополнительные правила для повышения точности в конкретных категориях. Для фильмов используется обнаружение нескольких отдельных имен в запросе (например, имена двух актеров), что считается сильным сигналом. Для музыки используется проверка наличия имени из запроса в заранее подготовленном списке известных исполнителей или групп.
Может ли запрос быть классифицирован как Media Query без использования товарного индекса?
Да. Альтернативный метод, описанный в Claim 16, полагается на совпадение Candidate Queries с Keyword List и расчет SPR, без обязательного шага по анализу товарных результатов для определения категории. Это позволяет классифицировать запросы даже при отсутствии прямых товарных соответствий в индексе.
Как SEO-специалист может использовать знание об этом патенте для оптимизации сайта с обзорами фильмов?
Необходимо обеспечить наличие на страницах терминологии, которая соответствует Keyword Lists и часто появляется в Candidate Queries: "cast", "director", "reviews", "release date". Также важно четко указывать и размечать имена актеров и съемочной группы (используя Schema.org), так как распознавание имен является сигналом для классификации. Повышение авторитетности сайта также поможет.
Что происходит, если система классифицирует запрос только как "Возможный медиа-запрос" (Possible Media Query)?
Если уверенность системы недостаточна (например, баллы близки к порогу), запрос помечается как Possible Media Query. В этом случае система запускает дополнительные процессы верификации (Процесс В), такие как детальный анализ SPR или применение специфических эвристик (например, распознавание имен), чтобы подтвердить или опровергнуть классификацию.

Семантика и интент
Мультимедиа
Индексация

Семантика и интент
Мультимедиа
SERP

Семантика и интент
SERP

Семантика и интент
SERP

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Персонализация
SERP
Ссылки

Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Антиспам

Персонализация
Поведенческие сигналы
SERP

SERP
Ссылки
Структура сайта

SERP
Семантика и интент
EEAT и качество

Мультиязычность
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа
