
Google использует архитектуру для обработки медиазапросов (фильмы, сериалы). Система определяет, что запрос связан с медиа, и одновременно отправляет запросы в разные корпусы данных (структурированные данные, веб-индекс, картинки, расписания). Затем результаты агрегируются в единый специализированный интерфейс (например, Knowledge Panel или детальная страница сущности), предоставляя пользователю сводную информацию из разных источников.
Патент решает проблему предоставления разрозненной информации в ответ на медиазапросы (например, о фильмах, сериалах, актерах). Вместо того чтобы заставлять пользователя искать расписание в одном месте, изображения в другом, а обзоры в третьем, система улучшает пользовательский опыт, предоставляя агрегированную сводку из различных источников в едином, специализированном интерфейсе.
Запатентована система и метод агрегации информации о медиаобъектах из различных корпусов данных (plurality of different corpuses). Когда система получает запрос и идентифицирует его как медиа-связанный (media-related), она параллельно опрашивает разные источники данных (например, структурированную базу данных, веб-индекс, индекс изображений) и объединяет полученные результаты в специализированный формат отображения.
Система функционирует следующим образом:
media-related.media-related object), например, фильм или сериал.Page Formatter (включающий Search Result Aggregator) собирает полученные результаты.One Box или детальной страницы), где для каждого типа контента выделена своя отдельная область (distinct area).Высокая. Описанная архитектура является фундаментальной для реализации Universal Search (Универсального поиска) и Blending (Смешивания результатов). Этот патент описывает базовые механизмы, лежащие в основе создания современных SERP features, таких как Knowledge Panels, карусели изображений и специализированные блоки для сущностей (фильмы, книги, музыка). Агрегация данных из разных индексов критически важна для современного поиска Google.
Патент имеет высокое стратегическое значение (7.5/10) для понимания того, как Google формирует выдачу для запросов, связанных с сущностями. Он не описывает алгоритмы ранжирования стандартных веб-страниц, но объясняет архитектуру, которая позволяет Google создавать богатые результаты (Rich Results) и SERP features. Это напрямую влияет на то, как пользователи взаимодействуют с выдачей, и определяет критическую важность оптимизации контента не только для веб-поиска, но и для вертикальных индексов (картинки, видео).
Crawler) и его последующего анализа и категоризации (Classifier) для хранения в соответствующих корпусах.Claim 1 (Независимый пункт): Описывает основной метод обработки поискового запроса и генерации агрегированной выдачи.
media-related).media-related object.plurality of different corpuses. (Результаты включают список эпизодов, даты/время показов, обзор программы, а также веб-контент/изображения, полученные через второй запрос, основанный на первом).distinct area).Claim 3 (Зависимый от 1): Уточняет типы корпусов. Сбор данных происходит как минимум из одного структурированного (structured corpus) и одного неструктурированного корпуса (unstructured corpus).
Claim 6 (Независимый пункт): Описывает метод с фокусом на параллельном поиске и агрегации.
separate search is conducted for each corpus).adjacent areas).distinct areas) для группировок результатов из каждого корпуса и генерацию кода для создания веб-страницы.Изобретение затрагивает несколько ключевых этапов поисковой архитектуры, обеспечивая механизм Универсального поиска.
CRAWLING и INDEXING
На этих этапах Crawler собирает данные (веб-страницы, изображения, данные от провайдеров расписаний). Classifier определяет тип контента и направляет его в соответствующие корпусы (Structured corpus, Unstructured corpus, индекс изображений).
QUNDERSTANDING – Понимание Запросов
Система должна определить, что запрос является media-related (триггер для активации механизма) и идентифицировать соответствующий media-related object (сущность).
RANKING – Ранжирование
Система генерирует внутренние запросы и отправляет их параллельно в соответствующие корпусы. Каждый корпус (Веб, Картинки, Структурированные данные) выполняет свой собственный поиск и ранжирование.
METASEARCH – Метапоиск и Смешивание
Это основной этап применения патента. Search result aggregator (часть Page Formatter) собирает Топ-N результаты от каждого задействованного корпуса. Page Formatter определяет макет (layout) страницы и генерирует код (Markup) для отображения агрегированных результатов в едином интерфейсе (например, One Box или детальная страница сущности).
Входные данные:
Head end).Выходные данные:
SERP features, такие как Knowledge Panels, карусели изображений и видео, списки эпизодов и расписания показов.media-related.media-related object (сущность).Head end) для локализации расписаний.Page Formatter агрегирует полученные разнородные результаты.Page Formatter генерирует код для отображения агрегированных результатов в едином интерфейсе. Интерфейс структурирован так, чтобы выделять отдельные области (distinct areas) для каждого типа данных.Патент фокусируется на агрегации данных из различных источников:
Web Data).Scheduled Data), метаданные фильмов и сериалов (актеры, режиссеры, даты выхода), биографии (Structured Media Content).Head end) для локализации результатов, в частности, расписаний ТВ-программ.Патент описывает архитектуру агрегации и форматирования, а не метрики ранжирования.
media-related. Упоминается использование "белого списка" (whitelist) терминов.Конкретные формулы или алгоритмы расчета оценок ранжирования внутри каждого корпуса в патенте не приводятся.
Universal Search и Blended Search для специфических вертикалей, в данном случае — медиа. Это не алгоритм ранжирования, а механизм формирования выдачи.plurality of different corpuses) — веб, картинки, структурированные данные — для ответа на один запрос пользователя.media-related переключает логику обработки запроса со стандартного поиска на специализированный процесс агрегации и меняет формат представления результатов.media-related object) и агрегацию всей доступной информации вокруг них. Это является архитектурной основой для работы Knowledge Graph и отображения Knowledge Panels.structured corpus и unstructured corpus подчеркивает, что структурированные данные критически важны для формирования информативных и точных агрегированных ответов.Structured corpus. Это помогает заполнять блоки с расписаниями, списками актеров и эпизодов в агрегированной выдаче.Structured corpus.media-related object), поэтому важно выстраивать эти связи.Патент подтверждает стратегию Google по переходу от выдачи в виде "10 синих ссылок" к богатой, агрегированной выдаче, основанной на сущностях и намерениях пользователя. Он описывает архитектуру, которая позволяет Google отвечать на запрос, используя наиболее подходящие типы контента из разных индексов. Для Senior SEO-специалистов это подчеркивает необходимость мыслить за пределами традиционного веб-поиска и фокусироваться на общей видимости сущности (Entity Visibility) во всех релевантных корпусах данных Google (Web, Images, Video, Structured Data).
Сценарий: Оптимизация страницы нового сериала на сайте стримингового сервиса.
Knowledge Panel или специализированный блок). Данные из микроразметки используются для заполнения списка эпизодов и информации об актерах. Оптимизированные изображения попадают в карусель Google Images, а трейлер — в блок Google Video. Сайт сервиса получает видимость через эти агрегированные элементы.Что такое "множество различных корпусов" (plurality of different corpuses) в контексте этого патента?
Это означает, что Google использует несколько независимых баз данных или индексов для ответа на один запрос. В патенте упоминаются структурированный корпус (например, база данных с расписаниями и метаданными фильмов), неструктурированный корпус (веб-индекс), а также корпусы изображений и видео. Система опрашивает их параллельно.
Описывает ли этот патент Knowledge Panel (Сеть знаний)?
Хотя термин Knowledge Panel не используется, патент описывает архитектуру, которая позволяет создавать такие элементы. Агрегация структурированных данных, изображений и веб-результатов о конкретном медиаобъекте в единый специализированный интерфейс (описанный в патенте как One Box или детальная страница) функционально соответствует тому, как работает Knowledge Panel для фильмов и сериалов.
Как Google определяет, что запрос является "media-related"?
Патент не дает исчерпывающего списка факторов, но упоминает несколько механизмов. Это может быть совпадение с "белым списком" (whitelist) известных медиа-терминов, использование пользователем специальных префиксов (например, "tv:"), или наличие в запросе других индикаторов, таких как название телеканала или имя известного актера.
Как этот патент связан с Universal Search или Blended Search?
Этот патент описывает конкретную реализацию архитектуры Universal Search для медиа-вертикали. Он детализирует, как именно происходит смешивание (Blending): параллельный опрос разных корпусов и последующая агрегация результатов с помощью Page Formatter в единый интерфейс.
Влияет ли этот патент на ранжирование моего сайта в обычном веб-поиске?
Напрямую нет. Патент не описывает алгоритмы ранжирования внутри веб-корпуса. Однако он описывает механизм, который может существенно изменить вид поисковой выдачи (SERP) по медиазапросам. Появление крупных агрегированных блоков может снизить CTR традиционных органических результатов, даже если их позиции не изменились.
Что самое важное для SEO специалиста в этом патенте?
Самое важное — это понимание того, что для достижения видимости по запросам, связанным с сущностями, недостаточно оптимизации только под веб-поиск. Необходимо обеспечить присутствие контента во всех релевантных корпусах (Images, Video) и предоставлять точные структурированные данные, чтобы участвовать в формировании агрегированной выдачи.
Как я могу оптимизировать свой контент, чтобы он попадал в эти агрегированные блоки?
Ключевыми являются три направления. Первое — внедрение микроразметки (Schema.org), чтобы предоставлять данные для Structured corpus. Второе — оптимизация изображений (качество, метаданные, alt-тексты) для попадания в Image corpus. Третье — оптимизация видеоконтента (например, на YouTube) для попадания в Video corpus.
Что такое "Structured Corpus" и как Google его получает?
Structured Corpus — это база данных, содержащая факты о медиаобъектах (расписания, актеры, даты выхода). Google может получать эти данные путем парсинга веб-страниц (особенно с микроразметкой), из фидов данных от партнеров (например, стриминговых сервисов или провайдеров расписаний), а также из авторитетных источников типа Wikipedia или iMDB.
Что подразумевается под генерацией "второго запроса" на основе первого?
Это означает, что система может модифицировать или генерировать новые запросы для более эффективного поиска в специализированных корпусах. Например, если первый запрос — имя актера, второй запрос для корпуса изображений может быть сформулирован так, чтобы найти именно фотографии этого актера, а не его однофамильцев, путем добавления уточняющих терминов.
Применяется ли эта технология только к фильмам и сериалам?
Патент сфокусирован на медиаинформации (фильмы, ТВ, актеры) в качестве примера реализации. Однако описанная архитектура — параллельный опрос разных корпусов и агрегация результатов для специфического интента — является универсальной и применяется Google во многих других вертикалях (например, Покупки, Локальный поиск, Погода, Спорт).

Персонализация
Мультимедиа

Семантика и интент
Мультимедиа
Knowledge Graph

Семантика и интент
Мультимедиа
Индексация


Индексация
Мультимедиа

Персонализация
EEAT и качество
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Индексация
Семантика и интент

Ссылки
Индексация
Мультимедиа

SERP
EEAT и качество
Поведенческие сигналы

EEAT и качество
Поведенческие сигналы

EEAT и качество
Семантика и интент
SERP

SERP
Семантика и интент
EEAT и качество

EEAT и качество
Антиспам
Ссылки
