Патент Google, описывающий фундаментальный механизм Universal Search. Система определяет, когда запрос связан со специализированной вертикалью (например, ТВ-программы), используя систему триггеров (ключевые слова, белые и черные списки). Затем она одновременно запрашивает данные из основного веб-индекса и вертикального индекса. Результаты смешиваются и отображаются в единой выдаче, выделяя вертикальные данные в специальный блок (OneBox).
Описание
Какую задачу решает
Патент решает проблему предоставления пользователю наиболее релевантного типа контента в ответ на запрос. Когда пользователи ищут информацию о событиях с привязкой ко времени (например, телешоу, фильмы), стандартные веб-результаты могут быть менее полезны, чем конкретное расписание. Изобретение обеспечивает механизм для идентификации таких запросов и интеграции специализированных, структурированных данных (time-bounded events) непосредственно в основную поисковую выдачу.
Что запатентовано
Запатентована система и метод смешивания результатов поиска (Blending / Universal Search). Система обрабатывает запрос, выполняя поиск одновременно и независимо в основном веб-индексе (Primary Database или electronic document database) и в специализированной базе данных мультимедийных событий (Secondary Database или time-bounded event database). Ключевым элементом является объединение этих разнородных результатов в единый интерфейс.
Как это работает
Механизм работает по принципу Универсального Поиска:
- Триггеринг (Triggering): Система анализирует запрос, чтобы определить вероятность того, что пользователь ищет мультимедийное событие. Для этого используются списки ключевых слов (Multimedia Events Keywords), «белые списки» (Whitelist) запросов, явно указывающих на события, и «черные списки» (Blacklist) для исключения ложных срабатываний.
- Параллельный поиск: Если триггер срабатывает, система отправляет запрос одновременно в веб-поиск и в поиск по вертикальной базе данных.
- Локализация: Для ТВ-программ система учитывает местоположение пользователя (Zip code) и предпочитаемого ТВ-провайдера для генерации релевантного расписания.
- Смешивание (Blending) и Отображение: Полученные наборы результатов объединяются. Вертикальные результаты (first results) отображаются в contiguous sub-region (часто называемом OneBox или SERP Feature), который визуально отличается от стандартных веб-результатов (second results). Этот блок часто располагается выше веб-результатов.
- Интерактивность: Блок может включать прямые действия, такие как запись на DVR или добавление в календарь.
Актуальность для SEO
Высокая (для принципов), Средняя (для реализации). Фундаментальные принципы Universal Search и смешивания результатов из разных вертикалей критически важны для современного поиска. Эта архитектура используется повсеместно (Картинки, Новости, Видео). Однако конкретный пример реализации для ТВ-программ с функцией записи на DVR и использованием простых списков (Whitelists/Blacklists) для определения интента частично устарел в эпоху стриминговых сервисов и продвинутых NLP-моделей для классификации запросов.
Важность для SEO
Влияние на SEO значительное (8/10). Патент не описывает алгоритмы ранжирования внутри веб-индекса, но описывает архитектуру, которая определяет структуру SERP. Механизм позволяет результатам из вертикальных индексов занимать приоритетные позиции (OneBox), часто смещая стандартные «синие ссылки» вниз и снижая их CTR. Понимание того, как Google определяет интент (Query Understanding) и запускает вертикальный поиск, критически важно для разработки комплексной SEO-стратегии.
Детальный разбор
Термины и определения
- Time-bounded events (События, ограниченные по времени)
- Мультимедийные события, имеющие запланированное время начала и продолжительность. Примеры: телепрограммы, фильмы, спортивные трансляции.
- Primary Database / Electronic Document Database (Основная база данных)
- Основной индекс поисковой системы, содержащий интернет-документы (веб-страницы).
- Secondary Database / Time-bounded Event Database (Вторичная база данных)
- Специализированный индекс или база данных, содержащая информацию о time-bounded events (например, расписание ТВ-программ).
- First Results (Первый набор результатов)
- Результаты, полученные из Secondary Database (мультимедийные события).
- Second Results (Второй набор результатов)
- Результаты, полученные из Primary Database (стандартные веб-результаты).
- Contiguous sub-region (Непрерывная подобласть)
- Отдельный блок в интерфейсе поисковой выдачи, используемый для отображения First Results. В патенте также упоминается как OneBox. В SEO-терминологии соответствует SERP Feature.
- Multimedia Events Keywords (Ключевые слова мультимедийных событий)
- Список терминов (например, «tv», «video», названия каналов), которые с высокой вероятностью указывают на поиск мультимедийных событий и используются для триггеринга поиска в Secondary Database.
- Whitelist (Белый список)
- Список терминов или фраз (например, названия популярных шоу), которые явно указывают на то, что запрос относится к мультимедийным событиям.
- Blacklist (Черный список)
- Список терминов или фраз, которые указывают на то, что запрос НЕ относится к мультимедийным событиям, даже если он содержит Multimedia Events Keywords (например, запрос «купить flat screen TV»).
- Online Application (Онлайн-приложение)
- Интерфейс или сервис (например, Multimedia Database Search Engine), предоставляющий подробную информацию о мультимедийных событиях, на который ведут ссылки из First Results.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной процесс смешивания результатов в ответ на запрос пользователя (user search query) на поиск электронных документов.
- (A) Получение первого набора результатов: Если определено, что ключевое слово запроса соответствует time-bounded events (ТВ-программам), система запускает первый поиск по time-bounded event database.
- (B) Получение второго набора результатов: Независимо (independent from invoking the first search query) от первого поиска, система использует веб-поисковик (web search engine) для запуска второго поиска по electronic document database (веб-индекс), которая отделена от базы данных событий.
- Отображение: Система одновременно отображает (presenting concurrently) (i) первый набор и (ii) второй набор результатов в одном окне браузера.
- Форматирование первого набора: Первый набор отображается в contiguous sub-region и визуально отличается от второго набора.
- Интерактивность: В этой же подобласти отображается (iii) пользовательская опция для записи выбранного события на устройство записи (media content recording device, например, DVR).
Claim 2 (Зависимый от 1): Уточняет разделение областей.
Второй набор результатов (веб-документы) отображается в области окна браузера, которая исключает contiguous sub-region, используемую для первого набора.
Claim 3 (Зависимый от 2): Уточняет взаимное расположение.
Первый и второй наборы отображаются в виде списка, при этом первый набор (события) отображается выше (displayed above) второго набора (веб-документы).
Claim 6 (Зависимый от 1): Уточняет контекстуализацию.
Первый набор результатов выбирается в соответствии с географическим положением (geographic location) и поставщиком телевизионных услуг (television showings provider), связанными с пользователем.
Где и как применяется
Изобретение описывает архитектуру Universal Search и затрагивает несколько ключевых этапов поиска.
QUNDERSTANDING – Понимание Запросов
На этом этапе происходит анализ запроса для определения интента и активации соответствующих вертикалей (Триггеринг). Система сравнивает запрос с предопределенными критериями (predefined criteria), используя списки Multimedia Events Keywords, Whitelist и Blacklist, чтобы решить, нужно ли запускать поиск в Secondary Database.
RANKING – Ранжирование
На этом этапе запускаются параллельные и независимые процессы поиска. Query Server направляет запрос как в Web Database Search Engine, так и (если сработал триггер) в Multimedia Database Search Engine. Каждый движок независимо ранжирует свои результаты.
METASEARCH – Метапоиск и Смешивание
Основное применение патента. Система агрегирует результаты из обоих источников. Search Results Formatting Module форматирует веб-результаты и мультимедийные результаты (используя One Box results formatting module). Система определяет, где и как отобразить contiguous sub-region (OneBox) на странице выдачи, часто размещая его выше стандартных веб-результатов.
Входные данные:
- Поисковый запрос пользователя.
- Списки для триггеринга (Keywords, Whitelist, Blacklist).
- Данные профиля пользователя (геолокация/zip code, поставщик ТВ-услуг – для локализации).
Выходные данные:
- Смешанная страница результатов поиска (Blended SERP), содержащая как стандартные веб-ссылки, так и специализированный блок с мультимедийными событиями и интерактивными функциями.
На что влияет
- Специфические запросы: Наибольшее влияние на запросы, связанные с медиа-контентом — названия телешоу, фильмов, спортивных команд или событий.
- Структура SERP: Влияет на визуальное представление выдачи, внедряя специализированные блоки (SERP Features/OneBox), которые конкурируют за внимание пользователя с органическими результатами.
- Географические факторы: Механизм сильно зависит от локации пользователя (zip code) для предоставления точного расписания местных каналов.
Когда применяется
Алгоритм применяется при выполнении условий триггеринга на этапе понимания запроса:
- Триггеры активации: Когда запрос содержит термины из Multimedia Events Keywords ИЛИ когда запрос присутствует в Whitelist.
- Условия исключения: Алгоритм НЕ применяется, если запрос содержит термины из Blacklist (например, коммерческий интент, связанный с покупкой ТВ).
- Зависимость от данных: Для корректной работы может потребоваться информация о местоположении пользователя (zip code). Если ее нет, но запрос в Whitelist, система может запросить локацию.
Пошаговый алгоритм
Процесс обработки запроса на сервере:
- Получение и парсинг запроса: Система получает и анализирует запрос от клиента.
- Поиск в Primary Database: Запускается поиск для генерации основного набора веб-результатов (Second results).
- Анализ триггеров (Triggering): Параллельно система сравнивает запрос с ключевыми словами и списками, связанными с Secondary Database.
- Проверка наличия Multimedia Events Keywords.
- Если их нет, проверка Whitelist.
- Если ключевые слова есть, проверка Blacklist.
- Принятие решения о вторичном поиске: Определяется, удовлетворяет ли сравнение предопределенным критериям (например, есть совпадение с Whitelist и нет совпадения с Blacklist).
- Если НЕТ: Процесс завершается, клиенту отправляются только основные веб-результаты.
- Если ДА: Перейти к шагу 5.
- Проверка локации: Система проверяет наличие zip code пользователя. Если его нет, но он необходим для локализации (особенно если запрос есть в Whitelist), система может запросить его.
- Поиск в Secondary Database: Запускается поиск по базе мультимедийных событий с учетом локации для генерации First results.
- Проверка качества (Quality Check) (Опционально): Выполняется проверка вторичных результатов. Результаты, не соответствующие predefined quality criteria или удовлетворяющие фильтрам, удаляются.
- Смешивание и форматирование: Основной и вторичный наборы результатов объединяются. Вторичные результаты форматируются для отображения в contiguous sub-region (OneBox).
- Отправка результатов: Объединенный набор результатов отправляется клиенту.
Какие данные и как использует
Данные на входе
Патент фокусируется на инфраструктуре смешивания и использует следующие типы данных:
- Структурные данные (из Secondary Database): Расписания программ, названия каналов, время начала, продолжительность, описания событий. Это ключевые данные для заполнения OneBox.
- Географические факторы: Почтовый индекс (zip code) или другая информация о местоположении пользователя используется для локализации расписания.
- Пользовательские факторы: Данные о предпочтениях пользователя, такие как выбранный поставщик телевизионных услуг (television show provider), используются для настройки списка каналов. Также используется информация о DVR пользователя для функции записи.
- Системные данные (для триггеринга): Multimedia Events Keywords, Whitelist, Blacklist.
Какие метрики используются и как они считаются
Патент не детализирует метрики ранжирования ни для веб-результатов, ни для результатов внутри OneBox. Он сосредоточен на механизмах триггеринга и отображения.
- Триггеринг (Predefined Criteria): Используется бинарная логика на основе сравнения запроса со списками (Whitelist, Blacklist, Keywords). Это определяет, будет ли запущен поиск во вторичной базе.
- Фильтрация (Quality Check): Упоминается проверка качества вторичных результатов и удаление результатов, не соответствующих predefined quality criteria. Сами критерии в патенте не раскрываются.
Выводы
- Фундамент Universal Search: Патент описывает базовую архитектуру, позволяющую Google интегрировать данные из специализированных вертикальных индексов в основную поисковую выдачу. Это ключевой механизм для создания современных SERP Features.
- Независимость индексов и параллельный поиск: Подтверждается, что поиск в веб-индексе и вертикальных индексах происходит независимо и параллельно. Ранжирование в одном индексе не влияет на ранжирование в другом до этапа смешивания.
- Критичность триггеринга (Triggering): Решение о том, показывать ли вертикальные результаты, принимается на этапе Query Understanding с использованием четко определенных правил и списков (Whitelist, Blacklist, Keywords). Это определяет интерпретацию интента пользователя.
- Приоритет отображения вертикалей: Если вертикальные результаты (First Results) генерируются, они получают визуальный приоритет. Патент явно указывает на отображение их в отдельном блоке (contiguous sub-region) и часто выше стандартных веб-результатов (Claim 3).
- Интерактивность в SERP: Патент подчеркивает стремление Google предоставлять не только информацию, но и возможность действия прямо из выдачи (например, добавить в календарь, записать на DVR).
- Важность контекста пользователя: Для вертикалей, связанных со временем и местом (time-bounded events), критически важен контекст пользователя (локация, провайдер услуг) для обеспечения релевантности данных.
Практика
Best practices (это мы делаем)
Хотя патент фокусируется на ТВ-программах, описанный механизм Universal Search применим ко всем вертикалям (Новости, Картинки, Видео, Локальный поиск).
- Оптимизация под вертикальный поиск: Необходимо определить, какие вертикали релевантны для тематики сайта, и целенаправленно оптимизировать контент для попадания в эти индексы (например, оптимизация видео для Google Video, изображений для Google Images, новостей для Google News). Это увеличивает шансы появиться в соответствующем OneBox.
- Использование структурированных данных: Для контента, который может быть классифицирован как событие (Event, Product, Recipe), необходимо использовать соответствующую микроразметку. Это помогает поисковым системам понять и структурировать данные для отображения в специализированных блоках.
- Анализ интента и триггеров SERP Features: Senior SEO-специалисты должны анализировать, какие ключевые слова вызывают появление специализированных блоков в их нише (аналог Whitelist). Это помогает понять, как Google интерпретирует интент и какие типы контента он считает приоритетными.
- Анализ SERP Real Estate: Учитывайте, что появление OneBox смещает органические результаты вниз и снижает их CTR. Оценивайте потенциал трафика с учетом структуры выдачи, а не только частотности запроса.
Worst practices (это делать не надо)
- Игнорирование вертикального поиска: Разработка стратегии исключительно вокруг ранжирования в «10 синих ссылках». Описанный механизм показывает, что вертикальные результаты часто имеют приоритет и занимают верхнюю часть экрана.
- Попытки спама для триггеринга: Попытки заставить систему показать вертикальный блок для нерелевантных запросов будут неэффективны. Система использует Blacklist для фильтрации интентов (например, разделяя интент «смотреть ТВ» и «купить ТВ»).
- Конкуренция с OneBox за базовую информацию: Пытаться ранжироваться по запросам, на которые Google отвечает функциональным блоком (например, расписание, погода). Google предпочтет использовать структурированные данные из своей базы.
Стратегическое значение
Этот патент является одним из основополагающих документов, описывающих переход Google к системе Universal Search. Он демонстрирует инфраструктуру, которая позволяет Google диверсифицировать выдачу и отвечать на запрос пользователя наиболее подходящим форматом контента. Стратегически это означает, что SEO не ограничивается веб-страницами; это управление видимостью во всех релевантных вертикалях и форматах Google.
Практические примеры
Сценарий: Интеграция видео-контента в выдачу (Применение механизма патента к другой вертикали)
- Задача: Увеличить видимость обучающего видео по запросу «как установить windows».
- Анализ (Triggering): Google определяет этот запрос как инструкцию (How-to), для которой видео является предпочтительным форматом (аналог срабатывания Whitelist для видео-интента).
- Действия SEO:
- Оптимизировать видео на YouTube или на сайте с разметкой VideoObject под этот запрос.
- Убедиться, что метаданные (заголовок, описание) релевантны.
- Добавить таймкоды (Key Moments).
- Механизм Google: При обработке запроса система запускает параллельный поиск в Primary Database (Web Index) и Secondary Database (Video Index).
- Ожидаемый результат (Blending): Google формирует SERP, где блок с видео (contiguous sub-region) отображается на приоритетной позиции. Оптимизированное видео попадает в этот блок, обеспечивая высокую видимость, даже если веб-страница сайта ранжируется ниже.
Вопросы и ответы
Описывает ли этот патент алгоритмы ранжирования?
Нет, этот патент не описывает, как ранжируются веб-страницы или как выбираются лучшие мультимедийные события. Он описывает инфраструктуру для триггеринга (когда искать в вертикали), параллельного выполнения поиска в разных индексах и смешивания (Blending) результатов в единой выдаче (Universal Search).
Что такое OneBox или Contiguous sub-region в контексте этого патента?
Это технический термин для обозначения специализированного блока в выдаче (SERP Feature), который визуально отделен от стандартных веб-ссылок. Он используется для отображения результатов из вертикального поиска (Secondary Database), например, расписания ТВ-программ, новостей или картинок.
Как Google решает, когда показывать вертикальный блок (OneBox)?
Решение принимается на этапе понимания запроса (Triggering). Система использует несколько списков: Multimedia Events Keywords (общие слова, указывающие на интент), Whitelist (запросы, которые точно относятся к вертикали) и Blacklist (запросы-исключения). Если условия выполняются, вертикальный поиск активируется.
Что такое Blacklist и зачем он нужен?
Blacklist используется для предотвращения ложных срабатываний и уточнения интента. Например, если пользователь ищет «купить новый TV», он использует слово «TV» (потенциальный Keyword), но его интент коммерческий, а не информационный (посмотреть расписание). Такой запрос может быть в Blacklist, чтобы не запускать ненужный поиск в базе мультимедийных событий.
Влияет ли ранжирование моего сайта в веб-поиске на его появление в OneBox?
Согласно патенту, поиск в Primary Database (Web) и Secondary Database (Vertical) происходит независимо. Высокие позиции в веб-поиске не гарантируют попадания в вертикальный блок, и наоборот. Необходимо оптимизировать контент непосредственно под требования соответствующей вертикали.
Насколько важен этот патент для современного SEO, если он фокусируется на ТВ-программах и DVR?
Он критически важен. Хотя примеры (ТВ и DVR) могут устаревать, описанная архитектура Universal Search является универсальной. Тот же самый механизм используется для интеграции Новостей, Картинок, Видео, Локальных результатов и т.д. Понимание этого патента дает понимание того, как устроена современная поисковая выдача Google.
Что означает интерактивность, упомянутая в патенте (запись на DVR, календарь)?
Это демонстрирует стремление Google превращать SERP в интерфейс для выполнения действий (Actionable SERP). В данном случае — это интеграция с внешними устройствами или приложениями. В современном поиске это проявляется в виде кнопок бронирования, покупки билетов или звонка прямо из выдачи.
Какую роль играет геолокация (Zip Code) в этом патенте?
Для событий, привязанных ко времени и месту (например, расписание местных ТВ-каналов), геолокация пользователя критически важна. Система использует ее для фильтрации и предоставления релевантных локальных данных. Это подчеркивает важность локального контекста в Universal Search.
Как я могу использовать знания из этого патента для своего сайта?
Необходимо рассматривать SEO комплексно. Определите, какие вертикали поиска релевантны для вашего бизнеса (например, Видео для инструкций, Картинки для e-commerce, Новости для медиа) и активно оптимизируйте контент под эти вертикали, чтобы увеличить шансы на появление в соответствующих SERP Features.
Может ли OneBox сместить мой сайт с первой позиции?
Да. В патенте (Claim 3) явно указано, что первый набор результатов (OneBox) может отображаться выше второго набора (стандартные веб-результаты). Это часто происходит на практике, когда SERP Features занимают верхнюю часть экрана, смещая органические результаты вниз и снижая их CTR.