
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
Патент решает проблему неоптимального пользовательского опыта, когда поисковая система имеет несколько репозиториев контента (Веб-страницы, Картинки, Новости, Товары), но по умолчанию предоставляет результаты только из одного (обычно веб-поиска). Пользователи часто ищут специализированный контент (например, изображения), не переключаясь вручную на соответствующий интерфейс. Цель изобретения — автоматически определить, какой тип контента (repository) на самом деле желает пользователь, и предоставить соответствующие результаты.
Запатентована система, которая использует модель машинного обучения для прогнозирования того, какой репозиторий контента предпочитает пользователь для данного запроса и контекста. Модель обучается на исторических данных журналов поиска (Log Data). Эта система позволяет поисковой машине автоматически выбирать и смешивать результаты из различных вертикалей, формируя Универсальный Поиск (Universal Search).
Система работает в двух фазах: офлайн-обучение и онлайн-применение.
Label) для каждой тройки — желал ли пользователь этот контент (обычно на основе клика). Извлекаются признаки (Features), и обучается модель для прогнозирования вероятности желания.Score) для каждого доступного репозитория. Эти оценки используются для принятия решений: в каких репозиториях выполнять поиск и/или как отображать и смешивать результаты из разных репозиториев на странице выдачи.Высокая. Этот патент описывает фундаментальную концепцию Универсального поиска (Universal Search) или смешанного поиска (Blended Search). Хотя конкретные модели машинного обучения, упомянутые в патенте (например, логистическая регрессия), вероятно, заменены более сложными нейронными сетями, сама идея прогнозирования желаемого типа контента на основе запроса и контекста пользователя остается центральной для современной архитектуры поиска Google.
Патент имеет критическое значение для SEO (8.5/10). Он объясняет механизм, который определяет композицию SERP и видимость различных типов контента. Если модель предсказывает, что пользователь хочет картинки, стандартные веб-результаты могут быть понижены. Это подчеркивает необходимость понимания доминирующего интента (типа контента) для ключевых запросов и оптимизации активов для соответствующих вертикалей (Image SEO, News SEO, Video SEO).
CTR для репозитория).Web Page Repository, Image Repository, Product Repository, News Repository.probability) или значением уверенности (confidence value), отражающим вероятность того, что пользователь желает информацию из данного репозитория.Claim 1 (Независимый пункт): Описывает комплексный процесс, включающий обучение модели и ее применение в поиске (вариант с поиском по всем репозиториям).
log data), связанных с прошлыми поисками.Score, отражающий вероятность того, что конкретный репозиторий содержит желаемую информацию.Score для каждого репозитория путем ввода информации о запросе и пользователе в модель.Score.Claim 4 (Зависимый): Детализирует процесс обучения модели, фокусируясь на маркировке данных.
Генерация правил модели включает определение метки (Label) для каждой тройки данных (u, q, r). Метка содержит информацию о том, содержит ли репозиторий r информацию, которая удовлетворяет запросу q, предоставленному пользователем u (т.е. был ли результат желаемым/кликнутым).
Claim 7, 8, 9 (Зависимые): Описывают логику смешивания (Blending) и отображения результатов из нескольких репозиториев.
Генерация документа с результатами поиска включает выбор наборов результатов из двух или более репозиториев на основе их Scores. Эти наборы результатов располагаются в документе на основе их Scores. Результаты из репозитория с более высоким Score размещаются на более заметном месте (more prominent location), чем результаты из репозитория с более низким Score.
Claim 11 (Зависимый): Описывает оптимизацию эффективности поиска (вариант с выборочным поиском).
Система выбирает группу репозиториев для поиска на основе их Scores (рассчитанных до поиска). Поиск выполняется только по этой выбранной группе репозиториев, а не по всем доступным.
Изобретение является ключевым компонентом для реализации Универсального поиска и затрагивает несколько этапов.
QUNDERSTANDING – Понимание Запросов
На этом этапе происходит офлайн-обучение модели на основе анализа логов. В режиме реального времени запрос и контекст пользователя обрабатываются для извлечения признаков (Features), которые подаются на вход модели. Это форма классификации интента, сфокусированная на определении желаемого типа контента.
RANKING – Ранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента. Система должна решить, какие вертикали (репозитории) активировать (Triggering) и как их объединить (Blending). Патент описывает два основных варианта реализации:
Scores. Поиск выполняется только в репозиториях с высокими оценками. Это экономит ресурсы.Патент также упоминает гибридный подход: использование «приблизительной основной модели» (approximate main model) с дешевыми признаками для выбора репозиториев для поиска (Path B), а затем использование «полной основной модели» (full main model) с дорогими признаками (включая анализ полученных документов) для финального смешивания.
Входные данные:
Выходные данные:
Scores для каждого репозитория, прогнозирующие желание пользователя.Image Repository), запросы, связанные с покупками (Product Repository), или запросы о текущих событиях (News Repository).Score для этой вертикали превышает определенный порог или является наивысшим среди всех репозиториев.Процесс А: Офлайн-обучение модели
Log Data).Label) — желал ли пользователь u информацию из репозитория r при запросе q (например, был ли клик).Features) — контекстуальные, пользовательские, запрос-зависимые и агрегированные.Процесс Б: Онлайн-применение (Вариант 1: Поиск по всем репозиториям)
Score для каждого репозитория.Scores. Например, показывать только репозиторий с наивысшей оценкой или смешивать несколько.Процесс В: Онлайн-применение (Вариант 2: Выборочный поиск)
Score для каждого репозитория. Выбираются репозитории для поиска (например, Топ-2 или те, что выше порога).Scores (например, порядок блоков).Патент детализирует признаки (Features), используемые для обучения модели, которые основаны на тройке (u, q, r).
Пользовательские факторы (u):
Log Data).Временные факторы (u/q):
Запрос-зависимые факторы (q):
Контентные факторы (r) (Опционально):
Эти признаки требуют выполнения поиска и являются вычислительно дорогими (computationally expensive). Используются в «полной модели».
Поведенческие факторы (Агрегированные статистики):
Эти данные критически важны для обучения и используются как признаки.
Click Rate / CTR) для запросов, отправленных в интерфейс репозитория r.CTR для запросов в интерфейс репозитория r для конкретного пользователя u.CTR для запросов в интерфейс репозитория r для пользователей из той же страны, что и u.CTR для конкретного запроса q, отправленного в интерфейс репозитория r.Score для Image Repository), фокусироваться нужно на создании и оптимизации качественных изображений.Labels и Click Rates), оптимизация сниппетов во всех вертикалях (заголовки, миниатюры видео/изображений) для повышения CTR критически важна. Это дает положительные сигналы для обучения модели.Этот патент заложил основу для перехода от статической выдачи к динамической, смешанной выдаче (Universal Search). Он подтверждает, что Google стремится предоставить наиболее подходящий *формат* ответа, а не только наиболее релевантный текстовый документ. Стратегически это означает, что SEO-специалисты должны быть экспертами в мультиформатном контенте и понимать, как пользовательское поведение и контекст формируют ландшафт SERP в их нише.
Сценарий 1: Визуальный интент (Пример из патента)
Score для Image Repository = 0.91, для Web Page Repository = 0.45.more prominent location), вытесняя стандартные веб-результаты.Сценарий 2: Новостной интент (Пример из патента)
Score для News Repository значительно выше, чем для Web Page Repository.News Repository показываются на приоритетной позиции.Что является самым важным фактором для определения того, какой репозиторий выберет Google?
На основе патента, самым важным фактором является прогнозируемая вероятность того, что пользователь желает контент из этого репозитория. Эта вероятность (Score) рассчитывается моделью машинного обучения, которая обучается на исторических данных о том, на что пользователи кликали (Label) в ответ на определенные запросы (q) в определенном контексте (u).
Учитывает ли эта система персонализацию?
Да, система явно учитывает персонализацию. Входные данные для модели включают информацию о пользователе (u), такую как cookie ID, местоположение (IP, страна), язык и историю предыдущих запросов. Это означает, что для одного и того же запроса модель может предсказать разные желаемые репозитории для разных пользователей.
Как этот патент связан с Universal Search (Универсальным поиском)?
Этот патент описывает фундаментальный механизм работы Universal Search. Он предоставляет метод для принятия решений о том, когда и как смешивать результаты из разных вертикалей (Веб, Картинки, Новости и т.д.) на одной странице выдачи, основываясь на прогнозируемом желании пользователя.
Может ли Google решить вообще не показывать стандартные веб-результаты?
Да, патент описывает такую возможность. Если правило гласит, что нужно предоставлять результаты только из репозитория с наивысшим Score (Claim 1), и этот Score принадлежит, например, Image Repository, то пользователю могут быть показаны только результаты из этого репозитория.
Как Google решает, какой блок показать выше: Картинки или Новости?
Решение принимается на основе выходных оценок (Scores) модели. Если Score для Image Repository выше, чем для News Repository, блок картинок будет показан на более заметной позиции (more prominent location), как указано в Claim 9. Порядок блоков напрямую коррелирует с прогнозируемой вероятностью желания пользователя.
Что такое «приблизительная» и «полная» модели, упомянутые в патенте?
Патент описывает стратегию оптимизации ресурсов. «Приблизительная модель» (approximate main model) использует дешевые признаки (которые легко вычислить до поиска) для быстрого решения, в каких репозиториях искать. «Полная модель» (full main model) использует дорогие признаки (например, анализ содержания найденных документов), которые требуют выполнения поиска, для финального решения о смешивании и отображении.
Как SEO-специалист может повлиять на то, чтобы его контент попал в нужный репозиторий?
Необходимо создавать контент в формате, соответствующем репозиторию (изображения, новости, товары), и оптимизировать его согласно лучшим практикам для данной вертикали. Также важно убедиться, что контент удовлетворяет интент пользователя и стимулирует клики, так как это поведение используется для обучения модели.
Что такое "политика исследования" (Exploration Policy), упомянутая в патенте?
Это механизм для сбора данных об эффективности разных репозиториев. Система может намеренно показывать результаты из субоптимального репозитория небольшому проценту пользователей, даже если модель предсказывает низкий Score. Это позволяет Google тестировать новые вертикали и собирать данные для дообучения модели.
Использует ли Google эту технологию сегодня?
Концептуально — да, это основа современной смешанной выдачи. Однако реализация, скорее всего, значительно эволюционировала. Упомянутые в патенте 2005 года методы (например, логистическая регрессия) почти наверняка заменены передовыми моделями глубокого обучения, но задача осталась той же: предсказать желаемый тип контента.
Что делать, если мой контент релевантен, но Google показывает другой тип контента в топе?
Это указывает на то, что модель Google определила, что пользователи предпочитают другой формат контента для этого запроса. В этом случае необходимо пересмотреть стратегию: либо создать и оптимизировать контент в том формате, который предпочитает Google (например, видео или изображения), либо сфокусироваться на запросах, где ваш текущий формат контента является доминирующим.

Мультимедиа
SERP

Персонализация
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Мультимедиа

SERP

Индексация
Поведенческие сигналы

Семантика и интент
Персонализация
Поведенческие сигналы

Knowledge Graph
Семантика и интент
Ссылки

Ссылки
SERP

Персонализация
Поведенческие сигналы
SERP

Антиспам
SERP
Ссылки

Ссылки
Индексация
Поведенческие сигналы

Ссылки
SERP

Мультиязычность
Ссылки
SERP

Семантика и интент
EEAT и качество
SERP

Поведенческие сигналы
SERP
EEAT и качество
