
Google анализирует, в каких вертикалях (корпусах) пользователи чаще ищут определенный запрос и на какие типы результатов они кликают в смешанной выдаче. Система вычисляет "Меру относительной релевантности" для каждого корпуса и использует её для повышения результатов из наиболее предпочтительного корпуса, учитывая язык, страну пользователя и актуальные тренды.
Патент решает задачу определения того, какой тип контента или корпус (например, Web, Картинки, Новости, Видео) является наиболее релевантным для конкретного поискового запроса. Цель — улучшить качество смешанной выдачи (Универсальный Поиск/Universal Search), автоматически определяя предпочтения пользователей относительно формата контента на основе агрегированного поведения.
Запатентована система для вычисления Меры относительной релевантности (Measure of Relative Relevance) различных корпусов к запросу. Эта мера основывается на двух ключевых типах данных: статистике поиска (где пользователи ищут) и статистике кликов (на что они кликают в смешанной выдаче). Полученные показатели используются как сигнал для модификации ранжирования результатов из разных корпусов.
Система анализирует исторические данные, используя два основных механизма:
CTR результатов из разных корпусов. Если пользователи чаще кликают на Картинки, чем на Веб-результаты, Картинки считаются более релевантными.Система также сегментирует данные по языку и стране (Smoothing) и придает больший вес недавним данным (Exponential Moving Average), чтобы учитывать локальные особенности и тренды. Итоговая мера релевантности используется для бустинга результатов из предпочтительного корпуса.
Высокая. Смешанная выдача является стандартом современного поиска Google. Механизмы, определяющие, когда и как высоко ранжировать результаты из вертикальных поисков (Картинки, Видео, Новости), критически важны для формирования SERP. Описанные методы анализа статистики поведения пользователей для управления смешиванием остаются фундаментальными.
Патент имеет высокое стратегическое значение (8.5/10). Он описывает механизм, который определяет предпочтительный формат контента для запроса. Это напрямую влияет на SEO-стратегию: если агрегированное поведение пользователей указывает на предпочтение видео, текстовый контент будет иметь меньше шансов занять высокие позиции. Понимание этих принципов необходимо для эффективной оптимизации под Универсальный Поиск.
RSF, отношении OCTR/BaseCTR или их комбинации.Основные независимые пункты патента (Claims 1, 9, 17) фокусируются на методе определения релевантности, основанном на анализе кликов (CTR) в смешанной выдаче с учетом контекста пользователя.
Claim 1 (Независимый пункт): Описывает метод расчета относительной релевантности на основе сравнения CTR разных корпусов с учетом языка.
Базового корпуса (Base Corpus) в ответ на запрос Q.Второго корпуса (Second Corpus) для того же запроса Q. (Уточняется, что результатов из второго корпуса меньше).BaseCTR).OCTR).Мера относительной релевантности, основанная на отношении CTR Второго корпуса к CTR Базового корпуса ().Ядром изобретения является использование сравнительного CTR между разными типами контента в смешанной выдаче как прямого сигнала предпочтений пользователей для конкретного запроса и языкового контекста. Если пользователи систематически кликают на результаты из второго корпуса (например, Видео) чаще, чем на результаты из базового (Web), система повысит релевантность второго корпуса.
Claim 7 (Зависимый от 1): Уточняет механизм сглаживания данных по языку и стране.
Данные для расчета CTR берутся как из языковых (L), так и из страновых (C) сегментов. Итоговый расчет основывается на взвешенной комбинации (weighted combination) этих данных. Это позволяет системе комбинировать данные разной гранулярности (например, глобальные, языковые и страновые) для обеспечения статистической надежности метрик, особенно при недостатке данных в конкретном сегменте.
Изобретение затрагивает несколько этапов поиска, используя офлайн-анализ для влияния на онлайн-ранжирование.
INDEXING – Индексирование
Контент должен быть классифицирован и отнесен к соответствующим корпусам (Web, Images, News и т.д.).
QUNDERSTANDING (Офлайн-анализ)
Основная вычислительная работа происходит офлайн. Система анализирует Session Logs для расчета статистики RSF и CTR Ratios для множества запросов, языков и стран. Применяются механизмы EMA и Smoothing. Данные сохраняются в базе данных.
RANKING – Ранжирование (Онлайн)
Генерируются кандидаты из различных корпусов и рассчитываются их базовые IR scores.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Ключевой этап применения. При получении нового запроса система извлекает рассчитанную Меру относительной релевантности для разных корпусов. Эта мера используется для модификации (бустинга или понижения) базовых IR scores результатов перед их финальным смешиванием в единую выдачу (SERP).
Входные данные:
IR scores результатов из разных корпусов.Выходные данные:
IR scores.RSF или CTR Ratios.Процесс А: Офлайн-анализ и генерация статистики (Периодический)
Corpus Search Fraction (R(Q,CP)) и CTR (OCTR, BaseCTR) для каждого сегмента.Exponential Moving Average для придания большего веса свежим данным и учета трендов.RSF и отношений CTR между корпусами.Процесс Б: Обработка запроса в реальном времени
IR scores.Squashing Function).IR scores результатов в зависимости от их корпуса.Система полагается исключительно на поведенческие и контекстуальные данные, агрегированные из логов поиска.
EMA и приоритизации свежих данных.Методы обработки метрик:
RSF в бустинг-фактор, ограничивая максимальное влияние. Пример из патента: , где J – константа.Relative Search Fraction) и что они фактически выбирают (измеряется через отношение CTR разных корпусов в смешанной выдаче).Smoothing обеспечивает надежность данных, комбинируя локальные и глобальные тренды при необходимости.Exponential Moving Average позволяет системе быстро реагировать на изменения в поведении пользователей и актуальные события, придавая больший вес недавним данным.RSF и CTR Ratio для этих корпусов.CTR вашего контента в блоках Universal Search напрямую сигнализирует системе о его релевантности (влияя на OCTR).EMA, система быстро реагирует на изменения. Если тренд смещается (например, к новостному контенту), нужно своевременно адаптироваться.Патент подтверждает стратегическую важность диверсификации контента и оптимизации под Универсальный Поиск. Он демонстрирует, что Google интерпретирует интент не только на семантическом уровне, но и на уровне формата подачи информации, основываясь на данных о поведении пользователей. Долгосрочная стратегия должна включать мониторинг предпочтений форматов и инвестиции в производство разнообразного контента для всех релевантных вертикалей.
Сценарий: Оптимизация запроса "Как завязать галстук"
RSF для Видео и Картинок). Также в смешанной веб-выдаче пользователи чаще кликают на видео или схемы-картинки, чем на текстовые инструкции (высокий OCTR по сравнению с BaseCTR).Measure of Relative Relevance для корпусов Видео и Картинки.CTR в смешанной выдаче.Какие два основных типа данных использует Google для определения предпочтительного корпуса?
Система использует два ключевых набора данных. Первый – Статистика Поиска (Relative Search Fraction), которая показывает, в какой вертикали пользователи ищут запрос. Это отражает их ожидания. Второй – Статистика Кликов (отношение CTR), которая показывает, на результаты из какого корпуса пользователи кликают в смешанной выдаче. Это отражает фактическую релевантность и удовлетворенность.
Что важнее: где пользователи ищут (RSF) или куда они кликают (CTR)?
Патент описывает использование обоих факторов, возможно, в виде взвешенной комбинации. CTR в смешанной выдаче (OCTR/BaseCTR) часто считается более сильным сигналом фактической полезности и удовлетворенности пользователя. Однако RSF важен как показатель явного намерения пользователя искать в определенной вертикали.
Как Google учитывает свежие тренды и изменения в поведении пользователей?
Система использует Exponential Moving Average (EMA) при расчете статистики. Это метод, который придает значительно больший вес недавним данным по сравнению с историческими. Если поведение меняется (например, из-за актуальных событий и роста интереса к Новостям), система быстро адаптирует свои оценки предпочтений корпусов.
Влияет ли язык и страна пользователя на эти расчеты?
Да, критически влияет. Вся статистика собирается и анализируется с учетом гранулярности по Языку (L) и Стране (C). Система стремится использовать наиболее детальные данные (Q, L, C). Это означает, что предпочтения по типам контента для одного и того же запроса могут сильно отличаться в разных регионах.
Что такое Smoothing (Сглаживание) и зачем оно нужно?
Smoothing используется для обеспечения надежности статистики при недостатке данных на высоком уровне гранулярности (например, по редкой стране или языку). Система комбинирует локальные данные с данными более общего уровня (например, глобальной статистикой). Это позволяет избежать некорректных выводов на основе недостаточной выборки.
Как этот патент влияет на SEO для изображений и видео?
Влияние критическое. Патент описывает механизм, который может значительно повысить (забустить) результаты из корпусов Images и Video в Универсальном Поиске, если система считает эти типы контента более релевантными запросу. Это подчеркивает необходимость серьезной работы над Image SEO и Video SEO как части общей стратегии.
Что такое Squashing Function и как она влияет на ранжирование?
Squashing Function – это математическая трансформация, применяемая к Мере относительной релевантности для расчета итогового коэффициента бустинга. Она используется для нормализации и ограничения максимального влияния этого сигнала, чтобы предотвратить чрезмерное повышение результатов только на основе предпочтения корпуса.
Может ли картинка или видео ранжироваться выше, чем ТОП-1 веб-результат?
Да. Если Мера относительной релевантности для корпуса Картинок или Видео значительно выше, чем для Веб-корпуса, и применен соответствующий агрессивный бустинг, блоки из этих вертикалей могут быть показаны на самой верхней позиции в смешанной выдаче, выше стандартных "синих ссылок".
Как я могу повлиять на эти показатели для моего контента?
Напрямую повлиять на RSF сложно, так как это глобальная статистика. Однако можно повлиять на CTR (OCTR). Создавая качественный контент для нужной вертикали и оптимизируя его представление (миниатюры, заголовки), вы повышаете вероятность клика в смешанной выдаче, что является позитивным сигналом для системы.
Применяется ли этот механизм ко всем запросам?
Нет. В патенте упоминается фильтрация (Filtering). Статистика рассчитывается и хранится только для запросов, которые превышают определенный порог популярности (Threshold T). Для редких или новых запросов (длинный хвост) этот механизм, скорее всего, не применяется.

Семантика и интент
Персонализация
SERP

SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

Поведенческие сигналы
Семантика и интент
Мультимедиа

Антиспам
Ссылки
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Семантика и интент
Структура сайта
Ссылки

Local SEO
Поведенческие сигналы
Свежесть контента

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
EEAT и качество
SERP

Ссылки
SERP
Семантика и интент

Свежесть контента
Антиспам
Ссылки

Поведенческие сигналы
