
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
Патент решает критическую проблему интерпретации неявной обратной связи пользователей (Implicit User Feedback), такой как клики (CTR). Проблема заключается в том, что пользователи кликают на результаты не только из-за их релевантности, но и из-за Presentation Bias (предвзятости представления). Это включает позицию результата (пользователи склонны кликать на верхние результаты независимо от качества) и визуальные аспекты (привлекательность сниппета, выделение жирным шрифтом). Изобретение направлено на то, чтобы отделить влияние этих факторов от истинного сигнала релевантности, содержащегося в кликах, тем самым повышая точность ранжирования.
Запатентована система и метод создания и использования Prior Model (Априорной модели), которая моделирует Presentation Bias. Эта модель предсказывает фоновую вероятность клика (ожидаемый CTR) на результат, основываясь на наборе признаков, связанных с его представлением (позиция, визуальное оформление) и контекстом выдачи. Цель – использовать эту модель для нормализации реальных данных о кликах, чтобы уменьшить влияние предвзятости представления на ранжирование.
Система работает в два этапа: офлайн-построение модели и онлайн-применение.
User Selections Logs) по множеству разных запросов. Извлекаются признаки, характеризующие представление результата (например, позиция, длина сниппета, наличие рекламы). Затем система вычисляет вероятность клика для различных комбинаций этих признаков, независимо от конкретного запроса.Click Fraction). Одновременно Prior Model предсказывает ожидаемый CTR для этого документа, учитывая его текущую позицию и оформление. Реальный CTR сравнивается с предсказанным. Если реальный CTR значительно выше предсказанного, это интерпретируется как сильный сигнал релевантности, и результат получает повышение (boost).Критически высокая. Точная интерпретация поведенческих факторов является одним из ключевых элементов современного машинного обучения в ранжировании. Понимание и компенсация позиционной предвзятости (Position Bias) и других видов Presentation Bias абсолютно необходимы для эффективного использования CTR в качестве сигнала качества. Этот патент описывает фундаментальный механизм для решения этой задачи.
Патент имеет критическое значение (10/10) для понимания того, как Google оценивает успех контента. Он показывает, что высокий CTR сам по себе недостаточен для улучшения ранжирования. Важен CTR относительно ожидаемого уровня для данной позиции и способа представления. Это означает, что SEO-стратегии должны фокусироваться на создании контента, который не просто привлекает клики, но и демонстрирует релевантность и удовлетворенность пользователя, превосходящие ожидания, основанные на его позиции в выдаче.
Position Bias), привлекательность сниппета, выделение жирным шрифтом, наличие рекламы и т.д.Presentation Features и Relevance Features). Часто строится независимо от конкретного запроса.Click Fraction).Implicit User Feedback Model. Рассчитывается как отношение взвешенных кликов на документ по запросу к общему числу взвешенных кликов по этому запросу.Presentation Bias (например, позиция, длина сниппета, количество выделенных слов).IR score, язык, страна).Claim 1 (Независимый пункт): Описывает основной процесс создания и использования модели для снижения влияния предвзятости представления.
presentation bias features), включая ранг (позицию), и признаки релевантности (relevancy features).Prior Model) на этой информации для предсказания CTR на основе этих признаков.Presentation Bias при ранжировании. Это достигается путем определения оценки качества (quality score) и исключения независимых эффектов предвзятости представления из этой оценки с помощью предсказаний модели.Claim 5 (Зависимый от 1): Детализирует обучение модели путем разделения на две модели.
Claim 6 (Зависимый от 5): Описывает использование двух моделей.
Поисковая система использует предсказания первой и второй моделей для корректировки оценок ранжирования (ranking scores) результатов поиска с целью снижения Presentation Bias. Это может включать расчет отношения между предсказаниями двух моделей (Claim 7).
Claim 8 (Зависимый от 1): Описывает механизм корректировки ранжирования.
Поисковая система использует сравнение предсказаний Prior Model (ожидаемый CTR) с данными из Implicit User Feedback Model (например, реальным Click Fraction) для корректировки оценок ранжирования.
Изобретение затрагивает несколько этапов поиска, используя данные, собранные на этапе взаимодействия с пользователем, и влияя на финальное ранжирование.
INDEXING / Офлайн-процессы (Анализ данных)
Критически важный компонент. На этом этапе (или в рамках отдельных офлайн-процессов анализа логов) происходит построение Prior Model. Система анализирует User Selections Logs, извлекает Presentation Features и Relevance Features и обучает модель предсказывать CTR независимо от запроса.
RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента происходит на финальных стадиях ранжирования (L3 или Reranking).
Implicit User Feedback Model (например, реальный Click Fraction – аспект релевантности документа).Prior Model для получения предсказанного CTR (сигнал, соответствующий аспекту представления).Relevance Signal), очищенного от Presentation Bias.ranking scores.Входные данные:
Presentation Features (позиция, сниппеты, форматирование) и Relevance Features (базовые IR scores) для показанных результатов.Implicit User Feedback Model (реальный CTR/Click Fraction).Выходные данные:
Prior Model (результат офлайн-обучения).Boost фактор, применяемый к ranking scores (онлайн).Position Bias наиболее выражен. Результат на позиции 1 имеет очень высокий ожидаемый CTR из-за предвзятости, поэтому ему труднее получить буст, чем результату на позиции 8.Prior Model, что усложняет получение буста за счет поведенческих факторов.Implicit User Feedback. Компенсация предвзятости является неотъемлемой частью интерпретации этих данных.Prior Model и наличие данных о реальных кликах.Процесс А: Построение Prior Model (Офлайн)
User Selections Logs, содержащим данные о показах и кликах по множеству запросов.Presentation Bias Features (позиция, форматирование, длина сниппета, наличие рекламы) и Relevance Features (IR score документа, IR score предыдущего/следующего документа, язык, страна).Prior Model.Relevance Features или только Presentation Features).Процесс Б: Применение Prior Model (Онлайн, во время ранжирования)
Implicit User Feedback Model (например, реальный Click Fraction (a)) для документа в контексте запроса.Prior Model для предсказания ожидаемого CTR (p) на основе этих признаков.ranking score документа.Implicit User Feedback Model, система может использовать третью модель (обученную на редких результатах) для предсказания его релевантности.Патент детализирует широкий спектр факторов, используемых для построения Prior Model.
user selections), время пребывания на документе (Dwell Time/Staytime) для классификации кликов (короткие, средние, длинные). Логи запросов.Bold Terms) в заголовке и сниппете.Porn Terms).Rank) результата.Ads).Onebox).Indentation, цвет фона).Prior Model. Это вероятность клика при заданном наборе признаков представления и контекста.Implicit User Feedback Model, отражающая реальное поведение пользователей по конкретному запросу. Рассчитывается на основе взвешенных кликов.Dwell Time). Длинные клики получают больший вес, чем короткие. Используются для расчета Click Fraction.Prior Model для его позиции и способа представления.Presentation Bias включает визуальные аспекты (сниппет, заголовок, форматирование). Привлекательный сниппет повышает pCTR. Если документ не оправдывает эту привлекательность (например, имеет высокий показатель коротких кликов), система может его пессимизировать.Prior Model учитывает контекст SERP, включая качество соседних результатов (их IR scores) и наличие отвлекающих элементов (реклама, Onebox). Присутствие сильных конкурентов или рекламы может изменить ожидаемый CTR для вашего результата.Dwell Time) и учет типа запроса (информационный vs навигационный) для более точной оценки удовлетворенности пользователя.Weighted Clicks) и реальный CTR (aCTR) будет интерпретирован как сигнал качества, превосходящий ожидания Prior Model (pCTR).Presentation Bias, а не качеством контента.Prior Model учтет привлекательность сниппета (повысив pCTR), а реальные данные покажут низкую удовлетворенность (короткие клики). Это приведет к выводу, что результат нерелевантен.Dwell Time), они будут иметь низкий вес при расчете aCTR и не помогут превзойти pCTR.Staytime) и паттерны кликов различаются для разных типов запросов, и это учитывается при взвешивании кликов.Этот патент подтверждает, что Google рассматривает SERP как экосистему, где взаимодействие пользователя с одним результатом зависит от контекста других. Стратегическое значение заключается в переходе от абсолютных метрик (CTR, Позиция) к относительным (CTR выше ожидаемого). Это фундаментальный механизм, позволяющий Google использовать машинное обучение для постоянного улучшения качества выдачи на основе поведения пользователей, минимизируя при этом риски манипуляций и естественные искажения, связанные с интерфейсом.
Сценарий 1: Результат на низкой позиции демонстрирует высокую релевантность
Boost Factor. Страница поднимается в выдаче.Сценарий 2: Результат на высокой позиции не оправдывает ожиданий
Boost Factor нейтрален или отрицателен. Страница теряет позиции, уступая место более релевантным результатам.Что такое Presentation Bias (Предвзятость представления) в контексте этого патента?
Presentation Bias – это совокупность факторов, которые влияют на вероятность клика на результат, но не связаны с его истинной релевантностью или качеством. Ключевым элементом является позиция результата (Position Bias): чем выше результат, тем чаще на него кликают. Также сюда входят визуальные аспекты: длина и привлекательность сниппета, количество выделенных жирным слов, наличие рекламы или спецэлементов (Onebox) рядом с результатом.
Как работает Prior Model и зачем она нужна?
Prior Model обучается на огромном массиве данных о кликах по разным запросам. Её задача – предсказать ожидаемый CTR (pCTR) для результата, основываясь на его Presentation Features (позиция, оформление) и контексте выдачи. Она нужна для того, чтобы установить базовый уровень ожидаемых кликов. Сравнивая реальный CTR (aCTR) с этим базовым уровнем (pCTR), система может понять, кликают ли на результат из-за его качества или просто потому, что он находится на первом месте.
Означает ли этот патент, что высокий CTR больше не важен для SEO?
Высокий CTR по-прежнему критически важен, но патент уточняет, что важен не абсолютный, а относительный CTR. Ваш CTR должен быть выше, чем ожидаемый CTR для вашей позиции и способа представления. Если результат на позиции 1 имеет 30% CTR, но ожидаемый CTR для этой позиции составляет 32%, это может быть негативным сигналом. Важно максимизировать CTR, демонстрируя при этом высокую удовлетворенность пользователя (длинные клики).
Как этот механизм влияет на результаты на низких позициях (например, ТОП 7-10)?
Этот механизм очень помогает качественным результатам на низких позициях. Ожидаемый CTR (pCTR) для позиции 8 очень низок. Если ваш результат на этой позиции сможет показать даже средний реальный CTR (aCTR), который будет значительно выше pCTR, он получит существенный буст. Это позволяет системе обнаруживать релевантные документы, которые изначально были недооценены базовыми алгоритмами ранжирования.
Как Google учитывает качество сниппета в этой модели?
Качество и привлекательность сниппета учитываются как Presentation Features при построении Prior Model. Признаки могут включать длину сниппета, количество выделенных слов, наличие привлекательных терминов. Если сниппет привлекателен, Prior Model предскажет более высокий ожидаемый CTR (pCTR). Это означает, что результату придется демонстрировать еще более высокий реальный CTR (aCTR), чтобы доказать свою релевантность.
Что произойдет, если я использую кликбейт для повышения CTR?
Использование кликбейта – проигрышная тактика. Во-первых, привлекательность заголовка может повысить ожидаемый CTR (pCTR). Во-вторых, кликбейт обычно ведет к низкой удовлетворенности и коротким кликам. Патент описывает взвешивание кликов по времени пребывания (Dwell Time). Короткие клики имеют низкий вес, что снижает итоговый взвешенный aCTR. В результате система увидит, что результат не оправдал ожиданий, и понизит его в выдаче.
Учитывает ли модель контекст соседних результатов?
Да, патент явно указывает, что Prior Model может учитывать признаки соседних результатов. Это включает как их качество (например, базовые IR scores), так и их представление (сниппеты, форматирование). Например, если ваш результат находится после очень сильного и привлекательного результата, ожидаемый CTR для вашего результата может быть ниже, так как пользователи склонны выбирать предыдущий.
Как система обрабатывает новые документы, по которым еще нет статистики кликов?
Патент предлагает вариант решения этой проблемы (описанный в FIG. 4E). Система может использовать отдельную модель (третью модель), обученную специально на редких или нечасто кликаемых результатах. Эта модель использует доступные признаки (например, позицию, IR score, язык) для предсказания базового уровня релевантности для новых документов, пока не будет накоплено достаточно данных.
Влияет ли наличие рекламы или спецблоков (Onebox) на ранжирование органических результатов через эту модель?
Да, влияет. Наличие рекламы (Ads) и специальных результатов (Onebox) указаны как признаки для Prior Model. Эти элементы могут отвлекать внимание пользователя и снижать CTR органических результатов. Prior Model учтет это и скорректирует ожидаемый CTR (pCTR) для органики в зависимости от контекста выдачи.
На каком этапе ранжирования применяется эта модель?
Применение модели происходит на финальных этапах ранжирования или переранжирования (Reranking). Система использует Prior Model для корректировки сигналов, полученных от Implicit User Feedback Model, перед тем как определить финальный порядок результатов. Это позволяет скорректировать выдачу на основе актуальных данных о поведении пользователей и текущем представлении SERP.

Поведенческие сигналы
SERP

Поведенческие сигналы

SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Персонализация

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
Антиспам
Краулинг

Local SEO
Семантика и интент
Поведенческие сигналы

Свежесть контента
Антиспам
Ссылки

Техническое SEO
SERP
Ссылки

Персонализация
Индексация
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Мультимедиа
