Google отслеживает результаты поиска в рамках одной поисковой сессии. Если пользователь вводит несколько связанных запросов подряд (например, уточняя свой интент), система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Чтобы повысить разнообразие выдачи, эти повторяющиеся результаты понижаются в ранжировании по последующим запросам.
Описание
Какую задачу решает
Патент решает проблему ухудшения пользовательского опыта во время многоэтапного поиска. Когда пользователь вводит серию связанных запросов (например, «черная куртка», затем «черное пальто»), стандартные алгоритмы часто показывают одни и те же результаты в топе. Если пользователь проигнорировал эти результаты при первом запросе, их повторное появление на высоких позициях при втором запросе снижает эффективность поиска и вызывает фрустрацию.
Что запатентовано
Запатентована система (включающая Demotion Engine) для идентификации и понижения повторяющихся результатов поиска (Repetitive Search Results) в рамках одной поисковой сессии (Search Session). Система сравнивает текущую выдачу с предыдущими выдачами в сессии и понижает повторяющиеся результаты. Ключевым элементом является использование Relevancy Threshold (порога релевантности), который гарантирует, что понижение не будет чрезмерным и релевантные результаты не опустятся ниже маржинального контента.
Как это работает
Система работает следующим образом:
- Отслеживание сессии: Система сохраняет историю запросов и показанных результатов в рамках текущей сессии.
- Идентификация повторов: При получении нового запроса (Q2) система сравнивает его результаты с результатами предыдущего запроса (Q1).
- Определение порога релевантности: Вычисляется Relevancy Threshold для выдачи Q2. Это точка, где релевантность значительно снижается (определяется разными методами).
- Идентификация кандидатов: Повторяющиеся результаты, ранжирующиеся выше порога, становятся кандидатами на понижение.
- Понижение (Demotion): Кандидаты перемещаются вниз в выдаче на позиции ниже установленного порога.
Актуальность для SEO
Высокая. Адаптация выдачи на основе контекста сессии и обеспечение разнообразия результатов во время сложных поисковых задач остаются критически важными для Google. Хотя конкретные методы расчета порогов, описанные в патенте (который является продолжением заявки от 2007 года), могли эволюционировать с развитием машинного обучения, базовый принцип динамического переранжирования на основе истории сессии высоко актуален.
Важность для SEO
Патент имеет существенное значение для понимания динамики ранжирования. Он описывает механизм переранжирования (RERANKING) в реальном времени, основанный на действиях пользователя в текущей сессии. Это означает, что видимость сайта может активно снижаться, если он не привлек внимание или не удовлетворил интент пользователя при первом показе в сессии. Это критически повышает важность высокого CTR и немедленного удовлетворения интента.
Детальный разбор
Термины и определения
- Demotion Engine (Механизм понижения)
- Компонент поисковой системы, отвечающий за идентификацию и понижение повторяющихся результатов поиска.
- Difference Measure (Мера разницы)
- Метрика для оценки разницы в Ranking Scores между двумя или более результатами поиска (например, процентное изменение).
- Difference Threshold (Порог разницы)
- Значение, при превышении которого Difference Measure считается значительным. Используется для определения Relevancy Threshold.
- Lowest Selected Search Result (Самый низкоранжированный выбранный результат)
- Результат с самой низкой позицией в предыдущей выдаче, на который кликнул пользователь.
- Optimized Query (Оптимизированный запрос)
- Запрос, автоматически сгенерированный поисковой системой на основе исходного запроса (например, синонимы, множественные числа). Используется в одном из методов определения порога.
- Ranking Score / Relevancy Score (Оценка ранжирования / Оценка релевантности)
- Числовое значение, определяющее позицию результата. Может быть основано на Information Retrieval (IR) scores и оценках качества (например, PageRank).
- Relevancy Threshold / Score Threshold (Порог релевантности)
- Определенный уровень релевантности в наборе результатов. Повторяющиеся результаты выше этого порога понижаются ниже этого порога.
- Repetitive Search Results (Повторяющиеся результаты поиска)
- Результаты, которые присутствуют в выдаче как по первому, так и по второму (последующему) запросу в рамках одной сессии.
- Search Session (Поисковая сессия)
- Последовательность запросов от одного пользователя, определяемая временными рамками или статусом входа в аккаунт.
- Threshold Repetitive Search Result (Пороговый повторяющийся результат)
- Используется в методе анализа кликов. Это самый высокоранжированный повторяющийся результат, который в первой выдаче находился НИЖЕ, чем Lowest Selected Search Result.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод понижения.
- Система идентифицирует первый набор результатов по первому запросу (Q1) в сессии.
- Система идентифицирует второй набор результатов по второму запросу (Q2), отличному от Q1, в той же сессии.
- Идентифицируются Repetitive Search Results (общие для обоих наборов).
- Определяется Score Threshold (порог релевантности) для второго набора.
- Идентифицируются кандидаты на понижение: повторяющиеся результаты, чья Ranking Score выше порога.
- Происходит понижение (demoting) как минимум одного кандидата путем снижения его ранга во втором наборе.
- Второй набор результатов (после переранжирования) предоставляется пользователю.
Патент описывает три основных метода определения Score Threshold:
Claim 2 (Зависимый, Метод 1: Резкое падение релевантности):
Система вычисляет Difference Measure (например, процентное изменение) между Ranking Scores последовательных результатов. Если эта мера превышает Difference Threshold (т.е. наблюдается резкое падение оценок), то Score Threshold устанавливается на основе наивысшей оценки в этой паре. Этот метод ищет «обрывы» (cliffs) в релевантности.
Claim 6 (Зависимый, Метод 2: Оптимизированные запросы):
Система идентифицирует самый высокоранжированный результат, который был найден в ответ на Optimized Query (например, синонимы Q2), а не на исходный Q2. Score Threshold устанавливается на основе Ranking Score этого результата. Логика в том, что такие результаты менее релевантны исходному интенту.
Claim 8 (Зависимый, Метод 3: Последний клик):
- Идентифицируется Lowest Selected Search Result (самый низкоранжированный кликнутый результат) в первом наборе (Q1).
- Идентифицируется Threshold Repetitive Search Result — самый высокоранжированный повторяющийся результат, который в Q1 был НИЖЕ последнего клика.
- Score Threshold во втором наборе (Q2) устанавливается на основе ранга этого порогового результата.
Где и как применяется
Изобретение применяется на финальных этапах обработки запроса для корректировки выдачи на основе контекста сессии.
RANKING – Ранжирование
Основная система генерирует предварительные списки результатов для Q1 и Q2, сортируя их по Ranking Scores.
RERANKING – Переранжирование (Twiddlers)
Основное место применения патента. Demotion Engine работает как твидлер (Twiddler), использующий сессионные данные.
- Анализ сессии: Система получает доступ к данным о предыдущих запросах, показанных результатах и действиях пользователя (кликах) из хранилища Session Search Results.
- Сравнение результатов: Выявляются повторы между текущей и предыдущей выдачей.
- Расчет порога и Переранжирование: Вычисляется Relevancy Threshold (используя Метод 1, 2 или 3), и повторяющиеся результаты выше порога понижаются.
Входные данные:
- Первый запрос и набор ранжированных результатов.
- Второй запрос и набор ранжированных результатов.
- Ranking Scores для всех результатов.
- Данные поисковой сессии (включая данные о кликах).
Выходные данные:
- Переранжированный второй набор результатов с пониженными повторяющимися элементами.
На что влияет
- Специфические запросы: Наибольшее влияние на информационные и коммерческие запросы, где пользователи склонны уточнять или изменять запрос в поисках лучшего ответа (исследование продукта, планирование, решение проблем).
- Типы контента: Влияет на сайты с широкой семантической релевантностью (крупные магазины, агрегаторы, контент-порталы), которые часто ранжируются по множеству связанных запросов.
Когда применяется
Алгоритм применяется при выполнении следующих условий:
- Триггер активации: Пользователь отправляет более одного запроса в рамках одной активной Search Session.
- Условие применения: Второй запрос отличается от первого, и в результатах поиска присутствуют Repetitive Search Results.
- Ограничения: Понижение применяется только к тем повторяющимся результатам, которые находятся выше рассчитанного Relevancy Threshold.
Пошаговый алгоритм
Основной процесс обработки запроса в рамках сессии
- Идентификация первого набора (R1): В ответ на первый запрос (Q1) генерируется и сохраняется набор R1. (Опционально: фиксируются клики пользователя).
- Идентификация второго набора (R2): В ответ на второй запрос (Q2) генерируется набор R2.
- Идентификация повторов: Система определяет Repetitive Search Results между R1 и R2.
- Определение порога релевантности (Relevancy Threshold): Система вычисляет порог для R2, используя один из методов:
- Метод 1 (Резкое падение): Анализ разницы (Difference Measure) в Ranking Scores. Порог устанавливается там, где эта разница превышает Difference Threshold.
- Метод 2 (Оптимизированный запрос): Порог устанавливается на уровне Ranking Score первого результата, найденного только по Optimized Query.
- Метод 3 (Последний клик): Определение Lowest Selected Search Result в R1 и установка порога на основе Threshold Repetitive Search Result.
- Идентификация кандидатов на понижение: Выбираются повторяющиеся результаты, которые в R2 ранжируются выше порога. (В Методе 3 кандидатами могут быть только те, что в R1 были выше последнего клика).
- Понижение (Demotion): Ранг кандидатов понижается так, чтобы они оказались ниже Relevancy Threshold в R2.
- Предоставление результатов: Переранжированный набор R2 показывается пользователю.
Какие данные и как использует
Данные на входе
- Поведенческие факторы:
- Клики (Clicks): Используются в Методе 3 для определения Lowest Selected Search Result. Отсутствие клика на результат интерпретируется как сигнал незаинтересованности в рамках сессии.
- Последовательность запросов: Используется для определения контекста сессии.
- Временные факторы:
- Время между запросами: Используется для определения границ Search Session.
- Системные данные (Internal):
- Ranking Scores: Внутренние оценки релевантности. Критичны для Метода 1 (анализ разницы в оценках).
- Данные об оптимизированных запросах: Информация о том, был ли результат найден по исходному или Optimized Query (используется в Методе 2).
Какие метрики используются и как они считаются
- Percentage Differential (Процентная разница): Метрика для Difference Measure. Рассчитывается как процентное изменение Ranking Score между двумя последовательными результатами.
- Change in Percentage Differential (Изменение процентной разницы): Разница между двумя последовательными значениями Percentage Differential. Используется для поиска точки максимального падения релевантности (Метод 1).
- Relevancy Threshold / Score Threshold: Вычисляемый порог, используемый для определения кандидатов на понижение и их новой позиции.
Выводы
- Поиск как диалог (Session-Based Re-ranking): Google рассматривает поиск как сессию, а не серию изолированных запросов. Контекст предыдущих действий напрямую влияет на ранжирование текущего запроса.
- Презумпция неудовлетворенности: Если пользователь вводит похожий запрос после просмотра предыдущей выдачи, система предполагает, что показанные ранее результаты (особенно проигнорированные) его не удовлетворили.
- Активное повышение разнообразия в сессии: Цель алгоритма — убрать уже виденные результаты из топа, чтобы предложить пользователю новые варианты и улучшить опыт взаимодействия.
- Защита от чрезмерного понижения (Relevancy Threshold): Понижение не является абсолютным пенальти. Relevancy Threshold гарантирует, что повторяющиеся, но релевантные результаты не будут понижены ниже маржинального контента. Порог динамически рассчитывается для каждой выдачи.
- Использование поведенческих сигналов в реальном времени: Патент описывает конкретные механизмы (включая Метод 3), где клики пользователя или их отсутствие напрямую используются для корректировки следующей выдачи в рамках той же сессии.
Практика
Best practices (это мы делаем)
- Удовлетворение интента с первого раза (First Impression Matters): Критически важно, чтобы сайт удовлетворил интент пользователя при первом показе в сессии. Если пользователь увидит ваш сайт, но вернется в поиск и введет похожий запрос, ваш сайт с высокой вероятностью будет понижен по этому второму запросу.
- Оптимизация CTR и привлекательности сниппетов: Высокий CTR сигнализирует о релевантности. Низкий CTR (пропуск результата) является сигналом для Demotion Engine о том, что результат не интересен пользователю в данный момент, что приведет к понижению при следующем запросе в сессии. Оптимизируйте Title и Description.
- Проектирование страниц под сложные задачи (Task Completion): Убедитесь, что ваши страницы помогают пользователю выполнить его задачу. Цель — удержать пользователя и предоставить исчерпывающий ответ, а не заставить его вернуться в Google для уточнения запроса.
- Анализ поисковых сессий (User Journey): Анализируйте последовательности запросов (а не только изолированные ключи), которые пользователи используют в вашей нише. Понимание того, как пользователи уточняют интент, поможет создать контент, который лучше соответствует их конечной цели.
Worst practices (это делать не надо)
- Кликбейт и обман ожиданий: Привлечение клика обманным путем приводит к быстрому возврату в выдачу (pogo-sticking) и продолжению сессии. Это сигнализирует о неудовлетворенности и может активировать механизм понижения при следующем связанном запросе.
- Создание поверхностного контента для широких запросов: Страницы, которые релевантны многим запросам, но не отвечают глубоко ни на один. Такие страницы будут часто пропускаться пользователями, что приведет к их систематическому понижению в рамках поисковых сессий.
- Оценка эффективности только по статическим позициям: Использование стандартных сервисов для отслеживания позиций не покажет реальную картину того, что видит пользователь во время активной сессии. Ранжирование может быть ниже из-за контекста сессии.
Стратегическое значение
Этот патент подтверждает стратегическую важность концепции «Выполнения поисковой задачи» (Search Task Completion). Google стремится не просто показать релевантные результаты, а помочь пользователю решить его проблему. Для SEO это означает переход от оптимизации под ключевые слова к оптимизации под сессии и интенты. Стратегия должна быть направлена на максимальное удовлетворение пользователя при первом взаимодействии.
Практические примеры
Сценарий 1: Поиск товара с уточнением (Применение Метода 1)
- Первый запрос (Q1): «лучшие кроссовки для бега». Магазин «SportShop» на 2-й позиции. Пользователь его игнорирует.
- Второй запрос (Q2): «лучшие кроссовки для трейлраннинга». «SportShop» снова релевантен и занимает 3-ю позицию.
- Активация механизма: Система идентифицирует «SportShop» как повторяющийся результат.
- Определение порога (Метод 1): Система анализирует Ranking Scores в выдаче Q2 и видит резкое падение оценок после 6-й позиции. Relevancy Threshold устанавливается на 6-й позиции.
- Понижение: «SportShop» понижается с 3-й позиции на 7-ю (ниже порога), уступая место новым результатам.
Сценарий 2: Использование анализа кликов (Применение Метода 3)
- Запрос 1 (Q1): «Симптомы гриппа». Результаты: Сайт А (Топ-1), Сайт Б (Топ-2), Сайт В (Топ-3). Пользователь кликает на Сайт Б (Топ-2).
- Запрос 2 (Q2): «Лечение гриппа». Результаты (до понижения): Сайт А (Топ-1), Сайт В (Топ-2), Сайт Г (Топ-3).
- Анализ системы:
- Lowest selected search result в Q1: Сайт Б (Позиция 2).
- Система предполагает, что пользователь видел Сайт А (выше клика) и проигнорировал его.
- Threshold repetitive search result: Сайт В (был ниже клика в Q1).
- Relevancy Threshold в Q2 устанавливается на позиции Сайта В (Позиция 2).
- Понижение: Сайт А (кандидат на понижение, так как он выше порога) понижается ниже порога.
- Финальная выдача Q2: Сайт В, Сайт Г, Сайт А.
Вопросы и ответы
Влияет ли это понижение на ранжирование моего сайта постоянно?
Нет. Этот механизм работает исключительно в рамках текущей поисковой сессии конкретного пользователя (session-based personalization). Он не влияет на глобальные факторы ранжирования вашего сайта. Как только пользователь начнет новую сессию, это понижение сбрасывается.
Как Google определяет границы поисковой сессии (Search Session)?
Патент упоминает несколько способов. Наиболее распространенный – это время между запросами. Если интервал превышает определенное время (например, 5-10 минут), сессия может считаться завершенной. Также сессия может быть привязана к учетной записи пользователя (пока он залогинен).
Что такое «Relevancy Threshold» и почему он важен?
Relevancy Threshold (порог релевантности) – это механизм защиты от чрезмерного понижения. Он определяет точку в выдаче, ниже которой релевантность значительно падает. Повторяющиеся результаты понижаются только до этого порога, гарантируя, что они не окажутся ниже малорелевантного контента.
Как именно рассчитывается «Relevancy Threshold»?
Патент предлагает три метода. Метод 1: Поиск «обрыва» в оценках ранжирования (резкое падение Ranking Score). Метод 2: Использование результатов, отвечающих только оптимизированному запросу (синонимам, вариациям). Метод 3: Анализ кликов пользователя на предыдущую выдачу (Lowest Selected Search Result).
Если мой сайт занимает первую позицию по обоим запросам, он тоже будет понижен?
Да, если он идентифицирован как повторяющийся результат и находится выше рассчитанного Relevancy Threshold. Система предполагает, что если пользователь ввел второй запрос, значит, результат на первой позиции его не удовлетворил или он его проигнорировал. Цель системы – предложить альтернативы.
Понижаются ли абсолютно все повторяющиеся результаты?
Нет. Понижаются только те повторяющиеся результаты, которые ранжируются выше Relevancy Threshold. Кроме того, в некоторых реализациях (например, Метод 3) могут понижаться только те результаты, которые пользователь предположительно уже просмотрел (например, те, что находились выше последнего клика).
Как я могу предотвратить понижение моего сайта этим механизмом?
Ключ к предотвращению – это удовлетворение интента пользователя с первого взаимодействия. Необходимо иметь привлекательные сниппеты для стимуляции клика (высокий CTR) и качественный контент, который полностью отвечает на запрос и не заставляет пользователя возвращаться в Google для уточнения.
Применяется ли этот механизм, если пользователь вводит один и тот же запрос дважды?
Нет. В патенте (Claim 1) четко указано, что второй запрос должен отличаться от первого (wherein the second query is different from the first query). При идентичном запросе механизм понижения не активируется.
В каких тематиках работа этого алгоритма наиболее заметна?
Наиболее заметно это в тематиках, где пользователи склонны к длительным сессиям с уточнением запросов. Это часто происходит в e-commerce (сравнение товаров: электроника, одежда) и при глубоком информационном поиске (планирование путешествия, исследование сложных тем).
Как этот патент связан с концепцией разнообразия выдачи (SERP Diversity)?
Этот патент напрямую связан с повышением разнообразия в контексте поисковой сессии. В то время как стандартные алгоритмы разнообразия работают в рамках одной выдачи, этот механизм обеспечивает разнообразие между последовательными выдачами, предотвращая доминирование одних и тех же ресурсов на протяжении всей сессии.