Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии

DEMOTION OF REPETITIVE SEARCH RESULTS (Понижение повторяющихся результатов поиска)

US8051076B1
Google LLC
2007-12-13
2011-11-01

Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.

Какую проблему решает

Патент решает проблему ухудшения пользовательского опыта во время поисковой сессии, когда пользователь вводит несколько последовательных, часто связанных запросов. В таких случаях стандартные алгоритмы ранжирования могут возвращать одни и те же результаты поиска (repetitive search results) на высоких позициях для разных запросов. Если пользователь не был заинтересован в этих результатах при первом запросе, их повторное появление на видном месте в ответ на последующие запросы является нежелательным.

Что запатентовано

Запатентована система и метод для понижения (demotion) повторяющихся результатов поиска в рамках одной поисковой сессии. Система идентифицирует результаты, которые уже были показаны в ответ на предыдущий запрос в той же сессии. Для текущего набора результатов определяется порог релевантности (relevancy threshold). Повторяющиеся результаты, ранжированные выше этого порога, становятся кандидатами на понижение и перемещаются ниже порога.

Как это работает

Ключевым механизмом является Demotion Engine, который работает следующим образом:

Отслеживание сессии: Система отслеживает запросы и показанные результаты в рамках одной search session.
Идентификация повторов: При получении нового запроса система сравнивает его результаты с результатами предыдущих запросов в сессии, выявляя repetitive search results.
Определение порога релевантности: Система вычисляет relevancy threshold для текущей выдачи. Это может быть сделано путем анализа значительного падения relevancy scores между соседними результатами, анализа результатов по оптимизированному запросу или анализа кликов пользователя по предыдущей выдаче.
Понижение: Повторяющиеся результаты, имеющие relevancy score выше порога, понижаются в ранжировании так, чтобы оказаться ниже этого порога. Это гарантирует, что они не будут скрыты полностью, но уступят место новым результатам.

Актуальность для SEO

Средняя. Патент подан в 2007 году. Проблема повторяющихся результатов при уточнении запросов остается актуальной для любой поисковой системы. Хотя конкретные методы расчета порогов (например, анализ разницы в relevancy scores) могут быть устаревшими по сравнению с современными нейросетевыми подходами, сама концепция корректировки выдачи на основе истории сессии (персонализация в реальном времени) активно используется Google.

Важность для SEO

Влияние на SEO — умеренное (6/10). Патент описывает механизм, который влияет на видимость сайта не глобально, а в контексте конкретной поисковой сессии пользователя. Он подчеркивает важность не только ранжирования по запросу, но и удовлетворения интента пользователя с первой попытки. Если страница не смогла заинтересовать пользователя (он ее проигнорировал или быстро вернулся) и он уточнил запрос, этот механизм может активно понизить эту страницу при повторном показе в той же сессии.

Термины и определения

Demotion Engine (Механизм понижения): Компонент поисковой системы, ответственный за идентификацию и понижение повторяющихся результатов поиска в рамках сессии.
Optimized Query (Оптимизированный запрос): Запрос, автоматически сгенерированный поисковой системой на основе пользовательского запроса. Может включать вариации (например, множественное число, альтернативное написание), которые часто ищут пользователи.
Relevancy Difference Measure (Мера разницы в релевантности): Метрика, основанная на разнице relevancy scores двух или более результатов поиска. Используется для определения существенного падения релевантности в выдаче.
Relevancy Difference Threshold (Порог разницы в релевантности): Значение, которое определяет существенную разницу в relevancy scores. Если Relevancy Difference Measure превышает этот порог, это используется для установки Relevancy Threshold.
Relevancy Score (Оценка релевантности): Числовое значение, определяющее позицию результата в поиске. Может быть комбинацией IR-score (релевантность контента запросу) и других сигналов (например, PageRank).
Relevancy Threshold (Порог релевантности): Уровень в ранжировании или оценка релевантности в текущем наборе результатов. Повторяющиеся результаты, находящиеся выше этого порога, являются кандидатами на понижение и перемещаются ниже него.
Repetitive Search Results (Повторяющиеся результаты поиска): Результаты поиска, которые присутствуют как в текущем наборе результатов, так и в наборе результатов для предыдущего запроса в той же сессии.
Search Session (Поисковая сессия): Последовательность запросов от одного пользователя. Может определяться периодом времени между запросами (например, таймаут 5-10 минут), статусом входа пользователя в систему или связью между запросами.
Threshold Repetitive Search Result (Пороговый повторяющийся результат): В контексте метода, основанного на кликах: это самый высокоранжированный повторяющийся результат из первого набора, который ранжируется ниже, чем последний (самый низкоранжированный) результат, на который кликнул пользователь.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод понижения результатов поиска.

Система идентифицирует первый набор результатов для первого запроса в рамках search session.
Система идентифицирует второй набор результатов для второго (отличного от первого) запроса в той же сессии.
Идентифицируются repetitive search results — результаты, присутствующие в обоих наборах.
Определяется relevancy threshold для второго набора результатов.
Идентифицируются кандидаты на понижение: это repetitive search results, чья relevancy score выше, чем relevancy threshold.
Система понижает (demoting) ранг одного или нескольких кандидатов во втором наборе.
Система предоставляет второй набор результатов (с учетом понижения) в ответ на второй запрос.

Claim 2 (Зависимый от 1): Детализирует один из методов определения relevancy threshold (Метод 1: Разница в оценках).

Система определяет, превышает ли relevancy difference measure (мера разницы между оценками двух или более результатов) заданный relevancy difference threshold.
Идентифицируется наивысшая relevancy score среди тех результатов, для которых мера разницы превысила порог.
Relevancy threshold устанавливается на основе этой наивысшей оценки.

Claim 4 (Зависимый от 2): Уточняет, что relevancy difference threshold может быть максимальным изменением процентной разницы (maximum change in percentage differential) между оценками релевантности.

Claim 6 (Зависимый от 1): Детализирует второй метод определения relevancy threshold (Метод 2: Оптимизированный запрос).

Идентифицируется relevancy score самого высокоранжированного результата, который отвечает optimized second query (запросу с автоматически добавленными/измененными ключевыми словами).
Relevancy threshold устанавливается на основе этой оценки.

Claim 8 (Зависимый от 1): Детализирует третий метод определения relevancy threshold (Метод 3: Последний клик).

Идентифицируется ранг самого низкоранжированного результата, который был выбран (lowest selected search result) из первого набора.
Идентифицируется threshold repetitive search result — это самый высокоранжированный повторяющийся результат, который в первом наборе ранжировался ниже, чем последний выбранный результат.
Relevancy threshold устанавливается на основе ранга этого threshold repetitive search result во втором наборе.

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса для корректировки порядка результатов с учетом контекста текущей сессии.

QUNDERSTANDING – Понимание Запросов
На этом этапе система должна отслеживать search session (определять границы сессии на основе времени, логина или связи запросов). Также здесь могут генерироваться optimized queries, которые используются в одном из методов определения порога.

RANKING – Ранжирование
На этом этапе генерируются исходные наборы результатов для первого и второго запросов с их базовыми relevancy scores.

RERANKING – Переранжирование (Twiddlers)
Это основной этап применения патента. Demotion Engine действует как Твидлер (Twiddler):

Анализ истории: Система анализирует результаты предыдущего запроса в сессии.
Идентификация повторов: Сравнивает текущий набор результатов с предыдущим.
Расчет порога: Вычисляет relevancy threshold одним из описанных методов (анализ оценок, оптимизированные запросы или анализ кликов).
Применение понижения: Корректирует ранжирование, понижая повторяющиеся результаты ниже порога.

Входные данные:

Первый запрос и первый набор ранжированных результатов (с relevancy scores).
Данные о взаимодействии пользователя с первым набором (клики), если используется Метод 3.
Второй запрос и второй набор ранжированных результатов (с relevancy scores).
Данные об optimized queries для второго запроса, если используется Метод 2.

Выходные данные:

Переранжированный второй набор результатов поиска, где повторяющиеся результаты понижены.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на последовательности связанных запросов, когда пользователь уточняет или расширяет свой поиск (например, от "черный пиджак" к "черное пальто"). Это затрагивает информационные и коммерческие запросы, требующие исследования.
Конкретные типы контента: Влияет на любой контент, который может быть релевантен сразу нескольким связанным запросам (например, агрегаторы, крупные интернет-магазины, энциклопедические статьи).

Когда применяется

Алгоритм применяется только в рамках активной search session при выполнении следующих условий:

Триггеры активации: Пользователь ввел как минимум второй запрос в текущей сессии, и этот запрос отличается от предыдущего.
Условие применения: В наборе результатов для второго запроса присутствуют repetitive search results, которые ранжируются выше, чем рассчитанный relevancy threshold.

Пошаговый алгоритм

Основной процесс обработки запроса в сессии

Начало сессии и первый запрос: Система идентифицирует первый набор результатов, ранжированных по relevancy score, в ответ на первый запрос. Результаты сохраняются в рамках сессии.
Второй запрос: Система идентифицирует второй набор результатов в ответ на второй запрос в той же сессии.
Идентификация повторов: Система определяет repetitive search results — те, что присутствуют в обоих наборах.
Определение порога релевантности: Система вычисляет relevancy threshold для второго набора результатов. Используется один из трех методов (описаны ниже).
Идентификация кандидатов: Определяются повторяющиеся результаты, чья relevancy score во втором наборе выше порога.
Понижение: Ранг кандидатов понижается так, чтобы они оказались ниже relevancy threshold во втором наборе.
Выдача результатов: Переранжированный второй набор предоставляется пользователю.

Методы определения Relevancy Threshold

Метод 1: Анализ разницы в оценках (Relevancy Difference)

Для каждой пары последовательных результатов во втором наборе вычисляется relevancy difference measure (например, процентное падение оценки).
Система ищет значительное падение релевантности — место, где эта мера превышает relevancy difference threshold (например, максимальное изменение процентной разницы).
Relevancy threshold устанавливается на уровне relevancy score результата, непосредственно предшествующего значительному падению.

Метод 2: Оптимизированный запрос (Optimized Query)

Система генерирует optimized query (например, добавляя синонимы или исправляя орфографию).
Идентифицируются результаты во втором наборе, которые были найдены благодаря optimized query, а не исходному тексту запроса пользователя.
Relevancy threshold устанавливается на уровне relevancy score самого высокоранжированного результата, найденного только через оптимизированный запрос.

Метод 3: Последний клик (Last-Clicked)

Система анализирует взаимодействие пользователя с первым набором результатов и идентифицирует самый низкоранжированный результат, на который кликнул пользователь (lowest selected search result).
Идентифицируется threshold repetitive search result: самый высокоранжированный повторяющийся результат, который в первом наборе находился ниже последнего кликнутого.
Relevancy threshold во втором наборе устанавливается на основе relevancy score этого порогового повторяющегося результата.
В этой реализации кандидатами на понижение становятся только те повторяющиеся результаты, которые находились выше последнего клика в первом наборе (предполагается, что пользователь их уже оценил и отверг).

Какие данные и как использует

Данные на входе

Системные данные: Relevancy scores для всех результатов в первом и втором наборах. Эти оценки являются основой для ранжирования и расчета порогов.
Поведенческие факторы (User Behavior): В одном из вариантов реализации (Метод 3) система использует данные о кликах пользователя по первому набору результатов (идентификация lowest selected search result).
Контекстные факторы (Session Data): Данные о поисковой сессии (история запросов и показанных результатов в рамках сессии).

Какие метрики используются и как они считаются

Percentage Differential (Процентная разница): Разница в relevancy scores между двумя последовательными результатами, выраженная в процентах. Формула для результатов R1 и R2 (где R1>R2): $(R1-R2)/R1$ .
Change in Percentage Differential (Изменение процентной разницы): Разница между Percentage Differential двух последовательных пар результатов. Используется для поиска резких скачков в падении релевантности.
Relevancy Difference Threshold: Может быть предопределенным значением (например, 10%) или динамически определяться как максимальное изменение процентной разницы (maximum change in percentage differential) в Топ-N результатах.
Relevancy Threshold: Итоговый порог, используемый для понижения. Определяется одним из трех методов, описанных в алгоритме.

Контекстная корректировка выдачи: Патент описывает механизм персонализации выдачи в реальном времени на основе истории текущей поисковой сессии. Система стремится показать новые результаты, если предыдущие не удовлетворили пользователя.
Понижение, а не удаление: Важно, что повторяющиеся результаты не удаляются из выдачи, а понижаются ниже relevancy threshold. Это сделано для того, чтобы не скрывать релевантный контент ниже маргинально релевантных страниц.
Множественные методы определения порога: Google предусмотрел несколько способов определения точки, ниже которой следует перемещать повторы:
1. Резкое падение релевантности в SERP (Relevancy Difference).
2. Появление результатов по автоматически расширенному запросу (Optimized Query).
3. Явные сигналы пользователя о просмотренных результатах (Last-Clicked).
Использование поведенческих сигналов для ранжирования: Метод "Last-Clicked" явно использует данные о кликах (или их отсутствии) как сигнал для переранжирования. Отсутствие клика на высокоранжированный результат в первом SERP интерпретируется как сигнал того, что пользователь видел и отверг этот результат, что приводит к его понижению в следующем SERP.
Баланс между новизной и релевантностью: Система пытается найти баланс, предоставляя новые результаты (за счет понижения старых), но только до тех пор, пока эти новые результаты сохраняют достаточный уровень релевантности (определяемый порогом).

Best practices (это мы делаем)

Максимизация CTR сниппета (Особенно важно для Метод 3): Так как отсутствие клика на результат может привести к его понижению при последующих связанных запросах в сессии, критически важно иметь привлекательные и релевантные Title и Description. Сниппет должен точно отражать содержание страницы, чтобы пользователь захотел кликнуть.
Удовлетворение интента немедленно: Необходимо убедиться, что страница полностью отвечает на запрос пользователя. Если пользователь кликнул на результат, но не нашел нужной информации и вернулся к поиску (короткий клик), это также может быть интерпретировано как неудовлетворенность. При следующем запросе эта страница может быть понижена.
Анализ путей пользователя (Search Journeys): SEO-специалистам следует анализировать, как пользователи уточняют запросы в их нише. Понимание типичных последовательностей запросов (например, от общего к конкретному) поможет создать контент, который либо удовлетворяет интент сразу, либо остается высокорелевантным на всех этапах пути.
Широкий семантический охват (Важно для Метод 2): Если ваш контент релевантен только узкой формулировке запроса, но не релевантен его вариациям (optimized query), он может оказаться ниже relevancy threshold. Создание контента, охватывающего тему широко, повышает его базовую релевантность по различным формулировкам.

Worst practices (это делать не надо)

Кликбейт и обман ожиданий: Использование заголовков для привлечения кликов, если контент не соответствует обещаниям. Это приведет к возврату пользователя в выдачу и последующему понижению страницы при уточнении запроса в рамках той же сессии.
Оптимизация под единственный узкий запрос: Создание страниц, которые высоко ранжируются только по одной конкретной формулировке, но имеют низкую общую релевантность теме. Такие страницы рискуют быть вытесненными при малейшем изменении запроса пользователем.

Стратегическое значение

Этот патент подтверждает важность анализа поведения пользователей в рамках сессии (Search Journey). Для Google важно не просто показать релевантный результат, но и помочь пользователю решить его задачу. Если результат не помогает продвинуться в решении задачи (что выражается в отсутствии клика или быстром возврате), его ценность снижается для последующих запросов в этой сессии. Стратегически это означает, что SEO должно фокусироваться на качестве взаимодействия пользователя с контентом и удовлетворении интента, а не только на достижении позиций по отдельным запросам.

Практические примеры

Сценарий: Поиск отеля с уточнением (Применение Метод 3 - Last-Clicked)

Запрос 1: "Отели в Париже центр".
SERP 1 и Действие: Пользователь видит результаты. Он кликает на Результат 1 (Hotel A) и Результат 3 (Hotel B). Он не кликает на Результат 2 (Hotel C) и Результат 4 (Hotel D). Hotel B (Результат 3) — это lowest selected search result.
Запрос 2: Пользователь уточняет запрос: "Отели в Париже центр с завтраком".
SERP 2 (Анализ): Система идентифицирует, что Hotel A, Hotel C и Hotel D также релевантны Запросу 2.
Применение понижения: Система предполагает, что пользователь уже видел и оценил результаты выше последнего клика (Hotel A и Hotel C). Поскольку они повторяются в SERP 2, они становятся кандидатами на понижение. Hotel A уже был кликнут (возможно, не подошел), Hotel C был проигнорирован.
Результат: В SERP 2 Hotel A и Hotel C будут понижены ниже relevancy threshold, чтобы дать приоритет новым отелям, соответствующим уточненному запросу, даже если базовый relevancy score Hotel A и C был выше. Hotel D не понижается, так как он был ниже последнего клика в SERP 1.

Влияет ли этот патент на глобальное ранжирование моего сайта?

Нет, этот патент описывает корректировку ранжирования только в рамках текущей поисковой сессии конкретного пользователя. Он не влияет на то, как ваш сайт ранжируется для нового пользователя или в новой сессии. Это форма персонализации в реальном времени, направленная на улучшение опыта при уточнении запросов.

Что такое "Порог релевантности" (Relevancy Threshold) и зачем он нужен?

Relevancy Threshold — это динамически определяемая точка в выдаче. Все повторяющиеся результаты, которые находятся выше этой точки, понижаются ниже нее. Это нужно для того, чтобы показать пользователю новые результаты вместо уже виденных, но при этом не опустить повторяющиеся результаты слишком низко — ниже страниц, которые едва релевантны запросу.

Как именно Google определяет этот порог?

Патент описывает три разных метода. Первый ищет резкое падение relevancy scores между соседними результатами в выдаче. Второй смотрит на результаты, которые попали в выдачу только благодаря автоматическому расширению запроса (optimized query). Третий анализирует, на какие результаты пользователь кликал в предыдущей выдаче в этой же сессии.

Если пользователь не кликнул на мой сайт, он будет понижен при следующем запросе?

Это возможно, если используется Метод 3 (Last-Clicked). Если ваш сайт был на высокой позиции, а пользователь кликнул на результат ниже вашего, система может интерпретировать это так, что ваш сайт был просмотрен и проигнорирован. При следующем связанном запросе в этой же сессии ваш сайт может быть понижен, чтобы показать другие варианты.

Если пользователь кликнул на мой сайт, но быстро вернулся (короткий клик), это повлияет на ранжирование?

Патент прямо не измеряет время клика, но фокусируется на самом факте выбора (selected search result). Однако, если пользователь вернулся и продолжил кликать на другие результаты в той же выдаче, это изменит lowest selected search result. В любом случае, неудовлетворенность пользователя, ведущая к уточнению запроса, создает условия для активации этого механизма понижения.

Как защитить свой сайт от такого понижения?

Ключевая стратегия — максимизировать вероятность того, что пользователь выберет ваш результат и будет им удовлетворен. Это достигается за счет создания максимально релевантных и привлекательных сниппетов (Title/Description) и обеспечения высокого качества контента на странице, который немедленно отвечает на интент пользователя.

Как система определяет, что началась новая поисковая сессия?

Патент предлагает несколько способов определения границ search session. Это может быть таймаут (например, если пользователь не вводил запросы 5-10 минут), явный вход или выход пользователя из аккаунта, или анализ семантической связи между новым и предыдущими запросами.

Применяется ли этот механизм, если пользователь ввел точно такой же запрос повторно?

Нет. В Claim 1 четко указано, что второй запрос должен отличаться от первого (wherein the second query is different from the first query). Механизм предназначен для ситуаций уточнения или изменения поиска, а не для повторения идентичных запросов.

Может ли этот механизм объяснить, почему мой трафик колеблется, хотя позиции стабильны?

Косвенно, да. Если значительная часть вашего трафика приходится на пользователей, которые проводят длительные поисковые сессии с уточнением запросов, активация этого механизма может снижать вашу видимость на последующих этапах их пути. Это снизит общий объем показов и трафика, даже если по первому запросу вы ранжируетесь высоко.

Актуален ли этот патент, учитывая его возраст (2007 год)?

Концепция актуальна, но реализация, вероятно, изменилась. Проблема "фильтрации пузырей" и необходимость разнообразия выдачи при уточнении запросов никуда не исчезла. Хотя современные системы Google, вероятно, используют более продвинутые методы (например, нейронные сети для оценки удовлетворенности), базовая идея понижения уже виденного контента для улучшения пользовательского опыта остается важной частью логики поиска.

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента

Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.

US9449095B1
2016-09-20

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы

Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.

US8392435B1
2013-03-05

Персонализация
Поведенческие сигналы
SERP

Как Google динамически понижает подсказки в Autocomplete, которые пользователь уже видел, но проигнорировал

Google использует механизм для улучшения релевантности поисковых подсказок (Autocomplete). Если пользователь видит подсказку, но продолжает вводить запрос, система считает, что эта подсказка не подходит. Патент описывает, как такие проигнорированные подсказки понижаются в последующих списках на основе времени просмотра (Exposure Time), освобождая место для новых, потенциально более релевантных вариантов.

US8972388B1
2015-03-03

Поведенческие сигналы

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи

Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.

US9256685B2
2016-02-09

Персонализация
Поведенческие сигналы
SERP

Как Google переранжирует результаты поиска в реальном времени, скрывая контент, который пользователь уже видел на других сайтах

Google использует механизм оценки новизны информации для динамической корректировки поисковой выдачи во время сессии пользователя. Система вычисляет «Information Gain Score» для непросмотренных документов, определяя, сколько новой информации они содержат по сравнению с уже посещенными сайтами. Результаты с уникальной информацией повышаются, а повторяющийся контент понижается, чтобы уменьшить избыточность.

US11354342B2
2022-06-07

SERP
Семантика и интент
Персонализация

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию

Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.

US8321463B2
2012-11-27

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий

Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.

US9881077B1
2018-01-30

Семантика и интент
Поведенческие сигналы

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика

Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.

US9031929B1
2015-05-12

Поведенческие сигналы
EEAT и качество

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках

Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.

US8417692B2
2013-04-09

Семантика и интент
Поведенческие сигналы

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью

Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.

US9348945B2
2016-05-24

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования

Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.

US8862572B2
2014-10-14

Поведенческие сигналы
Ссылки

Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика

Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.

US7716225B1
2010-05-11

Ссылки
Поведенческие сигналы
SERP

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа

Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.

US7305380B1
2007-12-04

Ссылки
SERP
Поведенческие сигналы

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)

Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.

US8615514B1
2013-12-24

Поведенческие сигналы

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе

Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.

US20150161127A1
2015-06-11

Семантика и интент
EEAT и качество
SERP