Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования

MODIFYING SEARCH RESULT RANKING BASED ON IMPLICIT USER FEEDBACK (Модификация ранжирования результатов поиска на основе неявной обратной связи пользователя)

US8661029B1
Google LLC
2006-11-02
2014-02-25

Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.

Какую проблему решает

Патент решает проблему ограниченности использования сырого показателя кликов (CTR) для оценки релевантности. CTR сильно подвержен предвзятости представления (presentation bias) — пользователи склонны кликать на результаты, которые находятся выше или имеют более привлекательные сниппеты, независимо от их истинной релевантности. Изобретение предлагает механизм оценки качества документа на основе анализа поведения пользователя после клика (Dwell Time или время пребывания), а не только факта клика.

Что запатентовано

Запатентована система модификации ранжирования, использующая меру релевантности, основанную на продолжительности пользовательских визитов (Dwell Time). Ядром изобретения является расчет метрики, которая соотносит количество "длинных просмотров" (longer views) или взвешенных по времени просмотров с общим количеством просмотров документа по конкретному запросу. Эта метрика позволяет оценить удовлетворенность пользователя независимо от позиции документа в выдаче.

Как это работает

Система отслеживает клики пользователей и время, проведенное на документе до возвращения на страницу результатов поиска (SERP). Эти взаимодействия взвешиваются на основе продолжительности: длинные визиты получают больший вес. Затем вычисляется метрика (в патенте приводится пример LCIC click fraction — доля длинных кликов), которая представляет собой отношение суммы взвешенных кликов к общему числу кликов. Эта метрика трансформируется в повышающий коэффициент (IRBoost), который применяется к базовой оценке ранжирования документа (IR score).

Актуальность для SEO

Критически высокая. Анализ поведенческих сигналов, удовлетворенности пользователей и времени пребывания на странице (Dwell Time) является центральным элементом современных поисковых систем. Этот патент описывает фундаментальные механизмы оценки качества контента через неявную обратную связь, что напрямую связано с концепциями Helpful Content.

Важность для SEO

Патент имеет критическое значение (10/10) для SEO. Он демонстрирует переход от стратегий, направленных на получение клика (оптимизация CTR сниппетов), к стратегиям, направленным на удержание пользователя и полное удовлетворение его интента после клика. Если контент не удерживает внимание пользователя (низкий Dwell Time, много коротких кликов), его позиции будут понижены, даже при высоком CTR или сильном ссылочном профиле.

Термины и определения

Dwell Time (Время пребывания): Время, которое пользователь проводит на странице результата поиска перед тем, как вернуться к SERP. В патенте обозначается как Time (T) или viewing length.
Implicit User Feedback (Неявная обратная связь пользователя): Данные о взаимодействии пользователя с результатами поиска (клики, время пребывания), используемые для оценки релевантности.
IR Score (Оценка информационного поиска): Базовая оценка релевантности документа, рассчитанная поисковой системой до применения поведенческих корректировок.
IRBoost (Коэффициент повышения ранжирования): Множитель, применяемый к IR Score. Рассчитывается на основе Measure of Relevance (например, LCIC).
LCIC Click Fraction (Доля длинных кликов): Пример реализации Measure of Relevance. Отношение взвешенных по времени кликов (или просто длинных кликов) к общему числу кликов для пары Запрос-Документ. LCIC = Long Clicks / Clicks.
Measure of Relevance (Мера релевантности): Метрика, рассчитываемая на основе неявной обратной связи. Основана на соотношении первого числа (длинные/взвешенные просмотры) ко второму числу (общее число просмотров).
Presentation Bias (Предвзятость представления): Влияние способа представления результата (позиция, заголовок, сниппет) на вероятность клика, не связанное с истинной релевантностью документа.
Rank Modifier Engine (Механизм модификации ранжирования): Компонент системы, который генерирует сигналы (например, LCIC) для корректировки базового ранжирования.
Smoothing Factor (S0) (Сглаживающий фактор): Константа, добавляемая в знаменатель при расчете метрик для стабилизации результатов при малом количестве данных (кликов).
Viewing Length Differentiator (Дифференциатор продолжительности просмотра): Фактор, используемый для корректировки весов времени просмотра. Примеры: категория запроса (навигационный/информационный) или тип пользователя (эксперт/новичок).
Weighted Clicks (#WC) (Взвешенные клики): Просмотры документа, которым присвоен вес на основе их продолжительности. Длинные просмотры получают больший вес.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод получения меры релевантности документа.

Система получает меру релевантности (measure of relevance) для документа, найденного по запросу.
Эта мера основана на соотношении первого числа (first number) и второго числа (second number).
Первое число соответствует подмножеству от общего числа просмотров документа (подразумеваются качественные, т.е. длинные или взвешенные просмотры).
Второе число соответствует общему числу просмотров документа.
Эта мера релевантности передается в систему ранжирования.

Ядро патента — это расчет нормализованной метрики удовлетворенности пользователя, которая сравнивает количество качественных взаимодействий с общим количеством взаимодействий. Это позволяет оценить качество документа независимо от объема трафика, который он получает.

Claim 3 (Зависимый от 1): Уточняет природу первого числа.

Первое число является взвешенной комбинацией просмотров.
Вес присваивается на основе продолжительности просмотра (viewing duration).

Система не просто считает клики, а присваивает им разную ценность в зависимости от времени, проведенного пользователем на странице.

Claim 4 (Зависимый от 1): Альтернативное уточнение.

Первое число — общее количество "длинных кликов" (long clicks).
Второе число — общее количество кликов.

Это конкретная реализация метода, где просмотры бинарно классифицируются как "длинные" или нет.

Claims 5, 6, 7 (Зависимые): Детализируют механизм взвешивания.

Взвешивание может использовать непрерывную функцию от времени (Claim 5) — чем дольше просмотр, тем плавно выше вес.
Или дискретную (разрывную) функцию (Claim 6).
Дискретная функция подразумевает классификацию времени просмотра по категориям (например, короткий, средний, длинный) и присвоение веса категории (Claim 7).

Claims 8, 9, 10 (Зависимые): Вводят контекстную корректировку весов.

Вес может быть скорректирован с использованием Viewing Length Differentiator (Claim 8).
Дифференциатор может быть основан на категории запроса (Claim 9). Например, для навигационных запросов порог "длинного клика" ниже, чем для информационных.
Дифференциатор может быть основан на типе пользователя (Claim 10). Например, поведение опытных пользователей интерпретируется иначе, чем новичков.

Где и как применяется

Изобретение применяется на разных этапах поисковой архитектуры, преимущественно в офлайн-обработке данных и на этапе ранжирования/переранжирования.

INDEXING – Индексирование (Офлайн-процессы)
Система анализирует логи поведения пользователей (Result Selection Logs) в офлайн-режиме. На этом этапе рассчитываются метрики LCIC для пар Запрос-Документ, которые затем сохраняются для использования в реальном времени.

RANKING – Ранжирование / RERANKING – Переранжирование
Это основной этап применения патента. Ranking Engine генерирует базовые IR scores. Затем Rank Modifier Engine вмешивается в процесс:

Получение данных: Извлекаются предварительно рассчитанные значения LCIC для документов в выдаче по данному запросу.
Трансформация: Значение LCIC преобразуется в повышающий коэффициент IRBoost с помощью одной из функций трансформации.
Корректировка: Базовый IR Score документа модифицируется с помощью IRBoost.
Финальная сортировка: Документы пересортировываются на основе скорректированных оценок.

Входные данные:

Логи выбора результатов (Result Selection Logs), включающие Запрос (Q), Документ (D), Время пребывания (T), Язык (L), Страну (C).
Базовые оценки ранжирования (IR Scores) от Ranking Engine.

Выходные данные:

Мера релевантности (LCIC Click Fraction).
Повышающий коэффициент (IRBoost).
Скорректированный набор результатов поиска с измененным ранжированием.

На что влияет

Типы контента и запросов: Наибольшее влияние оказывается на информационные запросы, где удовлетворенность пользователя часто коррелирует со временем, потраченным на изучение контента. Влияние на навигационные запросы может быть иным, так как система учитывает категорию запроса (Viewing Length Differentiator) и может ожидать короткого времени пребывания. Патент упоминает разделение на informational-quick (быстрый ответ) и informational-slow (требуется время на изучение).
Форматы контента: Лонгриды, подробные руководства, сложные статьи получают преимущество, если они успешно удерживают внимание. Контент, провоцирующий быстрое закрытие (pogo-sticking), пессимизируется.
Ниши: Сильное влияние в тематиках, требующих глубокого погружения (YMYL, финансы, здоровье, технические руководства), где быстрый ответ часто невозможен или нежелателен.

Когда применяется

Условия применения: Алгоритм применяется, когда для пары Запрос-Документ накоплено достаточное количество данных о кликах и времени пребывания.
Пороговые значения: Smoothing Factor (S0) определяет порог активации. Если общее число кликов значительно меньше S0, метрика стремится к нулю (или к среднему значению), и влияние на ранжирование минимально.
Меры предосторожности (Safeguards): Патент упоминает необходимость защиты от спама и накруток. Данные используются только после проверки на естественность поведения пользователя (анализ распределения позиций кликов, продолжительности кликов, частоты запросов).

Пошаговый алгоритм

Процесс А: Сбор и обработка данных (Офлайн)

Сбор данных (Tracking): Отслеживание взаимодействий пользователей с SERP. Запись в логи: Запрос (Q), Документ (D), Время пребывания (T), Язык (L), Страна (C).
Фильтрация данных: Удаление спам-активности и аномального поведения. Обеспечение принципа "один голос на пользователя" для пары Q-D.
Определение контекста (Differentiators): Классификация запроса (например, навигационный/информационный) и пользователя (например, эксперт/новичок).
Взвешивание кликов (Weighting): Применение весовой функции к времени пребывания (T) для получения взвешенного клика (WC). Функция может быть непрерывной или дискретной и корректируется на основе контекста (Шаг 3). Например, короткий клик может получить вес -0.1, а длинный 1.0.
Агрегация: Суммирование взвешенных кликов (#WC) и подсчет общего числа кликов (#C) для каждой пары Q-D, а также для сегментов (Q-D-L, Q-D-L-C).
Расчет LCIC (Calculation): Вычисление базовой меры релевантности. Формула:

Удовлетворенность пользователя (Dwell Time) как ключевой сигнал ранжирования: Патент формализует использование времени пребывания на странице как основного индикатора качества и релевантности. Система вознаграждает контент, который удерживает внимание пользователя.
Борьба с предвзятостью представления (Presentation Bias): Метрика LCIC специально разработана для оценки качества документа независимо от его позиции или привлекательности сниппета. В отличие от стандартного CTR, LCIC фокусируется на поведении после клика.
Контекстная интерпретация поведения: Система признает, что значение времени пребывания зависит от контекста. Viewing Length Differentiators позволяют адаптировать интерпретацию "длинного клика" в зависимости от типа запроса (навигационный vs информационный) и типа пользователя.
Сложное взвешивание взаимодействий: Система не просто делит клики на "хорошие" и "плохие". Она может использовать непрерывное взвешивание или несколько категорий (короткий, средний, длинный, последний клик), присваивая им разные веса (включая потенциально отрицательные для очень коротких кликов).
Агрессивный бустинг на основе поведения: Метрика LCIC преобразуется в IRBoost, который может значительно изменить финальное ранжирование. Функции трансформации настроены так, чтобы сильно повышать результаты с высоким LCIC.

Best practices (это мы делаем)

Фокус на полном удовлетворении интента: Контент должен не просто содержать ключевые слова, но и полностью отвечать на запрос пользователя, чтобы стимулировать длительное пребывание на странице (высокий Dwell Time) и минимизировать возврат в выдачу (pogo-sticking).
Улучшение вовлеченности и читабельности: Используйте четкую структуру, форматирование (заголовки, списки), мультимедиа и внутренние ссылки для удержания внимания пользователя. Это напрямую влияет на вес клика (Weighted Clicks).
Оптимизация UX и скорости загрузки: Медленная загрузка, плохая мобильная адаптация или навязчивая реклама провоцируют короткие клики. Улучшение этих аспектов снижает вероятность быстрого возврата к SERP, что положительно влияет на LCIC.
Анализ контента по типу запроса: Понимайте ожидания пользователя. Для запросов типа "quick answer" дайте быстрый ответ. Для сложных информационных запросов предоставьте глубину. Система адаптирует ожидания от Dwell Time в зависимости от типа запроса (Viewing Length Differentiator).
Повышение качества сниппетов (для честного CTR): Сниппеты должны точно отражать содержание страницы. Это гарантирует, что пользователи, перешедшие на сайт, найдут то, что искали, и останутся на нем дольше.

Worst practices (это делать не надо)

Использование кликбейта: Создание заголовков и сниппетов, которые привлекают клики, но не соответствуют содержанию страницы. Это приведет к высокому CTR, но низкому Dwell Time (короткие клики), что даст низкий показатель LCIC и понижение в ранжировании.
Создание тонкого контента (Thin Content): Страницы, которые не содержат достаточного количества полезной информации, не смогут удержать пользователя, что приведет к коротким кликам.
Игнорирование технических проблем и плохого UX: Любые элементы, раздражающие пользователя и заставляющие его быстро покинуть страницу (всплывающие окна на весь экран, автовоспроизведение видео со звуком), негативно влияют на метрики, описанные в патенте.
Накрутка поведенческих факторов: Попытки искусственно увеличить время пребывания или количество кликов. Патент упоминает механизмы защиты от спама, фильтрующие аномальное поведение (неестественное распределение кликов, времени просмотра и т.д.).

Стратегическое значение

Этот патент является фундаментальным для понимания роли поведенческих факторов в ранжировании Google. Он подтверждает стратегический переход от оценки релевантности на основе контента и ссылок к оценке удовлетворенности пользователя (User Satisfaction). Для долгосрочной SEO-стратегии критически важно интегрировать UX, CRO и глубокий анализ контента, фокусируясь не на привлечении трафика любой ценой, а на привлечении и удержании целевой аудитории.

Практические примеры

Сценарий: Борьба с кликбейтом в новостной тематике

Запрос: "Последние новости о выборах"
Результат А (Кликбейт): Заголовок: "ШОК! Кандидат Х скрывал ЭТО от избирателей!". Пользователь кликает, видит малоинформативную статью с большим количеством рекламы и возвращается в SERP через 5 секунд. Это классифицируется как короткий клик (низкий вес).
Результат Б (Качественный ресурс): Заголовок: "Анализ предвыборных программ кандидатов X и Y". Пользователь кликает и читает статью 3 минуты. Это классифицируется как длинный клик (высокий вес).
Расчет LCIC: Если большинство пользователей быстро покидают Результат А, его LCIC будет низким (много кликов, но мало взвешенных кликов). Если пользователи остаются на Результате Б, его LCIC будет высоким.
Применение IRBoost: Результат Б получит значительный IRBoost, а Результат А — нет (или получит минимальный).
Итог: Результат Б поднимется в выдаче выше Результата А, даже если у А изначально был выше CTR или больше ссылок.

Что такое LCIC и почему это важнее, чем стандартный CTR?

LCIC (Long Clicks / Clicks) — это метрика, которая измеряет отношение количества "длинных" (или взвешенных по времени) кликов к общему числу кликов на документ. В отличие от CTR, который показывает привлекательность сниппета и зависит от позиции, LCIC показывает, насколько контент удовлетворил пользователя после клика. Это позволяет Google бороться с кликбейтом и повышать в выдаче действительно полезные страницы.

Как система определяет, является ли клик "длинным" или "коротким"?

Патент предлагает два основных подхода: дискретный и непрерывный. При дискретном подходе устанавливаются временные пороги (например, меньше 30 сек — короткий, больше 2 минут — длинный) и присваиваются фиксированные веса. При непрерывном подходе вес клика плавно увеличивается с каждой секундой пребывания на странице. Конкретные пороги и функции могут настраиваться на основе исторических данных.

Может ли короткое время пребывания на странице всегда считаться плохим сигналом?

Нет, не всегда. Патент вводит понятие Viewing Length Differentiator. Система учитывает тип запроса. Если это навигационный запрос (например, "Facebook логин") или запрос, предполагающий быстрый ответ (например, "столица Франции"), короткое время пребывания ожидаемо и не будет пессимизировано. Однако для сложных информационных запросов короткий клик часто интерпретируется как неудача.

Как Google защищается от накрутки времени пребывания на сайте?

Патент упоминает необходимость защиты от спамеров. Для этого используется анализ поведения пользователя. Система проверяет естественность поведения: распределение позиций кликов, длительность кликов, количество кликов в минуту/час/день. Данные от пользователей или IP-адресов с аномальным поведением игнорируются. Также может применяться принцип "один голос на пользователя" для конкретной пары запрос-документ.

Влияет ли тип пользователя на оценку его кликов?

Да, это также часть Viewing Length Differentiator. Система может классифицировать пользователей (например, на опытных и новичков) по скорости их кликов или по истории запросов. Клики от более разборчивых пользователей (например, тех, кто часто кликает на результаты ниже ТОП-1) могут получать больший вес, чем клики от пользователей, которые всегда выбирают первый результат.

Что такое "Предвзятость представления" (Presentation Bias) и как этот патент с ней борется?

Presentation Bias — это склонность пользователей кликать на результат из-за его высокой позиции или привлекательного сниппета, а не из-за его реальной релевантности. Патент борется с этим, фокусируясь на том, что происходит после клика. Если пользователь быстро вернулся (короткий клик), система понимает, что привлекательность была обманчива, и снижает оценку качества этого результата.

Что означает "Сглаживающий фактор" (Smoothing Factor S0) в формуле LCIC?

Smoothing Factor добавляется в знаменатель формулы $[\#WC] / [\#C + S0]$ . Он нужен для защиты от шума при малом количестве данных. Если по документу было всего 2 клика и оба длинные, без S0 метрика была бы максимальной (100%), что нестабильно. S0 гарантирует, что метрика будет значимой только при накоплении достаточного количества кликов.

Как именно LCIC влияет на ранжирование? Это замена PageRank?

LCIC не заменяет базовые алгоритмы ранжирования, а дополняет их. Сначала рассчитывается базовая оценка релевантности (IR Score). Затем LCIC преобразуется в коэффициент IRBoost с помощью функции трансформации (например, сигмоидной). Финальная оценка получается путем применения IRBoost к IR Score. Это значит, что поведенческие факторы могут значительно скорректировать исходное ранжирование.

Что делать SEO-специалисту, чтобы улучшить показатель LCIC?

Необходимо сместить фокус с привлечения клика на удержание пользователя. Улучшайте читабельность текста, давайте ответ на интент пользователя в начале страницы, оптимизируйте скорость загрузки и UX (особенно на мобильных устройствах), убирайте навязчивую рекламу и создавайте контент, который стимулирует пользователя провести на странице больше времени, изучая материал.

Учитывает ли система данные по языкам и странам отдельно?

Да. Патент описывает расчет отдельных метрик для базового уровня (LCC_BASE), уровня языка (LCC_LANG) и уровня страны (LCC_COUNTRY). Система старается использовать наиболее специфичные данные (страна/язык), но если их недостаточно, она "откатывается" к более общим данным, используя сглаживающие факторы для их комбинирования.

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта

Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.

US9195944B1
2015-11-24

Поведенческие сигналы
Индексация
SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте

Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.

US9037581B1
2015-05-19

Персонализация
Поведенческие сигналы
SERP

Как Google использует поведенческие данные (Dwell Time) для оценки качества страниц и генерации превью в поиске

Google патентует систему "вспомогательного браузинга", которая активируется на странице результатов поиска (SERP) при проявлении интереса к ссылке. Система показывает текстовый сниппет и оценку интереса предыдущих пользователей, рассчитанную на основе имплицитных поведенческих сигналов, таких как время пребывания на странице (Linger Time/Dwell Time), повторные визиты и клики.

US7516118B1
2009-04-07

Поведенческие сигналы
SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов

Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.

US8868565B1
2014-10-21

Поведенческие сигналы
SERP

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия

Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.

US9020927B1
2015-04-28

Поведенческие сигналы
SERP
EEAT и качество

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска

Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.

US8447760B1
2013-05-21

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)

Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.

US8572096B1
2013-10-29

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News

Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.

US8375073B1
2013-02-12

EEAT и качество
SERP
Ссылки

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

US8060405B1
2011-11-15

Антиспам
Ссылки
SERP

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.

US8903812B1
2014-12-02

Поведенческие сигналы
SERP
Антиспам

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)

Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.

US8478519B2
2013-07-02

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)

Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.

US8825646B1
2014-09-02

Ссылки

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)

Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.

US20250005303A1
2025-01-02

SERP
EEAT и качество
Персонализация

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов

Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.

US8762363B1
2014-06-24

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует контекст пользователя и интерактивное уточнение для обучения моделей поиска

Google может инициировать поиск пассивно, основываясь на контексте действий пользователя (например, чтении статьи или телефонном звонке). Система позволяет пользователю уточнить этот поиск, выбрав один из использованных критериев (например, тапнув на сущность в тексте), чтобы повысить его значимость. Реакция пользователя на уточненные результаты используется для машинного обучения и улучшения взвешивания критериев в будущих поисковых запросах.

US11568003B2
2023-01-31

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования

Описание