Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

REINFORCEMENT LEARNING TECHNIQUES TO IMPROVE SEARCHING AND/OR TO CONSERVE COMPUTATIONAL AND NETWORK RESOURCES (Методы обучения с подкреплением для улучшения поиска и/или экономии вычислительных и сетевых ресурсов)

US11157488B2
Google LLC
2017-12-13
2021-10-26

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

Какую проблему решает

Патент решает проблему неэффективности поисковых сессий, когда пользователю приходится вводить несколько запросов, просматривать множество результатов или тратить значительное время, прежде чем найти желаемый контент. Это приводит к неудовлетворенности пользователя и излишнему расходу вычислительных и сетевых ресурсов. Изобретение направлено на сокращение продолжительности и повышение успешности поисковых сессий.

Что запатентовано

Запатентована система, использующая Reinforcement Learning (RL) для адаптивного улучшения процесса поиска. Система наблюдает за взаимодействиями пользователя в рамках поисковой сессии и итеративно обновляет свою стратегию (Policy). Цель – научиться выполнять такие поисковые действия (Search Actions) – например, корректировку весов ранжирования или переписывание запроса – которые максимизируют вознаграждение (Reward), связанное с быстрым и успешным завершением сессии.

Как это работает

Система работает в рамках цикла обучения с подкреплением:

Определение Состояния (State): При получении запроса система определяет текущее состояние (State), учитывая сам запрос (часто через эмбеддинги) и контекст (время, устройство).
Генерация Действий (Action Parameters): Текущая стратегия (Policy), часто реализованная как нейронная сеть, обрабатывает состояние и генерирует параметры действий (Action Parameters).
Выполнение Поиска (Search Actions): Поисковая система выполняет действия согласно параметрам. Это может включать: изменение весов факторов ранжирования, добавление терминов в запрос или модификацию индекса.
Завершение Сессии (Cessation Event): Сессия продолжается до наступления события завершения (положительного, например, длительный клик, или отрицательного – выход без клика).
Расчет Вознаграждения (Reward): Рассчитывается вознаграждение. Быстрые успешные сессии с минимумом "метаний" (pogo-sticking/quick-backs) получают высокое вознаграждение.
Обновление Стратегии (Policy Update): Policy обновляется на основе полученного вознаграждения, чтобы в будущем лучше реагировать на аналогичные состояния.

Актуальность для SEO

Высокая. Применение машинного обучения, в частности Reinforcement Learning, для оптимизации сложных систем, таких как поиск, является передовым направлением в IT. Фокус на эффективности и удовлетворенности пользователя (Search Satisfaction, Time-to-Success) соответствует современным приоритетам Google. Описанные механизмы динамической адаптации ранжирования и понимания запросов крайне актуальны.

Важность для SEO

Патент имеет критическое значение (9/10) для понимания современных SEO-стратегий. Он описывает механизм, который позволяет Google динамически изменять правила игры (веса факторов, интерпретацию запроса) в реальном времени, основываясь на том, насколько быстро пользователи находят удовлетворяющий ответ. Это подчеркивает первостепенную важность удовлетворения интента пользователя и качества поведенческих сигналов (особенно минимизации pogo-sticking), которые напрямую используются для обучения этой системы.

Термины и определения

Action Parameters (Параметры действий): Выходные данные Policy. Определяют, как именно поисковая система должна обработать запрос. Могут включать веса для различных сигналов ранжирования, инструкции по переписыванию запроса или модификации индекса.
Cessation Event (Событие завершения сессии): Событие, указывающее на окончание поисковой сессии. Может быть положительным (пользователь нашел контент, например, длительный клик) или отрицательным (пользователь прекратил поиск, не найдя нужного).
Policy (Стратегия, Политика): Ядро модели Reinforcement Learning. Определяет, какие действия (Action Parameters) следует предпринять в ответ на данное состояние (State). Часто реализуется в виде нейронной сети, веса которой обучаются итеративно.
Reinforcement Learning (RL) (Обучение с подкреплением): Тип машинного обучения, при котором система учится действовать в среде для максимизации некоторого совокупного вознаграждения (Reward).
Reward (Вознаграждение): Сигнал обратной связи, используемый для обновления Policy. Рассчитывается на основе исхода поисковой сессии. Цель системы – максимизировать Reward, что соответствует быстрым и успешным сессиям.
Search Actions (Поисковые действия): Действия, выполняемые поисковой системой, которыми управляют Action Parameters. Включают идентификацию релевантных документов (Retrieval) и их ранжирование (Ranking).
Search Session (Поисковая сессия): Последовательность поисковых запросов и взаимодействий пользователя, начинающаяся с исходного запроса и заканчивающаяся событием завершения (Cessation Event).
State (Состояние): Представление текущей ситуации в поисковой сессии. Основывается на текущем запросе (например, через Word2vec эмбеддинги) и может включать контекст (время, устройство, местоположение).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной цикл работы системы Reinforcement Learning для оптимизации поиска.

Система получает серию запросов в рамках Search Session.
Для запроса определяется соответствующее State.
Текущая Policy используется для генерации Action Parameters.
Поисковая система выполняет Search Actions на основе этих параметров и предоставляет результаты.
Система обнаруживает Cessation Event. Конкретизируется, что это может быть основано на том, что контент результата отображался в течение порогового времени (длительный клик/Dwell Time).
Определяется Reward. Он основан на (i) факте наступления Cessation Event и (ii) количестве раз, когда пользователь выбирал другие результаты и просматривал их менее порогового времени (pogo-sticking/quick-backs).
На основе Reward генерируется модифицированная Policy.
Впоследствии, при получении нового запроса, система использует эту модифицированную Policy для генерации новых действий.

Claim 2 (Зависимый): Уточняет, что Action Parameters могут включать параметры ранжирования, диктующие, как результаты должны быть упорядочены.

Claim 3 (Зависимый): Уточняет, что Action Parameters могут включать параметры поиска (retrieval parameters), диктующие, как идентифицировать релевантные файлы.

Claims 4 и 5 (Зависимые): Уточняют механизм поиска. Параметры могут диктовать модификацию поискового запроса (переписывание). Поиск осуществляется по модифицированному запросу, что позволяет находить файлы, индексированные по добавленным терминам, даже если их не было в исходном запросе.

Claim 6 (Зависимый): Уточняет, что Reward также зависит от количества состояний (длительности) сессии.

Claim 8 (Независимый пункт): Описывает механизм адаптации индекса на основе анализа сессии (связанный с RL, но описанный отдельно).

Получен Запрос 1 (с Термином А). Показаны Результаты 1.
Получен Запрос 2 (с Термином Б, без Термина А). Показаны Результаты 2 (включая Файл Х).
Пользователь выбирает Файл Х.
Система модифицирует Policy Value, связанное с Термином А. Эта модификация включает обновление записи индекса для Файла Х путем добавления Термина А (который ранее не был ассоциирован с Файлом Х).
Результат: повышается вероятность того, что будущий запрос с Термином А вернет Файл Х.

Где и как применяется

Изобретение представляет собой мета-систему, которая управляет стандартными компонентами поиска, используя данные о поведении пользователей для их оптимизации.

QUNDERSTANDING – Понимание Запросов

Система RL определяет State на основе запроса и контекста.
Action Parameters могут диктовать переписывание запроса (Query Rewriting) (Claims 4, 5). Система учится, какие модификации запроса приводят к более быстрому успеху.

RANKING – Ранжирование

Основное применение. Action Parameters могут динамически определять, какие сигналы ранжирования использовать и какие веса им присвоить для данного State (Claim 2). Система учится оптимальной конфигурации ранжирования для разных типов запросов.

INDEXING – Индексирование (Адаптация)

Система может модифицировать индекс на основе анализа поисковых сессий (Claim 8). Если пользователь начал с Термина А, а нашел документ по Термину Б, система может добавить Термин А в индекс для этого документа.

RERANKING – Переранжирование

Процесс оценки успешности сессии (Cessation Event, Reward) и последующее обучение модели (Policy Update) происходит после формирования выдачи и получения реакции пользователя.

Входные данные:

Поисковый запрос.
Контекстные данные (время, устройство, локация).
Данные о взаимодействии пользователя (клики, время просмотра контента, возвраты на выдачу).

Выходные данные:

Action Parameters (веса ранжирования, инструкции по переписыванию запроса).
Обновленная модель Policy.
(Опционально) Модифицированные записи в индексе.

На что влияет

Специфические запросы: Наибольшее влияние на сложные, многоэтапные или неоднозначные запросы, где стандартного ранжирования недостаточно для быстрого удовлетворения интента.
Типы контента: Патент упоминает поиск различных файлов (документы, веб-страницы, изображения, видео). Механизм универсален.
Персонализация: В патенте упоминается, что Policy может быть персонализирована для пользователя или группы пользователей, что ведет к адаптации поиска под конкретные паттерны поведения.

Когда применяется

Условия работы: Алгоритм работает непрерывно. Для каждого поискового запроса система определяет State и применяет текущую Policy для генерации Action Parameters.
Обучение: Обновление Policy происходит после завершения поисковой сессии (при наступлении Cessation Event).

Пошаговый алгоритм

Процесс А: Обработка запроса в реальном времени (Inference)

Получение запроса: Система получает поисковый запрос от пользователя, начиная новую или продолжая текущую Search Session.
Определение состояния: State Engine определяет текущее State на основе запроса (например, используя эмбеддинги терминов) и контекста.
Генерация параметров действий: Policy Engine обрабатывает State, используя текущую обученную Policy (например, нейронную сеть), и генерирует Action Parameters.
Выполнение поисковых действий: Поисковая система выполняет Search Actions:
- (Опционально) Переписывание запроса: Если Action Parameters диктуют, запрос модифицируется.
- Поиск (Retrieval): Идентифицируются релевантные документы (возможно, по модифицированному запросу).
- Ранжирование (Ranking): Документы ранжируются с использованием сигналов и весов, определенных в Action Parameters.
Предоставление результатов: Результаты поиска отображаются пользователю.

Процесс Б: Мониторинг и Обучение (Learning)

Мониторинг взаимодействий: Система отслеживает действия пользователя (клики, время просмотра контента, pogo-sticking, новые запросы).
Обнаружение завершения сессии: Определяется, произошло ли Cessation Event.
- Если НЕТ: Возврат к Процессу А (шаг 1) при получении нового запроса.
- Если ДА (Положительное): Обнаружен длительный клик (контент просматривался дольше порога).
- Если ДА (Отрицательное): Сессия прекращена без положительного события.
Расчет вознаграждения: Определяется Reward. Вознаграждение тем выше, чем быстрее достигнуто положительное событие и чем меньше было отрицательных сигналов (pogo-sticking) в ходе сессии.
Обновление стратегии: Policy обновляется (например, через backpropagation в нейронной сети) на основе полученного Reward. Цель – скорректировать будущие Action Parameters для аналогичных States.

Процесс В: Адаптация индекса (Опционально, по Claim 8)

Анализ сессии: После успешного завершения сессии анализируется последовательность запросов (Запрос 1 -> Запрос N) и выбранный документ.
Сравнение терминов: Сравниваются термины из ранних запросов (например, Запрос 1) с терминами из финального запроса (Запрос N).
Модификация индекса: Если документ был найден по Запросу N, но релевантен Запросу 1, термины из Запроса 1 могут быть добавлены в индекс для этого документа или их вес увеличен.

Какие данные и как использует

Данные на входе

Контентные факторы: Содержимое запросов (термины). Используются для определения State, часто через преобразование в эмбеддинги (например, Word2vec).
Поведенческие факторы: Критически важны для расчета Reward.
- Клики на результаты поиска.
- Время просмотра контента (Dwell Time): Используется для определения Cessation Event (длительный клик).
- Pogo-sticking / Quick-backs: Явно упоминается в Claim 1 как фактор, влияющий на Reward (выбор результата и просмотр менее порогового времени).
- Последовательность запросов в рамках сессии.
Пользовательские и Географические факторы (Контекст): Могут использоваться для определения State: время дня, день недели, тип устройства, географический регион.

Какие метрики используются и как они считаются

State Representation (Представление состояния): Метрика, агрегирующая данные запроса и контекста, часто в виде вектора (эмбеддинга).
Reward Function (Функция вознаграждения): Ключевая метрика для обучения. Она стремится максимизировать успешность сессии и минимизировать ее продолжительность/усилия.
- Успешность: Определяется наступлением положительного Cessation Event.
- Продолжительность/Усилия: Измеряется количеством запросов в сессии, общим временем сессии, количеством pogo-sticking событий.
Action Parameters (Параметры действий): Числовые значения, определяющие конфигурацию поиска. Например, веса для конкретных Ranking Signals.
Пороговые значения:
- Порог времени просмотра контента для идентификации положительного Cessation Event (длительный клик).
- Порог времени для идентификации pogo-sticking (короткий клик).
Алгоритмы машинного обучения:
- Reinforcement Learning (упоминается Q-learning или другие model-free техники).
- Нейронные сети (используются для реализации Policy).

Фокус на эффективности и удовлетворении (Time-to-Success): Основная цель системы – не просто показать релевантные результаты, а сделать так, чтобы пользователь нашел искомое максимально быстро и с минимальными усилиями. Это является функцией вознаграждения (Reward Function) для RL-модели.
Динамическая адаптация ранжирования: Патент описывает механизм, позволяющий Google отходить от статичного набора весов факторов ранжирования. Policy учится определять оптимальные веса (Action Parameters) для каждого конкретного состояния (State), то есть для разных типов запросов и контекстов.
Поведенческие факторы как обучающие сигналы: Поведенческие данные (Dwell Time, Pogo-sticking) используются не просто как факторы ранжирования, а как прямые сигналы обратной связи (Reward) для обучения RL-модели, которая управляет ранжированием. Pogo-sticking явно используется для пенализации (снижения Reward).
Обучение пониманию интента через сессии: Система анализирует всю поисковую сессию. Если пользователь начал с запроса А, но нашел ответ только после ввода запроса Б, система учится связывать А и Б.
Многоуровневая оптимизация (Ranking, Retrieval, Indexing): Оптимизация достигается не только через ранжирование. Система может предпринимать действия по переписыванию запроса (Query Rewriting) для улучшения Retrieval (Claims 4, 5) и даже модифицировать индекс, добавляя термины к документам на основе анализа сессий (Claim 8).
Персонализация стратегии поиска: Policy может обучаться индивидуально для пользователей или групп, что позволяет адаптировать механизмы поиска под их специфические паттерны поведения и потребности.

Best practices (это мы делаем)

Обеспечение полного удовлетворения интента (Search Satisfaction): Контент должен полностью решать задачу пользователя, чтобы стимулировать длительный клик (положительный Cessation Event) и предотвращать возврат на выдачу (pogo-sticking). Это напрямую максимизирует Reward для вашей страницы в этой модели.
Анализ и оптимизация поисковых путей (Search Journeys): Изучайте, как пользователи приходят к вашему контенту. Если они часто начинают с более общих или неточных запросов, убедитесь, что ваш контент семантически связан с этими начальными интентами. Это увеличит вероятность того, что система RL свяжет эти запросы с вашим контентом (через Query Rewriting или Index Adaptation).
Построение Topical Authority и широкое семантическое покрытие: Создавайте кластеры контента, которые покрывают все этапы пути пользователя и связанные подтемы. Это помогает "поймать" пользователя на разных этапах сессии и увеличивает вероятность того, что система идентифицирует ваш сайт как решение для широкого спектра связанных States.
Оптимизация сниппетов для управления ожиданиями: Сниппеты должны точно отражать содержание страницы. Это снижает вероятность pogo-sticking, который является сильным негативным сигналом для расчета Reward (Claim 1).

Worst practices (это делать не надо)

Кликбейт и введение в заблуждение: Использование заголовков или сниппетов, которые привлекают клик, но не соответствуют контенту страницы. Это гарантированно приводит к pogo-sticking, что напрямую пенализируется функцией вознаграждения RL-модели.
Оптимизация под узкий запрос без учета интента: Создание контента, формально релевантного запросу, но не решающего задачу пользователя. Это приведет к продолжению поисковой сессии, и система научится не показывать ваш контент высоко, чтобы сократить общее время сессии.
Игнорирование контекста пользователя: Не учитывать, что пользователи с разных устройств или в разное время могут иметь разные ожидания от одного и того же запроса (разные States). Система RL учитывает этот контекст при оптимизации.

Стратегическое значение

Этот патент подтверждает стратегический приоритет Google на машинном обучении, управляемом поведенческими данными. Ранжирование становится все более динамичным и контекстуальным. Система не ищет "лучший документ" в вакууме, а ищет "стратегию показа результатов, которая быстрее всего приведет к успеху". Для SEO это означает, что фокус смещается от традиционных факторов к доказательству того, что ваш контент является конечной точкой поисковой сессии. Способность удовлетворить интент быстро и полно становится главным активом.

Практические примеры

Сценарий 1: Адаптация ранжирования (Ranking Adaptation)

Ситуация: Пользователь ищет "лучшие кроссовки для бега по асфальту". Контекст: мобильное устройство, вечер.
Действие системы (RL): Система определяет State. Текущая Policy, основываясь на предыдущем опыте для этого State, генерирует Action Parameters, которые повышают вес факторов, связанных со свежестью обзоров и удобством чтения на мобильных, и снижают вес агрессивной рекламы.
Результат: В топ попадают свежие, авторитетные обзоры. Пользователь кликает на результат и долго его изучает (Cessation Event).
Обучение: Система получает высокий Reward и укрепляет связь между этим State и примененной конфигурацией ранжирования.

Сценарий 2: Адаптация индекса (Index Adaptation - Claim 8)

Ситуация: Пользователь ищет рецепт, вводя Запрос 1: "острый куриный суп". Результаты не устраивают.
Продолжение сессии: Пользователь вводит Запрос 2: "Том Ям рецепт".
Результат: Пользователь находит нужный рецепт (Документ Х) и кликает на него (Cessation Event).
Действие системы: Система анализирует сессию. Она видит, что Запрос 1 был началом пути, а Документ Х (найденный по Запросу 2) стал решением.
Обучение (Index Adaptation): Система модифицирует индекс, добавляя термины "острый", "куриный", "суп" к Документу Х или увеличивая их вес. В следующий раз по запросу "острый куриный суп" рецепт Том Ям будет показан выше.

Что такое Reinforcement Learning (RL) в контексте этого патента и чем он отличается от обычного машинного обучения в поиске?

В отличие от стандартного обучения с учителем (Supervised Learning), где модель учится предсказывать заранее известные правильные ответы (например, оценки асессоров), RL учится методом проб и ошибок. Система (агент) активно взаимодействует со средой (поисковой выдачей и пользователями), пробует разные действия (например, меняет веса ранжирования) и получает вознаграждение (Reward) в зависимости от результата (насколько быстро пользователь нашел ответ). Цель RL – выработать оптимальную стратегию (Policy) для максимизации вознаграждения в долгосрочной перспективе.

Как система определяет, что поисковая сессия завершилась успешно (Cessation Event)?

Патент явно указывает на использование времени просмотра контента (Dwell Time). Если пользователь кликнул на результат и контент отображался дольше определенного порога (длительный клик), это считается положительным событием завершения (Positive Cessation Event). Также упоминаются другие индикаторы, такие как "зависание" курсора над результатом. Отрицательное завершение – это прекращение поиска без положительного события.

Насколько важен Pogo-sticking (возврат на выдачу) согласно этому патенту?

Он критически важен. В Claim 1 прямо указано, что функция вознаграждения (Reward) рассчитывается с учетом количества раз, когда пользователь выбирал результаты и просматривал их менее порогового времени (т.е. быстро возвращался). Чем больше таких событий в сессии, тем ниже будет вознаграждение. Это означает, что pogo-sticking является сильным негативным сигналом, который обучает модель пессимизировать результаты, приводящие к такому поведению.

Патент говорит о динамическом изменении весов факторов ранжирования. Значит ли это, что стандартные факторы (ссылки, контент) больше не важны?

Нет, стандартные факторы остаются важны, но система RL решает, какой вес придать каждому из них в конкретной ситуации (State). Для одного запроса вес ссылок может быть высоким, а для другого (например, требующего максимальной свежести) RL-модель может принять решение (Action Parameters) снизить вес ссылок и повысить вес свежести, если это приводит к более быстрым успешным сессиям.

Что такое "Адаптация индекса" (Index Adaptation), описанная в Claim 8?

Это механизм, позволяющий Google обновлять ассоциации между терминами и документами на основе анализа поисковых сессий. Если пользователь начал поиск с Запроса А, но нашел нужный документ только введя Запрос Б, система может добавить термины из Запроса А в индекс для этого документа. Это позволяет улучшить выдачу по Запросу А в будущем, даже если документ изначально не содержал этих терминов или они считались неважными.

Как SEO-специалисту использовать знание о механизме Адаптации индекса?

Необходимо уделять внимание не только прямым ключевым словам, но и семантически связанным терминам и запросам, которые пользователи могут использовать в начале своего поиска (Search Journey). Создание контента, который покрывает эти смежные интенты и четко связан с целевой темой, увеличивает вероятность того, что система свяжет эти ранние запросы с вашим контентом через механизм адаптации индекса.

Может ли эта система переписывать запросы пользователя (Query Rewriting)?

Да. Claims 4 и 5 описывают, что Action Parameters могут диктовать модификацию поискового запроса, например, добавление или замену терминов. Система RL учится тому, какие модификации запроса приводят к более высокому вознаграждению (быстрому успеху). Например, если пользователь ищет "Ягуар", система может научиться добавлять "автомобиль" или "животное" в зависимости от контекста (State), если это ускоряет поиск.

Что такое State (Состояние) и какая информация в него входит?

State – это полное представление текущей ситуации. Оно включает содержание самого запроса (часто в виде эмбеддингов, таких как Word2vec) и контекст. Контекст может включать время суток, день недели, тип устройства, географическое положение пользователя и, возможно, предыдущие запросы в этой же сессии. Понимание State важно, так как все решения системы зависят от него.

Влияет ли этот патент на персонализацию поиска?

Да, влияет. В патенте упоминается, что стратегия (Policy) может быть персонализирована для конкретного пользователя или группы пользователей. Это означает, что система RL может обучаться на индивидуальных паттернах поведения и адаптировать механизмы ранжирования и переписывания запросов под конкретные предпочтения пользователя, чтобы повысить эффективность его поиска.

Какова главная метрика успеха для SEO в свете этого патента?

Главной метрикой становится "Time-to-Success" или эффективность удовлетворения интента. Необходимо стремиться к тому, чтобы именно ваша страница становилась конечной точкой поисковой сессии (Positive Cessation Event) и чтобы это происходило как можно быстрее, с минимальным количеством возвратов на выдачу. Это максимизирует Reward для вашей страницы в глазах системы RL.

Как Google определяет неудовлетворенность пользователя поисковой сессией и предлагает корректирующие действия

Google анализирует поведение пользователя во время поисковой сессии (клики, время на сайте, последующие запросы), чтобы определить уровень удовлетворенности. Если система фиксирует признаки неудовлетворенности (например, много коротких кликов или серия уточняющих запросов), она автоматически запускает "корректирующие операции": предлагает альтернативные запросы, ключевые слова из просмотренных страниц или запрашивает обратную связь.

US8316037B1
2012-11-20

Поведенческие сигналы

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов

Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.

US7565345B2
2009-07-21

Поведенческие сигналы
SERP

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов

Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.

US7617205B2
2009-11-10

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету

Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.

US8930351B1
2015-01-06

Персонализация
Поведенческие сигналы
SERP

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей

Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.

US10110701B2
2018-10-23

Knowledge Graph
Поведенческие сигналы
Персонализация

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом

Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.

US7346839B2
2008-03-18

Свежесть контента
Антиспам
Ссылки

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска

Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.

US8874594B2
2014-10-28

Персонализация
Поведенческие сигналы
Local SEO

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам

Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.

US8788477B1
2014-07-22

Поведенческие сигналы
EEAT и качество
SERP

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок

Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.

US12353458B2
2025-07-08

Ссылки
Семантика и интент
SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте

Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.

US9037581B1
2015-05-19

Персонализация
Поведенческие сигналы
SERP

Как Google динамически фильтрует выдачу, уточняя интент пользователя после клика по результату

Google использует механизм для обработки неоднозначных запросов. Если выдача содержит результаты, относящиеся к разным сущностям (например, «Ягуар» как животное и как автомобиль), клик пользователя по одному из результатов сигнализирует о его интересе к конкретной сущности. При возврате на страницу выдачи система модифицирует SERP, скрывая или понижая результаты, связанные с нерелевантными сущностями, и фокусируя выдачу на выбранном интенте.

US9355158B2
2016-05-31

Семантика и интент
SERP
Поведенческие сигналы

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок

Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.

US8577893B1
2013-11-05

Антиспам
Ссылки
Семантика и интент

Как Google обрабатывает клики по ссылкам на мобильные приложения (App Deep Links) в результатах поиска

Google использует механизм клиентской обработки результатов поиска, ведущих в нативные приложения. Если у пользователя не установлено нужное приложение, система на устройстве автоматически подменяет ссылку приложения (App Deep Link) на эквивалентный веб-URL. Это гарантирует доступ к контенту через браузер и обеспечивает бесшовный пользовательский опыт.

US10210263B1
2019-02-19

Ссылки
SERP

Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика

Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.

US7716225B1
2010-05-11

Ссылки
Поведенческие сигналы
SERP