Как Google использует машинное обучение для предсказания повторяющихся запросов и предоставления динамических результатов

IDENTIFICATION AND ISSUANCE OF REPEATABLE QUERIES (Идентификация и выполнение повторяемых запросов)

US11868417B2
Google LLC
2019-11-06
2024-01-09

Google использует систему машинного обучения для анализа контекста и поведения пользователей, чтобы предсказать, какие запросы будут повторяться в будущем. Для этих «повторяемых запросов» система упрощает ввод через ярлыки или меню. При повторном выполнении Google может намеренно изменять выдачу, предоставляя динамические результаты, и приоритизировать сканирование связанного контента.

Какую проблему решает

Патент решает проблему неэффективности, связанную с тем, что пользователи регулярно вводят одни и те же поисковые запросы (например, навигационные запросы, запросы о погоде или регулярных событиях). Это требует от пользователя ручного ввода, а от поисковой системы — затрат вычислительных ресурсов на обработку запроса. Изобретение направлено на улучшение пользовательского опыта (ускорение доступа) и повышение эффективности работы поисковой системы (оптимизация ресурсов).

Что запатентовано

Запатентована система идентификации и упрощенного выполнения «повторяемых запросов» (Repeatable Queries) — запросов, которые уже вводились ранее и, как ожидается, будут введены снова. Система использует модель машинного обучения (Learning Model), которая анализирует обширный набор контекстуальных данных (Contextual Data) по прошлым запросам, чтобы предсказать вероятность повторного ввода запроса в будущем. Если вероятность высока, запрос классифицируется как повторяемый и предлагается пользователю через специальные элементы интерфейса (например, ярлыки или меню).

Как это работает

Система работает следующим образом:

Сбор данных: Анализируются логи запросов (Query Logs) и кликов (Click Logs) для сбора истории запросов и связанных с ними Contextual Data (время, местоположение, язык, поведение на SERP).
Прогнозирование: Контекстуальные данные вводятся в обученную Learning Model, которая оценивает вероятность повторения запроса в будущем.
Классификация: Если вероятность превышает пороговое значение (Repeatability Threshold), запрос помечается как повторяемый и сохраняется в кэше (Repeatable Query Cache).
Предоставление интерфейса: Пользователю предоставляются элементы интерфейса (ярлыки, выпадающие списки), позволяющие выполнить повторяемый запрос без ручного ввода текста.
Обработка запроса: При выборе такого элемента запрос выполняется. Система может предоставить либо кэшированные результаты для экономии ресурсов, либо намеренно обновленные/динамические результаты для повышения вовлеченности.

Актуальность для SEO

Высокая. Патент опубликован в 2024 году и описывает современные подходы к использованию машинного обучения для понимания поведения пользователей и адаптации интерфейса. Тенденции к персонализации поиска, проактивному предоставлению информации (как в Google Discover) и упрощению взаимодействия с поисковыми системами делают это изобретение крайне актуальным.

Важность для SEO

Патент имеет среднее стратегическое значение для SEO (65/100). Он не описывает алгоритмы ранжирования, но дает важное понимание того, как Google интерпретирует стабильные пользовательские интенты и адаптирует выдачу для них. Ключевые аспекты для SEO — это возможность Google приоритизировать сканирование контента для повторяемых запросов и намеренно предоставлять динамические (обновленные или измененные) результаты при их повторном выполнении. Это подчеркивает важность свежести контента для определенных типов интентов.

Термины и определения

Click Logs (Логи кликов): Данные, фиксирующие взаимодействия пользователя с результатами поиска, включая клики по ссылкам, время просмотра и использование навигационных элементов на SERP.
Context Analyzer (Анализатор контекста): Компонент системы, отвечающий за извлечение и определение Contextual Data для каждого экземпляра запроса из логов.
Contextual Data (Контекстуальные данные): Информация, описывающая контекст, в котором был задан запрос, и последующие действия пользователя. Включает язык, местоположение, частоту, семантические векторы (Embedding), навигационный интент и поведенческие сигналы на SERP.
Embedding (Векторное представление / Эмбеддинг): Представление запроса, которое отражает его семантические отношения с другими запросами. Используется как признак для Learning Model.
Learning Model (Модель обучения): Модель машинного обучения (например, контролируемая/supervised), обученная предсказывать вероятность того, что запрос будет задан в будущем, на основе Contextual Data.
Query Logs (Логи запросов): Записи о поисковых запросах, отправленных пользователями поисковой системе.
Repeatable Query (Повторяемый запрос): Запрос, который был задан ранее и, согласно прогнозу Learning Model, с высокой вероятностью будет задан снова в будущем.
Repeatable Query Cache (Кэш повторяемых запросов): Хранилище для запросов, идентифицированных как повторяемые. Может также хранить соответствующие им результаты поиска.
Repeatability Threshold (Порог повторяемости): Минимальное значение вероятности, при превышении которого запрос классифицируется как Repeatable Query.
User Selectable Interface Component (Выбираемый пользователем компонент интерфейса): Элемент UI (например, ярлык, иконка, пункт выпадающего меню), который позволяет выполнить Repeatable Query без ручного ввода текста.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс идентификации и выполнения повторяемого запроса.

Система получает набор прошлых поисковых запросов.
Для каждого экземпляра запроса определяются Contextual Data (контекст ввода и взаимодействие с SERP).
Для первого запроса эти данные вводятся в Learning Model. Модель обучена на тренировочных данных с метками, указывающими, повторялся ли запрос (был ли введен пороговое число раз).
Модель выдает вероятность того, что первый запрос будет введен в будущем.
Запрос идентифицируется как Repeatable Query, если вероятность удовлетворяет Repeatability Threshold.
Повторяемый запрос сохраняется.
На устройстве пользователя предоставляется User Selectable Interface Component, который позволяет выполнить этот запрос без ввода пользователем компонента запроса (т.е. без ввода текста).
Система получает выбор этого компонента и предоставляет страницу результатов поиска (SERP).

Claim 4 (Зависимый от 1): Детализирует состав Contextual Data, используемых моделью. Это критически важный пункт для понимания признаков, по которым Google оценивает паттерны запросов. Включает:

Язык запроса.
Географическое местоположение (источника запроса и интереса пользователя).
Частота ввода запроса (конкретным устройством и количество уникальных устройств, вводивших запрос часто).
Embedding запроса (семантические связи).
Определение навигационного интента (направлен ли запрос на конкретный веб-сайт).
Взаимодействие с SERP: выбор результатов, время просмотра результатов (time of viewing), выбор навигационных элементов на SERP.

Claim 8 (Зависимый от 1): Описывает механизм проактивного поиска (Push-уведомления).

После идентификации запроса как повторяемого система определяет (на основе истории поиска), ожидается ли, что данное устройство введет этот запрос в будущем. Если да, система предоставляет набор результатов для этого запроса в виде уведомления (notification) без получения какого-либо запроса от устройства на выполнение этого запроса.

Claim 9 и 10 (Зависимые от 1): Описывают предоставление динамических результатов.

Система получает повторное выполнение того же Repeatable Query. Поисковая система предоставляет вторую страницу результатов, которая отличается от первой страницы результатов (Claim 9). Отличия могут заключаться в другом порядке результатов, другом составе результатов или включении динамического контента (dynamic content), которого не было на первой странице (Claim 10).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, в основном фокусируясь на понимании запросов и взаимодействии с пользователем.

CRAWLING – Сканирование и Сбор данных
В описании патента упоминается, что поисковая система может приоритизировать индексирование (prioritize the indexing) сайтов, связанных с повторяемыми запросами, ожидая, что пользователям потребуется динамический (новый или обновленный) контент для таких запросов. Это позволяет оптимизировать ресурсы краулинга.

INDEXING – Индексирование
Система может кэшировать результаты для Repeatable Queries в Index или Repeatable Query Cache для быстрого доступа (Claims 2, 3).

QUNDERSTANDING – Понимание Запросов (Основное применение)
Основная часть изобретения реализуется на этом этапе (часто в виде офлайн-процессов). Система анализирует Query Logs и Click Logs, используя Context Analyzer и Learning Model для классификации запросов. Это глубокий анализ стабильности интента, контекста и поведения пользователей.

RERANKING – Переранжирование
Когда Repeatable Query выполняется повторно, система может активировать специальную логику (Claims 9 и 10) на этапе RERANKING, чтобы диверсифицировать, обновить или изменить порядок результатов по сравнению с предыдущим выполнением этого же запроса.

Входные данные:

Query Logs и Click Logs.
Contextual Data, извлеченные из логов (язык, гео, частота, эмбеддинги, поведение на SERP).
Тренировочные данные для Learning Model.

Выходные данные:

Классификация запросов (повторяемый / не повторяемый).
Repeatable Query Cache.
Элементы пользовательского интерфейса (ярлыки, меню).
Потенциально измененные (динамические) результаты поиска при повторном выполнении запроса.

На что влияет

Специфические запросы: Наибольшее влияние на запросы со стабильным, повторяющимся интентом. Это включает навигационные запросы (бренды, названия сайтов), регулярные информационные запросы (погода, новости по теме, расписания) и запросы, связанные с хобби или рутинными задачами.
Типы контента: Влияет на контент, который должен регулярно обновляться. Поскольку система может предоставлять динамические результаты для повторяемых запросов (Claims 9, 10), приоритет отдается свежему или обновленному контенту.

Когда применяется

Триггеры активации (Идентификация): Процесс идентификации запускается при анализе логов запросов. Модель активируется для оценки любого запроса на предмет его повторяемости.
Триггеры активации (Выполнение): Механизм упрощенного выполнения активируется, когда пользователь взаимодействует с интерфейсом поисковой системы (видит ярлыки или меню) или когда система решает отправить проактивное уведомление (Claim 8).
Условие для динамических результатов: Активируется, когда пользователь повторно выполняет Repeatable Query, и система решает предоставить измененную выдачу (Claims 9, 10).

Пошаговый алгоритм

Процесс А: Идентификация повторяемых запросов

Получение набора поисковых запросов: Система извлекает набор ранее выполненных запросов из Query Logs.
Определение контекстуальных данных: Для каждого экземпляра каждого запроса Context Analyzer определяет Contextual Data (язык, гео, частота, эмбеддинги, взаимодействие с SERP и т.д.), используя Query Logs и Click Logs.
Ввод данных в модель обучения: Контекстуальные данные для анализируемого запроса вводятся в Learning Model.
Получение прогноза: Модель выдает вероятность того, что запрос будет выполнен в будущем.
Определение повторяемости: Система сравнивает полученную вероятность с Repeatability Threshold.
Сохранение: Если порог удовлетворен, запрос идентифицируется как Repeatable Query и сохраняется в Repeatable Query Cache.

Процесс Б: Выполнение повторяемого запроса

Предоставление интерфейса: На устройстве пользователя отображается User Selectable Interface Component (например, ярлык или список), который позволяет выполнить один из сохраненных Repeatable Queries без ввода текста. Список может быть персонализирован (Claim 7).
Получение выбора пользователя: Система получает сигнал о выборе пользователем определенного компонента.
Предоставление результатов поиска: Поисковая система предоставляет SERP.
Варианты обработки:
- Кэширование (Claims 2, 3): Система может предоставить ранее сохраненные результаты из кэша.
- Динамическая выдача (Claims 9, 10): Если это повторное выполнение запроса, система может предоставить SERP, отличающуюся от предыдущей (другой порядок, состав или динамический контент).

Процесс В: Проактивное уведомление (Claim 8)

Прогнозирование намерения пользователя: На основе истории поиска система определяет, что пользователь, вероятно, скоро выполнит определенный Repeatable Query. (В описании патента упоминается возможность использования дополнительной модели для определения времени, когда запрос ожидается).
Отправка уведомления: Система отправляет уведомление на устройство пользователя, содержащее результаты поиска для этого запроса, до того, как пользователь его запросил.

Какие данные и как использует

Данные на входе

Система использует обширный набор данных (Contextual Data) для обучения модели и прогнозирования повторяемости запросов (Claim 4).

Временные факторы: Частота ввода запроса (глобально и конкретным пользователем), время ввода запросов.
Географические факторы: Местоположение, откуда был введен запрос; местоположение, интересующее пользователя (Geographic location of interest).
Пользовательские факторы: История поиска пользователя (для персонализации и проактивных уведомлений); идентификаторы устройств; количество уникальных пользователей, вводивших запрос пороговое число раз.
Поведенческие факторы (Взаимодействие с SERP): Выбор одного или нескольких результатов поиска; время просмотра (Time of viewing) результатов; выбор навигационных элементов на SERP (например, кнопки «следующая страница», «назад»).
Контентные/Семантические факторы:
- Язык, на котором написан запрос.
- Embedding запроса (семантические отношения с другими запросами).
- Определение навигационного интента (направлен ли запрос на конкретный сайт).

Какие метрики используются и как они считаются

Вероятность будущего выполнения (Likelihood): Основная метрика, рассчитываемая Learning Model на основе Contextual Data.
Repeatability Threshold: Пороговое значение для классификации запроса как повторяемого.
Метки обучения (Labels): Используются при обучении модели. Метка указывает, был ли тренировочный запрос введен пороговое число раз (т.е. повторялся ли он в прошлом).
Алгоритмы машинного обучения: Используется контролируемая модель машинного обучения (Supervised machine learning model). Конкретный тип модели в патенте не указан, но упоминается использование NLP-техник для генерации эмбеддингов.

Google активно идентифицирует стабильные интенты: Система целенаправленно ищет запросы, которые пользователи регулярно повторяют. Это позволяет Google лучше понять рутинные потребности пользователей и адаптировать под них как интерфейс, так и результаты поиска.
Контекст и поведение на SERP критичны для понимания запросов: Модель машинного обучения использует широкий спектр сигналов (Contextual Data) для классификации запросов. Помимо текста и семантики (Embedding), учитываются гео, язык, частота и, что важно, взаимодействие пользователя с выдачей (клики, время просмотра, навигация). Это подтверждает важность удовлетворения интента.
Приоритет динамического контента для повторяющихся запросов: Ключевой вывод из Claims 9 и 10 — Google может намеренно изменять SERP при повторном выполнении Repeatable Query. Это означает, что даже для стабильных интентов пользователи ожидают обновления, нового порядка или динамического контента. Статичный контент может терять актуальность для таких запросов (QDF).
Потенциальное влияние на сканирование (Crawl Prioritization): В описании патента прямо говорится о возможности приоритизации индексирования сайтов, связанных с повторяемыми запросами, для обеспечения доступности динамического контента. Это дает сигнал о том, что контент, отвечающий на стабильные интенты, может получать преимущество в сканировании.
Движение к проактивному поиску: Claim 8 описывает механизм доставки результатов через уведомления до того, как пользователь ввел запрос. Это подтверждает стратегическое направление Google к «беззапросному поиску» (аналогично Google Discover), основанному на прогнозировании потребностей.
Брендовые запросы как повторяемые: Учет навигационного интента в Contextual Data предполагает, что брендовые и навигационные запросы являются основными кандидатами на роль Repeatable Queries.

Best practices (это мы делаем)

Обеспечение свежести контента для стабильных интентов: Определите запросы в вашей нише, которые могут быть классифицированы как Repeatable Queries (регулярные события, расписания, обновляемые обзоры). Регулярно обновляйте контент, отвечающий на эти запросы. Учитывая Claims 9 и 10, Google стремится предоставлять динамические результаты при повторных запросах, поэтому свежий контент будет иметь преимущество.
Оптимизация под проактивный поиск (Discover/Notifications): Поскольку результаты для повторяемых запросов могут доставляться проактивно (Claim 8), следуйте рекомендациям для Google Discover. Используйте качественные изображения, четкие заголовки и создавайте контент, который соответствует прогнозируемым потребностям аудитории.
Улучшение поведенческих сигналов на SERP: Contextual Data включают анализ взаимодействия с SERP (клики, время просмотра). Оптимизируйте сниппеты для повышения CTR и работайте над качеством контента, чтобы пользователь находил ответ на странице и не возвращался на выдачу (удовлетворение интента).
Мониторинг Crawl Budget: Используйте данные о сканировании (например, в GSC), чтобы убедиться, что страницы, нацеленные на стабильные интенты, регулярно сканируются. Учитывая упоминание о приоритизации сканирования для Repeatable Queries, качественный и регулярно обновляемый контент в этой категории должен хорошо индексироваться.
Укрепление бренда и навигационных запросов: Поскольку навигационные запросы (упомянутые в Claim 4 как часть контекста) являются вероятными кандидатами на Repeatable Queries, сильный бренд генерирует стабильный поток трафика, который Google стремится упростить для пользователей.

Worst practices (это делать не надо)

Публикация статичного контента для развивающихся тем: Создание «вечнозеленого» контента без его регулярного обновления для тем, которые пользователи проверяют часто (повторяемые запросы), может привести к пессимизации. Если Google ожидает динамических результатов (Claims 9, 10), статичная страница перестанет удовлетворять требованиям.
Игнорирование контекста пользователя (Гео/Язык): Контекстуальные данные критичны для идентификации повторяемых запросов. Неоптимизированный под локальный контекст контент может не быть распознан как релевантный для повторяющихся потребностей локальных пользователей.
Манипуляция частотой запросов: Попытки искусственно сделать запрос «повторяемым» путем накрутки частоты бесполезны, так как модель учитывает множество факторов, включая количество уникальных пользователей и естественность поведения на SERP.

Стратегическое значение

Патент подтверждает стратегию Google, направленную на глубокое понимание пользовательских паттернов и переход от реактивного поиска к проактивному ассистированию. Для SEO это означает, что фокус смещается от оптимизации под отдельные ключевые слова к оптимизации под долгосрочные потребности пользователя (User Journeys). Важность свежести контента возрастает, так как она обеспечивает ценность при повторных обращениях к теме. Также патент дает прямое указание на то, что Google может связывать определенные типы запросов с приоритетами сканирования.

Практические примеры

Сценарий 1: Оптимизация контента под динамические результаты

Ситуация: У вас есть страница «Лучшие смартфоны 2025 года». Это типичный Repeatable Query, так как пользователи регулярно проверяют обновления.
Действие (На основе Claims 9, 10): Недостаточно создать страницу один раз. Необходимо регулярно (например, ежемесячно или при выходе новых моделей) обновлять контент, добавлять новости, изменять рейтинги.
Ожидаемый результат: Google распознает, что страница предоставляет динамический контент, соответствующий ожиданиям пользователей при повторных запросах. Это повышает шансы на высокое ранжирование и потенциально увеличивает частоту сканирования страницы.

Сценарий 2: Оптимизация под проактивные уведомления

Ситуация: Сайт спортивной команды. Запрос «[Команда] следующий матч» является Repeatable Query.
Действие (На основе Claim 8): Создать страницу с расписанием, используя структурированные данные (Schema.org/Event). Обеспечить максимальную точность и своевременное обновление информации.
Ожидаемый результат: Google прогнозирует интерес пользователя к следующему матчу и может отправить проактивное уведомление с результатами (расписанием) с вашего сайта, обеспечивая трафик до того, как пользователь ввел запрос.

Что такое «Повторяемый запрос» (Repeatable Query) согласно патенту?

Это запрос, который уже вводился ранее и, по прогнозу модели машинного обучения Google, с высокой вероятностью будет введен снова в будущем. Система определяет это, анализируя контекст прошлых запросов (время, место, язык) и поведение пользователей на странице результатов.

Какие сигналы Google использует для определения повторяемости запроса?

Патент перечисляет обширный набор Contextual Data (Claim 4): язык, местоположение пользователя и интересующее его местоположение, частота ввода запроса (конкретным пользователем и глобально), количество уникальных пользователей, часто вводящих запрос, семантические векторы (Embedding), наличие навигационного интента, а также поведение на SERP (клики, время просмотра, использование навигации).

Правда ли, что Google может показывать разные результаты для одного и того же повторяемого запроса?

Да, это ключевой момент патента (Claims 9 и 10). При повторном выполнении Repeatable Query Google может намеренно предоставить выдачу, отличающуюся от предыдущей. Отличия могут заключаться в другом порядке результатов, другом составе ссылок или включении нового динамического контента. Это подчеркивает важность свежести контента.

Влияет ли этот патент на сканирование и индексирование (Crawl Budget)?

Да, влияет косвенно. В описании патента упоминается, что поисковая система может приоритизировать индексирование сайтов, связанных с повторяемыми запросами. Это делается для того, чтобы обеспечить наличие динамического (обновленного) контента, который ожидают пользователи при повторных запросах.

Что означает «проактивное предоставление результатов» в контексте этого патента?

Это механизм (Claim 8), при котором Google прогнозирует, что пользователь скоро введет определенный повторяемый запрос, и отправляет результаты поиска в виде уведомления на устройство пользователя до того, как запрос был фактически введен. Это шаг к «беззапросному поиску», похожему на Google Discover.

Как SEO-специалисту использовать знание о динамических результатах для повторяемых запросов?

Необходимо идентифицировать стабильные интенты в своей нише и обеспечить регулярное обновление соответствующего контента. Если пользователи часто проверяют тему, статичная страница может потерять позиции, так как Google будет искать более свежие или динамические ответы при повторных запросах.

Являются ли брендовые запросы повторяемыми?

С высокой вероятностью, да. В списке Contextual Data (Claim 4) явно указано определение того, направлен ли запрос на конкретный веб-сайт (навигационный интент). Брендовые и навигационные запросы часто вводятся пользователями регулярно для быстрого доступа к сайту.

Как работает модель машинного обучения, упомянутая в патенте?

Это контролируемая модель, обученная на исторических данных. Она принимает на вход Contextual Data запроса и выдает вероятность его повторения в будущем. Модель учится на примерах запросов, которые в прошлом повторялись (имели метку о превышении порога частоты ввода).

Какова основная цель этого изобретения для Google?

Цель двоякая: улучшение пользовательского опыта (упрощение ввода частых запросов, предоставление свежих результатов) и повышение эффективности системы (экономия вычислительных ресурсов за счет потенциального кэширования результатов и оптимизации сканирования).

Как этот патент связан с персонализацией поиска?

Патент тесно связан с персонализацией. Система может показывать пользователю список повторяемых запросов, основанный на его личной истории поиска (Claim 7). Также история пользователя используется для прогнозирования его будущих запросов и отправки проактивных уведомлений (Claim 8).

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

US11157488B2
2021-10-26

Индексация
Поведенческие сигналы
Семантика и интент

Как Google использует историю поиска и контекст (время, местоположение) для проактивного предложения релевантных прошлых результатов на разных устройствах

Google патентует систему, которая анализирует историю поиска пользователя и использует контекстуальные сигналы (время, местоположение и прошлое поведение, такое как клики и время на сайте), чтобы определить актуальность прошлых результатов. Система проактивно предлагает эти результаты в виде информационных элементов на разных устройствах, устраняя необходимость повторного поиска, например, показывая ресторан, который пользователь искал ранее и рядом с которым находится сейчас.

US8805828B1
2014-08-12

Персонализация
Поведенческие сигналы

Как Google предварительно вычисляет результаты поиска для ожидаемых запросов, чтобы ускорить выдачу и повысить её качество

Google использует систему предиктивного поиска для повышения скорости и эффективности. Система прогнозирует, какие запросы пользователи введут в будущем, и заранее вычисляет для них результаты поиска, сохраняя их в специальном «предиктивном кэше». Это позволяет мгновенно обслуживать популярные и трендовые запросы, а также использовать более сложные алгоритмы ранжирования, поскольку вычисления происходят до получения запроса.

US20100318538A1
2010-12-16

Индексация

Как Google систематизирует сбор, хранение и анализ истории поисковых запросов и поведенческих данных пользователей

Патент Google, описывающий инфраструктуру для перехвата, фильтрации, консолидации и хранения истории поисковых запросов и их результатов. Система детально фиксирует контекстную информацию, включая то, какие результаты просмотрел пользователь, когда и как часто. Эти данные формируют основу для анализа поведения пользователей и обучения систем ранжирования.

US9111284B2
2015-08-18

Поведенческие сигналы
Персонализация

Как Google обнаруживает неэффективные последовательности запросов и обучает пользователей контекстному поиску

Google анализирует последовательности запросов для выявления паттернов, при которых пользователи излишне повторяют контекст. При обнаружении такого паттерна Google отображает «Teachable Moment Interface» с подсказками о том, как задавать более короткие контекстные последующие запросы (например, с использованием местоимений), повышая эффективность поиска.

US10120903B2
2018-11-06

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта

Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.

US7962462B1
2011-06-14

Поведенческие сигналы
Ссылки
SERP

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах

Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.

US7769751B1
2010-08-03

Поведенческие сигналы
Антиспам
SERP

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей

Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.

US20210125108A1
2021-04-29

Поведенческие сигналы
SERP

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

US9235653B2
2016-01-12

Knowledge Graph
Свежесть контента
Семантика и интент

Как Google автоматически генерирует блоки "Связанные ссылки" и "Похожие запросы", анализируя контент страницы при загрузке

Патент описывает систему для динамической генерации виджетов связанных ссылок. При загрузке страницы система извлекает текст (заголовок, контент, запрос из реферера), определяет наиболее важные ключевые слова с помощью глобального репозитория (Keyword Repository), выполняет поиск по этим словам (часто в пределах того же домена) и отображает топовые результаты для улучшения навигации.

US9129009B2
2015-09-08

Ссылки
Семантика и интент
Техническое SEO

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче

Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.

US9424360B2
2016-08-23

Local SEO
Поведенческие сигналы

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента

Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.

US8892549B1
2014-11-18

EEAT и качество
Семантика и интент

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы

Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.

US8392435B1
2013-03-05

Персонализация
Поведенческие сигналы
SERP

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента

Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.

US8145636B1
2012-03-27

Семантика и интент
Поведенческие сигналы

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках

Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.

US8417692B2
2013-04-09

Семантика и интент
Поведенческие сигналы