Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)

QUERY COMPOSITION SYSTEM (Система составления запросов)

US10146829B2
Google LLC
2015-09-28
2018-12-04

Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.

Какую проблему решает

Патент решает задачу упрощения и ускорения процесса ввода поисковых запросов, особенно на мобильных устройствах. Цель — предоставить пользователю релевантные поисковые подсказки без необходимости ввода каких-либо символов (Zero-Input Queries). Система стремится предсказать намерение пользователя, основываясь исключительно на его текущем контексте, при этом избегая перегрузки интерфейса слишком большим количеством отдельных подсказок путем их группировки.

Что запатентовано

Запатентована система для генерации и предоставления Context Clusters (контекстных кластеров). Контекстный кластер — это группа запросов, которые связаны как тематически (содержание запроса), так и ситуативно (контекст ввода, например, время и место). Система рассчитывает вероятность (Context Cluster Probability) того, что пользователь захочет ввести запрос из определенного кластера, основываясь на его текущем контексте, и предлагает эти кластеры в интерфейсе поиска до начала ввода текста.

Как это работает

Система функционирует в двух режимах:

Офлайн-обработка: Анализируются исторические логи запросов (Log Data). Запросы группируются в Context Clusters на основе двух критериев: схожести Input Context (время, место, интересы пользователя) и схожести содержания запроса (тема). Для каждого кластера вычисляется Context Cluster Probability.
Онлайн-обработка: Когда пользователь активирует строку поиска (User Event), но еще не ввел текст, система получает его текущий контекст. На основе этого контекста и заранее рассчитанных вероятностей система выбирает наиболее релевантные Context Clusters и отображает их пользователю. При выборе кластера пользователю предлагаются конкретные запросы из этого кластера.

Актуальность для SEO

Высокая. Изобретатель — Jakob Uszkoreit, ключевая фигура в развитии NLP и архитектуры Transformer в Google. Предиктивный поиск, контекстуальные подсказки и Zero-Input Queries являются критически важными элементами современного поиска, особенно в мобильных интерфейсах, Google Assistant и системах типа Google Discover. Понимание контекста пользователя для предугадывания его намерений — центральное направление развития поиска.

Важность для SEO

Патент имеет значительное влияние на SEO (7.5/10). Он демонстрирует, как Google интерпретирует намерения пользователей не только через ключевые слова, но и через ситуативный контекст (время, место, профиль пользователя). Это критически важно для оптимизации под конкретные сценарии использования и ситуативные интенты (особенно локальный поиск и времязависимый контент), а не только под абстрактные ключевые фразы. Попадание в эти предиктивные подсказки может стать важным источником трафика.

Термины и определения

Context Cluster (Контекстный кластер): Группа из одного или нескольких исторических запросов (Query Inputs), сгруппированных на основе схожести их Input Context и схожести их содержания (content).
Context Cluster Probability (Вероятность контекстного кластера): Метрика, указывающая на вероятность того, что пользователь выберет хотя бы один запрос, принадлежащий данному кластеру, при условии определенного Input Context. Рассчитывается путем агрегации вероятностей отдельных запросов в кластере.
Input Context (Контекст ввода): Данные, описывающие обстоятельства, при которых был введен запрос. Контекст отличается от содержания самого запроса. Включает местоположение устройства, время и дату ввода запроса, а также предпочтения и интересы пользователя (явные или неявные).
Log Data (Данные журнала): Хранилище исторических поисковых сессий, включающее введенные запросы и соответствующий им Input Context.
User Event (Пользовательское событие): Действие пользователя, указывающее на намерение начать ввод поискового запроса (например, активация строки поиска). Критически важно, что это событие происходит до того, как пользователь ввел какой-либо текст запроса (Zero-Input).
Context Similarity Measure (Мера схожести контекста): Метрика для оценки того, насколько похожи обстоятельства ввода (Input Contexts) двух разных запросов.
Query Similarity Measure (Мера схожести запроса): Метрика для оценки того, насколько похожи содержание или тема двух разных запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный метод, включающий офлайн-генерацию кластеров и онлайн-обработку запроса пользователя.

Система получает доступ к данным о запросах (Query Data), которые включают сами запросы и их Input Context (обстоятельства ввода, отличные от содержания запроса).
Запросы группируются в Context Clusters. Группировка основана одновременно на Input Context и на содержании (content) запросов.
Для каждого кластера определяется Context Cluster Probability — вероятность того, что запрос из этого кластера будет выбран.
Данные о кластерах и вероятностях сохраняются.
Система получает от устройства индикацию о User Event и текущий контекст устройства. User Event определен как доступ к вводу поисковой системы, при котором пользователь еще не предоставил ввод запроса (Zero-Input).
На основе вероятностей кластеров и текущего контекста устройства выбирается Context Cluster.
Система предоставляет устройству данные для отображения элемента выбора (selection input) для выбранного контекстного кластера.

Claim 4 и 5 (Зависимые от 1): Детализируют процесс группировки (Шаг 2).

Группировка включает определение Context Similarity Measures и Query Similarity Measures. Запросы группируются в кластер, только если мера схожести их контекстов удовлетворяет порогу (context similarity threshold) И мера схожести самих запросов удовлетворяет порогу (query similarity threshold). Это ключевое двойное условие.

Claim 7 (Зависимый): Уточняет расчет вероятности кластера (Шаг 3).

Context Cluster Probability рассчитывается путем агрегирования (суммирования) вероятностей ввода (probabilities of entry) отдельных запросов в кластере.

Claim 10 (Независимый пункт): Описывает метод онлайн-обработки.

Этот пункт фокусируется на процессе реагирования на User Event в реальном времени, используя уже существующие данные о Context Clusters. Он повторяет логику шагов 5-7 из Claim 1: получение события и контекста, выбор кластера на основе вероятностей и контекста, и предоставление кластера пользователю до ввода текста.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, связывая анализ исторических данных с пользовательским интерфейсом в реальном времени.

INDEXING – Индексирование (Сбор данных)
На этом этапе происходит сбор и сохранение Log Data — записей о введенных запросах и их Input Context (время, место, данные пользователя). Эти данные являются сырьем для анализа.

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ и Онлайн-обработка)
Основная работа происходит здесь. В офлайн-режиме Context Cluster System анализирует Log Data, выполняет кластеризацию, рассчитывает вероятности и сохраняет Context Cluster Data. В онлайн-режиме, когда происходит User Event, система использует текущий контекст пользователя для предсказания его намерения и выбора подходящих кластеров.

RANKING / UI Generation (Реал-тайм)
Система ранжирует выбранные Context Clusters на основе их вероятности в данном контексте и генерирует пользовательский интерфейс с подсказками (Suggestions).

Входные данные (Офлайн):

Исторические Query Inputs и их Input Context.

Входные данные (Онлайн):

Индикация User Event (активация строки поиска без ввода текста).
Текущий контекст пользовательского устройства.

Выходные данные:

Данные для отображения Context Cluster selection inputs (предлагаемые категории запросов).
При выборе кластера — данные для отображения конкретных Query Inputs из этого кластера или подкластеров.

На что влияет

Специфические запросы: Наибольшее влияние на запросы, сильно зависящие от контекста — локальные (поиск ресторанов, магазинов, кинотеатров), времязависимые (расписание транспорта, часы работы) и персонализированные (запросы, связанные с интересами).
Конкретные ниши: Локальный бизнес, развлечения, транспорт, мероприятия, новости.
Мобильный поиск: Система особенно актуальна для мобильных устройств, где ввод текста затруднен, а контекстные данные (местоположение) легко доступны.

Когда применяется

Триггеры активации: Система активируется при наступлении User Event — когда пользователь демонстрирует намерение начать поиск (например, открывает вкладку поиска), но еще не ввел ни одного символа (Zero-Input).
Условия применения: Применяется, если для текущего контекста пользователя существуют заранее рассчитанные Context Clusters с достаточно высокой Context Cluster Probability (превышающей порог selection probability threshold).

Пошаговый алгоритм

Процесс А: Офлайн-генерация контекстных кластеров

Сбор данных: Доступ к Log Data, содержащим исторические запросы и их Input Context.
Анализ схожести контекста: Определение Context Similarity Measures между контекстами ввода разных запросов (близость местоположения, совпадение времени).
Анализ схожести содержания: Определение Query Similarity Measures между содержанием запросов (общие темы, ключевые слова).
Группировка (Кластеризация): Запросы группируются в Context Clusters. Условие группировки: схожесть контекста И схожесть содержания должны превышать соответствующие пороги (similarity thresholds).
Расчет вероятностей запросов: Для каждого отдельного запроса определяется вероятность его ввода (probability of entry) в данном контексте.
Расчет вероятностей кластеров: Для каждого Context Cluster рассчитывается Context Cluster Probability путем агрегации (суммирования) вероятностей входящих в него запросов.
Сохранение: Данные о кластерах и их вероятностях сохраняются в Context Cluster Data.

Процесс Б: Онлайн-обработка и предоставление подсказок

Обнаружение события: Система получает индикацию о User Event.
Получение контекста: Система получает текущий контекст пользовательского устройства (местоположение, время, данные пользователя).
Выбор и Ранжирование кластеров: Система обращается к Context Cluster Data и выбирает Context Clusters, релевантные текущему контексту, ранжируя их по Context Cluster Probability. Может применяться бустинг на основе истории пользователя.
Фильтрация: Выбранные кластеры фильтруются (вероятность выше порога). Может применяться ограничение на максимальное количество (например, топ-4).
Отображение кластеров: Система отправляет данные на устройство для отображения выбранных Context Clusters.
Обработка выбора кластера (Опционально): Если пользователь выбирает кластер, система отображает конкретные запросы, принадлежащие выбранному кластеру, или подкластеры (если используется иерархия, как упомянуто в патенте).

Какие данные и как использует

Данные на входе

Система критически зависит от контекстуальных данных, связанных с историческими и текущими поисковыми сессиями.

Географические факторы: Местоположение устройства (location) в момент ввода запроса. Используется для определения схожести контекста. Локации могут быть разрешены до адресов или в рамках сетки местоположений.
Временные факторы: Время и дата ввода запроса (time and date). Используется для анализа контекста. Время может быть разбито на слоты (например, часовые интервалы).
Пользовательские и Поведенческие факторы:
- Предпочтения и интересы: Явные (указанные в профиле) или неявные (выведенные из потребляемого контента).
- История запросов пользователя (user query history): Может использоваться для повышения (boosting) вероятности кластеров для конкретного пользователя.
- Логи запросов (Log Data): Источник всех исторических данных.
Контентные факторы (Содержание запросов): Текст запросов, ключевые слова, темы. Используются для определения схожести содержания (content similarity).

Какие метрики используются и как они считаются

Context Similarity Measure (Мера схожести контекста): Метрика, измеряющая схожесть двух Input Contexts. Расчет основан на сравнении местоположения, времени и интересов пользователя.
Query Similarity Measure (Мера схожести запроса): Метрика, измеряющая схожесть содержания двух запросов. Расчет основан на анализе тем, ключевых слов или символов.
Similarity Thresholds (Пороги схожести): Пороговые значения для Context similarity и Query similarity, необходимые для включения запросов в один кластер.
Probability of Entry (Вероятность ввода): Вероятность того, что конкретный запрос будет введен пользователем в данном контексте.
Context Cluster Probability (Вероятность контекстного кластера): Агрегированная (суммарная) вероятность всех запросов, входящих в кластер, для данного контекста. $P(Cluster) = \sum P(Query_i)$ .
Selection probability threshold (Порог вероятности выбора): Минимальная Context Cluster Probability, необходимая для того, чтобы кластер был предложен пользователю.

Контекст как основа для предсказания интента: Google активно использует обстоятельства пользователя (место, время, интересы) как мощные предикторы поискового намерения. Input Context является таким же важным фактором для понимания запроса, как и его содержание.
Zero-Input Queries — приоритетное направление: Система разработана специально для предоставления подсказок до ввода текста. Это подчеркивает стремление Google предугадывать потребности пользователя и снижать его усилия, особенно на мобильных устройствах.
Двойное требование к кластеризации (Контекст + Содержание): Для формирования Context Cluster требуется одновременное выполнение двух условий: схожесть контекста И схожесть содержания. Это гарантирует, что предлагаемые кластеры будут релевантны как ситуации пользователя, так и его потенциальной теме интереса.
Преимущество агрегированной вероятности («Эффект кластера»): Механизм агрегации вероятностей позволяет предлагать пользователю запросы, которые сами по себе имеют низкую индивидуальную вероятность выбора, но принадлежат к кластеру с высокой общей вероятностью. Это помогает удовлетворять более нишевые информационные потребности.
Ситуативная релевантность: Ранжирование предлагаемых кластеров напрямую зависит от текущей ситуации пользователя. Релевантность динамична и меняется в зависимости от времени и места, что критично для локального и событийного поиска.

Best practices (это мы делаем)

Оптимизация под ситуативные интенты: Анализируйте не только ЧТО ищут пользователи, но и КОГДА и ГДЕ они это делают. Создавайте контент, отвечающий на запросы, возникающие в конкретных обстоятельствах (например, "что делать в пятницу вечером рядом с [Локация]", расписания, меню, часы работы).
Усиление локального SEO: Местоположение является ключевым компонентом Input Context. Убедитесь, что ваш бизнес и контент четко привязаны к географическим локациям (Google Business Profile, локальные сигналы), чтобы повысить вероятность попадания в локальные Context Clusters.
Работа с времязависимым контентом (Freshness/QDF): Время является вторым ключевым компонентом контекста. Своевременно обновляйте информацию о событиях, новостях и предложениях, которые могут формировать Context Clusters в определенные периоды времени (сезонность, праздники, время суток).
Построение тематического авторитета (Topical Authority): Поскольку кластеры формируются также на основе схожести содержания, важно полностью охватывать тему. Это увеличивает шансы того, что ваш контент будет релевантен различным запросам внутри определенного тематического кластера (например, кластер "Фильмы" может включать запросы о расписании, трейлерах, рецензиях).
Анализ предиктивной выдачи (Zero-Input): Изучайте подсказки, которые Google предлагает при активации строки поиска на мобильном телефоне в разных локациях и в разное время, чтобы понять, какие Context Clusters формируются в вашей нише.

Worst practices (это делать не надо)

Игнорирование контекста пользователя: Фокусировка исключительно на высокочастотных абстрактных запросах без учета контекста их возникновения снижает потенциал видимости в предиктивном поиске.
Пренебрежение мобильным опытом: Система в первую очередь ориентирована на улучшение мобильного поиска, где контекст играет решающую роль. Игнорирование мобильной оптимизации негативно скажется на вовлеченности.
Предоставление устаревшей информации: Если ваш контент связан с локациями или временем, устаревшие данные сделают его нерелевантным для текущего Input Context пользователя, исключая его из актуальных кластеров.

Стратегическое значение

Патент подтверждает стратегию Google на переход от реактивного поиска (ответ на введенный запрос) к проактивному или предиктивному поиску (предсказание запроса на основе контекста). Для SEO это означает необходимость глубокого понимания не только семантики, но и прагматики поиска — обстоятельств, которые побуждают пользователя искать информацию. Долгосрочная стратегия должна включать анализ пользовательских сценариев (Customer Journey Map) с учетом времени и места.

Практические примеры

Сценарий: Оптимизация сайта кинотеатра под Context Clusters

Анализ контекста (Офлайн): Google анализирует данные и видит, что пользователи часто ищут "расписание сеансов", "трейлеры новинок" и "купить билеты" в пятницу вечером (Время), находясь рядом с кинотеатром (Локация). Google группирует это в кластер "Кино".
Действия по оптимизации:
- Убедиться, что на сайте есть четкая локальная привязка и актуальные данные в GBP.
- Создать легкодоступные, быстрые страницы для каждого интента (расписание, трейлеры, билеты).
- Обеспечить быстрое обновление расписания и использовать микроразметку (Schema.org) для фильмов и событий.
Результат (Онлайн): Пользователь находится рядом с кинотеатром в пятницу вечером и открывает строку поиска Google на телефоне (User Event). Система определяет контекст и предлагает Context Cluster "Кино" (до ввода текста).
Вовлечение: Пользователь нажимает на кластер "Кино" и видит подсказки: "расписание сеансов [Название кинотеатра]", "трейлеры фильмов". Выбирает нужный запрос и попадает на оптимизированный сайт.

Что такое "Zero-Input Query" в контексте этого патента?

Это поисковая подсказка, которую система предоставляет пользователю до того, как он ввел хотя бы один символ в строку поиска. Активация происходит в момент User Event (например, при нажатии на строку поиска). Предложения основаны исключительно на предсказании намерения пользователя в его текущем контексте (время, местоположение, интересы).

Что входит в понятие "Input Context" и почему он важен для SEO?

Input Context — это обстоятельства, при которых вводится запрос (местоположение, время, дата, интересы пользователя), отличные от содержания запроса. Для SEO это критически важно, так как система группирует и предлагает запросы на основе этого контекста. Если ваш контент не оптимизирован под обстоятельства, в которых возникает потребность в нем (ситуативный интент), он может не попасть в эти предиктивные подсказки.

Чем описанная система отличается от стандартного автодополнения (Google Autocomplete)?

Стандартное автодополнение реагирует на символы, которые пользователь начинает вводить, пытаясь завершить фразу на основе популярных запросов. Описанная система работает в режиме Zero-Input — она предлагает подсказки (в виде Context Clusters) до того, как пользователь начал что-либо вводить, основываясь исключительно на текущем контексте пользователя.

Как формируются контекстные кластеры (Context Clusters)?

Кластеры формируются путем анализа исторических логов. Система ищет запросы, которые удовлетворяют двум условиям одновременно: они должны иметь схожий Input Context (например, введены в одном месте в одно время) И схожее содержание (например, касаться темы "рестораны"). Если оба параметра превышают заданные пороги схожести, запросы объединяются в кластер.

Может ли мой контент, оптимизированный под низкочастотный запрос, попасть в эти подсказки?

Да, благодаря механизму агрегации вероятностей (так называемый «Эффект кластера»). Патент подчеркивает, что Context Cluster Probability рассчитывается путем суммирования вероятностей отдельных запросов. Это позволяет запросам с низкой индивидуальной вероятностью быть предложенными пользователю, если они принадлежат к кластеру с высокой агрегированной вероятностью.

Какое значение этот патент имеет для локального SEO (Local SEO)?

Огромное. Местоположение является одним из главных компонентов Input Context. Система активно продвигает локально релевантные запросы. Если Google знает, что пользователи часто ищут определенные услуги, находясь рядом с вашим бизнесом, он предложит эти запросы предиктивно. Это подчеркивает необходимость сильной локальной оптимизации для попадания в эти кластеры.

Использует ли эта система мою личную историю поиска?

Да. Патент упоминает, что предпочтения и интересы пользователя являются частью Input Context. Также история запросов пользователя может использоваться для корректировки (повышения или понижения) вероятностей кластеров индивидуально для него, делая подсказки персонализированными.

Что означает требование схожести содержания (Query Similarity) для SEO?

Это означает, что недостаточно просто присутствовать в нужном месте в нужное время. Запросы должны быть тематически связаны для попадания в один кластер. Для SEO это подтверждает важность построения тематического авторитета (Topical Authority) и полного раскрытия темы, чтобы соответствовать различным запросам внутри одного кластера.

Может ли система предлагать несколько уровней кластеров?

Да, патент упоминает возможность иерархической структуры с подкластерами (sub-context clusters). Например, пользователь может выбрать кластер "Кино", а затем ему будут предложены подкластеры "Трейлеры" и "Расписание сеансов", и только после этого — конкретные запросы.

Насколько важен этот патент, учитывая, что его изобретатель – Jakob Uszkoreit?

Это придает патенту значительный вес. Jakob Uszkoreit является одним из авторов архитектуры Transformer (статья "Attention Is All You Need"), лежащей в основе современных языковых моделей (BERT, MUM). Это указывает на то, что описанные методы контекстуального понимания и кластеризации запросов являются фундаментальными для стратегии Google в области NLP и Query Understanding.

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)

Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.

US8065316B1
2011-11-22

Семантика и интент
SERP
Поведенческие сигналы

Как Google кластеризует новостные результаты для генерации блоков "Связанные темы" и "Категории"

Google анализирует результаты поиска по новостям и группирует статьи, освещающие одно и то же событие, в кластеры. Затем система извлекает общие ключевые слова из этих кластеров для формирования блока "Связанные темы" (Related Topics), помогая уточнить запрос. Одновременно определяется широкая категория новостей (например, "Спорт"), из которой предлагается дополнительный контент для расширения контекста.

US11194868B1
2021-12-07

Семантика и интент
Свежесть контента
SERP

Как Google использует контекст пользователя (местоположение, время, историю) для предсказания поискового намерения в локальном поиске (Queryless Search)

Google использует механизм предиктивного поиска (Queryless Search), который анализирует местоположение пользователя, время суток, историю поиска и историю перемещений. На основе этих данных система автоматически предлагает релевантные категории (например, "Рестораны", "Бары") еще до ввода запроса. Система адаптирует предложения в зависимости от знакомства пользователя с локацией и фильтрует результаты по времени работы и близости.

US9529867B1
2016-12-27

Local SEO
Семантика и интент
Персонализация

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов

Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.

US7664734B2
2010-02-16

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует историю поиска и контекст (время, местоположение) для проактивного предложения релевантных прошлых результатов на разных устройствах

Google патентует систему, которая анализирует историю поиска пользователя и использует контекстуальные сигналы (время, местоположение и прошлое поведение, такое как клики и время на сайте), чтобы определить актуальность прошлых результатов. Система проактивно предлагает эти результаты в виде информационных элементов на разных устройствах, устраняя необходимость повторного поиска, например, показывая ресторан, который пользователь искал ранее и рядом с которым находится сейчас.

US8805828B1
2014-08-12

Персонализация
Поведенческие сигналы

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов

Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.

US20170068720A1
2017-03-09

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования

Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.

US7454417B2
2008-11-18

Персонализация
Поведенческие сигналы
SERP

Как Google решает, показывать ли прямой ответ, анализируя частоту использования естественного языка в исторических запросах о факте

Google анализирует исторические данные о том, как пользователи ищут конкретный факт. Если они часто используют естественный язык (например, «какая высота у Эйфелевой башни»), система считает, что пользователи действительно ищут этот факт. На основе этого рассчитывается «Оценка поиска фактов» (Fact-Seeking Score). Эта оценка используется как сигнал ранжирования, чтобы решить, нужно ли показывать прямой ответ (Factual Answer) и насколько высоко его разместить в результатах поиска.

US9396235B1
2016-07-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)

Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.

US8650196B1
2014-02-11

Поведенческие сигналы
SERP
Семантика и интент

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)

Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.

US9116996B1
2015-08-25

Поведенческие сигналы
Семантика и интент

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных

Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.

US10318581B2
2019-06-11

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

US8060405B1
2011-11-15

Антиспам
Ссылки
SERP

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске

Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).

US8498984B1
2013-07-30

SERP
Поведенческие сигналы

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями

Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.

US20110295842A1
2011-12-01

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов

Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.

US8738612B1
2014-05-27

Семантика и интент
Поведенческие сигналы
SERP