Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя

QUERY REFINEMENTS USING SEARCH DATA (Уточнение запросов с использованием поисковых данных)

US9116952B1
Google LLC
2013-05-31
2015-08-25

Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.

Какую проблему решает

Патент решает проблему сложности и неэффективности ввода уточненных поисковых запросов, особенно на мобильных устройствах или при использовании голосового ввода. Пользователи часто вводят запросы последовательно, уточняя свой интент в диалоговом режиме (например, сначала общий запрос, затем модификатор). Система призвана автоматически распознавать эту последовательность как единое намерение и объединять запросы, избавляя пользователя от необходимости вручную вводить полный комбинированный запрос.

Что запатентовано

Запатентована система для автоматического определения и выбора уточненного запроса (Query Refinement) на основе последовательности из двух запросов (Q1 и Q2), полученных в рамках одной пользовательской сессии. Система использует исторические данные (Query Logs), чтобы найти общие паттерны уточнений для Q1, а затем фильтрует их, чтобы найти уточнение, которое наилучшим образом сочетает элементы как Q1, так и Q2. Цель — предсказать и выполнить наиболее вероятный комбинированный запрос (Q3).

Как это работает

Механизм активируется при получении двух последовательных запросов (Q1, затем Q2) в одной сессии:

Сбор кандидатов: Система извлекает из Query Logs набор исторических уточнений, которые пользователи ранее вводили после Q1.
Фильтрация (Intersection): Система фильтрует этот набор, оставляя только те уточнения, которые содержат n-grams, семантически похожие (similar) как на n-grams из Q1, так и на n-grams из Q2.
Ограничение (Topic Drift Prevention): В некоторых вариантах система дополнительно исключает уточнения, содержащие n-grams, которых нет ни в Q1, ни в Q2, чтобы предотвратить смещение темы.
Оценка и Выбор: Оставшиеся кандидаты оцениваются (scoring). Уточнение с наивысшей оценкой сравнивается с пороговым значением (Threshold Score). Если порог превышен, это уточнение становится третьим запросом (Q3) и выполняется. В противном случае система выполняет исходный второй запрос (Q2).

Актуальность для SEO

Высокая. Патент описывает фундаментальные механизмы для реализации контекстного и разговорного поиска (Conversational Search). Понимание контекста сессии и интерпретация последовательных запросов являются ключевыми элементами современных поисковых систем, особенно в эпоху Google Assistant и голосового поиска. Участие Behshad Behzadi (ключевая фигура в развитии Google Search и Assistant) подчеркивает значимость этого изобретения для развития диалогового поиска.

Важность для SEO

Патент имеет значительное влияние на стратегию контента и исследование ключевых слов (7.5/10). Хотя он не описывает алгоритмы ранжирования, он критически важен для понимания того, как Google интерпретирует пользовательские сессии и формирует итоговый запрос (Q3), который поступает в систему ранжирования. Это подчеркивает необходимость оптимизации не под отдельные изолированные запросы, а под целые поисковые пути и финальное, уточненное намерение пользователя.

Термины и определения

First Query (Q1) / Second Query (Q2): Последовательность запросов, введенных пользователем в рамках одной сессии без промежуточных запросов.
Third Query (Q3): Итоговый запрос, выбранный системой для выполнения поисковой операции. Это может быть либо автоматически сгенерированное уточнение, либо исходный Q2.
Historical Data / Query Logs: База данных, хранящая историю поисковых запросов и сессий. Используется для определения общих паттернов уточнения запросов.
N-gram: Последовательность из N элементов (обычно слов) из текста запроса.
Query Refinement (Уточнение запроса): Запрос, который является модификацией предыдущего запроса. В патенте выделяются наборы: R_m (все исторические уточнения Q1), R_n (уточнения, содержащие элементы Q1 и Q2) и R_o (строго отфильтрованный R_n).
Refinement Generator: Компонент системы, отвечающий за генерацию и фильтрацию наборов уточнений запросов.
Refinement Scoring System: Компонент, отвечающий за оценку (scoring) кандидатов в уточнения на основе их сходства с Q1 и Q2.
Semantic Class (Семантический класс): Категория, к которой принадлежат n-grams. Например, "Москва" и "Лондон" принадлежат к классу <city>. Используется для определения сходства и обобщения паттернов запросов.
Similarity (Сходство n-grams): Метрика, определяющая близость двух n-grams. Включает точное совпадение, синонимы, аббревиатуры, акронимы, расшифровки, альтернативное написание, принадлежность к одному семантическому классу или разное грамматическое число (единственное/множественное).
Threshold Score (Пороговая оценка): Минимальная оценка, которую должно набрать уточнение, чтобы быть выбранным в качестве Q3 вместо исходного Q2.
User Session (Пользовательская сессия): Последовательность взаимодействий пользователя с поисковой системой за ограниченный период времени.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод обработки последовательных запросов.

Система получает первый запрос (Q1) и второй запрос (Q2) в рамках одной сессии, причем Q2 следует сразу за Q1 без промежуточных запросов.
Из исторических данных (historical data) определяется первый набор уточнений для Q1.
Определяется второй набор уточнений (подмножество первого). Критерий включения: каждое уточнение должно содержать хотя бы один n-gram, похожий на n-gram из Q1, И хотя бы один n-gram, похожий на n-gram из Q2.
Патент детально определяет, что значит "похожий" (similar): точное совпадение, акроним, расшифровка, синоним, аббревиатура, альтернативное написание, тот же семантический класс (n-gram from the same class) или другое грамматическое число.
Каждое уточнение во втором наборе оценивается (scoring).
На основе оценок выбирается третий запрос (Q3) из группы, состоящей из второго набора уточнений и Q2.
Q3 используется как входные данные для поисковой операции.

Claim 3 (Зависимый от 2): Вводит механизм предотвращения смещения темы (Topic Drift).

После определения кандидатов (второй набор), система исключает из него все уточнения, которые содержат n-gram, НЕ являющийся похожим ни на один n-gram из Q1, ни на один n-gram из Q2.

Это критически важное ограничение: итоговое уточнение должно состоять исключительно из элементов, присутствующих (или семантически схожих) в исходных двух запросах.

Claim 8 (Зависимый от 2): Детализирует механизм оценки.

Оценка (score) для конкретного уточнения основывается на его n-grams, которые похожи на n-grams из Q1 или Q2.

Claim 9 и 10 (Зависимые от 8): Описывают процесс выбора Q3 с использованием порога.

Определяется, превышает ли наивысшая оценка (highest score) пороговое значение (Threshold Score).
Если ДА (Claim 9): В качестве Q3 выбирается уточнение с наивысшей оценкой.
Если НЕТ (Claim 10): В качестве Q3 выбирается исходный второй запрос (Q2).

Claim 13, 14, 15 (Зависимые от 8): Описывают использование весовых коэффициентов при оценке.

(13) N-grams, похожие на Q2, могут иметь больший вес (greater weight value), чем n-grams, похожие на Q1.
(14) Нераспространенные (uncommon) n-grams могут иметь больший вес, чем распространенные (common).
(15) N-grams, похожие и на Q1, и на Q2 одновременно, могут иметь больший вес, чем те, что похожи только на один из запросов.

Где и как применяется

Изобретение применяется преимущественно на этапе понимания запроса для интерпретации пользовательского ввода перед передачей его в систему ранжирования.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система работает как механизм переписывания и интерпретации запросов в реальном времени (или использует предварительно вычисленные данные).

Мониторинг сессии: Система отслеживает последовательность запросов в рамках одной User Session.
Интерпретация ввода: При получении Q2 сразу после Q1 активируется Refinement Generator.
Генерация и Оценка: Система генерирует, фильтрует и оценивает кандидатов для Q3, используя Refinement Scoring System.
Выбор запроса: Refinement Selector определяет финальный запрос (Q3), который будет обработан поисковой системой.

RANKING – Ранжирование
Патент напрямую не влияет на алгоритмы ранжирования, но он определяет, КАКОЙ запрос будет ранжироваться. Вместо ранжирования результатов для Q1 или Q2, система ранжирует результаты для автоматически сгенерированного Q3.

Входные данные:

Первый запрос (Q1).
Второй запрос (Q2).
Данные сессии (для подтверждения последовательности).
Query Logs (исторические данные о паттернах уточнений).
База данных семантического сходства (синонимы, аббревиатуры, семантические классы).

Выходные данные:

Третий запрос (Q3), который передается как входные данные для поисковой операции (этап RANKING).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, которые пользователи склонны уточнять: коммерческие (выбор товара с характеристиками), локальные (поиск места с типом кухни или услугой), информационные (поиск сущности с атрибутом).
Типы контента: Влияет на все типы контента, где применимы уточнения (товары, локальные страницы, статьи).
Устройства и ввод: Механизм особенно критичен для мобильных устройств и голосового поиска (Voice Search), где ввод длинных запросов затруднен и пользователи чаще используют последовательные, разговорные запросы.

Когда применяется

Триггеры активации: Получение двух разных запросов (Q1 и Q2) последовательно, без промежуточных запросов, в рамках одной User Session.
Условия применения: Наличие в Query Logs исторических данных об уточнениях для Q1, которые также пересекаются с Q2.
Пороговые значения: Финальное применение уточнения (выбор его в качестве Q3) происходит только в том случае, если его оценка (score) превышает установленный Threshold Score.

Пошаговый алгоритм

Процесс обработки запроса в реальном времени

Получение Q1: Система получает первый запрос от пользователя и возвращает результаты поиска SR1.
Получение Q2: Система получает второй запрос от того же пользователя в той же сессии сразу после Q1.
Генерация первого набора уточнений (R_m): Refinement Generator извлекает из Query Logs исторические уточнения, которые следовали за Q1 в прошлых сессиях.
Фильтрация по пересечению (R_n): Refinement Generator создает второй набор уточнений R_n (подмножество R_m). В R_n включаются только те уточнения, которые содержат n-grams, похожие на Q1, И n-grams, похожие на Q2.
(Опционально) Фильтрация по ограничению (R_o): Refinement Generator создает третий набор R_o (подмножество R_n), исключая уточнения, содержащие любые n-grams, не похожие ни на Q1, ни на Q2.
Оценка кандидатов: Refinement Scoring System рассчитывает оценку (score) для каждого уточнения в наборе R_n (или R_o). При расчете могут использоваться весовые коэффициенты (например, предпочтение терминам из Q2 или редким терминам).
Выбор Q3: Refinement Selector определяет уточнение с наивысшей оценкой (R_p).
- Сравнение с порогом: Если оценка R_p > Threshold Score, то Q3 = R_p.
- Откат: Если оценка R_p ≤ Threshold Score, то Q3 = Q2.
Выполнение поиска: Система выполняет поисковую операцию, используя Q3, и возвращает результаты SRp пользователю.
(Опционально) Обратная связь: Система может предложить пользователю опцию отката к Q2, если Q3 был выбран неверно (например, элемент интерфейса "Incorrect Query?").

Какие данные и как использует

Данные на входе

Патент фокусируется на обработке запросов и исторических данных о поведении пользователей.

Поведенческие факторы (User Behavior): Query Logs являются основным источником данных. Система анализирует исторические последовательности запросов в сессиях, чтобы выявить паттерны уточнений.
Контентные факторы (Query Content): N-grams из текущих запросов Q1 и Q2. Анализируется состав запросов для последующего сопоставления.
Лингвистические данные: Данные для определения семантического сходства (Similarity): словари синонимов, аббревиатур, альтернативных написаний, а также данные о Semantic Classes (например, списки городов, брендов, характеристик).

Какие метрики используются и как они считаются

Score (Оценка уточнения): Агрегированная метрика, показывающая, насколько хорошо кандидат в уточнение сочетает элементы Q1 и Q2. Рассчитывается путем суммирования весов n-grams кандидата, которые похожи на n-grams в Q1 и/или Q2.
Весовые коэффициенты (Weights): Используются для модуляции оценки. Патент предлагает несколько стратегий взвешивания:
- Предпочтение Q2: Вес(n-gram похожий на Q2) > Вес(n-gram похожий на Q1).
- Предпочтение пересечения: Вес(n-gram похожий на Q1 И Q2) > Вес(n-gram похожий только на Q1 ИЛИ Q2).
- Предпочтение редкости: Вес(Uncommon n-gram) > Вес(Common n-gram). Редкость может определяться на основе частоты встречаемости в Query Logs.
Threshold Score (Пороговая оценка): Предопределенное значение, используемое для принятия решения о замене Q2 на автоматически сгенерированное уточнение. Обеспечивает контроль качества автозамены.
Similarity (Сходство): Используется на этапах фильтрации. Определяется (похож/не похож) на основе лингвистических и семантических правил (синонимы, классы и т.д.).

Контекст сессии имеет приоритет: Google активно пытается понять намерение пользователя в рамках всей сессии, а не обрабатывает каждый запрос изолированно. Последовательные запросы интерпретируются как уточнение единого намерения.
Автоматическое переписывание запросов: Система может автоматически переписать и выполнить запрос (Q3), который пользователь не вводил, если она достаточно уверена (Score > Threshold), что этот запрос лучше отражает комбинированное намерение Q1 и Q2.
Зависимость от исторических данных: Способность системы генерировать релевантные уточнения напрямую зависит от наличия и качества данных в Query Logs. Уточнения основаны на том, что делали другие пользователи в прошлом.
Строгие правила для предотвращения ошибок: Механизм включает несколько уровней защиты от неверной интерпретации:
- Уточнение должно включать элементы ИЗ ОБОИХ запросов (Claim 1).
- Уточнение НЕ ДОЛЖНО включать элементы, отсутствующие в обоих запросах (Claim 3, опционально, для предотвращения Topic Drift).
- Должен быть превышен порог уверенности (Threshold Score).
Семантическое понимание для сопоставления: Система полагается не только на точное совпадение текста, но и на глубокое семантическое понимание (синонимы, аббревиатуры, Semantic Classes) для идентификации сходства между n-grams.
Основа для разговорного поиска: Этот механизм является фундаментальным для поддержки естественного диалога с поисковой системой.

Best practices (это мы делаем)

Анализ поисковых путей (Search Journeys): Необходимо исследовать, как пользователи уточняют запросы в вашей нише. Понимать, какие модификаторы (Q2) они обычно добавляют к общим запросам (Q1). Используйте инструменты анализа SERP и логи сервера для выявления этих паттернов.
Оптимизация под уточненный интент (Q3): Убедитесь, что ваш контент оптимизирован под финальный, комбинированный запрос (Q3), а не только под начальный (Q1). Если Q1=[кроссовки], а Q2=[для бега по пересеченной местности], ваш контент должен быть высоко релевантен Q3=[кроссовки для бега по пересеченной местности].
Структурирование контента для поддержки уточнений: Организуйте контент и архитектуру сайта таким образом, чтобы она отражала естественные пути уточнения. В E-commerce это означает четкую иерархию категорий и логичные фасетные фильтры, соответствующие атрибутам, которые пользователи используют в Q2. В контентных проектах — логичное покрытие темы от общего к частному.
Использование семантического сходства: Включайте в контент синонимы, распространенные аббревиатуры и различные формулировки, которые пользователи могут использовать на разных этапах поиска. Поскольку Google использует широкое определение Similarity, это поможет распознать вашу страницу как релевантную для Q3.
Оптимизация под семантические классы: Если ваш бизнес зависит от переменных атрибутов (например, локации, модели, цвета), убедитесь, что Google понимает структуру вашего контента и принадлежность сущностей к классам. Это поможет системе сопоставлять паттерны (например, [услуга] в [город]).

Worst practices (это делать не надо)

Изолированная оптимизация под Head Terms: Фокусировка только на высокочастотных общих запросах (Q1) без учета того, как пользователи их уточняют. Это приводит к привлечению трафика, который плохо конвертируется, так как не удовлетворяет финальный интент (Q3).
Игнорирование контекста сессии: Рассмотрение каждого ключевого слова как отдельной цели, игнорируя взаимосвязи между запросами и путь пользователя.
Создание запутанной структуры сайта: Архитектура, которая не поддерживает логичные пути уточнения (например, отсутствие фильтров по ключевым атрибутам), затрудняет пользователям поиск нужной информации и может снижать релевантность страниц для автоматически сгенерированных уточненных запросов (Q3).

Стратегическое значение

Этот патент подтверждает стратегический приоритет Google на понимание контекста и развитие разговорного поиска (Conversational Search). Для SEO это означает, что анализ изолированных ключевых слов уступает место анализу пользовательских сессий и интентов. Долгосрочная стратегия должна фокусироваться на построении тематического авторитета и создании контента, который сопровождает пользователя на всем пути поиска, от первоначального интереса до финального уточненного запроса. Понимание того, как Google комбинирует запросы, позволяет более точно прогнозировать трафик и оптимизировать контент под реальные потребности пользователей.

Практические примеры

Сценарий: Оптимизация локального бизнеса (Кафе)

Анализ паттернов: SEO-специалист определяет, что пользователи часто ищут Q1=[кафе рядом со мной] или Q1=[кафе в центре], а затем уточняют Q2=[с верандой] или Q2=[где тихо поработать].
Идентификация Q3: Система Google, вероятно, сгенерирует Q3=[кафе с верандой в центре] или Q3=[тихое кафе для работы рядом со мной].
Действия SEO: Необходимо убедиться, что на сайте кафе и в его профиле (Google Business Profile) явно указана информация о наличии веранды и атмосфере, подходящей для работы (используя соответствующие n-grams). Создать контент, оптимизированный под эти уточненные интенты (Q3).
Ожидаемый результат: Повышение видимости кафе не только по общим запросам, но и для пользователей с конкретными потребностями, когда Google автоматически выполняет уточненный запрос Q3.

Сценарий: E-commerce (Магазин электроники)

Анализ паттернов: Пользователь ищет Q1=[купить телевизор Samsung], затем Q2=[4K 55 дюймов].
Идентификация Q3: Google генерирует Q3=[купить телевизор Samsung 4K 55 дюймов].
Действия SEO: Убедиться, что листинги товаров или страницы категорий/фильтров точно соответствуют этому Q3. Использовать структурированные данные для четкой передачи характеристик (разрешение, диагональ). Архитектура сайта должна позволять легко найти эту комбинацию характеристик.
Ожидаемый результат: Сайт появляется в выдаче по точному запросу Q3, что повышает вероятность конверсии, так как контент точно соответствует уточненному намерению.

Как этот патент влияет на исследование ключевых слов?

Он смещает фокус с анализа изолированных запросов на анализ поисковых путей и сессий. SEO-специалистам необходимо понимать, как пользователи двигаются от общих запросов (Q1) к более конкретным (Q2) и какие комбинации (Q3) являются финальным интентом. Это требует более глубокого анализа связанных запросов, "People Also Ask" и паттернов поведения пользователей для выявления типичных уточнений в нише.

Применяется ли этот механизм только для голосового поиска?

Нет, он применяется ко всем типам ввода (текст, голос), но его ценность особенно высока для голосового и мобильного поиска. В этих сценариях пользователям неудобно вводить длинные, сложные запросы, и они чаще используют последовательные, разговорные фразы. Система помогает интерпретировать эти фразы как единый сложный запрос.

Как Google определяет, что два n-grams "похожи" (similar)?

Патент определяет сходство очень широко (Claim 1). Оно включает не только точное текстовое совпадение, но и синонимы, аббревиатуры (Москва/МСК), акронимы, альтернативное написание, разное грамматическое число (ресторан/рестораны), а также принадлежность к одному семантическому классу (например, распознавание разных городов как <city>).

Что такое "Семантический класс" (Semantic Class) и как он используется?

Это категория сущностей. Например, Q1=[авиабилеты в Париж]. Система распознает "Париж" как <city>. Если в Query Logs есть паттерн уточнений для [авиабилеты в <city>], система может применить эти паттерны к Парижу. Это позволяет обобщать поведение пользователей и применять паттерны даже к запросам, которые ранее не встречались в точной формулировке.

Что произойдет, если система не найдет подходящих уточнений в Query Logs?

Если система не находит исторических уточнений для Q1, которые также пересекаются с Q2, или если ни одно из найденных уточнений не превышает Threshold Score, система откатывается к стандартному поведению. В этом случае она просто выполнит второй запрос (Q2) так, как он был введен пользователем.

Как механизм предотвращает смещение темы (Topic Drift)?

Патент описывает строгий механизм фильтрации (Claim 3). Система может исключить любое уточнение, которое содержит термины, отсутствующие как в Q1, так и в Q2. Например, если Q1=[рестораны в Москве] и Q2=[итальянские], уточнение [итальянские рестораны в Москве с караоке] может быть исключено, так как "караоке" не присутствовало в исходных запросах.

Как влияют весовые коэффициенты на выбор уточнения?

Веса определяют, какие элементы запроса важнее. Патент предлагает повышать вес терминов из Q2 (так как это текущее уточнение), редких терминов (так как они более специфичны) и терминов, присутствующих в обоих запросах (Claims 13-15). Это помогает выбрать наиболее релевантное и точное уточнение среди нескольких кандидатов.

Может ли пользователь контролировать этот процесс?

Да. Патент упоминает возможность предоставления пользователю интерфейсного элемента (например, кнопки "Incorrect Query?"), позволяющего запросить результаты для исходного Q2, если автоматически сгенерированный Q3 оказался неверным. Это обеспечивает механизм обратной связи и контроля.

Как SEO-специалисту адаптировать контент под этот механизм?

Необходимо структурировать контент так, чтобы он логично отвечал на уточняющие вопросы. Используйте четкую иерархию, фасетную навигацию (для e-commerce) и семантически богатое наполнение. Убедитесь, что страницы, предназначенные для узких интентов (Q3), содержат все необходимые элементы из общих запросов (Q1) и модификаторов (Q2).

Влияет ли этот патент на ранжирование?

Напрямую нет, он не описывает факторы ранжирования. Однако он критически влияет на то, КАКОЙ запрос поступает в систему ранжирования (этап QUNDERSTANDING). Если система выбирает Q3 вместо Q2, то ранжирование будет происходить именно по Q3. Следовательно, понимание этого механизма необходимо для обеспечения релевантности контента итоговому запросу.

Как Google использует историю запросов в сессии для эффективного распознавания фраз (N-грамм) и понимания уточнений пользователя

Google оптимизирует процесс распознавания фраз (N-грамм) в запросе, анализируя предыдущий запрос пользователя в той же сессии. Если пользователь уточняет запрос, добавляя новые слова, система исключает эти новые слова из анализа N-грамм в сочетании со старыми терминами. Это повышает эффективность и позволяет точнее понять, какие слова являются единым понятием, а какие — дополнительными уточнениями.

US8359326B1
2013-01-22

Семантика и интент

Как Google понимает контекст последовательных запросов и переписывает их для уточнения интента пользователя

Google использует систему для интерпретации серийных запросов, особенно в голосовом поиске. Если новый запрос является уточнением предыдущего (например, [погода завтра], затем [а во вторник]), система генерирует варианты, комбинируя старый и новый интенты. Затем она ранжирует эти варианты на основе популярности и семантической логики, чтобы выполнить наиболее вероятный итоговый запрос пользователя ([погода во вторник]).

US9165028B1
2015-10-20

Семантика и интент

Как Google поддерживает контекст в диалоговом поиске, переписывая неполные запросы на основе предыдущих результатов и грамматических шаблонов

Google использует систему для понимания диалогового поиска. Если пользователь задает последующий неполный запрос (например, «напомни мне за час до этого»), система определяет контекст из предыдущего запроса (например, время рейса). Затем она использует грамматические шаблоны, чтобы переписать неполный запрос в полный и понятный для выполнения действия (например, «установить напоминание на 13:40 для рейса UA 214»).

US20180285444A1
2018-10-04

Семантика и интент

Как Google понижает вес уточняющих слов при последовательных запросах в рамках одной сессии

Google анализирует историю запросов пользователя в рамках одной сессии. Если новый запрос является прямым расширением предыдущего (например, "погода Москва" -> "погода Москва завтра"), система снижает вес добавленных терминов ("завтра") или делает их опциональными. Это гарантирует, что результаты останутся сфокусированными на исходном намерении пользователя, а уточнения используются как фильтры.

US8645409B1
2014-02-04

Семантика и интент
Персонализация

Как Google определяет локальный интент и предлагает уточнить запрос до его отправки в поиск

Google использует вероятностную модель, основанную на поведении пользователей, чтобы определить, имеет ли вводимый запрос локальный интент. Если вероятность высока, система предлагает пользователю добавить уточняющую информацию (например, местоположение) ещё до того, как запрос будет отправлен в поисковую систему. Это позволяет сразу формировать более точную и локализованную выдачу.

US8484190B1
2013-07-09

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность

Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.

US8751520B1
2014-06-10

SERP
Поведенческие сигналы
Семантика и интент

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования

Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.

US8661029B1
2014-02-25

Поведенческие сигналы
SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска

Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.

US8131754B1
2012-03-06

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей

Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.

US8732187B1
2014-05-20

Ссылки
Мультимедиа
Поведенческие сигналы

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)

Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.

US8572096B1
2013-10-29

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента

Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.

US11238116B2
2022-02-01

Knowledge Graph
Семантика и интент
EEAT и качество

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя

Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.

US7296016B1
2007-11-13

Персонализация
Поведенческие сигналы
SERP

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента

Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.

US9449095B1
2016-09-20

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов

Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.

US9009146B1
2015-04-14

Поведенческие сигналы
Семантика и интент
SERP