Как Google корректирует вес ключевых слов на основе истории запросов в рамках одной сессии

Google анализирует последовательность запросов пользователя в рамках одной поисковой сессии. Если пользователь повторяет начало предыдущего запроса и добавляет новые слова (уточнения), система снижает вес этих новых слов. Это позволяет сохранить фокус на изначальном интенте и рассматривать добавленные термины как второстепенные уточнения, а не как изменение основного направления поиска.

Описание

Какую задачу решает

Патент решает проблему интерпретации уточняющих запросов (query refinements). Когда пользователь последовательно вводит запросы, добавляя новые термины к предыдущему запросу (например, «ноутбук» -> «ноутбук apple» -> «ноутбук apple отзывы»), стандартная поисковая система может придать новым терминам слишком большой вес. Это может сместить фокус поиска и ухудшить релевантность относительно изначального намерения. Изобретение направлено на улучшение понимания интента пользователя путем распознавания того, какие термины являются ядром поиска, а какие — уточнением.

Что запатентовано

Запатентована система для контекстуальной оценки поисковых терминов в рамках одной поисковой сессии (search session). Система отслеживает историю запросов и идентифицирует повторяющиеся упорядоченные последовательности терминов (predicate subsequence). Если текущий запрос содержит такую последовательность из предыдущего запроса плюс новые термины (subsequent search terms), система корректирует атрибуты (search term attributes) этих новых терминов, чтобы снизить их влияние на ранжирование по сравнению с повторяющейся последовательностью.

Как это работает

Механизм работает следующим образом:

Отслеживание сессии: Система группирует запросы пользователя в рамках одной search session.
Идентификация предикатов: При получении нового запроса система сравнивает его с предыдущими запросами сессии. Если новый запрос начинается с упорядоченной последовательности терминов, которая являлась предыдущим запросом, эта последовательность помечается как predicate subsequence.
Идентификация уточнений: Термины, следующие за predicate subsequence, помечаются как subsequent search terms.
Корректировка атрибутов: Система изменяет search term attributes для subsequent search terms. Это может включать снижение их веса (weight adjustment), перевод их в разряд опциональных (optionalization) или добавление их вариантов/синонимов (variant adjustment).
Результат: Поиск фокусируется на predicate subsequence (основном интенте), а subsequent search terms используются как фильтры или второстепенные факторы ранжирования.

Актуальность для SEO

Высокая. Понимание контекста сессии и эволюции запросов является фундаментальной задачей современных поисковых систем. Хотя методы понимания контекста значительно усложнились с появлением трансформерных моделей (BERT, MUM), базовый принцип, описанный в патенте — использование истории сессии для определения важности терминов — остается крайне актуальным для интерпретации сложных и последовательных поисковых взаимодействий.

Важность для SEO

Патент имеет умеренно высокое значение для SEO. Он раскрывает конкретный механизм того, как Google может интерпретировать важность различных частей длинного запроса, если он является уточнением предыдущего. Это подчеркивает стратегическую важность оптимизации под базовые запросы (которые станут predicate subsequence), поскольку именно они будут иметь наибольший вес при последующих уточнениях пользователя. Оптимизация только под длинный хвост без релевантности базовому запросу может быть менее эффективной.

Детальный разбор

Термины и определения

Search Session (Поисковая сессия): Серия запросов, поданных пользователем в течение определенного периода времени. Сессия может определяться временными рамками между запросами (например, перерыв более 10 минут завершает сессию), логином пользователя или тематической связностью запросов.
Ordered Sequence (Упорядоченная последовательность): Последовательность поисковых терминов в запросе в том порядке, в котором они были указаны.
Predicate Subsequence (Предикативная подпоследовательность): Упорядоченная последовательность терминов в текущем запросе, которая идентична предыдущему запросу, введенному в рамках той же поисковой сессии. Представляет собой предполагаемое ядро поискового интента.
Subsequent Search Term (Последующий поисковый термин): Один или несколько терминов в текущем запросе, которые следуют сразу после predicate subsequence. Представляют собой уточнение или фильтрацию основного интента.
Search Term Attribute (Атрибут поискового термина): Характеристика термина, используемая поисковой системой для его обработки. В патенте упоминаются вес (weight), опциональность (optionalization) и варианты (variants).
Weight Adjustment (Корректировка веса): Изменение веса (значимости) термина в запросе. В контексте патента — снижение веса subsequent search terms относительно predicate subsequence.
Optionalization (Опционализация): Процесс перевода термина из обязательного в опциональный. Результаты поиска не обязаны содержать этот термин, но его наличие может влиять на ранжирование.
Variant Adjustment (Корректировка вариантов): Модификация запроса путем добавления вариантов (синонимов, связанных терминов) для subsequent search term. Это расширяет поиск по уточнению, сохраняя фокус на предикате.
Term Cluster (Кластер терминов): Группа связанных терминов, часто встречающихся вместе или являющихся взаимозаменяемыми в логах запросов. Используется для поиска вариантов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод контекстуальной оценки.

Система получает доступ к первому и второму запросам, полученным в рамках одной search session, причем второй запрос получен после первого. Оба запроса состоят из упорядоченных последовательностей терминов.
Система сравнивает второй запрос с первым и определяет, что второй запрос содержит predicate subsequence, которая является первым запросом, и что после этой подпоследовательности расположен как минимум один дополнительный термин.
В ответ на это определение:
- Термин, следующий за предикатом, идентифицируется как subsequent search term.
- Модифицируется относительная важность (relative importance) предикативной подпоследовательности по отношению к последующему термину.
Модификация включает относительное изменение веса, связанного с subsequent search term. Это изменение приводит к тому, что вес последующего термина в контексте второго запроса становится меньше, чем вес того же термина, если бы он был включен в запрос без этого предиката в рамках той же сессии.
Пункт также описывает условие отмены: Если в той же сессии получен третий запрос, который содержит subsequent search term, но не содержит predicate subsequence (ни первый, ни второй запрос), то относительная важность этого термина не модифицируется.

Ядро изобретения — это динамическое снижение веса уточняющих терминов, но только при условии, что они следуют за повторяющимся из предыдущего запроса предикатом. Это подтверждает, что система интерпретирует повторение как сигнал важности предиката.

Claim 2 (Зависимый): Уточняет, что модификация важности — это относительное снижение веса subsequent search term по сравнению с весом predicate subsequence.

Claim 3 (Зависимый): Уточняет альтернативный способ модификации важности: идентификация варианта (variation) для subsequent search term и модификация запроса для включения этого варианта.

Где и как применяется

Изобретение применяется на этапе обработки и интерпретации запроса пользователя.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система (Contextual Search Term Evaluator) анализирует входящий запрос в контексте текущей search session.

Анализ истории сессии: Система должна иметь доступ к истории предыдущих запросов в рамках сессии (Session Log).
Распознавание структуры запроса: Query Analysis Module определяет, является ли текущий запрос продолжением предыдущего (наличие predicate subsequence и subsequent search terms).
Переписывание/Модификация запроса: Если структура распознана, система модифицирует запрос перед передачей его на этап ранжирования. Это включает снижение весов, опционализацию или добавление вариантов (используя Variant Data).

RANKING – Ранжирование
Алгоритмы ранжирования используют модифицированный запрос, полученный с этапа QUNDERSTANDING. Поскольку веса уточняющих терминов снижены, система ранжирования будет отдавать приоритет документам, которые наиболее релевантны основному предикату.

Входные данные:

Текущий поисковый запрос.
История предыдущих запросов в рамках текущей search session.
Данные о вариантах и кластерах терминов (для Variant Adjustment).

Выходные данные:

Модифицированное представление запроса с скорректированными атрибутами терминов (веса, опциональность, добавленные варианты).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на информационные и транзакционные запросы, где пользователи часто используют последовательное уточнение для фильтрации или углубления в тему. Например, в e-commerce («кроссовки» -> «кроссовки nike» -> «кроссовки nike air max») или при поиске информации («python tutorial» -> «python tutorial beginners»).
Конкретные типы контента: Влияет на все типы контента, но особенно заметно там, где существует иерархия или фасетная навигация, которую пользователи имитируют через запросы.

Когда применяется

Алгоритм применяется при выполнении строго определенных условий в реальном времени во время поисковой сессии:

Условие 1 (Сессия): Пользователь должен находиться в активной search session и ввести как минимум два запроса.
Условие 2 (Структура): Текущий запрос должен содержать predicate subsequence, которая идентична одному из предыдущих запросов сессии.
Условие 3 (Уточнение): В текущем запросе должны присутствовать subsequent search terms, следующие за предикатом.

Исключения: Как указано в Claim 1, если пользователь вводит новый запрос, содержащий уточняющий термин, но без предиката, корректировка веса не применяется.

Пошаговый алгоритм

Процесс контекстуальной оценки запроса:

Начало обработки. Система получает новый поисковый запрос в рамках активной поисковой сессии.
Сравнение с историей сессии. Система сравнивает упорядоченную последовательность терминов текущего запроса с упорядоченными последовательностями предыдущих запросов в этой сессии.
Идентификация предиката. Определяется, включает ли текущий запрос predicate subsequence, которая идентична одному из предыдущих запросов.
- Если НЕТ: Завершить процесс, обработать запрос стандартным образом.
- Если ДА: Перейти к шагу 4.
Идентификация последующих терминов. Идентифицируются все термины, расположенные после predicate subsequence. Они помечаются как subsequent search terms.
Корректировка атрибутов. Система применяет один или несколько методов корректировки к subsequent search terms:
- Снижение веса: Вес последующих терминов уменьшается относительно веса терминов в предикате (например, масштабирование веса до 0.5).
- Опционализация: Последующие термины помечаются как необязательные для поиска, но используемые для ранжирования.
- Добавление вариантов: Система ищет синонимы или связанные термины (из Term Clusters) для последующих терминов и добавляет их в запрос с низким весом (например, через оператор OR).
Завершение обработки. Модифицированный запрос с новыми атрибутами передается в поисковую систему для выполнения поиска и ранжирования.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о поведении пользователя в реальном времени и предварительно вычисленных данных о связях между терминами.

Поведенческие факторы: Критически важными данными являются последовательности запросов в рамках текущей Search Session. Именно анализ этой последовательности запускает весь механизм.
Системные данные (Офлайн): Для реализации Variant Adjustment система использует предварительно рассчитанные Term Clusters или данные о статистической связи между терминами, полученные из анализа общих логов запросов (query logs).

Какие метрики используются и как они считаются

Веса терминов (Term Weights): Система использует веса для определения значимости терминов. В патенте приводится пример нормализации весов: терминам предиката может быть присвоен вес 1.0, а последующим терминам — сниженный вес, например, 0.5. Эти веса могут использоваться для масштабирования оценок релевантности (например, IR scores).
Упорядоченность (Ordering): Строгая проверка порядка слов для идентификации predicate subsequence.
Статистические связи: Используются для идентификации вариантов. Упоминаются методы кластеризации (например, k-means clustering) для группировки терминов, которые статистически связаны или часто путаются друг с другом.

Выводы

Контекст сессии определяет вес слов: Google может динамически изменять значимость (вес) ключевых слов в запросе, основываясь на том, что пользователь искал непосредственно перед этим. Повторение запроса — сильный сигнал о том, что он является ядром интента.
Уточнения имеют меньший вес, чем ядро запроса: Термины, добавленные к предыдущему запросу (subsequent search terms), интерпретируются как фильтры или уточнения. Система активно снижает их вес, чтобы сохранить фокус поиска на основном интенте (predicate subsequence).
Гибкость в обработке уточнений: Система может не только снижать вес уточнений, но и делать их опциональными (optionalization) или автоматически расширять их синонимами (variant adjustment). Это позволяет найти баланс между следованием точному запросу и обеспечением полноты выдачи.
Зависимость от структуры запроса: Механизм активируется только при строгом соблюдении порядка слов, когда новый запрос буквально начинается с предыдущего запроса. Изменение порядка слов или удаление слов из начала запроса не активирует этот механизм корректировки.
Интерпретация интента: Патент демонстрирует механизм, позволяющий системе делать вывод о намерениях пользователя: «Пользователь все еще ищет X, но теперь хочет отфильтровать результаты по Y», вместо «Пользователь теперь ищет X+Y как единое целое».

Практика

Best practices (это мы делаем)

Фокус на базовых интентах (Head/Body Keywords): Необходимо обеспечить максимальную релевантность и авторитетность сайта по базовым запросам, с которых пользователи начинают поиск в нише. Поскольку эти запросы становятся predicate subsequence и сохраняют максимальный вес при уточнениях, оптимизация под них является приоритетной.
Анализ путей пользователя (Search Journeys): Изучайте, как пользователи уточняют запросы в вашей тематике. Понимание типичных subsequent search terms позволяет создавать контент, который отвечает на эти уточнения, но не теряет связь с основным интентом.
Комплексное покрытие темы (Topical Coverage): Создавайте страницы, которые полностью покрывают базовый интент и включают информацию по частым уточнениям. Это гарантирует, что страница останется релевантной как для исходного запроса, так и для уточненного, даже если вес уточнений будет снижен.
Использование синонимов для уточнений: Поскольку система может применять Variant Adjustment к уточняющим терминам, полезно использовать естественные синонимы и связанные термины на странице для повышения вероятности соответствия расширенному запросу.

Worst practices (это делать не надо)

Оптимизация исключительно под длинный хвост: Создание страниц, оптимизированных только под очень специфические, длинные запросы, без учета базового интента. Если пользователь придет к этому запросу последовательно, система может понизить вес специфических уточнений, и страница окажется нерелевантной ядру поиска.
Игнорирование основного интента на странице: Создание контента, который слишком сильно фокусируется на второстепенных ключевых словах (которые могут быть subsequent search terms) в ущерб основному запросу (predicate subsequence).
Keyword Stuffing в надежде покрыть все варианты: Попытка агрессивно оптимизировать текст под все возможные комбинации запросов. Лучше сфокусироваться на четком ответе на базовый интент и его естественных уточнениях.

Стратегическое значение

Патент подтверждает важность понимания не только отдельных запросов, но и всего процесса поиска пользователя (Search Journey). Для Google важен контекст сессии. Стратегически это означает, что построение авторитетности должно идти от общего к частному: сначала сайт должен быть признан релевантным по широкой теме (базовый запрос), чтобы затем успешно ранжироваться по уточнениям этой темы. Система предпочитает результаты, которые сильно релевантны ядру запроса, даже если они чуть слабее соответствуют уточняющим словам.

Практические примеры

Сценарий: Последовательный поиск в E-commerce

Запрос 1 (Q1): Пользователь вводит «Running Shoes». Система обрабатывает запрос стандартно.
Запрос 2 (Q2): Пользователь уточняет, вводя «Running Shoes Nike».
Анализ Системы:
- Predicate Subsequence: «Running Shoes» (идентичен Q1).
- Subsequent Search Term: «Nike».
Действие Системы: Снижает вес термина «Nike». Например, Q2 интерпретируется как: (Running[вес 1.0] AND Shoes[вес 1.0]) AND (Nike[вес 0.5]).
Результат для SEO: В выдаче будут доминировать страницы, максимально релевантные «Running Shoes» (например, общие категории магазинов), а наличие «Nike» будет использоваться для фильтрации или бустинга внутри этого набора. Страница, оптимизированная только под «Nike», но слабо релевантная «Running Shoes», проиграет.
Запрос 3 (Q3): Пользователь вводит «Nike Air Max».
Анализ Системы: Predicate Subsequence не найдена (Q3 не начинается ни с Q1, ни с Q2).
Действие Системы: Обрабатывает Q3 стандартно, без снижения весов (как указано в исключении Claim 1).

Вопросы и ответы

Означает ли этот патент, что ключевые слова из «длинного хвоста» менее важны?

Не совсем. Они остаются важными для конверсии и точного ответа на интент. Однако патент показывает, что если пользователь приходит к длинному запросу путем последовательного уточнения, то наибольший вес сохраняют термины из начала запроса (predicate subsequence). Это значит, что для успешного ранжирования по длинному хвосту необходимо также быть высоко релевантным базовому запросу, который ему предшествовал.

Как Google определяет границы поисковой сессии (Search Session)?

Патент упоминает несколько способов: по времени между запросами (например, перерыв в 5-10 минут завершает сессию), по явному входу/выходу пользователя из системы или по смене темы запросов (например, переход от поиска цифровых камер к поиску погоды). На практике Google использует комбинацию этих сигналов для определения границ сессии.

Что произойдет, если пользователь изменит порядок слов в запросе?

Механизм, описанный в данном патенте, строго зависит от упорядоченной последовательности (Ordered Sequence). Если пользователь меняет порядок слов (например, «Atlanta weather» -> «weather forecast Atlanta»), система не распознает «Atlanta weather» как predicate subsequence в новом запросе в том виде, как это описано в патенте. Запрос будет обработан стандартными алгоритмами понимания запросов.

Что такое «Опционализация» (Optionalization) последующего термина?

Это один из способов снижения влияния термина. Если термин опционализирован, поисковая система не требует его обязательного присутствия в документе для включения документа в результаты поиска. Однако, если термин присутствует, это может повысить ранжирование документа. Это позволяет сохранить фокус на предикате, но использовать уточнение для сортировки.

Как работает «Корректировка вариантов» (Variant Adjustment)?

Если система идентифицирует subsequent search term, она может расширить запрос, добавив его синонимы или связанные термины (из Term Clusters). Например, если запрос «used hybrid automobile», где «automobile» — последующий термин, система может интерпретировать его как («used hybrid») AND («automobile» OR «car» OR «auto»). Это делает уточнение более широким, сохраняя акцент на предикате.

Применяется ли этот механизм, если пользователь удаляет слова из предыдущего запроса?

Нет. Патент описывает ситуацию, когда предыдущий запрос полностью содержится в новом запросе как predicate subsequence, и к нему добавляются новые термины. Удаление терминов (сокращение запроса) не подпадает под логику работы этого изобретения и обрабатывается иначе.

Как этот патент соотносится с современными моделями типа BERT или MUM?

Этот патент описывает более ранний, вероятно, основанный на правилах (rules-based) подход к пониманию контекста сессии. Современные модели, такие как MUM, способны понимать контекст сессии на гораздо более глубоком семантическом уровне, не требуя строгого повторения порядка слов. Однако логика, заложенная в патенте (повторение = важность), вероятно, интегрирована в обучение этих моделей или может использоваться как дополнительный эвристический слой в Query Understanding.

Влияет ли этот механизм на подбор подсказок (Autocomplete)?

Патент напрямую не описывает работу Autocomplete. Он фокусируется на обработке уже введенного запроса. Однако данные о том, как пользователи последовательно уточняют запросы (какие subsequent search terms часто следуют за predicate subsequence), безусловно, используются для генерации и ранжирования поисковых подсказок.

Может ли этот механизм объяснить, почему категорийные страницы часто ранжируются выше карточек товаров по уточненным запросам?

Да, это может быть одним из объяснений. Если пользователь ищет «Ноутбук» (Q1), а затем «Ноутбук Dell XPS 13» (Q2), система придаст наибольший вес слову «Ноутбук». Категорийная страница часто лучше оптимизирована под этот общий запрос, чем карточка конкретного товара. Термины «Dell XPS 13» будут иметь сниженный вес, помогая отфильтровать выдачу, но основа ранжирования останется за релевантностью к слову «Ноутбук».

Как SEO-специалисту использовать эти знания при проектировании структуры сайта?

Это подчеркивает важность иерархической структуры, где общие категории хорошо оптимизированы под базовые интенты (потенциальные predicate subsequences). Страницы нижнего уровня (товары, статьи с уточнениями) должны наследовать релевантность от верхних уровней и четко отвечать на subsequent search terms. Структура должна отражать естественный путь пользователя от общего к частному.