
Google оптимизирует процесс распознавания фраз (N-грамм) в запросе, анализируя предыдущий запрос пользователя в той же сессии. Если пользователь уточняет запрос, добавляя новые слова, система исключает эти новые слова из анализа N-грамм в сочетании со старыми терминами. Это повышает эффективность и позволяет точнее понять, какие слова являются единым понятием, а какие — дополнительными уточнениями.
Патент решает две ключевые проблемы при обработке поисковых запросов. Во-первых, он снижает вычислительную сложность (computationally intensive) анализа N-грамм, так как проверка всех возможных комбинаций слов в запросе ресурсоемка. Во-вторых, он повышает точность интерпретации запросов, помогая отличить устойчивые фразы (например, "hot dog") от случайной последовательности ключевых слов, особенно когда пользователь уточняет свой поиск.
Запатентована система контекстуального анализа N-грамм (в частности, биграмм), которая использует историю запросов в рамках одной поисковой сессии (Search Session). Суть изобретения — в выборочном исключении определенных комбинаций слов из анализа N-грамм. Если пользователь уточняет запрос, добавляя или изменяя термины, система предполагает, что эти новые термины не образуют фразу с терминами, перенесенными из предыдущего запроса.
Механизм работает путем сравнения последовательных запросов в сессии:
ordinal position) в Q1 и Q2. Выделяются Common Terms (общие термины, сохранившие позицию) и Differing Search Terms (новые или перемещенные термины).N-грамм пары, состоящие из Common Term и смежного с ним Differing Search Term.Высокая. Понимание контекста сессии и точная интерпретация эволюционирующего намерения пользователя являются фундаментальными задачами современных поисковых систем. Хотя методы распознавания фраз эволюционировали с появлением нейронных сетей (BERT/MUM), базовая логика использования истории сессии для эффективной и точной сегментации запроса остается крайне актуальной.
Патент имеет умеренное значение (6/10) для SEO. Он не описывает факторы ранжирования, но критически важен для понимания этапа Query Understanding. Он объясняет, как Google интерпретирует составные и уточненные запросы. Точное определение границ N-грамм и модификаторов напрямую влияет на расчет релевантности. Понимание этого механизма важно для разработки стратегий, ориентированных на всё поисковое путешествие пользователя (Search Journey).
predefined proximity), которая может определяться временем или семантической связью.Ordinal Position в обоих запросах.Ordinal Position. Включают Additional и Substitute термины.Document Corpora).Claim 1 (Независимый пункт): Описывает основной метод контекстуального анализа биграмм с учетом позиций.
differing search terms в Q2 (термины, отсутствующие в Q1).common terms. Критическое условие: термин должен быть в обоих запросах И иметь одинаковую порядковую позицию в Q1 и Q2.adjacent common terms (общие термины, находящиеся рядом друг с другом в обоих запросах).adjacent common terms на анализ биграмм для Q2.differing search terms из анализа биграмм для Q2 (в комбинации с общими терминами).Ядро изобретения — использование контекста сессии и строгого требования к сохранению позиции для сокращения пространства анализа. Если слово добавлено или перемещено, оно исключается из анализа в комбинации со старыми терминами.
Claim 9 (Независимый пункт): Обобщает метод Claim 1 для N-грамм любой длины.
Логика идентична Claim 1, но применяется к n-gram analysis. Система исключает различающиеся термины из анализа N-грамм в текущем запросе, основываясь на сравнении с предыдущим запросом и порядковыми позициями.
Claims 3, 4, 10 (Зависимые пункты): Уточняют обработку различающихся терминов.
Хотя различающиеся термины исключаются из анализа в комбинации с общими терминами, они могут быть проанализированы между собой. Если несколько Additional или Substitute терминов идут подряд, они могут быть отправлены на анализ N-грамм отдельно.
Изобретение применяется на этапе интерпретации запроса для его предобработки.
QUNDERSTANDING – Понимание Запросов
Это основная фаза применения. Contextual Bigram Analysis System работает как модуль обработки запроса в реальном времени для определения его структуры.
Session Identification Component определяет, является ли запрос частью активной сессии, используя Session Log.Query Comparison Component сравнивает текущий запрос с предыдущим.Potential Bigram Identification Component применяет логику исключения.Search Engine (на этап Ранжирования) либо с разметкой исключенных пар, либо уже реформулированный с идентифицированными N-граммами.INDEXING – Индексирование и извлечение признаков
На этом этапе происходит необходимый офлайн-процесс: статистический анализ Document Corpora для генерации базы Known Bigrams.
Входные данные:
Known Bigrams.Выходные данные:
N-граммами и исключенными парами.Common Term) с Q1 (с учетом позиции) И хотя бы один различающийся термин (Differing Search Term).Common Terms по строгому определению, механизм не активируется.Процесс обработки запроса в реальном времени
Ordinal Positions в Q1 и Q2.Common Term и смежного Differing Term, как не подлежащие анализу N-грамм (Exclude Differing Search Terms from Bigram Analysis).Common Terms.Differing Terms.Known N-grams.Ordinal Position (порядок слов) являются критически важными входными данными для сравнения Q1 и Q2.Session Log). Идентификатор пользователя и временные метки используются для определения границ сессии.Known Bigrams, предварительно рассчитанная офлайн на основе анализа Document Corpora.Система использует преимущественно логические операции сравнения и статистические данные:
Known Bigrams.Query Understanding.Differing Terms), добавленные к запросу, являются модификаторами или новыми концепциями, а не частью фразы со старыми словами (Common Terms). Это позволяет исключить маловероятные комбинации из анализа.N-грамм и одновременно на повышение точности за счет избегания ложного распознавания фраз при обработке уточняющих запросов.N-граммами), а какие — модификаторами.Known Bigrams.ordinal position учитывается при распознавании фраз.Ordinal Position указывает на важность структуры фразы. Не стоит полагаться на то, что Google "поймет" намерение, если порядок слов в контенте неестественен.Document Corpora) для идентификации Known Bigrams.Патент подтверждает стратегический переход от анализа изолированных запросов к анализу поведения пользователя в рамках сессии. Для SEO это означает, что стратегически важно понимать весь путь пользователя (Customer Journey Map) и то, как контент сайта соответствует различным этапам этого пути. Google интерпретирует намерение динамически, сегментируя уточненные запросы на основе предыдущих действий пользователя.
Сценарий 1: Уточнение запроса в E-commerce
Common Terms (сохранили позицию): "Холодильник", "Samsung", "RB37J". Они анализируются на N-граммы.Differing Term: "отзывы".Сценарий 2: Изменение порядка слов (Сброс контекста)
Ordinal Position изменился. Согласно строгому определению Claim 1, нет Common Terms.Напрямую ли этот патент влияет на ранжирование?
Нет, напрямую не влияет. Патент описывает механизм на этапе понимания запроса (Query Understanding). Он помогает Google более точно и эффективно интерпретировать, что ищет пользователь, определяя, какие слова являются фразой, а какие — отдельными ключевыми словами. Точное понимание запроса затем позволяет системе ранжирования лучше подобрать релевантные документы.
Что такое "Ordinal Position" и почему это так важно в этом патенте?
Ordinal Position — это порядковый номер слова в запросе. Это критически важно, потому что патент требует, чтобы слова не просто присутствовали в обоих запросах, но и находились на одном и том же месте, чтобы считаться Common Terms. Если пользователь меняет порядок слов (например, с "A B" на "B A"), система считает, что контекст изменился, и не применяет логику контекстуального исключения.
Что патент определяет как "поисковую сессию"?
Патент предлагает несколько вариантов определения границ сессии (Session Boundary). Это может быть фиксированный период времени между запросами от одного пользователя (например, 5-10 минут бездействия завершают сессию). Также это может определяться входом/выходом пользователя из системы или анализом смысловой взаимосвязи между запросами (например, наличие общих терминов).
Означает ли этот патент, что Google игнорирует новые слова в уточненном запросе?
Абсолютно нет. Новые слова (Differing Search Terms) полностью учитываются при поиске. Патент лишь описывает, что эти новые слова исключаются из анализа N-грамм в комбинации со старыми словами (Common Terms). Это помогает избежать ошибочного предположения, что новое слово образует устойчивую фразу со словом, рядом с которым оно было добавлено.
Если я добавлю два новых слова подряд, будут ли они проанализированы как N-грамма?
Да. Патент уточняет (Claims 3, 4, 10), что хотя новые слова (Differing Terms) исключаются из анализа в паре со старыми словами (Common Terms), они могут быть проанализированы на предмет образования N-граммы между собой. Например, если Q1="A B", а Q2="A B C D", то "B C" исключается, но "C D" может быть проанализировано.
Как SEO-специалисту использовать эту информацию на практике?
Основное применение — это понимание того, как Google сегментирует сложные запросы. При создании контента важно фокусироваться на естественных N-граммах (основное понятие) и покрывать релевантные уточнения (модификаторы). Также важно изучать сценарии поиска пользователей (Search Journeys), чтобы понять, как эволюционируют запросы от общих к конкретным.
Является ли этот механизм устаревшим с появлением BERT и MUM?
Хотя современные модели (BERT, MUM) используют гораздо более сложные методы для понимания контекста, базовая идея использования контекста сессии для интерпретации запроса остается фундаментальной. Этот патент описывает конкретную эвристику для повышения эффективности и точности сегментации запроса, которая может использоваться наряду с нейросетевыми моделями.
Откуда Google берет список "Известных N-грамм" (Known N-grams)?
Список Known N-grams генерируется офлайн путем статистического анализа больших корпусов документов (Document Corpora), таких как веб-индекс. Система использует статистические методы для выявления пар или групп слов, которые появляются вместе значительно чаще, чем можно было бы ожидать случайно.
Какова основная польза этого патента для Google: экономия ресурсов или улучшение качества поиска?
Обе цели. Экономия ресурсов (повышение эффективности) достигается за счет сокращения количества пар слов, которые нужно анализировать. Улучшение качества поиска (повышение точности) достигается за счет более точной интерпретации намерений пользователя при уточнении запроса и предотвращения ошибочного распознавания случайных сочетаний слов как фраз.
Что происходит, если система ошибочно исключит реальную N-грамму из анализа?
Если система исключит пару слов из анализа N-грамм, эти слова будут обработаны как отдельные ключевые слова. Это может привести к немного менее точной интерпретации запроса. Однако эвристика патента основана на предположении, что при уточнении запроса новые слова чаще являются модификаторами, а не частью новой фразы со старыми словами.

Семантика и интент
Поведенческие сигналы

Семантика и интент

Семантика и интент
Персонализация

Семантика и интент

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
Ссылки
SERP

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
EEAT и качество
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
Персонализация
SERP

Ссылки
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP
