
Google использует систему для интерпретации поисковых запросов, которая разбивает текст запроса на все возможные комбинации фраз (фразификации). Система оценивает эти комбинации, используя вероятность существования фразы в индексе и предпочитая интерпретации с меньшим количеством длинных фраз. Это позволяет поисковой системе понимать запрос как набор концепций, а не просто набор ключевых слов.
Патент решает фундаментальную проблему интерпретации пользовательских запросов. Традиционные системы часто рассматривают запрос как "мешок слов" (bag of words), что приводит к потере концептуального значения, заложенного во фразах (например, разница между "New York" как фразой и "New" + "York" как отдельными словами). Изобретение предлагает механизм для систематического определения того, какие слова в запросе следует рассматривать как единую фразу (концепцию), а какие — как отдельные термины.
Запатентован метод "Фразификации" (Query Phrasification) входного текста, например, поискового запроса. Система генерирует все возможные варианты разбиения запроса на последовательности фраз (phrasifications). Каждая фразификация оценивается на основе статистической вероятности входящих в нее фраз и их количества. Цель — выбрать наиболее вероятную и семантически точную интерпретацию запроса.
Ключевой механизм работы системы:
Probability of Occurrence) и общее количество фраз в данной интерпретации.Высокая. Понимание запросов (Query Understanding) является критически важным элементом современного поиска. Хотя конкретные алгоритмы, описанные в этом патенте (поданном в 2007 году), вероятно, были дополнены или заменены более сложными нейросетевыми моделями (например, BERT, MUM), фундаментальный принцип — переход от ключевых слов к концепциям и фразам — остается центральным для Google. Этот патент описывает базовую логику и математическую модель для этого перехода.
Патент имеет высокое стратегическое значение (8/10). Он демонстрирует механизм, с помощью которого Google активно пытается идентифицировать концепции и сущности в запросе. Это подчеркивает, что SEO-стратегия должна фокусироваться на оптимизации под значимые фразы и темы, а не только на присутствии отдельных ключевых слов. Порядок слов и их сочетаемость имеют решающее значение для того, как Google поймет запрос и, соответственно, какой контент будет считать релевантным.
Claim 1 (Независимый пункт): Описывает основной метод идентификации валидных фраз во входном тексте (запросе), содержащем три или более слов.
disjoint union of component phrases).Probability of Occurrence) каждой составляющей фразы и (b) Общем количестве составляющих фраз в данной интерпретации (N).Система запрограммирована на то, чтобы предпочитать более длинные, концептуальные интерпретации запроса (например, ["New York restaurants"]) по сравнению с разбором на отдельные слова (["New" И "York" И "restaurants"]), при условии, что длинная фраза статистически вероятна.
Claim 5 (Зависимый от 1): Определяет конкретную математическую модель для оценки (Scoring Model).
Оценка (S) для фразификации рассчитывается по формуле:
S=f(N)⋅∑i=1NP(pi)⋅C(pi)
Где:
Эта формула является ядром изобретения. Она формализует интуитивное понимание того, что хорошая интерпретация запроса должна состоять из фраз, которые часто встречаются (высокий P), в которых система уверена (высокий C), и при этом общее количество фраз должно быть оптимизировано (через f(N)).
Изобретение применяется на этапе понимания запроса и влияет на последующее ранжирование.
QUNDERSTANDING – Понимание Запросов
Это основная область применения патента. Query Phrasification Module работает на этом этапе, принимая запрос пользователя и преобразуя его из текста (или Boolean Word Tree) в семантически обогащенное представление (Phrase Tree).
RANKING – Ранжирование
Результаты фразификации напрямую влияют на ранжирование. Phrase Tree передается модулю планирования запросов (Query Scheduling Module), который определяет, как искать документы, соответствующие именно этим фразам, а не отдельным словам.
Входные данные:
Boolean Word Tree (исходный запрос, возможно, дополненный синонимами).Phrase Data (статистика по известным фразам: P(pᵢ)).Выходные данные:
Phrase Tree (набор наилучших интерпретаций запроса).Процесс фразификации запроса (Query Phrasification):
Boolean Word Tree, представляющее запрос.Candidate Phrasifications). Phrase Scoring Function. S=f(N)∗∑i=1N[P(pi)∗C(pi)]
Boolean Phrase Tree, которое передается модулю планирования запросов (Query Scheduling Module).Патент фокусируется на обработке запроса и использовании предварительно рассчитанных данных о фразах.
Boolean Word Tree. Сюда также могут входить связанные слова (синонимы), добавленные на предыдущих этапах обработки.Probability of Occurrence).Система использует несколько ключевых метрик для оценки интерпретации запроса:
Scoring Model) явно разработан так, чтобы предпочитать фразификации с меньшим количеством фраз (Claim 1). Это означает, что при прочих равных условиях система выберет интерпретацию с более длинными и точными фразами.Probability of Occurrence фраз в индексе. Google предпочитает те фразы, которые реально используются в документах.Confidence C<1). Это означает, что прямое соответствие фразе из запроса может иметь приоритет над синонимичным соответствием.Probability of Occurrence).Probability of Occurrence, и Google вряд ли будет использовать их для интерпретации запросов.Confidence). Прямое использование целевой фразы (если она валидна) надежнее.Патент подтверждает стратегию Google, направленную на понимание естественного языка и концептуальный поиск. Для SEO это означает, что техническая оптимизация и ссылочное продвижение должны строиться на фундаменте глубокого понимания семантики и использования языка, который отражает реальные концепции в вебе. Долгосрочная стратегия должна фокусироваться на построении тематического авторитета (Topical Authority), где сайт становится источником для множества взаимосвязанных фраз и концепций в своей области.
Сценарий: Оптимизация страницы под запрос "best lightweight hiking boots"
Что такое "фразификация" (Phrasification) простыми словами?
Это процесс, с помощью которого Google решает, как интерпретировать запрос: как одно целое понятие, как набор из нескольких фраз или как набор отдельных слов. Система перебирает все варианты и выбирает наиболее вероятный, основываясь на статистике использования этих фраз в интернете.
Патент утверждает, что система предпочитает меньше длинных фраз. Что это значит для SEO?
Это означает, что Google стремится к точности (Precision). Если запрос "New York travel guide" может быть понят как одна фраза, система предпочтет это, а не поиск трех отдельных слов. Для SEO это подчеркивает важность оптимизации контента под полные, устоявшиеся фразы и концепции, а не под отдельные ключевые слова.
Как Google определяет, является ли фраза "валидной" или вероятной?
Валидность определяется метрикой Probability of Occurrence. Согласно патенту, эта вероятность основана на том, как часто фраза встречается в корпусе проиндексированных документов. Чем чаще фраза используется в вебе, тем выше ее вероятность и тем охотнее Google будет использовать ее для интерпретации запросов.
Стоит ли нам использовать больше синонимов в контенте, основываясь на этом патенте?
Патент показывает, что система учитывает синонимы (Related Words/Phrases) при фразификации, но присваивает им пониженный коэффициент уверенности (Confidence C<1). Это значит, что использование синонимов полезно для охвата, но основная оптимизация должна быть направлена на прямые, валидные фразы, которые используют пользователи.
Что такое функция f(N) и параметры Alpha/Beta?
Это математический механизм, позволяющий Google настраивать баланс между точностью и полнотой. f(N) штрафует интерпретации запроса, состоящие из большого количества коротких фраз (N). Параметры Alpha и Beta позволяют инженерам Google регулировать силу этого штрафа, тем самым определяя, насколько агрессивно система будет предпочитать длинные фразы коротким.
Влияет ли этот патент на работу с "длинным хвостом" (long-tail) запросов?
Да, напрямую. Длиннохвостые запросы часто сами по себе являются сложными фразами. Если система распознает такой запрос как одну валидную фразу (N=1), она будет искать документы, релевантные именно этой целостной концепции. Это дает преимущество страницам, точно оптимизированным под такие сложные фразы.
Как этот патент соотносится с современными алгоритмами, такими как BERT?
Этот патент (подача 2007 г.) описывает статистический подход к пониманию фраз, основанный на частотности и булевой логике. Современные модели, такие как BERT, используют нейросети для глубокого понимания контекста и связей между словами, не полагаясь только на статистику устоявшихся фраз. Однако цель у них общая — понять концепции в запросе. Этот патент можно рассматривать как одного из предшественников современных систем Query Understanding.
Нужно ли избегать использования предлогов или стоп-слов в ключевых фразах?
Нет, если они являются частью валидной фразы. Система оценивает вероятность фразы целиком. Если фраза "President of the United States" имеет высокую вероятность, система распознает ее как единое целое, включая стоп-слова. Важно использовать фразы в их естественном виде.
Как узнать, какие фразы Google считает валидными в моей нише?
Патент не предлагает инструмента для этого, но указывает, что валидность основана на частоте в корпусе. Практически это можно оценить, анализируя выдачу, подсказки Google (Google Suggest/Autocomplete), а также используя инструменты анализа семантики, которые опираются на большие данные о частотности фраз в интернете.
Меняет ли этот патент подход к внутренней перелинковке?
Да, это подтверждает важность использования точных, валидных фраз в анкорном тексте ссылок. Если анкорный текст распознается как высоковероятная фраза, это может служить сильным сигналом релевантности для целевой страницы именно по этой концепции, а не по отдельным словам анкора.

Индексация
Свежесть контента
Семантика и интент

Семантика и интент
SERP

Индексация
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Local SEO
Семантика и интент

Семантика и интент
Поведенческие сигналы

Ссылки
Индексация
Техническое SEO

Поведенческие сигналы

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Семантика и интент
Ссылки
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
Структура сайта
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
