
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
Патент решает задачу идентификации различных формулировок запросов, которые имеют одинаковое семантическое значение (интент), особенно когда эти запросы структурированы вокруг сущностей. Система стремится понять, являются ли две разные фразы (шаблоны) синонимичными, анализируя, ищут ли пользователи одну и ту же информацию, используя эти разные фразы. Это улучшает понимание запросов (Query Understanding) и позволяет поисковой системе предоставлять релевантные результаты, даже если точная формулировка запроса варьируется.
Запатентована система для определения семантической эквивалентности между шаблонами запросов (Query Templates), которые содержат идентификатор коллекции сущностей (Entity Collection). Изобретение использует анализ прошлых запросов и поведение пользователей (показатели кликов), чтобы рассчитать меру сходства (Similarity Measure) между двумя шаблонами. Если сходство высоко, шаблоны признаются эквивалентными, а их текстовые части — синонимичными.
Система сравнивает два шаблона запроса с одинаковой коллекцией сущностей (например, T1: [продолжительность жизни в <Страна>] и T2: [средний возраст смерти в <Страна>]).
Document Selection Rate (DSR) и Term Selection Rate (TSR, агрегированный как HMTSR) для общих документов.Similarity Measure. Если она превышает порог, шаблоны считаются эквивалентными.Высокая. Понимание синонимов, парафразов и семантической эквивалентности является фундаментальной задачей для современных поисковых систем. С ростом значимости сущностей (Entities) и структурированных данных, методы, описанные в этом патенте, крайне актуальны для точной интерпретации интента пользователя и улучшения качества поиска в 2025 году.
Патент имеет высокое значение (8/10) для SEO. Он раскрывает механизм, с помощью которого Google изучает взаимозаменяемость ключевых фраз на основе реального поведения пользователей, а не только лингвистического анализа. Это подчеркивает стратегический сдвиг от фокусировки на точных ключевых словах к оптимизации под интент и сущности. Понимание этого механизма позволяет SEO-специалистам сосредоточиться на создании контента, который удовлетворяет потребность пользователя (и получает клик), а не на переборе всех возможных синонимов в тексте.
Entity Similarity Measures и/или количества общих сущностей.Claim 1 (Независимый пункт): Описывает основной метод определения эквивалентности шаблонов запросов на основе поведения пользователей и количества общих сущностей.
Document Selection Rates (DSR1 и DSR2) для документа D.Similarity Measure (SM) на основе DSR1, DSR2, а также сравнения количества общих сущностей с пороговым значением.Claim 2 (Зависимый от 1): Добавляет использование Term Selection Rates (TSR).
Расчет Similarity Measure дополнительно основывается на TSR для терминов из T1 и T2 по отношению к документу D.
Claim 4 и 5 (Зависимые от 2): Детализируют расчет с использованием Гармонического среднего (HMTSR).
Рассчитывается гармоническое среднее TSR для терминов T1 (HMTSR1) и T2 (HMTSR2) (Claim 4). Вклад документа в Similarity Measure определяется как минимальное значение из двух произведений: (DSR1 * HMTSR1) и (DSR2 * HMTSR2) (Claim 5). Это гарантирует, что оба шаблона должны иметь как высокий DSR, так и высокий HMTSR для данного документа.
Claim 7 (Зависимый от 1): Вводит фильтрацию документов.
Система определяет, что документ D не является multi-attribute document. Документ используется в анализе, только если он сфокусирован на ограниченном числе атрибутов.
Claim 13 (Независимый пункт): Альтернативный метод, основанный только на количестве общих сущностей.
entity groups), для которых существуют инстанциации как T1, так и T2.Изобретение является ключевым компонентом этапа понимания запросов и используется для расширения и уточнения запросов.
QUNDERSTANDING – Понимание Запросов
Основное применение. Система использует этот механизм для построения базы данных синонимов и эквивалентных шаблонов запросов. Это происходит в офлайн-режиме путем анализа больших объемов данных из журналов запросов (record of past queries) и поведения пользователей.
Similarity Measure между парами шаблонов.RANKING / RERANKING – Ранжирование / Переранжирование
В онлайн-режиме система применяет полученные знания.
Входные данные:
selections).Выходные данные:
multi-attribute documents, предпочитая страницы с узким фокусом.Entity Collection и встречаются в логах запросов с достаточной частотой.multi-attribute documents, чтобы избежать ложных корреляций.Офлайн-процесс: Определение эквивалентности шаблонов (T1 и T2)
Entity Collection (EC).Entity Similarity Measure:multi-attribute documents (Claim 7).Document Selection Rate для T1 (DSR1) и T2 (DSR2).Term Selection Rates для терминов T1 и T2. Затем вычисляется гармоническое среднее (HMTSR1 и HMTSR2) (Claim 4).Entity Similarity Measure для сущности E.Similarity Measure между T1 и T2 на основе агрегации Entity Similarity Measures и данных о покрытии из Шага 3.Similarity Measure превышает порог, T1 и T2 помечаются как семантически эквивалентные, а их текстовые части — как синонимы.record of past queries) и данные о кликах (selections). Эти данные необходимы для расчета Document Selection Rate (DSR) и Term Selection Rate (TSR).Entities), их алиасах и принадлежности к коллекциям (Entity Collections). Это необходимо для идентификации шаблонов запросов и их инстанциаций.Multi-attribute document).Entity Collections. Эквивалентность определяется не абстрактно, а в контексте конкретного типа сущности. Фраза может быть синонимом в одном контексте (например, для городов) и не быть в другом.DSR (популярность документа для запроса) и HMTSR (насколько документ релевантен *всем* терминам запроса). Использование гармонического среднего (HMTSR) обеспечивает высокое качество оценки релевантности.Entity Similarity), но и достаточное количество самих сущностей, демонстрирующих такое поведение (Quantity of Common Entities, Claims 1 и 13).multi-attribute documents (Claim 7) указывает на то, что для калибровки системы понимания языка Google предпочитает документы, сфокусированные на одном конкретном атрибуте сущности, а не обзорные страницы.DSR), и Google сможет связать различные формулировки запросов с этой страницей.multi-attribute documents, создавайте страницы, посвященные конкретным атрибутам сущностей, если это целесообразно. Например, отдельная страница «Срок службы батареи iPhone 16» может быть более полезной для системы, чем общий обзор iPhone 16, включающий один абзац о батарее.Query Templates.DSR) является прямым сигналом для этой системы. Работайте над привлекательными сниппетами и соответствием контента заголовку, чтобы максимизировать вероятность выбора вашего документа.multi-attribute documents.DSR), она не поможет Google установить семантическую эквивалентность и, вероятно, будет ранжироваться хуже по связанным запросам.Этот патент подтверждает стратегию Google по переходу от анализа ключевых слов к пониманию интента через анализ сущностей и поведения пользователей. Он показывает, как именно пользовательские данные используются для обучения NLP-моделей. Для SEO это означает, что долгосрочная стратегия должна базироваться на глубоком понимании целевой аудитории, её потребностей (интентов) и создании контента, который эти потребности наилучшим образом удовлетворяет, что подтверждается поведенческими метриками.
Сценарий: Оптимизация сайта о путешествиях
DSR). Google увидит это поведение для Парижа, Лондона, Рима и т.д. (Quantity of Common Entities). Система определит, что эти три шаблона эквивалентны, и страница будет высоко ранжироваться по всем синонимичным запросам.Как система определяет, что два шаблона запросов эквивалентны?
Система использует два основных фактора. Первый — это количество общих сущностей, которые использовались в прошлых запросах для обоих шаблонов. Второй — это сходство поведения пользователей (Entity Similarity): если для множества сущностей пользователи кликают на одни и те же документы независимо от формулировки шаблона, система считает их эквивалентными.
Что такое Document Selection Rate (DSR) и почему он важен?
DSR показывает, как часто пользователи выбирают конкретный документ в ответ на запросы, соответствующие шаблону. Это ключевой показатель удовлетворенности пользователя и релевантности документа. Если документ имеет высокий DSR для двух разных шаблонов запросов, это сильный сигнал о том, что эти шаблоны семантически связаны.
Что такое Term Selection Rate (TSR) и чем он отличается от DSR?
DSR измеряет популярность документа для всего запроса (инстанциации шаблона). TSR измеряет важность конкретного *термина* из запроса для выбора этого документа. Он помогает понять, насколько каждый термин в шаблоне способствует релевантности результата, фильтруя шум и обеспечивая более точное понимание семантики.
Почему используется гармоническое среднее (HMTSR) для агрегации TSR?
Использование гармонического среднего гарантирует, что все термины в шаблоне должны иметь высокий TSR, чтобы общий HMTSR был высоким. Если хотя бы один термин имеет низкий TSR (то есть не важен для выбора документа), общий HMTSR будет низким. Это обеспечивает более строгую оценку релевантности всего шаблона.
Что такое «мультиатрибутный документ» и почему Google их фильтрует?
Это документ, который описывает слишком много разных атрибутов сущности (например, обзорная страница, покрывающая население, климат, историю и экономику города). Google фильтрует их (Claim 7), потому что они могут создавать ложные корреляции. Если пользователи кликают на такую страницу по запросам о климате и по запросам об экономике, это не значит, что «климат» и «экономика» — синонимы.
Как этот патент влияет на подбор ключевых слов (Keyword Research)?
Он снижает необходимость поиска и использования всех возможных синонимов вручную. Если вы создадите качественный контент, который удовлетворяет интент и получает клики (высокий DSR), Google самостоятельно свяжет различные синонимичные формулировки запросов с вашим контентом, используя механизм, описанный в патенте.
Нужно ли теперь создавать отдельные страницы под каждый синонимичный запрос?
Нет, этот патент как раз направлен на то, чтобы избежать этого. Цель состоит в том, чтобы создать одну каноническую страницу, которая отвечает на интент. Если система признает разные запросы эквивалентными, эта каноническая страница будет ранжироваться по всем вариантам.
Как я могу использовать фильтрацию мультиатрибутных документов в своей SEO-стратегии?
Это подтверждает важность создания узкоспециализированного контента. Если вы хотите ранжироваться по конкретному атрибуту сущности (например, «время зарядки смартфона X»), создание отдельной, глубоко проработанной страницы именно на эту тему может быть эффективнее, чем упоминание этого атрибута в общем обзоре смартфона X.
Выполняется ли этот процесс анализа эквивалентности в реальном времени?
Нет. Сам процесс анализа логов, расчета DSR, HMTSR и вычисления Similarity Measure требует больших вычислительных ресурсов и выполняется офлайн на агрегированных данных. Однако результаты этого анализа (база данных эквивалентных шаблонов и синонимов) используются в реальном времени при обработке запросов пользователей.
Как этот патент соотносится с технологиями вроде BERT или MUM?
Этот патент описывает метод сбора высококачественных обучающих данных о семантической эквивалентности, основанный на поведении пользователей. Современные NLP-модели, такие как BERT и MUM, превосходно умеют понимать контекст. Данные, генерируемые механизмом этого патента, могут использоваться для обучения или тонкой настройки (fine-tuning) этих моделей, предоставляя им надежные примеры синонимичных фраз.

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Ссылки
Knowledge Graph

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
SERP

Knowledge Graph
SERP
Семантика и интент

Персонализация
SERP
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Техническое SEO
SERP
Ссылки

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Ссылки
EEAT и качество
Антиспам

Персонализация
Поведенческие сигналы
SERP

Knowledge Graph
Поведенческие сигналы
Персонализация
