
Google анализирует, как термины совместно встречаются в списках и таблицах на веб-страницах, чтобы выявить связанные, но не синонимичные пары (например, "кошка" и "собака"). Если пара идентифицирована как связанная, система применяет более строгие критерии (Penalty Criteria) для признания их синонимами, чтобы избежать неверного расширения запроса и смещения темы (Topic Drift).
Патент решает проблему "topicality-drifting" (смещения темы) при автоматическом расширении запросов. Стандартные методы генерации синонимов, основанные, например, на анализе замен терминов пользователями в сессиях, часто ошибочно идентифицируют связанные, но не синонимичные термины как синонимы (например, "Январь" и "Февраль", "Армия" и "Флот"). Использование таких пар для расширения запроса приводит к нерелевантным результатам.
Запатентована система для выявления коррелирующих, но потенциально не синонимичных пар терминов. Система анализирует совместную встречаемость (co-occurrence) терминов внутри структурированных данных (списков, таблиц) в большом корпусе документов. На основе этого анализа формируется "Correlated-pair list" (список коррелирующих пар или "черный список"), который используется для ужесточения критериев валидации синонимов.
Механизм работает в два этапа:
Correlated-pair list.Correlated-pair list. Если да, то для признания пары синонимами применяются более строгие критерии (penalty criteria). Например, требуется значительно более высокий показатель частоты замен этих терминов самими пользователями в поисковых сессиях (Session Switching Requirement).Высокая. Точное понимание взаимоотношений между сущностями (являются ли они синонимами, связанными понятиями, конкурентами или разными типами одного класса) критически важно для современного семантического поиска и точного расширения запросов. Описанные механизмы помогают Google уточнять своё понимание семантики и контекста для предотвращения Topic Drift.
Патент имеет значительное влияние на SEO (7/10). Он объясняет, как Google отличает истинные синонимы от просто связанных понятий. Это подчеркивает важность точного использования языка и контекста на странице. Структурированные данные, такие как списки и таблицы, напрямую информируют алгоритмы о взаимосвязях между сущностями, и их корректное использование помогает Google правильно интерпретировать контент и избегать ошибок синонимизации.
Potentially Non-Synonymous (потенциально не синонимичные). Функционирует как "черный список" (blacklist) при валидации синонимов.<OL>, <UL>, <DL>), таблицы, заголовки (<H1>-<H6>) и перечисления, разделенные специальными символами.Correlated-pair list.Основное изобретение (как определено в Claim 1) сосредоточено на процессе использования списка потенциально несинонимичных пар для динамического ужесточения критериев синонимизации.
Claim 1 (Независимый пункт): Описывает метод фильтрации предложенных синонимов с использованием штрафных критериев.
Synonym Candidate)."potentially non-synonymous" (т.е. присутствует в Correlated-pair list).penalty criteria, которые применяются только к таким парам. Эта оценка включает определение "quantity of switches" (частоты переключения между запросами с этими терминами пользователями).penalty criteria (т.е. частота переключений высокая). Этот порог такой же, как для пар, не входящих в черный список.penalty criteria (т.е. частота переключений низкая). Второй порог выше первого.Ядро изобретения заключается в том, что идентификация пары как коррелирующей (через анализ списков) не приводит к автоматическому отклонению синонима, а запускает дополнительную проверку поведения пользователей (Quantity of Switches). Если пользователи часто заменяют термины, штраф снимается; если нет — требования к валидации ужесточаются.
Изобретение затрагивает два ключевых этапа поиска: индексирование (для анализа данных) и понимание запросов (для применения результатов анализа).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-процесс построения Correlated-pair list. Система анализирует Corpus документов, извлекает структурированные данные (Lists) и вычисляет корреляцию между совместно встречающимися терминами. Также на этом этапе могут применяться фильтры Authorship для обеспечения разнообразия источников.
QUNDERSTANDING – Понимание Запросов
На этом этапе система использует Correlated-pair list при обработке запроса и его потенциальном расширении (Query Expansion/Rewriting). Когда система рассматривает возможность использования Synonym Candidate, она применяет логику динамического выбора порогов, чтобы отфильтровать или пессимизировать связанные, но нежелательные термины.
Входные данные:
Corpus документов, структурные элементы (HTML-теги списков, таблиц).Synonym Candidate), Correlated-pair list, данные о поведении пользователей (Session Switching rates).Выходные данные:
Correlated-pair list (черный список).Synonym Candidate для расширения запроса.penalty criteria) активируется только тогда, когда оцениваемая пара терминов присутствует в Correlated-pair list.Session Switching (при валидации).Процесс А: Офлайн-генерация списка коррелирующих пар (Blacklist)
Corpus документов. Применяется фильтрация для обеспечения разнообразия Authorship (разные источники/авторы).Lists (HTML-списки, таблицы, перечисления) из документов на основе структурных признаков.Correlated-pair list.Процесс Б: Валидация синонимов (Использование Blacklist)
Synonym Candidate.Correlated-pair list.Quantity of Switches (частота переключения пользователей между этими терминами в сессиях).Quantity of Switches высокий (удовлетворяет критериям): Выбирается стандартный (первый) порог валидации.Quantity of Switches низкий (не удовлетворяет критериям): Выбирается повышенный (второй, более строгий) порог валидации.<OL>, <UL>, <LI>, <DL>, <DT>, <H1>-<H6>), структура таблиц, разделители (запятые, табуляция) для идентификации Lists.Authorship и фильтрации корпуса.Quantity of Switches (частоты переключения между запросами).Topic Drift.structured data) напрямую информирует алгоритмы о взаимоотношениях между сущностями. Термины, часто перечисляемые вместе, с меньшей вероятностью будут считаться синонимами.Correlated-pair list) и предпочитает не расширять запрос, если нет высокой уверенности в синонимичности терминов.Session Switching может преодолеть штраф и подтвердить их синонимичность в данном контексте.Authorship, чтобы избежать предвзятости, которая может возникнуть из-за повторяющихся списков на одном сайте или от одного автора.Session Switching у пользователей.Correlated-pair list), создавайте отдельные страницы с четким фокусом и ясной структурой, подчеркивающей различия.Correlated-pair list, что усложнит их валидацию как синонимов, если поведенческих сигналов недостаточно.Этот патент подтверждает, что Google использует глубокий структурный анализ контента для построения своего понимания взаимоотношений между сущностями (Entity Relationships), что является основой семантического поиска. Он демонстрирует механизм улучшения точности на этапе Понимания Запросов. Для SEO-стратегии это означает, что не только наличие ключевых слов, но и структура их представления (в тексте против списка) влияет на интерпретацию контента поисковой системой.
Сценарий: Дифференциация моделей смартфонов
Correlated-pair list.Synonym Candidate.Correlated-pair list. Она проверяет Session Switching. Пользователи редко заменяют "iPhone 15" на "iPhone 15 Pro" в рамках одной сессии (так как это разные продукты с разной ценой).Session Switching низкий. Применяется повышенный порог. "iPhone 15 Pro" не признается синонимом для "iPhone 15". Выдача формируется точно по исходному запросу.Какова главная цель изобретения, описанного в этом патенте?
Основная цель — предотвратить "смещение темы" (topicality-drifting) при расширении поисковых запросов. Система учится отличать термины, которые являются истинными синонимами, от терминов, которые просто связаны или принадлежат к одной категории (например, "кошка" и "собака"), и избегает использования последних для автоматического расширения запроса.
Как Google определяет, что два термина коррелируют, но не являются синонимами?
Google анализирует их совместную встречаемость в структурированных данных — списках и таблицах — по всему интернету. Если два термина очень часто появляются вместе в различных списках (например, в списках брендов одежды или марок автомобилей), они считаются коррелирующими, и добавляются в Correlated-pair list.
Что такое "Correlated-pair list" и как он используется?
Это список пар терминов, идентифицированных как связанные, но потенциально не синонимичные. Он функционирует как "черный список". При оценке потенциального синонима система проверяет этот список; если пара в нем есть, к ней применяются более строгие критерии валидации (Penalty Criteria).
Если два термина попали в "черный список" (Correlated-pair list), могут ли они все равно считаться синонимами?
Да, но требования для этого значительно выше. Система потребует очень сильных поведенческих сигналов, подтверждающих, что пользователи считают эти термины взаимозаменяемыми. В частности, необходим высокий показатель Session Switching (частоты, с которой пользователи меняют один термин на другой в своих запросах).
Как этот патент влияет на SEO для сайтов, которые часто сравнивают конкурентов?
Это положительно влияет на точность поиска. Если ваш бренд и бренд конкурента часто упоминаются вместе в сравнительных таблицах или списках, Google с меньшей вероятностью будет рассматривать их как синонимы. Это гарантирует, что при поиске вашего бренда выдача не будет "загрязнена" результатами о конкуренте, и наоборот.
Какие типы HTML-элементов анализирует система для выявления корреляций?
Система анализирует структурированные перечисления. К ним относятся HTML-списки (упорядоченные <OL>, неупорядоченные <UL>, списки определений <DL>), таблицы, заголовки, а также элементы, разделенные запятыми или табуляцией.
Имеет ли значение источник списка при анализе?
Да. В патенте упоминается фильтрация по критерию Authorship (авторства). Это делается для обеспечения разнообразия источников и уменьшения влияния повторяющихся списков на одном сайте или от одного автора, что повышает точность глобальной оценки корреляции.
Как я могу гарантировать, что Google будет рассматривать мои ключевые слова как синонимы?
Чтобы повысить вероятность признания терминов синонимами, используйте их взаимозаменяемо в основном тексте (прозе) и в различных контекстах. Избегайте простого перечисления синонимов в виде списка, так как это может привести к обратному эффекту — попаданию в Correlated-pair list и усложнению валидации.
Что такое "Session Switching Requirement"?
Это поведенческая метрика (также называемая Quantity of Switches), которая измеряет, как часто пользователи вручную меняют один термин на другой в последующих поисковых запросах в рамках одной сессии. Высокий показатель свидетельствует о том, что пользователи считают эти термины взаимозаменяемыми.
Выполняется ли этот процесс в реальном времени во время поиска?
Процесс состоит из двух частей. Генерация Correlated-pair list путем анализа списков в интернете происходит офлайн (на этапе индексирования и анализа). А вот использование этого списка для проверки и валидации синонимов происходит на этапе понимания и расширения запроса пользователя (Query Understanding).

Local SEO
Семантика и интент

Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Семантика и интент
SERP
Ссылки

Персонализация
Семантика и интент
Поведенческие сигналы

Антиспам
SERP
Ссылки

Local SEO
Семантика и интент
Поведенческие сигналы

Ссылки
SERP
Структура сайта

Семантика и интент
SERP
Поведенческие сигналы

SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

Ссылки
SERP
Семантика и интент
