
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
Патент решает задачу автоматической идентификации и кластеризации документов, которые являются разными версиями одного и того же контента (например, переводами на разные языки или региональными вариантами). Цель — улучшить пользовательский опыт в международном поиске, предоставляя контент на предпочтительном языке пользователя и избегая показа нескольких эквивалентных версий в одной поисковой выдаче.
Запатентована система для обнаружения и верификации связей между документами путем анализа ссылок и ассоциированных с ними Relation Indicators (индикаторов связи). Система ищет сигналы на странице (например, ссылку с анкором «German» или изображение флага), указывающие на существование связанной версии. Ключевым элементом является обязательная верификация этой связи с использованием таких методов, как машинный перевод и сравнение контента, а также анализ частоты обновлений, для подтверждения эквивалентности документов.
Система работает в несколько этапов:
Relation Indicators.Verification Score. Основной метод (Claim 1) включает машинный перевод первого документа и сравнение его со вторым. Дополнительные методы включают сравнение частоты обновлений (Update Frequency) и анализ поведения пользователей (Selection Activity).Высокая. Корректная обработка мультиязычного и мультирегионального контента остается критически важной задачей для глобальных поисковых систем. Описанные в патенте механизмы позволяют Google алгоритмически определять связи между страницами. Эти методы дополняют использование атрибута hreflang и могут служить механизмом верификации заявленных связей или механизмом отката (fallback), если hreflang отсутствует или реализован некорректно.
Патент имеет критическое значение для международного SEO (International SEO). Он демонстрирует, как Google может идентифицировать и валидировать локализованный контент, анализируя структуру ссылок на странице и эквивалентность контента. Понимание этих механизмов диктует лучшие практики по реализации переключателей языков и управлению обновлениями контента, что напрямую влияет на то, какая версия сайта будет показана пользователям в разных странах и на разных языках.
anchor text), изображение флага, специфические фразы рядом со ссылкой (например, «Select a language»).measure of confidence) системы в том, что два документа действительно связаны (например, являются переводами). Генерируется на основе процессов верификации.Claim 1 (Независимый пункт): Описывает основной метод идентификации и верификации связанных документов.
reference) на второй документ.Relation Indicator.Measure of Similarity.particular similarity threshold).Ядром изобретения является комбинация использования сигналов из ссылок и обязательной верификации этой связи через сравнение машинного перевода.
Claim 4 (Зависимый от 1): Описывает применение механизма в поиске (обработка второго документа).
Это механизм подмены результатов в SERP для обеспечения локальной/языковой релевантности.
Claim 6 (Зависимый от 1): Добавляет проверку обратных ссылок. Определение связи также основывается на идентификации ссылки из второго документа на первый (взаимность).
Claim 7 (Зависимый от 1): Добавляет метод верификации через анализ обновлений. Определение связи включает:
Update Frequency первого и второго документов.Claim 8 (Зависимый от 1): Добавляет метод верификации через поведение пользователей. Определение связи также основывается на анализе Selection Activity, связанной с этими документами.
Изобретение применяется в основном на этапах индексирования и ранжирования для обеспечения корректной обработки мультиязычного контента.
INDEXING – Индексирование и извлечение признаков
Основной этап работы алгоритма. Система (Document identification system) анализирует просканированные документы:
Relation Indicators.Update Frequency) и поведение пользователей (Selection Activity).Verification Score. Если он выше порога, информация о связи между документами сохраняется в индексе (кластеризация версий).RANKING / RERANKING – Ранжирование и Переранжирование
На этом этапе используются предварительно рассчитанные связи для формирования выдачи.
Входные данные:
Selection Activity).Выходные данные:
Verification Score для пар документов.Relation Indicator.particular similarity threshold (порог сходства) при сравнении контента или частоты обновлений для подтверждения связи.Процесс А: Идентификация и верификация связи (Индексирование)
Relation Indicators (анкор, текст рядом, изображение флага). Если индикаторов нет, процесс останавливается для этой пары.Verification Score.Measure of Similarity.Selection Activity пользователей.similarity threshold, связь подтверждается.Процесс Б: Применение связи (Ранжирование)
Relation Indicators.Relation Indicators.Update Frequency, таймстампы изменений). Используется для верификации эквивалентности контента.Selection Activity – данные о том, как пользователи реагируют на предложенные переводы или переключаются между версиями.Measure of Similarity или Verification Score для подтверждения связи.hreflang).Verification Score). Ключевой метод валидации (Claim 1) — машинный перевод и сравнение контента. Если контент не эквивалентен, связь не будет установлена.Update Frequency), с большей вероятностью будут признаны связанными версиями одного контента (Claim 7).Verification Score, и связь не будет установлена.Relation Indicators.Патент подтверждает стратегию Google по кластеризации эквивалентного контента для улучшения качества глобального поиска. Для SEO это означает, что корректная техническая реализация мультиязычности критична для предотвращения каннибализации трафика между разными версиями сайта и обеспечения ранжирования нужной версии в соответствующем регионе. Хотя hreflang остается стандартом, этот патент показывает, что Google имеет надежные механизмы для самостоятельного определения и верификации связей, основываясь на анализе контента, ссылок и паттернов обновлений.
Сценарий: Оптимизация переключателя языков для алгоритмического обнаружения
Сайт имеет английскую и немецкую версии. Необходимо убедиться, что Google корректно идентифицирует связь между ними, используя механизмы из патента.
Плохая реализация: Переключатель реализован выпадающим списком через JavaScript, прямые ссылки отсутствуют. Анкоры не используются.
Оптимизированная реализация (соответствует патенту):
<div class="language-selector"> <p>Read this page in:</p> <ul> <li><a href="/de/page.html">Deutsch</a></li> <li><a href="/fr/page.html">Français</a></li> </ul> </div> Преимущества:
Relation Indicator.Relation Indicators).Такая реализация облегчает Google обнаружение и верификацию связей между версиями, что обеспечивает корректный показ в международной выдаче.
Заменяет ли этот механизм использование атрибута hreflang?
Нет, не заменяет. hreflang является явным указанием для поисковой системы о наличии альтернативных версий. Описанный в патенте механизм является автоматическим способом обнаружения таких связей на основе анализа ссылок и контента. Он дополняет hreflang и может служить механизмом отката (fallback), если hreflang отсутствует или реализован с ошибками, а также методом верификации заявленных связей.
Что такое «Relation Indicator» и что лучше использовать: название языка или флаг страны?
Relation Indicator — это сигнал, указывающий на связь между документами. Патент явно упоминает и названия языков/регионов в анкорах, и изображения (например, флаги) как эффективные индикаторы. С точки зрения SEO, использование названия языка (например, «Deutsch») предпочтительнее, так как язык не всегда равен стране, но использование флагов также является допустимым сигналом согласно патенту.
Как именно Google проверяет, что страницы являются переводами друг друга?
Патент описывает конкретный механизм верификации (Claim 1). Система выполняет машинный перевод первого документа на язык второго, а затем сравнивает результат перевода со вторым документом. Если полученная мера сходства (Measure of Similarity) превышает определенный порог, система считает контент эквивалентным и подтверждает связь.
Что произойдет, если контент на разных языках не полностью совпадает (локализация)?
Если контент значительно различается из-за локализации, Verification Score может оказаться ниже порогового значения. В этом случае система может не установить связь между документами. Это может привести к тому, что обе страницы будут рассматриваться как независимый контент и могут конкурировать друг с другом в выдаче. Важно сохранять основную семантику эквивалентной.
Насколько важны обратные ссылки между языковыми версиями?
Они очень важны. Патент (Claim 6) явно указывает, что идентификация обратной ссылки (из второго документа на первый) используется в процессе определения связи. Это подтверждает лучшую практику SEO, согласно которой все языковые версии должны перелинковываться между собой (полная взаимность).
Как влияет частота обновления контента на идентификацию связей?
Патент (Claim 7) описывает сравнение частоты и времени обновлений (Update Frequency) как метод верификации. Если две страницы обновляются синхронно или с небольшой задержкой, это усиливает уверенность системы в том, что они являются версиями одного и того же контента. Значительное отставание в обновлениях одной из версий может помешать установлению связи.
Что подразумевается под «Отказом от предоставления» (forgoing presenting) одной из версий в поиске?
Это означает, что если система уверена в связи между документами и определила, какая версия лучше подходит пользователю по языку/региону, она покажет только эту версию в результатах поиска. Другие версии будут подавлены (дедуплицированы), даже если они также релевантны запросу. Это предотвращает каннибализацию и улучшает пользовательский опыт.
Что делать, если переключатель языков реализован через JavaScript без прямых ссылок?
В этом случае описанный в патенте механизм не сможет функционировать, так как он основан на анализе ссылок в документе. Необходимо переработать переключатель, используя стандартные HTML-ссылки (<a href>), или убедиться, что мультиязычность корректно реализована через альтернативные методы (например, hreflang в XML-карте сайта или HTTP-заголовках).
Что такое «Selection Activity» и как она используется?
Selection Activity (Claim 8) — это данные о поведении пользователей. Например, если система предлагает перевод страницы, а пользователи часто возвращаются к оригиналу или пытаются переключиться на другую версию, это может сигнализировать о неверно установленной связи или низком качестве перевода. Эти данные используются для корректировки Verification Score.
Может ли этот механизм связать страницы на одном языке, но для разных регионов (например, US и UK)?
Да. Патент указывает, что Relation Indicator может быть не только названием языка, но и названием или изображением географического региона (Claim 2). Механизм верификации через сравнение контента также будет работать, так как перевод не потребуется или будет минимальным, а сходство контента, как правило, будет высоким.

Мультиязычность
Семантика и интент
SERP

Ссылки
Мультиязычность
Семантика и интент

Мультиязычность
Семантика и интент
Ссылки

Мультиязычность
Персонализация
Индексация

Поведенческие сигналы
Ссылки
SERP

Индексация
Техническое SEO
Структура сайта

Антиспам
SERP
Поведенческие сигналы

Поведенческие сигналы
Индексация
Техническое SEO

Семантика и интент
Поведенческие сигналы
SERP

Индексация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Ссылки
SERP

SERP
EEAT и качество
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
SERP
