
Google анализирует шаблоны в структуре URL сайта (например, поддомены или папки) и сопоставляет их с фактическим контентом страниц. Система вычисляет вероятность того, что определенный шаблон указывает на язык, страну или тип устройства. При поиске эти данные используются для расчета оценки соответствия (Alignment Score) и повышения в ранжировании той версии страницы, которая лучше всего подходит пользователю, при одновременном понижении дубликатов.
Патент решает проблему обработки сайтов, содержащих субстантивно дублирующийся или схожий контент, таргетированный на разные аудитории (разные языки, страны или типы устройств — user agents). Часто владельцы сайтов не указывают таргетинг явно, а структура URL может быть неоднозначной (например, de.example.com может означать немецкий язык или таргетинг на Германию). Это приводит к появлению в выдаче избыточных (redundant) результатов с одного домена, что ухудшает пользовательский опыт. Изобретение призвано автоматически определить таргетинг контента по структуре URL и выбрать наиболее подходящую версию для конкретного пользователя.
Запатентована система автоматического определения атрибутов контента (Resource Attributes) на основе анализа структуры URL (Address Attributes). Система анализирует множество URL одного домена, выявляет повторяющиеся шаблоны и сравнивает их с фактическими характеристиками контента на этих страницах. На основе этого сравнения вычисляется вероятность (Likelihood), что определенный шаблон URL указывает на конкретный атрибут контента. Эти данные используются для корректировки поисковой выдачи в соответствии с атрибутами пользователя.
Система работает в два этапа:
*.example.com). Затем она изучает контент этих страниц и определяет его атрибуты (язык, геолокацию и т.д.). Сравнивая шаблоны URL с атрибутами контента, система вычисляет Likelihood — вероятность того, что данный шаблон указывает на определенный атрибут.Alignment Score — оценку соответствия между атрибутами пользователя и вероятными атрибутами каждой страницы. Страница с наивысшим Alignment Score повышается в ранжировании, а остальные версии могут быть понижены.Высокая. Автоматическое определение локализации, интернационализации и адаптации под устройства остается ключевой задачей поисковых систем. Хотя явные сигналы (например, hreflang) являются стандартом, многие сайты их не используют или используют некорректно. Описанный механизм позволяет Google эффективно обрабатывать такие ситуации, гарантируя, что пользователи увидят наиболее релевантную для их контекста версию контента.
Патент имеет высокое значение для SEO, особенно для международных, мультиязычных проектов и сайтов с разными версиями для устройств. Он описывает механизм, с помощью которого Google интерпретирует структуру URL как сигнал таргетинга и принимает решения о ранжировании разных версий. Нечеткая или противоречивая структура может привести к неправильной интерпретации сигналов системой, что вызовет показ неверной версии страницы в поиске или каннибализацию между версиями.
Resource Locator), которая варьируется в соответствии с идентифицированным шаблоном. Например, в шаблоне <AA1>.example.com, Address Attribute — это поддомен (например, 'fr', 'de', 'm').User Attributes) и предполагаемыми атрибутами ресурса (на основе вычисленных Likelihoods).Resource Attributes и вычисляет Likelihoods путем сравнения с Address Attributes.Address Attribute (шаблон URL) указывает на конкретный Resource Attribute (характеристику контента). Например, вероятность того, что шаблон указывает на язык, а не на страну.user-agent (тип устройства).Likelihoods и User Attributes для вычисления Alignment Score и переранжирования результатов поиска (повышения и понижения).Address Attribute (шаблон). Например, fr.example.com/page1 и de.example.com/page1 принадлежат к одному набору.Claim 1 (Независимый пункт): Описывает офлайн-процесс анализа сайта для определения связи между структурой URL и контентом.
resource locators), имеющие одно и то же доменное имя.resource attributes) и (b) Атрибуты адреса (address attributes) — части URL, которые варьируются по шаблону.set of similar resource locators) — группа URL, соответствующих одному шаблону.likelihood), что атрибут адреса указывает на конкретный атрибут контента. Это основано на том, как контент меняется при изменении значения атрибута адреса.resource index data store).Claim 3 (Зависимый от 1): Описывает процесс использования вычисленных вероятностей во время поиска для корректировки ранжирования.
alignment score). Эта оценка основана на атрибутах пользователя (user attributes) и вероятностях (likelihoods), связанных с URL результата.Claim 4 (Зависимый от 3): Уточняет механизм корректировки.
Ранг других результатов (второго результата), которые имеют более низкую оценку соответствия, но изначально ранжировались выше первого результата, понижается.
Claim 8 (Зависимый от 3): Определяет приоритеты при расчете соответствия.
При повышении ранга используется приоритет выравнивания (alignment priority), при котором языковое соответствие имеет приоритет над страновым соответствием, а страновое соответствие имеет приоритет над соответствием user-agent.
Claim 10 (Зависимый от 6 и 1): Детализирует метод расчета вероятностей для языка и страны.
language counter) увеличивается, если ресурс написан на языке, указанном кодом в URL. Счетчик страны (country counter) увеличивается, если ресурс таргетирован на страну, указанную кодом в URL.Likelihood) для языка и страны определяется на основе значений этих счетчиков.Изобретение затрагивает этапы индексирования для предварительного анализа и этап переранжирования для применения результатов анализа.
INDEXING – Индексирование и извлечение признаков
Основная работа механизма происходит на этом этапе (офлайн). Site Processing Engine анализирует структуру сайта и контент.
Address Attributes) и группировки URL. Анализ контента для определения Resource Attributes. Вычисление вероятностей (Likelihoods).Likelihoods сохраняются в индексе (Attribute Data) и ассоциируются с соответствующими URL.RERANKING – Переранжирование
Механизм активируется во время обработки запроса для корректировки финальной выдачи. Search Results Adjusting Engine выполняет эту функцию.
User Attributes. Вычисление Alignment Scores для результатов, принадлежащих к одному набору схожих URL. Переранжирование внутри этого набора: лучшая версия повышается, остальные понижаются.Входные данные:
Likelihoods.Выходные данные:
m.).Set of Similar Resource Locators (т.е. несколько версий одной страницы).Address Attribute).Процесс А: Определение Вероятностей (Офлайн / Индексирование)
Resource Attributes) — язык, страна таргетинга, требования к user-agent.Address Attributes).Sets of Similar Resource Locators на основе выявленных шаблонов.a priori probabilities).Процесс Б: Корректировка Ранжирования (Онлайн / Обработка Запроса)
User Attributes (язык, страна, устройство).Set of Similar Resource Locators.Alignment Score на основе сохраненных Likelihoods и User Attributes. При расчете могут учитываться приоритеты (Язык > Страна > Устройство).Alignment Score повышается в ранге (обычно выше всех остальных результатов группы).Alignment Score, понижаются в ранге.Система использует следующие типы данных:
Resource Locators для выявления Address Attributes. Патент упоминает анализ хост-имен (поддоменов), путей (директорий), имен файлов, номеров портов и параметров запроса.Resource Attributes (например, определение языка текста, признаков геотаргетинга).User Attributes). Включают язык, страну (по IP или настройкам), тип устройства (User-Agent). Могут быть получены из настроек браузера, данных аккаунта (User Account Data) или истории поиска.site linkage information для определения иерархических отношений между ресурсами и валидации атрибутов.Historical Data (логи запросов и кликов). Могут использоваться для определения таргетинга (например, если на ресурс идет трафик преимущественно из одной страны) или анализа изменений запросов (query revisions).Метод 1 (Счетчики) (Claim 10): Подсчитывается, сколько раз атрибут адреса (например, код 'fr') соответствовал атрибуту контента (например, французскому языку — Language Counter, или таргетингу на Францию — Country Counter). Вероятность рассчитывается как отношение соответствующего счетчика к общему числу URL в наборе.
Метод 2 (С использованием априорных вероятностей) (Table 1 в описании): Учитывается a priori probability (на основе анализа всего интернета) и наблюдаемое распределение на конкретном сайте. Они комбинируются для получения оценки уверенности (Confidence). Итоговая Likelihood для шаблона рассчитывается как взвешенная сумма оценок уверенности для разных значений атрибута.
User Attributes и Likelihoods ресурса. Например, это может быть скалярное произведение вектора атрибутов пользователя и вектора вероятностей ресурса. При расчете учитываются приоритеты атрибутов (Claim 8).Likelihoods — вероятности того, что шаблон указывает на язык, страну или user-agent. Это позволяет обрабатывать неоднозначные случаи (например, код 'es' для Испании или испанского языка).Search Results Adjusting Engine. Он гарантирует, что если в выдаче есть несколько версий одного контента, версия, наиболее соответствующая атрибутам пользователя (Alignment Score), будет показана выше остальных.Set of Similar Resource Locators) и обрабатывает их как кластер. После выбора лучшей версии остальные понижаются (демоушены), чтобы избежать дублирования в SERP.Likelihood и ошибкам в таргетинге.Likelihoods. Используйте стандартные коды (ISO 639 для языков, ISO 3166 для стран)./fr/, контент должен быть на французском языке. Несоответствие снизит точность определения Resource Attributes./en-gb/, /en-us/). Это помогает избежать неоднозначности и позволяет системе точнее рассчитывать Alignment Score.hreflang остается лучшей практикой. Это устраняет необходимость для Google угадывать таргетинг и верифицирует автоматические выводы системы.site linkage information. Четкая перелинковка помогает системе идентифицировать Sets of Similar Resource Locators.Address Attributes.example.com/uk/ для английского языка вместо /en/) может привести к конфликтам при вычислении Likelihoods.Resource Attribute и снижает уверенность системы.Address Attributes и сгруппировать схожие ресурсы (хотя анализ параметров запроса упомянут в патенте как возможный).Патент подчеркивает важность технической реализации интернационализации и адаптации. Для Google важно не просто наличие контента, а возможность системы четко идентифицировать разные версии и понять их взаимосвязь. Стратегия SEO для международных проектов должна базироваться на максимально чистых и однозначных сигналах таргетинга, начиная со структуры URL. Это подтверждает, что Google стремится к максимальной персонализации выдачи на основе контекста пользователя (язык, местоположение, устройство), и система будет активно продвигать версию контента, которая лучше соответствует этому контексту.
Сценарий 1: Разрешение неоднозначности Язык vs Страна
Ситуация: Сайт использует структуру <код>.example.com. Есть fr.example.com (Французский язык) и ca.example.com.
Проблема: Код 'ca' может означать Каталанский язык или Канаду.
Действия Google (согласно патенту):
ca.example.com. Предположим, он на английском и французском языках и таргетирован на Канаду.Likelihoods. Language Likelihood для каталанского будет близка к 0. Country Likelihood для Канады будет высокой.Alignment Score для ca.example.com по стране и продвинет этот результат.Alignment Score для ca.example.com был бы низким.Сценарий 2: Исправление непоследовательной структуры
Ситуация: Сайт использует example.com/de/. В 70% случаев контент на немецком языке, в 30% — на английском, но для Германии.
Действия Google: Система рассчитает Language Likelihood ≈ 0.7 и Country Likelihood ≈ 1.0 (если весь контент таргетирован на Германию). Уверенность в языковом таргетинге снижена.
SEO Рекомендация: Обеспечить 100% последовательность. Создать структуру example.com/de-de/ (немецкий для Германии) и example.com/en-de/ (английский для Германии). Это позволит системе рассчитать высокие Likelihoods для обеих структур и точно таргетировать контент на пользователей в зависимости от их языка и местоположения.
Заменяет ли этот механизм необходимость внедрения атрибута hreflang?
Нет, не заменяет. Hreflang предоставляет явные и точные инструкции поисковой системе. Описанный в патенте механизм используется для автоматического определения локализованных версий, когда явные сигналы отсутствуют, неоднозначны или внедрены с ошибками. Это запасной вариант (fallback) или механизм валидации. Лучшая практика — использовать hreflang и поддерживать чистую, последовательную структуру URL.
Как система определяет, что означает сегмент URL: язык или страну?
Система использует вероятностный подход. Она анализирует контент всех страниц, соответствующих шаблону. Если изменение кода в URL (например, 'fr') коррелирует с изменением языка контента, система присвоит высокую Likelihood языковому атрибуту. Если язык остается тем же, но меняется таргетинг (валюта, адреса), высокая Likelihood будет присвоена атрибуту страны. Система рассчитывает обе вероятности.
Что важнее для системы: язык или страна?
В патенте (Claim 8) явно указано, что система использует приоритеты (alignment priority) при расчете Alignment Score. Языковое соответствие имеет приоритет над страновым соответствием, а страновое — над соответствием user-agent. Это означает, что для Google важнее всего показать пользователю контент на правильном языке.
Что произойдет, если структура URL непоследовательна?
Непоследовательная структура затрудняет идентификацию четких шаблонов (Address Attributes) и приводит к низким значениям Likelihood. Если система не уверена в таргетинге, механизм корректировки ранжирования будет работать некорректно. Это может привести к каннибализации между версиями, показу неверной версии пользователю или игнорированию структуры URL как сигнала таргетинга.
Как работает механизм корректировки ранжирования (Search Results Adjusting Engine)?
Он активируется, когда в выдаче присутствуют несколько версий одной страницы (из одного Set of Similar Resource Locators). Система вычисляет Alignment Score, сравнивая атрибуты пользователя с предполагаемыми атрибутами каждой версии. Версия с наилучшим соответствием повышается в ранге, вытесняя другие версии из этой группы, которые могут быть понижены (демоушены).
Влияет ли этот патент на сайты только с одним языком?
Да. Во-первых, если сайт имеет таргетинг на разные страны с одним языком (например, English для США и Австралии) и использует разную структуру URL. Во-вторых, патент охватывает таргетинг по User-Agent. Если сайт имеет разные версии для устройств (например, m.example.com), этот механизм будет использоваться для показа правильной версии пользователю в зависимости от его устройства.
Что такое "Априорные вероятности" (a priori probabilities) и как они используются?
Это вероятности, рассчитанные Google на основе анализа всего интернета. Например, Google знает, что код 'fr' в 99% случаев означает французский язык. При анализе вашего сайта система комбинирует эту общую статистику (априорную вероятность) с тем, что наблюдает на вашем домене (наблюдаемое распределение), чтобы рассчитать итоговую уверенность (Confidence). Использование стандартных ISO кодов помогает использовать эти данные эффективнее.
Может ли система ошибиться в определении атрибутов?
Да, поскольку механизм основан на вероятностях (Likelihoods). Если сигналы на сайте противоречивы (например, на странице с URL /de/ находится контент на английском языке), система может неправильно интерпретировать структуру. Чем чище и консистентнее сигналы на сайте, тем ниже вероятность ошибки.
Что делать, если я использую параметры URL (например, ?lang=fr) вместо папок?
Патент упоминает, что Address Attributes могут включать варьирующиеся параметры запроса (varying query parameters). Система способна анализировать и их. Однако примеры в патенте фокусируются на структуре хоста и пути, и использование статических URL (папок или поддоменов) традиционно считается более надежной практикой в SEO для обеспечения четких шаблонов.
Насколько сильно повышается или понижается результат в выдаче?
Патент не указывает конкретных значений. Повышение происходит как минимум так, чтобы наиболее подходящий результат оказался выше других результатов из того же набора схожих URL. Относительно понижения, в одном из примеров (в описании) показано, что деприоритизированный результат может быть смещен значительно вниз (например, с позиции N на N+20), потенциально за пределы первой страницы выдачи.

Мультиязычность
Персонализация
Индексация

Персонализация
Мультиязычность
SERP

Ссылки
Мультиязычность
Семантика и интент

Техническое SEO
Краулинг
Индексация

Мультиязычность
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Local SEO
Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
SERP
Индексация

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Антиспам

EEAT и качество
Антиспам
SERP

Индексация
Поведенческие сигналы

Knowledge Graph
Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
SERP
