
Google использует систему для автоматического обнаружения взаимосвязи между десктопными (non-mobile) и мобильными (mobile) версиями страниц, когда используются разные URL. Система анализирует структуру URL, находит общие токены и проверяет схожесть контента. На основе найденных пар генерируются правила (Regular Expressions) для предсказания мобильного URL по десктопному, что улучшает индексацию мобильного контента и корректность выдачи.
Патент решает проблему идентификации и сопоставления мобильных и десктопных версий веб-страниц, когда сайт использует отдельные URL (например, конфигурация m-dot), но не предоставляет явных сигналов связывания (например, rel=alternate/canonical или редиректов на основе User-Agent). Это затрудняет поисковым системам обнаружение и индексацию мобильного контента, а также консолидацию сигналов ранжирования между версиями, и может приводить к показу некорректной версии сайта пользователю.
Запатентована система для автоматического обнаружения пар соответствующих URL (мобильный и немобильный) и генерации правил для преобразования одного типа URL в другой. Система идентифицирует потенциальные пары путем анализа общих токенов в структуре URL и подтверждает связь путем сравнения контента страниц. На основе подтвержденных пар система выявляет паттерны трансформации и формализует их в виде правил (используя Regular Expressions) для масштабного применения.
Система работает в двух основных направлениях:
Selective URL Tokens) и ищет мобильные и десктопные URL с общими токенами. Затем она верифицирует потенциальные пары, сравнивая контент страниц (например, методом шинглирования — shingling), игнорируя шаблонные элементы (boilerplate).placeholders), и система генерирует правила на основе Regular Expressions, описывающие, как десктопный URL преобразуется в мобильный.Эти правила затем используются для улучшения индексации или для подмены URL в реальном времени в поиске.
Высокая. Хотя Google перешел на Mobile-First Indexing (MFI) и рекомендует адаптивный дизайн, многие сайты все еще используют конфигурации с раздельными URL (m-dot). Для таких сайтов корректное сопоставление десктопных и мобильных версий остается критически важным для консолидации сигналов ранжирования. Механизмы, описанные в патенте, предоставляют Google автоматизированный способ справиться с отсутствием или ошибками в явных сигналах сопоставления со стороны вебмастера.
Патент имеет высокое значение для технического SEO, особенно для сайтов с раздельными мобильными и десктопными URL. Он подчеркивает, что Google может автоматически связывать версии страниц, даже если вебмастер не настроил каноникализацию или редиректы. Однако зависимость от автоматического распознавания паттернов и анализа контента подчеркивает критическую важность консистентной структуры URL и паритета контента между мобильной и десктопной версиями для успешного сопоставления.
const_1), используемые для представления совпадающих строк (токенов) при анализе паттернов трансформации URL.Claim 1 (Независимый пункт): Описывает полный цикл генерации и верификации правил трансформации URL.
matching character strings) между двумя URL, которые содержат общую подстроку определенной минимальной длины.pattern), специфицирующий эту строку.rule) для генерации мобильного URL из входного немобильного URL.verifying), что веб-страница, связанная со сгенерированным вторым мобильным URL, соответствует веб-странице второго немобильного URL.Claim 2 (Зависимый от 1): Уточняет метод определения совпадающих строк. Он включает разделение URL на токены на основе разделителей URL и сравнение этих токенов.
Claim 3 (Зависимый от 1): Уточняет, что паттерны (patterns) представлены в виде регулярных выражений (regular expressions).
Claim 4 (Зависимый от 1): Уточняет метод верификации. Он включает сравнение контента веб-страниц, связанных с немобильным и сгенерированным мобильным URL.
Claim 5 (Зависимый от 1): Описывает применение изобретения в индексации. Второй немобильный URL берется из индекса поисковой службы, и после генерации и верификации соответствующий мобильный URL добавляется в индекс.
Claim 6 и 7 (Зависимые от 1): Описывают применение в ранжировании. Генерация мобильного URL происходит в ответ на поисковый запрос. Сгенерированный мобильный URL включается в набор результатов поиска и может быть приоритизирован (повышен) при отображении.
Claim 8 (Зависимый от 1): Описывает применение на стороне клиента (мобильного устройства). Система перехватывает запрос на десктопную страницу, генерирует мобильный URL с помощью правила и отправляет запрос уже на мобильную версию.
Изобретение применяется на нескольких ключевых этапах поисковой архитектуры, преимущественно связанных с обработкой и индексацией контента.
CRAWLING – Сканирование и Сбор данных
INDEXING – Индексирование и извлечение признаков
URL Tokens, сравнение контента методом shingling) выполняется на этапе индексации для установления соответствия между страницами.Regular Expressions для трансформации URL происходит офлайн на основе проиндексированных данных.RANKING / RERANKING – Ранжирование и Переранжирование
Входные данные:
Выходные данные:
Regular Expressions) для трансформации URL в рамках домена.?mobile=1) или через анализ контента (например, наличие тега viewport).Алгоритм состоит из двух основных процессов: А) Обнаружение соответствующих пар URL и Б) Генерация правил трансформации.
Процесс А: Обнаружение пар URL (Finding Pairs)
Selective URL Tokens — токенов, которые не встречаются слишком часто в домене и являются значимыми для идентификации конкретной страницы. Удаление неселективных токенов.Boilerplate Content (шаблонных элементов) из обеих страниц.Shingling или статистического анализа вероятности совпадения токенов для оценки схожести основного контента.Процесс Б: Генерация правил трансформации (Rule Generation)
const_1). Например, www.site.com/news/123 и m.site.com/mobile/123 преобразуются в www.const_1/news/const_2 и m.const_1/mobile/const_2.Regular Expression, который описывает все возможные значения этого плейсхолдера (например, const_2 может соответствовать \d{3} — любым трем цифрам).Regular Expressions. Например: Если десктопный URL соответствует паттерну X, то мобильный URL соответствует паттерну Y.Система использует следующие типы данных:
viewport) могут использоваться для идентификации мобильных страниц.Selective URL Tokens (токены с низкой частотой).boilerplate.rel=alternate/canonical). Это функционирует как система подстраховки.shingling, удаление boilerplate). Это означает, что паритет основного контента между мобильной и десктопной версиями критически важен.selective) частях URL, игнорируя общие элементы. Это подчеркивает важность наличия уникальных идентификаторов или ключевых слов в URL.Regular Expressions позволяет масштабировать найденные паттерны на весь сайт. Это означает, что консистентность структуры URL значительно облегчает работу системы.Рекомендации актуальны для сайтов, использующих конфигурацию с раздельными URL (Separate URLs / m-dot).
shingling для верификации пар, расхождения в основном контенте могут помешать корректному сопоставлению.Regular Expressions и применить их ко всему сайту.Selective URL Tokens (например, ID продукта, уникальные слаги). Это помогает системе на этапе первичного поиска кандидатов для сопоставления.rel=alternate на десктопной странице и rel=canonical на мобильной. Это устраняет неоднозначность и снижает зависимость от автоматических алгоритмов.shingling, что приведет к тому, что страницы не будут связаны./category/page1, /category/page2), что затрудняет первичное сопоставление на основе структуры URL.Патент подтверждает стремление Google понять структуру и взаимосвязи контента на сайте, даже при сложных технических реализациях. Для SEO-стратегии это означает, что техническая реализация мобильной версии должна быть максимально чистой и последовательной. Хотя предпочтительным подходом является адаптивный дизайн (единый URL), при использовании раздельных URL необходимо стратегически подходить к структуре URL и управлению контентом, чтобы максимизировать синергию между версиями, а не создавать две независимые сущности.
Сценарий 1: Оптимизация структуры URL интернет-магазина (m-dot)
Интернет-магазин использует раздельную мобильную версию и хочет убедиться, что Google корректно сопоставляет страницы товаров.
Плохая реализация:
www.shop.com/catalog/shoes/nike-air-max-id12345.htmlm.shop.com/product.php?id=12345Анализ: Трансформация сложная. Общий Selective URL Token только один (12345). Система может связать эти страницы, но генерация общего правила для всего сайта будет затруднена из-за сильного изменения структуры пути и имен файлов.
Оптимизированная реализация:
www.shop.com/p/nike-air-max/12345/m.shop.com/p/nike-air-max/12345/Анализ: Идеальная консистентность. Паттерн трансформации прост: замена "www" на "m". Система легко сгенерирует правило: www.(.*) -> m.$1. Это гарантирует быстрое и точное сопоставление всех страниц.
Сценарий 2: Проверка паритета контента новостного сайта
Новостной сайт заметил, что мобильные версии статей плохо индексируются.
Проблема: На мобильной версии отображается только первые три абзаца статьи, а остальное скрыто под кнопкой "Читать далее" и не доступно в исходном коде при загрузке.
Анализ: Когда система применяет shingling для сравнения десктопной (полной) и мобильной (урезанной) версий, оценка схожести контента может оказаться ниже порогового значения. Страницы не будут признаны парой.
Решение: Обеспечить доступность всего основного текста статьи в исходном коде мобильной страницы при первой загрузке. Это позволит алгоритму shingling подтвердить идентичность контента.
Применяется ли этот патент к сайтам с адаптивным дизайном (Responsive Design)?
Нет. Патент специально разработан для решения проблемы сайтов, использующих отдельные URL для мобильных и десктопных версий (например, конфигурации m-dot). Сайты с адаптивным дизайном используют единый URL и единый HTML-код для всех устройств, поэтому сопоставление пар URL для них не требуется.
Как этот патент связан с Mobile-First Indexing (MFI)?
MFI означает, что Google преимущественно использует мобильную версию контента для индексации и ранжирования. Этот патент критически важен для MFI на сайтах с раздельными URL, так как он помогает Google эффективно находить мобильную версию страницы по известной десктопной и подтверждать, что это одна и та же сущность. Корректное сопоставление гарантирует, что сигналы с десктопной версии будут консолидированы с мобильной.
Что такое Shingling и почему он используется для верификации?
Шинглирование (Shingling) — это техника, при которой текст документа разбивается на короткие последовательности слов (шинглы), например, все возможные последовательности из 5 слов. Затем сравнивается процент общих шинглов между двумя документами. Это надежный способ определить, содержат ли две страницы один и тот же основной контент, даже если их структура, навигация или реклама отличаются.
Что произойдет, если контент на мобильной и десктопной версиях немного отличается?
Патент упоминает удаление шаблонного контента (boilerplate removal) перед сравнением, поэтому различия в навигации, футере или рекламе игнорируются. Однако, если основной контент значительно отличается (например, мобильная версия урезана), оценка схожести (Shingling) может оказаться ниже порога, и система не сможет автоматически подтвердить пару. Это подчеркивает важность паритета контента.
Что такое "Селективные токены URL" (Selective URL Tokens)?
Это части URL, которые помогают уникально идентифицировать страницу внутри домена. Например, в URL www.site.com/news/2025/my-article токены "news" и "2025" могут быть неселективными, так как встречаются часто, а "my-article" — селективным. Система ищет общие селективные токены для поиска потенциальных пар URL.
Означает ли этот патент, что мне больше не нужно настраивать rel=alternate и rel=canonical?
Нет. Явная настройка rel=alternate (на десктопной версии) и rel=canonical (на мобильной версии) всегда является лучшей практикой. Это дает Google четкий сигнал и устраняет необходимость полагаться на автоматические алгоритмы, описанные в патенте. Патент описывает механизм 'подстраховки' для случаев, когда эти сигналы отсутствуют или настроены некорректно.
Как непоследовательная структура URL влияет на работу этого алгоритма?
Непоследовательность сильно усложняет работу системы. Алгоритм ищет общие паттерны трансформации и генерирует правила (Regular Expressions) на их основе. Если для разных разделов сайта используются разные правила формирования мобильных URL, системе придется генерировать множество частных правил, что менее эффективно и может привести к ошибкам или неполному покрытию.
Может ли система ошибочно связать две разные страницы?
Такая вероятность существует, но она минимизируется за счет двухэтапной проверки. Сначала система ищет совпадение по селективным токенам URL, а затем проводит строгую верификацию через сравнение контента (shingling). Если две разные страницы имеют схожие URL и очень похожий контент, они могут быть ошибочно связаны.
Как система определяет, является ли URL мобильным или десктопным?
Патент предлагает несколько методов. Самый распространенный — по структуре URL (например, наличие "m." вместо "www.", пути "/m/" или параметра ?mobile=1). Также может использоваться анализ HTML-кода на наличие специфичных для мобильных устройств тегов (например, viewport) или даже рендеринг страницы для проверки ее адаптивности под мобильный экран.
Как сгенерированные правила используются Google на практике?
Правила используются тремя основными способами. Во-первых, для улучшения краулинга: предсказание мобильных URL по известным десктопным (Crawl Discovery). Во-вторых, для индексации: добавление найденных мобильных URL в индекс и их связывание с десктопными. В-третьих, при ранжировании: подмена десктопного URL на мобильный в выдаче для пользователей мобильных устройств.

SERP
Техническое SEO
Индексация

Структура сайта
Персонализация
Техническое SEO

Техническое SEO
Ссылки

SERP
Поведенческие сигналы
Персонализация

Индексация
Краулинг
Ссылки

Семантика и интент
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы

Поведенческие сигналы
Ссылки
SERP

Поведенческие сигналы
SERP
Семантика и интент

Персонализация
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
Семантика и интент

Семантика и интент
Поведенческие сигналы
Персонализация

SERP
Поведенческие сигналы
