
Система определяет языковые предпочтения пользователя и сравнивает их с языком посещаемой веб-страницы. Если страница отображается не на предпочтительном языке из-за ошибки маршрутизации (например, из-за геолокации), и существует альтернативная версия на нужном языке, система предлагает пользователю перейти на нее или автоматически перенаправляет его.
Патент решает проблему, когда пользователи попадают на версию веб-страницы, язык которой не соответствует их предпочтениям. Это может происходить из-за выбора неоптимального результата в поиске или, как особо подчеркивается в патенте, из-за ошибок маршрутизации (error in routing), когда система ошибочно отдает приоритет другим сигналам (например, геолокации по IP-адресу) вместо явных языковых предпочтений пользователя. Изобретение направлено на улучшение пользовательского опыта путем обеспечения доступа к наиболее подходящей локализованной версии контента.
Запатентована система и метод для идентификации и предложения альтернативных языковых версий веб-страницы. Система определяет предпочтительный язык пользователя (preferred language) и сравнивает его с языком текущей страницы. В случае несовпадения, особенно если это несовпадение вызвано ошибкой маршрутизации запроса, система ищет альтернативную версию страницы на предпочтительном языке и предоставляет пользователю доступ к ней, потенциально блокируя доступ к исходной (неправильной) версии.
Механизм работает в двух плоскостях: офлайн и онлайн.
Parallel Data (например, схожести URL, отличающихся только кодом языка), сравнения контента (возможно, с переводом на базовый язык) и учета спецификаций владельца сайта. Идентифицированные альтернативы группируются в кластеры (Cluster Information).Language Preference), используя настройки и индикаторы (IP, cookies, Accept-Language). При получении запроса на страницу система проверяет, соответствует ли язык страницы предпочтениям. Если нет (особенно из-за ошибки маршрутизации), система обращается к Cluster Information, находит подходящую альтернативу и перенаправляет пользователя.Высокая. Корректная обработка интернационализации (i18n) остается критически важной задачей для глобальных поисковых систем и браузеров. Обеспечение того, чтобы пользователи получали контент на предпочтительном языке, напрямую влияет на UX и конверсии. Описанные механизмы тесно связаны с тем, как Google обрабатывает локализованный контент.
Влияние на международное SEO является значительным. Хотя патент не описывает фактор ранжирования напрямую, он детализирует инфраструктуру, необходимую для идентификации, кластеризации и предоставления локализованного контента. Понимание этих механизмов критично для обеспечения того, чтобы правильная версия страницы показывалась соответствующему пользователю. Корректная техническая реализация сигналов для помощи системе в кластеризации становится первостепенной задачей.
hl=), cookies, заголовок запроса Accept-Language, User Agent и IP-адрес.Language Indicators.Формула изобретения сосредоточена на специфическом сценарии исправления ошибок маршрутизации, связанных с языком.
Claim 1 (Независимый пункт): Описывает метод на стороне сервера.
preferred language) пользователя.error in routing) исходного запроса на другую страницу.Claim 4 (Независимый пункт): Описывает аналогичный процесс с точки зрения клиентского устройства (например, браузера), взаимодействующего с сервером для исправления ошибки маршрутизации и получения доступа к правильной языковой версии (Page 2) вместо ошибочно запрошенной (Page 1).
Claims 2 и 3 (Зависимые): Уточняют, как идентифицируется альтернативная страница (Page 2). Это делается с использованием Cluster Information — заранее сгенерированных данных, связывающих страницы с похожим контентом на разных языках.
Claim 9 (Зависимый, от Claim 8, который зависит от 7): Описывает метод генерации этих связей (кластеров):
Parallel Data.Claims 5, 11, 13, 15 (Зависимые): Детализируют процесс предоставления результата. Система может автоматически отображать правильную версию (Page 2) без показа неправильной (Page 1) (Claim 5). Система может активно предотвращать доступ (preventing... from accessing) к неправильной версии, предоставляя вместо нее правильную (Claims 11, 13, 15).
Claims 16, 17, 18 (Зависимые): Уточняют причину ошибки маршрутизации. Ошибка может быть вызвана обнаруженной геолокацией (detected geolocation) устройства. Это означает, что система исправляет ситуации, когда геолокация пользователя ошибочно привела к выбору неправильного языка вопреки его предпочтениям.
Изобретение затрагивает несколько ключевых этапов поиска, обеспечивая корректную доставку локализованного контента.
CRAWLING – Сканирование и Сбор данных
На этом этапе система должна обнаружить различные языковые версии контента в интернете.
INDEXING – Индексирование и извлечение признаков
Это критически важный этап для данного патента. Система выполняет офлайн-обработку:
Parallel Data и спецификации владельцев сайтов (web page specified by a site owner).Cluster Information, связывая альтернативные версии вместе.RANKING / RERANKING – Ранжирование / Переранжирование
На этапе формирования выдачи система старается выбрать наиболее подходящую версию из кластера на основе Language Preference и Language Indicators пользователя.
Обработка Запроса (Post-Click / Redirection)
Основное применение патента, описанное в Claims, происходит здесь. Это механизм исправления ошибок (failsafe mechanism).
Cluster Information, чтобы найти правильную версию и перенаправить пользователя.Входные данные:
Language Preference пользователя (настройки, история).Language Indicators (IP, Геолокация, Accept-Language).Cluster Information (из индекса).Выходные данные:
error in routing), когда система изначально направила пользователя на неправильную версию, например, основываясь на геолокации, которая противоречит явным языковым предпочтениям.Процесс А: Офлайн-обработка (Индексирование и Кластеризация)
Parallel Data (схожесть URL, структура сайта) и спецификаций владельца сайта.Cluster Information в индексе.Процесс Б: Онлайн-обработка (Обработка запроса и Исправление ошибок)
Language Preference (возможно, используя упорядоченный список предпочтений).detected geolocation).Cluster Information, связанной с Page 1.Система использует широкий спектр данных для определения предпочтений пользователя и идентификации альтернативных версий контента.
Language Preference (настройки аккаунта, специфичные для приложения переопределения).Accept-Language.hl=), используемые для указания языка.hreflang в HTML/Sitemap) и структура URL (Parallel Data).Cluster Information) во время индексирования. Это основа для всей работы международного поиска.Parallel Data) и учет спецификаций, предоставленных владельцами сайтов (site owner specifications).preventing access) к странице на неправильном языке.hreflang: Это основной способ предоставить «спецификации владельца сайта», упомянутые в патенте. Корректное использование hreflang (в HTML, HTTP-заголовках или Sitemap) помогает Google точно формировать Cluster Information и связывать альтернативные версии.lang и избегайте смешивания нескольких языков в основном контенте. Это облегчает этап определения языка при индексировании.Parallel Data на основе схожести URL.hreflang или его неправильная реализация: Это заставляет Google полагаться исключительно на автоматические методы (сравнение контента, Parallel Data), что увеличивает риск ошибок при кластеризации.Патент подтверждает стратегическую важность надежной архитектуры для международного SEO. Google инвестирует значительные ресурсы в то, чтобы понимать и кластеризовать локализованный контент. Стратегия должна быть направлена на максимальное содействие этим процессам. Предоставление четких сигналов (в первую очередь hreflang) минимизирует вероятность того, что Google ошибется при определении релевантности ваших страниц для пользователей в разных странах и с разными языковыми предпочтениями.
Сценарий: Обеспечение правильной кластеризации контента для международного E-commerce.
hreflang. На странице США добавить: <link rel="alternate" hreflang="de-DE" href="https://site.com/de/product" />. На странице Германии добавить: <link rel="alternate" hreflang="en-US" href="https://site.com/us/product" />.Cluster Information.Как Google определяет, что две страницы являются переводами друг друга?
Google использует комбинацию методов. Во-первых, учитываются спецификации владельца сайта (на практике это реализация hreflang). Во-вторых, анализируются Parallel Data, такие как схожесть URL-структур, отличающихся только языковым кодом. В-третьих, система сравнивает контент страниц; патент упоминает, что страницы могут быть машинно переведены на базовый язык для оценки схожести контента.
Что такое «Cluster Information» в контексте этого патента?
Cluster Information — это данные в индексе Google, которые группируют веб-страницы с похожим контентом, но на разных языках. Это позволяет системе быстро находить альтернативные версии страницы. Для SEO это означает, что все ваши локализованные версии должны быть правильно связаны, чтобы попасть в один кластер.
Описывает ли этот патент работу атрибута hreflang?
Термин hreflang в патенте не используется. Однако патент ссылается на «web page specified by a site owner» (веб-страница, указанная владельцем сайта) как на один из способов идентификации альтернативных версий. В практике современного SEO именно hreflang является стандартным механизмом для предоставления таких спецификаций Google.
Почему патент так много внимания уделяет исправлению «ошибок маршрутизации» (routing errors)?
Патент подчеркивает сценарий, когда система ошибочно направляет пользователя на основе одного сигнала (например, геолокации по IP), игнорируя более важный сигнал (явное языковое предпочтение). Это указывает на то, что Google стремится приоритизировать явные предпочтения пользователя над предполагаемыми, и создает механизмы для исправления таких конфликтов в реальном времени.
Стоит ли мне использовать автоматическое перенаправление по IP-адресу на моем сайте?
Исходя из этого патента, это не рекомендуется. Google сам пытается исправить ошибки, вызванные геолокацией. Принудительное перенаправление на вашем сервере может конфликтовать с предпочтениями пользователя и мешать Googlebot сканировать все версии сайта. Лучшая практика — предлагать пользователю выбор языка, а не перенаправлять его принудительно.
Что произойдет, если контент на моих локализованных страницах немного отличается?
Патент указывает, что кластеры формируются для страниц с «similar content» (похожим контентом). Небольшие различия (например, локальные цены, контактная информация) допустимы. Однако, если контент значительно отличается, система может решить, что страницы не являются альтернативными версиями, и не объединит их в кластер, что повредит вашей международной SEO-стратегии.
Как Google определяет языковые предпочтения пользователя?
Используется иерархия сигналов (Language Indicators). Наивысший приоритет обычно имеют явные настройки пользователя (например, в аккаунте Google или браузере) и специфичные для приложения переопределения (application-specific language override). Также учитываются параметры URL, cookies, заголовок Accept-Language браузера и, в последнюю очередь, сигналы, основанные на IP-адресе.
Является ли описанный механизм фактором ранжирования?
Патент не описывает это как прямой фактор ранжирования. Однако он описывает инфраструктуру, которая определяет, какая именно страница из кластера будет показана пользователю. Если ваша страница не будет правильно кластеризована, она не сможет эффективно ранжироваться для целевой аудитории, поэтому косвенное влияние на видимость огромно.
Может ли Google найти альтернативные версии, если я не укажу их через hreflang?
Да, может. Система использует автоматические методы, такие как анализ Parallel Data (структура URL) и сравнение контента. Однако полагаться только на автоматику рискованно. Использование hreflang значительно повышает точность и надежность кластеризации вашего контента.
Что произойдет, если система обнаружит языковое несоответствие, но не найдет альтернативной версии?
Если альтернативная версия не найдена в Cluster Information, пользователь останется на исходной странице. Система может также предложить пользователю машинный перевод текущей страницы (например, через Google Translate, что также упоминается в патенте как возможный вариант). Это может негативно сказаться на поведенческих факторах и конверсии.

Структура сайта
Персонализация
Техническое SEO

Мультиязычность
Ссылки
SERP

Персонализация
Мультиязычность
SERP

Мультиязычность
Семантика и интент
SERP

Мультиязычность
Персонализация
SERP

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Local SEO

Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы
Персонализация

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Антиспам
SERP
