
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.
Патент решает проблему точного определения языков, которым релевантен конкретный ресурс, особенно когда традиционный анализ контента неэффективен. Это актуально для страниц с недостаточным количеством текста (например, страницы только с изображениями, фреймами или навигационные хабы). Также решается задача идентификации всех релевантных языков для ресурсов со смешанным контентом.
Запатентована система определения языковой релевантности ресурса путем анализа контекста его входящих (incoming resource links) и исходящих (outgoing resource links) ссылок. Система извлекает языковые признаки (Language Features) из ссылочного окружения и использует модель классификации (Language Classification Model) для расчета оценок языковой релевантности (Language Relevance Scores). Эти оценки агрегируются для создания языкового профиля ресурса.
Ключевой механизм работы системы:
Language Features: язык анкоров, коды в URL, язык контента исходной и целевой страниц.Language Relevance Scores (LRS) для каждой ссылки. Оценка зависит от контекста: например, исходящая ссылка с анкором "English Version" может снизить релевантность английского для текущей страницы, но повысить её для целевой.Link Quality), например, понижается вес шаблонных (boilerplate) ссылок. Система также идентифицирует Language Gateway Resources (Языковые шлюзы); ссылки с них получают повышенный вес.Relevant Language Data (RLD) для ресурса (например, вектора вероятностей языков).Высокая. Корректная идентификация языка является фундаментальной задачей международного поиска. Хотя алгоритмы NLP значительно продвинулись, анализ ссылочного контекста остается критически важным сигналом для определения языковой и географической релевантности, особенно для сложных многоязычных сайтов и нетекстового контента.
Патент имеет высокое значение (7/10) для международного SEO. Он описывает механизм, который Google использует для понимания языкового таргетинга страницы за пределами анализа её контента и тегов hreflang. Если ссылочные сигналы (анкоры, язык источников) противоречат заявленному языку страницы, это может привести к неправильной классификации и проблемам с видимостью сайта на целевых рынках.
Language Features для генерации Language Relevance Scores.Link Quality, статус Language Gateway источника.boilerplate, размер шрифта, позиция на странице, наличие "nofollow".Claim 1 (Независимый пункт): Описывает основной метод работы системы.
Language Relevance Scores (LRS) для каждой входящей И исходящей ссылки на основе данных, определяющих эти ссылки.Ядро изобретения — использование контекста как входящих, так и исходящих ссылок для определения языкового профиля ресурса.
Claim 2 (Зависимый): Уточняет признаки, используемые для генерации LRS.
target content language).source content language).Claim 3 (Зависимый): Уточняет использование Language Indicators в самих ссылках (например, анкорный текст или код страны в URL) для генерации LRS.
Claim 6 (Зависимый): Вводит понятие Link Quality как фактора, влияющего на генерацию LRS.
Claim 7 и 8 (Зависимые): Вводят концепцию Language Gateway Resource.
Language Gateway Resource (бустинг сигнала).Language Gateway, если количество релевантных языков по входящим ссылкам превышает порог N, И количество релевантных языков по исходящим ссылкам превышает порог M.Claim 11 (Зависимый): Описывает реализацию с использованием модели. LRS генерируется путем идентификации множества Language Features и их обработки с помощью Language Classification Model.
Изобретение применяется преимущественно на этапе индексирования и влияет на ранжирование.
INDEXING – Индексирование и извлечение признаков
Основной этап применения. Language Relevance System анализирует граф ссылок.
Feature Extractor собирает Language Features (анкоры, URL, язык соседних страниц, Link Quality). Language Classification Model вычисляет LRS для каждой ссылки и классифицирует ресурс (Gateway/Common).Relevant Language Data (RLD) и классификация ресурса сохраняются в Resource Index.RANKING – Ранжирование
Поисковая система использует сохраненные RLD как один из признаков при расчете релевантности ресурса запросу (например, сопоставляя RLD с языком запроса пользователя).
Входные данные:
Link Quality (boilerplate, позиция, шрифт).Language Gateway Resource активируется при превышении порогов N (разнообразие языков входящих ссылок) и M (разнообразие языков исходящих ссылок).Процесс А: Расчет языковой релевантности ресурса
Language Features: Link Quality (boilerplate, позиция, шрифт, nofollow).Language Gateway или Common).Common Source Feature (сайт, домен), чтобы ограничить чрезмерное влияние одного источника.Language Classification Model генерирует Language Relevance Scores (LRS) для каждой ссылки/группы ссылок. Оценки корректируются: Language Gateway Resource.boilerplate ссылок.Relevant Language Data (RLD).Resource Index.Процесс Б: Идентификация Language Gateway Resources
Language Gateway Resource. Этот статус сохраняется и используется в Процессе А (шаг 4) для других ресурсов.Boilerplate: Является ли ссылка частью повторяющегося шаблонного блока.Language Gateway Resource.Common Source Feature: Принадлежность ссылок к одному источнику.Language Features.boilerplate ссылок и повышает вес заметных ссылок.Language Gateways; снижение LRS при низком Link Quality; ограничение влияния ссылок с Common Source.Language Gateway Resources (многоязычные хабы). Ссылки с таких ресурсов считаются более надежными индикаторами языка и получают повышенный вес.Link Quality. Ссылки в сквозных блоках (boilerplate), с мелким шрифтом или внизу страницы имеют меньший вес. Уникальные и заметные ссылки имеют больший вес.Common Source Feature предотвращает ситуацию, когда один сайт с множеством ссылок может непропорционально повлиять на определение языка целевого ресурса.Language Indicators.boilerplate) могут иметь пониженный вес, они должны быть реализованы качественно.Language Gateway Resource (получают ссылки извне на разных языках и ссылаются на разные языки внутри). Это усиливает языковые сигналы для внутренних разделов.source content language) является прямым фактором.Language Features.Language Indicators ослабляет языковые сигналы.Link Quality и, соответственно, их влияние на определение языка.Language Relevance Score ссылки.Патент подтверждает необходимость комплексного подхода к международному SEO. Недостаточно просто перевести контент и настроить hreflang. Стратегия должна включать создание соответствующей языковой экосистемы вокруг контента через ссылочный граф. Этот механизм объясняет, почему Google может алгоритмически определить язык страницы, основываясь на её ссылочном профиле, даже если контент страницы или декларативные теги говорят об обратном.
Сценарий: Оптимизация главной страницы международного бренда (Language Gateway)
Компания выходит на рынки Франции и Германии. Главная страница (brand.com) служит хабом.
Language Gateway Resource и усилить сигналы для brand.com/fr/ и brand.com/de/.Link Quality, не boilerplate) со ссылками с анкорами "Français" и "Deutsch".Language Gateway.Language Gateway (brand.com) получает повышенный вес (Boost).Что такое «Языковой шлюз» (Language Gateway Resource) и почему он важен?
Language Gateway Resource — это страница (часто главная страница глобального сайта), которая имеет как входящие ссылки с множества разных языков, так и исходящие ссылки на множество разных языков. Важность заключается в том, что Google считает такие страницы авторитетными: ссылки, исходящие с них, получают повышенный вес (Boost) при определении языка целевой страницы.
Как Google обрабатывает сквозные (boilerplate) ссылки при определении языка?
Патент указывает, что Link Quality является фактором. Ссылки, идентифицированные как "boilerplate" (шаблонные или сквозные, например, в меню или футере), получают пониженный вес при расчете Language Relevance Scores. Если ваш переключатель языков реализован как низкокачественный сквозной блок, его влияние будет снижено.
Как этот патент влияет на использование атрибута hreflang?
Патент описывает алгоритмический механизм определения языка на основе ссылок. Он не заменяет hreflang, который дает явные инструкции. На практике эти системы дополняют друг друга. Сигналы из ссылочного графа используются для валидации hreflang или определения языка при его отсутствии. Важно, чтобы сигналы не противоречили друг другу.
Влияет ли язык анкорного текста на определение языка страницы?
Да, это один из ключевых Language Indicators. Система анализирует язык анкора и наличие явных указаний языка. Важно, что система учитывает контекст: исходящая ссылка с анкором "French version" может сигнализировать, что текущая страница НЕ на французском, но целевая страница — на французском.
Как система определяет язык, если на странице вообще нет текста (например, только изображение)?
Это основная проблема, которую решает патент. В отсутствие текста система полностью полагается на контекст ссылок: язык анкоров входящих и исходящих ссылок, язык контента ссылающихся страниц и страниц, на которые ссылается ресурс. Анализ этого контекста позволяет присвоить языковой профиль нетекстовому ресурсу.
Может ли один сайт с тысячами ссылок исказить языковую принадлежность моего сайта?
Патент предусматривает защиту от этого с помощью Common Source Feature. Система группирует ссылки, исходящие из одного источника (сайта, домена или страницы), и ограничивает их общее влияние на итоговый расчет Relevant Language Data. Это предотвращает непропорциональное влияние одного источника.
Влияет ли позиция ссылки на странице или размер шрифта на её вес?
Да, это часть оценки Link Quality. Патент указывает, что система может увеличивать Language Relevance Scores для ссылок с крупным шрифтом и расположенных ближе к началу ресурса, по сравнению со ссылками с мелким шрифтом или расположенными в футере.
Влияет ли PageRank или авторитетность ссылающегося сайта на языковую оценку?
Да, патент упоминает, что важность ресурса (Resource Importance) может учитываться. Language Relevance Scores для входящих ссылок с более важных (авторитетных) ресурсов могут быть увеличены по сравнению с оценками от менее важных ресурсов.
Как лучше оформлять ссылки на другие языковые версии: флагами или текстом?
Текстом. Исходя из патента, текстовый анкор является сильным Language Feature. Флаги (изображения) не дают явного текстового сигнала, что усложняет анализ. Лучшая практика — использовать название языка на целевом языке (например, "Deutsch"), так как это напрямую указывает на язык целевого ресурса.
Как обучается Language Classification Model?
Модель обучается с использованием методов машинного обучения с учителем (упоминаются Naïve Bayes, SVM, логистическая регрессия). Используются обучающие данные — ресурсы, для которых релевантные языки были определены людьми-оценщиками. Модель учится присваивать веса различным Language Features (анкорам, URL, качеству ссылок и т.д.) для точного предсказания языка.

Мультиязычность
Поведенческие сигналы
SERP

Мультиязычность
Ссылки
SERP

Мультиязычность
Семантика и интент
SERP

Мультиязычность
Персонализация
Индексация

Структура сайта
Персонализация
Техническое SEO

Local SEO
Ссылки
SERP

Персонализация
Ссылки

Семантика и интент
SERP
Поведенческие сигналы

Мультиязычность
Ссылки
SERP

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы
SERP

SERP
EEAT и качество
Поведенческие сигналы

Семантика и интент
Ссылки
Knowledge Graph

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
