
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
Патент решает проблему точного определения языковой релевантности ресурса в сложных сценариях, когда традиционный анализ контента ненадежен. Это касается многоязычных страниц (например, ресурсы для изучения языков), нетекстового контента (изображения, видео) или контента, представляющего интерес для носителей разных языков (например, англоязычный сайт о международной знаменитости). Изобретение позволяет определить, для кого фактически полезен ресурс, основываясь на поведении пользователей.
Запатентована система идентификации языков, релевантных документу, основанная на анализе агрегированных поведенческих данных. Система вычисляет Language Relevance Scores (Оценки языковой релевантности) на основе того, какой Search Engine User Interface Language (Язык интерфейса поисковой системы) использовали пользователи, перешедшие на этот документ из поиска. Ключевой особенностью является взвешивание этих кликов с использованием сигналов вовлеченности (например, Dwell Time) и контекста клика.
Система работает путем анализа Click Data (Данных о кликах) в два этапа:
Language Relevance Score, основанный на взвешенной доле кликов. Эти данные сохраняются в индексе.Language Relevance Score.Высокая. Поведенческие факторы (User Engagement) и точность международного ранжирования остаются критически важными для Google. Этот патент описывает надежный механизм определения языковой релевантности, который не зависит от анализа текста на странице и напрямую связан с концепцией удовлетворенности пользователя (User Satisfaction).
Патент имеет высокое значение (8/10) для SEO, особенно для международных и многоязычных проектов. Он демонстрирует, что для ранжирования в определенном языковом сегменте недостаточно просто иметь контент на этом языке или настроить hreflang; необходимо, чтобы носители этого языка демонстрировали реальную вовлеченность (высокий Dwell Time) при переходе из поиска. Это также открывает возможности для кросс-языкового ранжирования, если контент имеет сильную межъязыковую привлекательность.
Dwell Time (время до возврата в выдачу). Короткие визиты могут снижать вес клика.Click Data и генерацию Language Relevance Scores.Resource Index) и используются при ранжировании.Claim 1 (Независимый пункт): Описывает основной метод определения и использования языковой релевантности в процессе ранжирования.
Click Data для этого ресурса: для каждого зарегистрированного клика определяется язык интерфейса, через который он был сделан.Language Relevance Scores на основе количества запросов (кликов), связанных с каждым языком интерфейса.search result score) ресурса корректируется на основе того, входит ли язык текущего запроса в набор релевантных языков ресурса.Claim 4 (Зависимый от 1): Детализирует расчет Language Relevance Scores с использованием взвешивания.
Расчет оценок включает присвоение веса (Weight) каждому из множества запросов (кликов) и вычисление оценок на основе этих весов. Система использует не просто количество кликов, а их качество или значимость.
Claims 5-9 (Зависимые от 4): Определяют факторы, используемые для расчета веса конкретного запроса (клика).
duration of a visit) к ресурсу (Dwell Time).Изобретение затрагивает этапы индексирования (для расчета и хранения данных) и ранжирования (для их применения).
INDEXING – Индексирование и извлечение признаков
Language Relevance System работает преимущественно в офлайн-режиме. Она обрабатывает агрегированные Click Data из логов поиска, вычисляет Language Relevance Scores и генерирует Relevant Language Data (языковой вектор). Эти данные сохраняются в Resource Index и ассоциируются с конкретным документом.
RANKING – Ранжирование / RERANKING – Переранжирование
На этапе ранжирования поисковая система извлекает сохраненные RLD для документа-кандидата. Система сравнивает язык текущего пользователя (определенный по языку запроса, настройкам или интерфейсу) с языковым вектором документа. Если язык пользователя имеет высокий LRS для данного документа, оценка ранжирования документа корректируется (повышается).
Входные данные:
Click Data для ресурса, включающие: язык интерфейса, продолжительность визита (Dwell Time), позиция клика в выдаче, информация о других результатах в выдаче, индикаторы мультиязычности пользователя.Выходные данные:
Relevant Language Data (Вектор языковой релевантности) для ресурса, сохраненный в индексе.Click Data для ресурса.RLD только если его LRS превышает определенный порог. Пороги могут быть разными для разных языков (например, ниже для редких языков и выше для английского).Процесс А: Офлайн-расчет Оценок Языковой Релевантности (LRS)
Click Data для этого ресурса за определенный период.LRS для языка N рассчитывается как отношение суммы весов кликов с языка N к общей сумме весов всех кликов ресурса.LRS превышают установленный порог, выбираются как релевантные.Процесс Б: Применение при ранжировании
RLD.RLD ресурса. Степень корректировки зависит от значения LRS.Патент фокусируется исключительно на поведенческих и пользовательских факторах для определения языковой релевантности.
Click Data: Основной источник данных.Duration of a visit (Dwell Time): Используется для оценки качества клика и удовлетворенности пользователя.Search Engine User Interface Language: Язык интерфейса, используемый при клике (например, по домену google.fr или настройкам).
Dwell Time (Claim 6) является критически важным фактором. Только качественные, удовлетворяющие интент клики (длительные визиты) вносят значительный вклад в LRS.Dwell Time и минимизировать быстрые возвраты в выдачу, так как это напрямую влияет на вес клика (Claim 6) и итоговый LRS для языка пользователя.LRS, даже если контент технически корректен и переведен.LRS для этого языка.Dwell Time), что снижает LRS для этого языка.Патент подтверждает стратегическую важность поведенческих сигналов как прямых факторов ранжирования. Он показывает, что Google измеряет демонстрируемую релевантность через взаимодействие с пользователем, а не просто оценивает потенциальную релевантность через анализ контента. Для долгосрочной стратегии международного SEO это означает переход от модели "перевод контента" к модели "удовлетворение потребностей локальной аудитории".
Сценарий 1: Дисамбигуация многоязычной страницы
Сайт для изучения французского языка англоговорящими. Страница содержит 50% текста на английском и 50% на французском.
Click Data. 95% кликов приходят от пользователей, использующих google.co.uk (Английский интерфейс). Эти пользователи демонстрируют высокий Dwell Time. Пользователи с google.fr (Французский интерфейс) быстро уходят.LRS для английского языка и низкий для французского. Страница будет хорошо ранжироваться для англоязычных пользователей.Сценарий 2: Кросс-языковая релевантность (Технический блог)
Высококачественная статья на английском языке о новой JavaScript библиотеке.
Dwell Time, Claim 6).LRS для русского языка, несмотря на то, что она на английском. Статья начинает ранжироваться выше в российской выдаче по релевантным запросам.Означает ли этот патент, что язык самого контента не имеет значения для ранжирования?
Не совсем. Язык контента по-прежнему важен для базовой релевантности. Однако этот патент описывает механизм, который может скорректировать релевантность на основе того, кто фактически потребляет контент. Если носители языка находят контент бесполезным (что выражается в коротком Dwell Time), Language Relevance Score будет низким, независимо от языка текста.
Как именно измеряется "Duration of a visit" (Dwell Time) и как это влияет на вес клика?
Патент определяет это как время, которое проходит до того, как пользователь возвращается на страницу результатов поиска после клика на ресурс (Claim 6). Если пользователь не возвращается, это также учитывается. Клики, приводящие к коротким визитам, получают меньший вес, так как это может указывать на то, что пользователь не нашел информацию полезной или не понял язык ресурса.
Что означает "вероятность того, что пользователь мультиязычен" и почему такие клики могут получать меньший вес?
Система может оценивать вероятность мультиязычности на основе настроек пользователя или истории его взаимодействия с контентом (Claim 5). Клики от мультиязычных пользователей могут получать меньший вес, потому что их интерес к ресурсу не обязательно свидетельствует об интересе всей языковой группы. Например, если только русско-английские билингвы кликают на английский сайт из русской выдачи, это не значит, что сайт релевантен всем русскоязычным пользователям.
Как позиция клика в выдаче влияет на Language Relevance Score (Claim 8)?
Патент утверждает, что вес клика может быть основан на его позиции. Если пользователь кликнул на результат, находящийся низко в выдаче, этот клик может получить больший вес, так как он свидетельствует о высокой заинтересованности. И наоборот, вес кликов по первому результату может быть снижен, так как пользователи часто кликают на него автоматически.
Что происходит, если пользователь пропускает результаты на своем родном языке (Claim 9)?
Это сильный позитивный сигнал. Если пользователь, использующий французский интерфейс, пропускает результаты на французском языке, чтобы кликнуть на ваш результат (независимо от его языка), вес этого клика увеличивается. Это указывает системе, что ваш ресурс более предпочтителен для этой языковой аудитории, чем доступные альтернативы на их родном языке.
Каково влияние этого механизма на автоматически переведенный контент?
Этот механизм является сильной защитой против некачественного автоматического перевода. Даже если такой контент привлекает клики, низкое качество текста обычно приводит к быстрым отказам (короткий Dwell Time). Это генерирует клики с низким весом, и, как следствие, Language Relevance Score для целевого языка будет очень низким, что приведет к понижению в ранжировании.
Как этот патент взаимодействует с атрибутом hreflang?
Hreflang сообщает Google о наличии альтернативных версий страницы. Описанный механизм работает параллельно. Hreflang помогает определить, какую версию показать, а Language Relevance Score влияет на то, насколько высоко эта версия будет ранжироваться. Если hreflang настроен корректно, но целевая аудитория демонстрирует низкую вовлеченность (низкий LRS), страница все равно будет ранжироваться плохо.
Может ли этот механизм помочь ранжироваться нетекстовому контенту (например, изображениям или видео) на международном уровне?
Да, это одно из преимуществ, упомянутых в патенте. Поскольку механизм основан на поведении пользователей, а не на анализе текста, он может эффективно определять языковую релевантность для ресурсов, где текст отсутствует. Если пользователи из Германии часто кликают на определенное видео и долго его смотрят, оно получит высокий LRS для немецкого языка.
Рассчитывается ли Language Relevance Score на уровне страницы или всего сайта?
Согласно патенту, процесс анализа и расчета оценок выполняется для конкретного ресурса (first resource), то есть на уровне отдельной страницы (документа). Система анализирует данные о кликах, относящиеся именно к этому URL.
Как быстро система реагирует на изменения в поведении пользователей?
Расчет LRS происходит в офлайн-режиме путем анализа данных о кликах за определенный период. Патент упоминает возможность обновления оценок через предопределенные интервалы времени или после накопления определенного количества новых кликов. Это означает, что система не реагирует мгновенно, но адаптируется по мере изменения паттернов поведения.

Мультиязычность
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Мультиязычность
Персонализация

Ссылки
Мультиязычность
Семантика и интент

Мультиязычность
Поведенческие сигналы

Мультиязычность
Семантика и интент
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Knowledge Graph
SERP
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

SERP
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Индексация
Семантика и интент

Антиспам
Ссылки
Семантика и интент

Персонализация
Семантика и интент
Мультимедиа

Техническое SEO
Поведенческие сигналы
SERP

Семантика и интент
SERP
Персонализация

Поведенческие сигналы
Local SEO
