
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
Патент решает проблему ограниченности стандартных подходов к ранжированию, которые часто слишком строго фильтруют результаты по языку предпочтений пользователя. Это не учитывает поведение многоязычных пользователей, которые часто потребляют контент на языках, отличных от их основного предпочтения (например, носители хинди, читающие на английском, или разработчики, ищущие документацию). Изобретение улучшает релевантность выдачи, предлагая контент на альтернативных языках, если он статистически популярен среди пользователей с аналогичными языковыми настройками.
Запатентована система корректировки ранжирования на основе анализа исторических данных о взаимодействии пользователей с контентом в привязке к их языковым предпочтениям (user language preferences). Суть изобретения заключается в генерации language statistics для документов и вычислении специфического веса (Language Selection Weight). Этот вес используется для повышения в выдаче тех документов, которые демонстрируют высокую привлекательность (высокий CTR) для пользователей с определенным языковым предпочтением, даже если язык документа отличается.
Система работает в несколько этапов:
selection data repository. Каждое взаимодействие ассоциируется с языковым предпочтением пользователя (явным или неявным).language statistics для конкретных документов. Это включает подсчет кликов (selection count) и показов (presentation count) для каждой пары "документ + языковое предпочтение".query language preference.Language Selection Weight. Этот вес основан на двух ключевых метриках: (A) популярности документа среди пользователей с данным языковым предпочтением и (B) CTR документа среди этой же группы.Language Selection Weight применяется для модификации базового ranking score документа, повышая позиции контента, релевантного для данной языковой группы.Высокая. Понимание поведения многоязычных пользователей и персонализация выдачи на основе поведенческих сигналов (включая CTR) являются ключевыми направлениями развития поиска Google. В условиях глобализации способность точно ранжировать контент для пользователей с разными основными языками (например, англоязычный контент для неанглоязычной аудитории) остается критически важной задачей.
Патент имеет высокое значение (8/10) для SEO, особенно в контексте международной стратегии. Он демонстрирует, что релевантность не ограничивается совпадением языка контента и языка пользователя. Ключевым фактором становится поведенческая привлекательность (CTR) контента для конкретного языкового сегмента аудитории. Это означает, что оптимизация сниппетов и контента для повышения CTR среди целевых языковых групп может напрямую влиять на ранжирование, даже если контент представлен на другом языке.
selection data repository (например, click log).Selection Count и Presentation Count.ranking score документа. Основан на статистике взаимодействия пользователей с определенным языковым предпочтением с этим документом.Claim 1 (Независимый пункт): Описывает основной метод работы системы.
language-content correspondence data, связывающие языковые предпочтения пользователей и их выбор контента.selection count (клики) и presentation count (показы) для каждой комбинации контента и языка. Определения критически важны: Selection count: сколько раз пользователи с предпочтением языка X кликнули на документ Y.Presentation count: сколько раз пользователям с предпочтением языка X был показан документ Y.language statistics на основе этих данных.query language preference.language statistics и query language preference для генерации ранжирования.Claim 6 (Зависимый от 1): Детализирует процесс ранжирования.
Генерация ранжирования включает вычисление Language Selection Weight для документов. Итоговый ranking score документа зависит от этого веса.
Claim 8 (Зависимый от 6): Определяет конкретную формулу для Language Selection Weight.
Вес вычисляется по формуле:
Где:
A – процент от общего числа пользователей, кликнувших на документ, которые имеют языковое предпочтение, соответствующее запросу. (Относительная популярность документа внутри языковой группы).B – процент кликов (CTR) на документ среди пользователей, имеющих языковое предпочтение, соответствующее запросу. (Привлекательность документа для языковой группы).bias1, bias2, bias3 – калибровочные (смещающие) коэффициенты.Формула явно интегрирует поведенческие факторы (популярность и CTR), сегментированные по языку пользователя, в расчет ранжирования.
Изобретение затрагивает несколько этапов поисковой архитектуры, используя данные, собираемые офлайн, и применяя их в реальном времени.
INDEXING – Индексирование и извлечение признаков (Офлайн-процессы)
Content Item Selection Records в selection data repository (логи кликов).Language classifier) агрегирует эти данные для генерации language statistics (включая метрики A и B). Эти статистики затем используются для обновления индекса (content item index) (Claim 3).RANKING / RERANKING – Ранжирование и Переранжирование (Онлайн-процессы)
Основное применение патента.
Ranking Engine получает query language preference и извлекает из индекса предварительный набор результатов с их базовыми оценками и language statistics.Language Selection Weight для каждого документа, используя формулу из Claim 8, подставляя значения A и B, релевантные для текущего query language preference.ranking scores корректируются с помощью вычисленного веса (например, путем умножения).Входные данные:
Query Language Preference.Language Statistics для каждого результата (агрегированные Selection Counts и Presentation Counts).Выходные данные:
Ranking Scores.query language preference (явно или неявно).language statistics (данных о кликах и показах) для документов-кандидатов по данному языковому предпочтению.Процесс А: Офлайн-подготовка данных
Language Preference пользователя.selection data repository.language statistics для каждого документа (или домена, согласно Claim 2). Рассчитываются Selection Counts и Presentation Counts для всех языков.content item index.Процесс Б: Обработка запроса в реальном времени
Query Language Preference (например, Немецкий).ranking scores.Query Language Preference (Немецкий).Language Selection Weight по формуле .ranking scores документов корректируются (например, умножаются) на Language Selection Weight. Документы на других языках (например, Английском), популярные у немецкоговорящих пользователей, получат повышение.Патент фокусируется исключительно на использовании поведенческих и пользовательских данных в рамках этого механизма.
Selection Count (Клики): Количество выборов документа пользователями, сегментированное по языковому предпочтению.Presentation Count (Показы): Количество показов документа пользователям, сегментированное по языковому предпочтению.User Language Preference: Языковые настройки пользователя, полученные из профиля, настроек браузера, cookies или определенные неявно по поведению.Другие факторы (контентные, ссылочные и т.д.) используются для расчета базового ranking score, но не являются частью данного изобретения.
Система вычисляет следующие ключевые метрики:
language statistics. Для новых сайтов этот механизм может не активироваться из-за недостатка данных.Language Selection Weight.Language Selection Weight от разных языковых групп.Language Selection Statistics и улучшаете видимость для многоязычной аудитории.Language Selection Weight и ухудшит ранжирование для этих пользователей.Патент подтверждает стратегическую важность поведенческих факторов (в частности, сегментированного CTR) в алгоритмах ранжирования Google. Он подчеркивает, что Google рассматривает релевантность как функцию от предпочтений и поведения целевой аудитории, а не просто как свойство контента. Для долгосрочной международной SEO-стратегии критически важно не просто переводить контент, а понимать и оптимизировать пользовательский опыт и привлекательность сниппетов для каждого ключевого языкового сегмента.
Сценарий: Продвижение англоязычного сайта с ПО в Германии
Language Selection Weight. Это позволит англоязычной странице эффективно конкурировать с локализованными результатами в немецкой выдаче.Как Google определяет языковые предпочтения пользователя (Language Preference)?
Патент указывает, что предпочтение может быть определено явно или неявно. Явные индикаторы включают настройки языка в аккаунте пользователя, настройки браузера, cookies или параметры запроса. Неявные индикаторы могут включать язык, используемый в предыдущих запросах пользователя, или паттерны выбора контента на определенном языке в истории поиска.
Что важнее в формуле Language Selection Weight: Метрика A (популярность) или Метрика B (CTR)?
Патент не указывает относительную важность A и B. Формула складывает оба компонента: . Это означает, что для достижения высокого веса документ должен быть одновременно популярен среди данной языковой группы (высокий A) и иметь высокую кликабельность при показе этой группе (высокий B). Оба фактора критичны.
Влияет ли язык самого контента на работу этого алгоритма?
Напрямую – нет. Алгоритм оперирует статистикой кликов и языковыми предпочтениями пользователей, а не анализом языка текста на странице. Цель патента как раз и состоит в том, чтобы позволить контенту на языке Y ранжироваться для пользователей с предпочтением языка X, если статистика показывает, что этот контент им интересен.
Как этот патент влияет на стратегию использования hreflang?
Патент не упоминает hreflang. Hreflang помогает Google показать правильную версию страницы. Однако этот патент подчеркивает, что Google также использует поведение для определения релевантности. Если, например, английская версия имеет значительно более высокий CTR у немецких пользователей, чем немецкая версия, этот механизм может предпочесть английскую версию, основываясь на высоком Language Selection Weight.
Что делать, если мой сайт на английском языке плохо ранжируется в неанглоязычных странах?
В контексте этого патента, это может означать, что ваш сайт имеет низкие показатели Метрики A и B среди пользователей с соответствующими языковыми предпочтениями. Необходимо проанализировать CTR вашего сайта в этих регионах и работать над оптимизацией сниппетов и контента, чтобы повысить их привлекательность для этих языковых групп.
Применяется ли этот механизм только к многоязычным странам, таким как Индия или Швейцария?
Нет. Хотя патент приводит примеры, актуальные для многоязычных регионов (хинди/английский), механизм универсален. Он применяется везде, где пользователи потребляют контент на языках, отличных от их основного предпочтения. Например, он актуален для ранжирования англоязычного контента в Скандинавии, Германии или России.
Может ли этот механизм понизить мой сайт в выдаче?
Да. Language Selection Weight является модификатором ранжирования. Если ваши конкуренты имеют высокие показатели A и B для определенной языковой группы, а ваш сайт имеет низкие, вы будете ранжироваться ниже. Низкий CTR среди целевой языковой аудитории приведет к низкому весу и, соответственно, к более низким позициям для этой аудитории.
Как система обрабатывает новые сайты без истории кликов?
Для новых сайтов language statistics будут отсутствовать. В этом случае Language Selection Weight, вероятно, будет нейтральным. Ранжирование будет основываться на стандартных факторах, пока не накопится достаточный объем данных о поведении пользователей.
Агрегируются ли эти данные на уровне документа или домена?
Патент (Claim 2) указывает, что language statistics могут быть агрегированы как для отдельных элементов контента (документов), так и на основе доменов (domains corresponding to the content items). Это позволяет применять обобщенные статистики домена к отдельным страницам.
Является ли это подтверждением того, что Google использует CTR как фактор ранжирования?
Да, в рамках описанной системы. Патент явно определяет Метрику B как "click through percentage" (процент кликов) для пользователей с определенным языковым предпочтением и включает ее в формулу расчета Language Selection Weight, который напрямую влияет на ranking score.

Мультиязычность
Поведенческие сигналы
SERP

Мультиязычность
Поведенческие сигналы
Персонализация

Персонализация
Мультиязычность
SERP

Мультиязычность
Семантика и интент
SERP

Поведенческие сигналы
Мультиязычность
Персонализация

Knowledge Graph
Семантика и интент
EEAT и качество

Ссылки
SERP
Семантика и интент

Структура сайта
SERP
Ссылки

Ссылки
Антиспам
Краулинг

Knowledge Graph
Семантика и интент
Персонализация

Персонализация
EEAT и качество
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Антиспам
Ссылки
Техническое SEO

EEAT и качество
Семантика и интент
SERP

Поведенческие сигналы
EEAT и качество
SERP
