Как Google приоритизирует локальное поведение пользователей над глобальной популярностью в международном поиске

Google использует систему для корректировки поискового ранжирования на основе местоположения и языка пользователя. Система приоритизирует данные о кликах от конкретной популяции пользователей (например, страны) над более широкими популяциями (например, глобальными данными). Глобальные сигналы популярности «понижаются» в весе, чтобы гарантировать более высокое ранжирование локально релевантных результатов, даже если они менее популярны в мировом масштабе.

Описание

Какую задачу решает

Патент решает проблему искажения локальной поисковой выдачи результатами, которые популярны глобально, но менее релевантны для конкретной популяции пользователей. Он устраняет уязвимость, при которой высокий Click-Through Rate (CTR) или другие поведенческие метрики в одной большой стране (например, США) могут неправомерно повысить ранжирование результата в меньшей стране (например, Канаде), вытесняя локально релевантные документы.

Что запатентовано

Запатентована система модификации ранжирования, использующая иерархические популяции пользователей (например, Страна, Язык, Глобальный уровень) для расчета quality of result statistic (статистики качества результата), основанной на поведении пользователей (кликах). Ключевым элементом является механизм «понижения веса» (deemphasizing) данных из более широких популяций при их комбинировании с данными из более специфичных популяций для сохранения локальной релевантности.

Как это работает

Система собирает и агрегирует данные о кликах (click data), которые взвешиваются по времени просмотра (viewing time), и категоризирует их по странам и языкам. При оценке релевантности документа для конкретного контекста (например, пользователь из Канады, ищущий на английском языке), система приоритизирует данные о кликах из Канады. Если этих данных недостаточно, она использует данные для английского языка в целом (более широкая популяция). Однако, чтобы глобальные данные не исказили локальную выдачу, система применяет правила для «понижения веса» глобальных данных, особенно если локальные сигналы слабее глобальных.

Актуальность для SEO

Высокая. Международный и локализованный поиск являются фундаментальными аспектами работы Google. Использование поведенческих сигналов (кликов, dwell time) с поправкой на контекст пользователя остается критически важным механизмом ранжирования в 2025 году. Этот патент описывает базовую логику того, как Google интерпретирует поведенческие факторы в международном контексте.

Важность для SEO

Патент имеет высокое значение (8/10), особенно для международного SEO. Он демонстрирует, что глобальная популярность и высокий глобальный CTR не гарантируют высоких позиций в локальной выдаче. Система требует локализованного подхода к оптимизации и измерению эффективности, подчеркивая важность удовлетворения локальных пользователей над глобальными метриками.

Детальный разбор

Термины и определения

Click Data (Данные о кликах): Агрегированная информация о взаимодействии пользователей с результатами поиска, включающая клики и время просмотра документа (dwell time). Клики часто взвешиваются (weighted clicks) в зависимости от продолжительности просмотра (короткие, средние, длинные).
Deemphasize (Понижение веса / Приглушение): Процесс уменьшения влияния данных из второй (более широкой) популяции при расчете итоговой статистики качества. Это может достигаться за счет применения коэффициентов сглаживания (smoothing factors) или других весовых функций.
First Population (Первая популяция): Более специфичная группа пользователей, например, пользователи из определенной страны (Country-specific).
LCC (Long Click Count) Fraction (Доля длинных кликов): Метрика, упомянутая в описании патента. Оценивает качество результата на основе доли кликов, которые привели к длительному просмотру страницы, независимо от других результатов по запросу.
Population (Популяция): Группа пользователей, объединенная общими признаками, такими как страна, язык или глобальная совокупность всех пользователей.
Quality of Result Statistic (Статистика качества результата): Итоговая метрика, рассчитанная путем комбинирования данных о кликах из разных популяций (с учетом понижения веса). Используется как входной сигнал для ранжирования.
Second Population (Вторая популяция): Более широкая группа пользователей, включающая первую популяцию. Например, пользователи, говорящие на определенном языке (Language-specific) или глобальная база (Generic).
Traditional Click Fraction (Традиционная доля кликов): Метрика, упомянутая в описании патента. Оценивает популярность результата относительно других результатов для данного запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод модификации ранжирования на основе популяций.

Идентификация данных о кликах (click data) для документа, где каждый клик взвешен по времени просмотра (viewing time) и ассоциирован со страной и языком пользователя.
Расчет первых данных (first click data) путем агрегации взвешенных кликов для конкретной страны.
Расчет вторых данных (second click data) путем агрегации взвешенных кликов для конкретного языка (более широкая популяция).
Понижение веса (deemphasizing) вторых данных относительно первых, основываясь, как минимум, на определении того, что язык запроса и язык пользовательского интерфейса совпадают.
Расчет quality of result statistic путем комбинирования первых данных с пониженными в весе вторыми данными.
Предоставление этой статистики как входного сигнала для ранжирования документа.

Если язык запроса совпадает с языком интерфейса (например, английский запрос на google.ca), система предполагает локальный интент и понижает влияние глобальных данных о кликах, чтобы предотвратить доминирование результатов, популярных за пределами этой страны.

Claim 2 (Зависимый от 1): Определяет дополнительное условие для понижения веса.

Определяется первая доля кликов (first click fraction) на основе первых данных (Страна).
Определяется вторая доля кликов (second click fraction) на основе вторых данных (Язык).
Если первая доля МЕНЬШЕ второй доли, вторые данные понижаются в весе.

Это критически важный механизм. Если документ очень популярен глобально (высокая вторая доля), но менее популярен в конкретной стране (низкая первая доля), система активно уменьшает буст от глобальной популярности, чтобы защитить локальную релевантность.

Claim 3 (Зависимый от 1): Определяет еще одно условие для понижения веса.

Определяется, совпадает ли язык документа с языком пользовательского интерфейса.
Если ДА, вторые данные понижаются в весе.

Если пользователь видит результат на том же языке, что и его интерфейс, система понижает влияние глобальных кликов, приоритизируя локальное поведение.

Где и как применяется

Изобретение применяется на финальных этапах обработки запроса для корректировки ранжирования на основе поведенческих данных.

CRAWLING & INDEXING – Сканирование, Индексирование и Сбор данных
На этом этапе происходит сбор и сохранение сырых данных о поведении пользователей (Result Selection Logs). Эти данные включают запрос (Q), документ (D), время просмотра (T), язык (L) и страну (C) пользователя. Данные агрегируются и сохраняются в иерархической структуре баз данных (например, Глобальная -> Язык -> Страна).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. Компонент Rank Modifier Engine использует данные из Result Selection Logs для расчета quality of result statistic.

Получение контекста: Определяется контекст пользователя (Страна, Язык).
Извлечение данных: Система извлекает данные о кликах для пары Запрос-Документ из наиболее специфичной популяции (например, Страна).
Обработка Разреженности (Backoff): Если специфичных данных недостаточно, система обращается к более широкой популяции (например, Язык или Глобальный уровень).
Применение Deemphasizing: При комбинировании данных из разных уровней применяются правила понижения веса для более широких данных.
Расчет статистики: Генерируется финальная quality of result statistic (например, скорректированная доля кликов).
Модификация ранжирования: Эта статистика используется для корректировки Ranking Score документа.

Входные данные:

Исходный запрос пользователя.
Контекст пользователя (Страна, Язык интерфейса).
Язык документа.
Агрегированные данные о кликах (Click Data) из иерархических баз данных (Страна, Язык, Глобальный уровень).

Выходные данные:

Quality of result statistic, которая используется как сигнал для модификации ранжирования.

На что влияет

Конкретные типы контента и ниши: Наибольшее влияние оказывается на сайты, работающие в международном масштабе или в нескольких регионах с одним языком (например, США/Канада/Великобритания). Особенно актуально для e-commerce, новостных и информационных сайтов, где интент и релевантные ответы могут сильно отличаться географически.
Специфические запросы: Влияет на запросы с неоднозначным географическим интентом или запросы, где популярные ответы различаются в разных странах (например, названия брендов, общие информационные запросы типа «страхование» или «доставка еды»).

Когда применяется

Условия применения: Алгоритм применяется при расчете поведенческих факторов ранжирования для запросов, по которым накоплена статистика кликов в разных популяциях.
Триггеры активации: Механизм понижения веса (deemphasizing) активируется, когда система комбинирует данные из разных уровней иерархии популяций (например, при нехватке данных на уровне страны и использовании данных на уровне языка).
Специфические условия активации понижения:
- Когда доля кликов в специфичной популяции ниже, чем в широкой.
- Когда язык запроса совпадает с языком интерфейса.
- Когда язык документа совпадает с языком интерфейса.

Пошаговый алгоритм

Процесс расчета статистики качества результата:

Идентификация запроса и контекста: Система получает запрос и определяет контекст пользователя (Страна, Язык интерфейса), а также язык запроса.
Определение популяций: Устанавливается иерархия популяций. Например, Первая популяция (специфичная) = Страна пользователя; Вторая популяция (широкая) = Язык пользователя.
Извлечение первых данных: Система извлекает агрегированные данные о кликах (first click data) для данного запроса и документа из Первой популяции.
Извлечение вторых данных: Система извлекает агрегированные данные о кликах (second click data) из Второй популяции.
Оценка условий для понижения веса: Система проверяет выполнение условий для deemphasizing:
- Совпадают ли язык запроса и язык интерфейса?
- Совпадают ли язык документа и язык интерфейса?
- Является ли доля кликов, рассчитанная по первым данным, меньше доли кликов, рассчитанной по вторым данным?
Применение понижения веса: Если условия выполнены, вес вторых данных уменьшается относительно первых. Это может быть реализовано через применение коэффициентов сглаживания (smoothing factors), которые зависят от объема первых данных.
Комбинирование данных: Первые данные и пониженные в весе вторые данные объединяются. Например, с использованием иерархических формул, приведенных в описании патента.
Генерация статистики: Создается итоговая quality of result statistic.
Передача сигнала ранжирования: Статистика передается в систему ранжирования для корректировки Ranking Score документа.

Какие данные и как использует

Данные на входе

Поведенческие факторы:
- Клики (Clicks) на результаты поиска.
- Время просмотра документа (Dwell time / Time on document). Используется для классификации кликов (короткие, средние, длинные) и их взвешивания.
- Логи выбора результатов (Result Selection Logs).
Географические факторы:
- Страна пользователя (Country), определяемая, например, по IP или используемому интерфейсу (e.g., google.ca).
Пользовательские факторы (Контекст):
- Язык интерфейса (Language of the user interface).
- Язык запроса (Language of the query).
Контентные факторы:
- Язык документа (Language of the document).

Какие метрики используются и как они считаются

Система использует метрики, основанные на взвешенных кликах, и применяет иерархический подход к их расчету.

Взвешенные клики (Weighted Clicks — #WC): Клики взвешиваются на основе времени просмотра. Длинные клики получают больший вес, короткие – меньший или отрицательный.
Традиционная доля кликов (Traditional Click Fraction): Метрика популярности относительно других результатов. Пример формулы из описания: $[\#WC(Q,D)] / [\#WC(Q) + S0]$ , где S0 – коэффициент сглаживания.
Доля длинных кликов (LCC Fraction): Метрика качества результата, независимая от позиции. Пример формулы из описания: $[\#WC(query,url)] / [\#C(query,url) + S0]$ .
Иерархические метрики: Метрики рассчитываются на разных уровнях:
- BASE (Глобальный уровень).
- LANG (Уровень языка).
- COUNTRY (Уровень страны).
Коэффициенты сглаживания (Smoothing Factors — S0, S1, S2): Используются для реализации механизма deemphasizing и backoff (отката к более общему уровню). Патент предполагает, что эти коэффициенты могут настраиваться, например, в зависимости от объема трафика в популяции.
Комбинирование метрик: Система комбинирует метрики с разных уровней, применяя правила понижения веса. Например, итоговая метрика COUNTRY использует данные уровня страны, а также данные LANG (пониженные в весе) и BASE (еще более пониженные в весе).

Выводы

Приоритет локального поведения над глобальным: Google активно приоритизирует сигналы удовлетворенности пользователей (Click Data, LCC) из специфичной популяции (Страна) над сигналами из более широкой популяции (Язык, Глобальный уровень).
Механизм защиты от глобального искажения (Deemphasizing): Система использует конкретные правила для «понижения» веса глобальных данных. Особенно важно правило: если локальная популярность ниже глобальной, влияние глобальных данных агрессивно снижается. Это предотвращает доминирование глобально популярных, но локально нерелевантных результатов.
Контекст определяет интерпретацию кликов: Ценность клика зависит не только от его продолжительности (dwell time), но и от контекста, в котором он был совершен (Страна пользователя, Язык интерфейса, Язык запроса). Совпадение языка запроса и интерфейса интерпретируется как сильный сигнал локального интента.
Критичность локализованного анализа эффективности: Для международного SEO недостаточно отслеживать глобальные метрики. Необходимо анализировать CTR и удовлетворенность пользователей в разрезе каждой целевой страны и языка.

Практика

Best practices (это мы делаем)

Оптимизация под локальный интент и удовлетворенность: Сосредоточьтесь на создании контента, который максимально полно отвечает на запросы пользователей в конкретной стране. Цель — добиться высоких показателей LCC (Long Click Count) именно среди локальной аудитории, а не только высокого глобального CTR.
Локализованный мониторинг эффективности: Отслеживайте ранжирование, CTR и поведенческие метрики отдельно для каждой целевой страны и языка. Не полагайтесь на средние или глобальные данные. Эффективность в США не гарантирует эффективность в Канаде или Великобритании.
Усиление локальных сигналов: Используйте локальные сигналы релевантности (локальные ссылки, упоминания в местных СМИ, привязка к местным сущностям), чтобы улучшить восприятие контента локальной аудиторией и повысить локальные поведенческие метрики.
Корректная техническая локализация: Убедитесь, что техническая реализация (например, hreflang, ccTLD или структура подпапок) четко указывает Google, какая версия контента предназначена для какой популяции (Страна/Язык). Это помогает системе корректно ассоциировать поведенческие сигналы с нужной версией страницы.

Worst practices (это делать не надо)

Игнорирование локальных различий в интенте: Использование прямого перевода контента без адаптации под локальный рынок. Механизм deemphasizing накажет страницы, которые популярны в одной стране, но не удовлетворяют пользователей в другой.
Ориентация на глобальный CTR: Попытки оптимизировать глобальную кликабельность в ущерб локальной релевантности. Система активно понизит вес глобальных кликов, если локальные сигналы слабые.
Объединение разных стран в один языковой раздел: Создание единой «английской» версии сайта для США, Великобритании и Австралии без учета локальных особенностей. Поведение пользователей из разных стран будет смешиваться, что может привести к неоптимальному ранжированию во всех регионах.

Стратегическое значение

Патент подтверждает стратегическую важность глубокой локализации в международном SEO. Успех на международных рынках не достигается простым масштабированием или переводом. Google рассматривает каждую комбинацию Страна/Язык как отдельную Population со своими уникальными потребностями и поведенческими паттернами. Долгосрочная стратегия должна включать ресурсы для понимания и удовлетворения этих отдельных популяций, а не рассматривать международный поиск как монолитный.

Практические примеры

Сценарий: Ранжирование интернет-магазина в Канаде и США

Сайт Ecommerce.com (США) и Localshop.ca (Канада) ранжируются по запросу «buy running shoes» (купить кроссовки).

Ситуация: Ecommerce.com имеет огромную глобальную популярность и высокий Traditional Click Fraction в США. Localshop.ca менее популярен глобально, но предлагает релевантный контент для канадцев (цены в CAD, местная доставка).
Обработка запроса в Канаде (google.ca): Пользователь ищет на английском языке из Канады.
Анализ данных:
- Первая популяция (Канада): Ecommerce.com имеет низкую долю кликов (пользователи уходят из-за цен в USD). Localshop.ca имеет высокую долю кликов.
- Вторая популяция (Английский язык глобально): Ecommerce.com имеет очень высокую долю кликов (из-за США).
Применение Deemphasizing: Система обнаруживает, что (1) Язык запроса и интерфейса совпадают (Английский) и (2) Доля кликов в Первой популяции для Ecommerce.com НИЖЕ, чем во Второй.
Результат: Влияние высокой глобальной популярности Ecommerce.com агрессивно понижается (deemphasized) при ранжировании в Канаде. Localshop.ca получает преимущество за счет сильных локальных сигналов и ранжируется выше.

Вопросы и ответы

Что такое «Популяция» (Population) в контексте этого патента?

Популяция — это группа пользователей, объединенная общими признаками. Патент описывает иерархию популяций: наиболее специфичная — это комбинация Страна+Язык (например, Канадцы, говорящие по-французски), более широкая — Язык (все франкоговорящие пользователи), и самая широкая — Глобальная база (все пользователи). Система использует эту иерархию для расчета поведенческих факторов.

Что означает «Deemphasizing» (Понижение веса)?

Это процесс уменьшения влияния данных о кликах из более широкой популяции при расчете ранжирования для более узкой популяции. Например, если данных из Канады мало, система использует глобальные данные, но снижает их вес. Это делается для того, чтобы глобальная популярность не перекрывала локальную релевантность.

В каком случае Google наиболее агрессивно понижает вес глобальных данных?

Наиболее агрессивное понижение происходит, когда доля кликов (Click Fraction) в локальной популяции значительно ниже, чем в глобальной. Это указывает на то, что результат популярен в мире, но не релевантен локально. В этом случае система активно защищает локальную выдачу от искажения глобальными данными.

Как этот патент влияет на стратегию международного SEO для сайта на одном языке (например, Английском)?

Он подчеркивает, что нельзя рассматривать англоязычный рынок как единое целое. Поведение пользователей в США, Великобритании и Австралии оценивается отдельно. Необходимо оптимизировать контент и пользовательский опыт для каждой страны индивидуально, чтобы добиться высоких локальных поведенческих метрик (LCC, CTR) в каждой из них.

Что важнее: глобальный CTR или локальный CTR?

Локальный CTR (и особенно локальный LCC — доля длинных кликов) значительно важнее для ранжирования в конкретной стране. Патент описывает механизм, который специально создан для приоритизации локальных сигналов над глобальными, даже если локальных данных меньше.

Как язык интерфейса пользователя влияет на ранжирование согласно патенту?

Если язык запроса пользователя совпадает с языком его интерфейса (например, немецкий запрос на google.de), это интерпретируется как сильный сигнал локального интента. В этом случае система активирует понижение веса глобальных данных, чтобы убедиться, что результаты максимально релевантны для этой локальной популяции.

Что такое LCC Fraction и почему она упоминается в патенте?

LCC (Long Click Count) Fraction — это доля длинных кликов. Она измеряет, как долго пользователи остаются на странице после клика, что является индикатором качества и удовлетворенности. Патент использует эти взвешенные по времени клики (Weighted Clicks) как основу для расчета Quality of Result Statistic в разных популяциях.

Если мой сайт хорошо ранжируется в США, поможет ли это ранжированию в Канаде?

Это может помочь только в том случае, если поведение канадских пользователей схоже с поведением пользователей из США для данного запроса. Однако, если канадские пользователи предпочитают другие результаты (локальная доля кликов ниже глобальной), то высокая популярность в США будет «понижена» (deemphasized) и не даст значительного преимущества в Канаде.

Как этот патент связан с использованием hreflang?

Хотя патент напрямую не упоминает hreflang, корректное использование hreflang помогает Google понять, какая страница предназначена для какой популяции (Страна/Язык). Это позволяет системе более точно собирать и применять локализованные поведенческие сигналы к нужным страницам, делая механизм, описанный в патенте, более эффективным.

Стоит ли использовать единую глобальную версию сайта вместо локализованных версий?

Исходя из этого патента, это плохая стратегия, если интент пользователей различается географически. Единая версия затрудняет оптимизацию под локальные поведенческие факторы. Локализованные версии позволяют максимизировать Quality of Result Statistic для каждой отдельной популяции.