Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google агрегирует поведенческие сигналы из совместимых стран и языков для уточнения ранжирования

    REFINING SEARCH RESULTS (Уточнение результатов поиска)
    • US9697259B1
    • Google LLC
    • 2017-07-04
    • 2009-08-31
    2009 Hyung-Jin Kim Local SEO Мультиязычность Патенты Google Поведенческие сигналы

    Google улучшает локальное ранжирование, агрегируя поведенческие данные (клики) не только из страны пользователя, но и из «совместимых» стран (соседних, культурно близких) или схожих языков. Система определяет совместимость на основе общих характеристик (границы, культура), собирает клики из этих сегментов и активно исключает данные из несовместимых регионов, создавая более релевантную выдачу на основе поведения схожих аудиторий.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоптимального использования исторических поведенческих данных (например, кликов) при ранжировании. Если полагаться только на данные из узкого сегмента пользователя (тот же язык и страна), часто возникает проблема разреженности данных (data sparsity). Однако слишком широкое агрегирование (глобальные данные) вносит шум и снижает локальную релевантность. Патент предлагает гранулярный подход, использующий концепцию «совместимости» между странами и языками, чтобы расширить пул данных, сохраняя контекстуальную релевантность.

    Что запатентовано

    Запатентована система уточнения результатов поиска путем выборочного агрегирования поведенческих данных из «совместимых» контекстов. Система определяет страны, имеющие общие характеристики со страной пользователя (например, общую границу, культуру или климат). Затем она генерирует Combined Click Measure, агрегируя country-specific click measures только из этих совместимых стран и активно исключая данные из несовместимых регионов. Этот уточненный сигнал используется для ранжирования.

    Как это работает

    Механизм работает путем уточнения поведенческих сигналов на основе совместимости:

    • Определение контекста: Система получает запрос и определяет характеристики пользователя (язык, географическое положение).
    • Идентификация совместимости: Определяется набор стран (согласно Claims) или языков (согласно Detailed Description), которые считаются совместимыми с контекстом пользователя на основе предопределенных общих характеристик (characteristic in common).
    • Селективная Агрегация: Для документов-кандидатов система извлекает исторические данные о кликах и комбинирует их только из совместимых сегментов, формируя Combined Click Measure. Данные из несовместимых сегментов исключаются или их вес понижается.
    • Ранжирование: Результаты поиска переранжируются с учетом этой агрегированной поведенческой метрики.

    Актуальность для SEO

    Высокая. Локализация, персонализация и точная интерпретация поведенческих факторов остаются ключевыми направлениями развития поиска. Способность использовать данные из схожих рынков (кластеров) для улучшения ранжирования на целевом рынке является важным механизмом для борьбы с разреженностью данных и повышения локальной релевантности. Этот подход позволяет масштабировать использование User Experience сигналов.

    Важность для SEO

    Влияние на SEO высокое (8.5/10), особенно для международного и локального продвижения. Патент раскрывает механизм, при котором поведенческие сигналы из одной страны могут напрямую влиять на ранжирование в другой, если страны признаны совместимыми. Это означает, что SEO-стратегия должна учитывать не только отдельные страны, но и кластеры совместимых рынков. Успех на одном рынке может катализировать рост на схожих рынках.

    Детальный разбор

    Термины и определения

    Characteristic in common (Общая характеристика)
    Критерий, используемый для определения совместимости между географическими локациями (странами). В Claims патента явно упоминаются: общий климат (common climate), общая культура (common culture) и общая граница (shared border).
    Click Fraction (Доля кликов)
    Метрика, описанная в Detailed Description. Используется для сравнения популярности документа для определенной характеристики (например, языка). Может рассчитываться как отношение кликов по документу в сегменте к общему числу кликов по документу.
    Combined Click Measure (Комбинированная мера кликов)
    Агрегированный показатель, сгенерированный путем объединения country-specific click measures только из выбранного подмножества совместимых стран. Исключает данные из несовместимых стран.
    Country-Specific Click Measure (Мера кликов для конкретной страны)
    Показатель поведения пользователей (например, CTR), связанный с конкретным документом и конкретной страной, основанный на ранее предоставленных результатах поиска.
    Language Demotion Score (LD) / Country Demotion Score (CD)
    Метрики, упомянутые в Detailed Description. Оценивают вероятность того, что пользователь поймет документ, основываясь на совместимости языка (LD) или страны (CD) пользователя и документа.
    Predefined Compatibility (Предопределенная совместимость)
    Правила или данные, определяющие, что две или более характеристики пользователя (языки или страны) считаются похожими или связанными.
    Rank Refiner Engine
    Компонент, который обрабатывает данные из логов выбора результатов (Result Selection Logs), применяет логику совместимости и генерирует уточненные поведенческие сигналы.
    Result Selection Logs
    Журналы, хранящие информацию о взаимодействии пользователей с результатами поиска (запрос, документ, время, язык, страна пользователя).

    Ключевые утверждения (Анализ Claims)

    Выданные Claims (Формула изобретения) патента US9697259B1 сосредоточены именно на географической (страновой) совместимости.

    Claim 1 (Независимый пункт): Описывает метод обработки поискового запроса с учетом географической совместимости поведенческих данных.

    1. Система получает запрос от пользователя, находящегося в определенном географическом положении.
    2. Определяется, имеют ли другие страны «общую характеристику» (characteristic in common) с местоположением пользователя.
    3. Выбирается подмножество стран, которые имеют эту общую характеристику (совместимые страны).
    4. Идентифицируются результаты поиска (документы).
    5. Для каждого результата извлекается множество различных country-specific click measures (метрик поведения пользователей в конкретных странах в отношении этого документа).
    6. Для каждого результата генерируется Combined Click Measure. Эта генерация включает объединение только тех метрик, которые относятся к выбранным (совместимым) странам.
    7. Ключевой момент: Combined Click Measure исключает метрики из стран, которые не были определены как имеющие общую характеристику (несовместимые страны).
    8. Результаты ранжируются на основе этих Combined Click Measures.

    Ядро изобретения — селективное агрегирование поведенческих данных: использование данных из схожих контекстов и активное исключение данных из несхожих контекстов для повышения релевантности.

    Claims 7, 8, 9 (Зависимые от 1): Конкретизируют, что такое «общая характеристика».

    • Claim 7: Общий климат (common climate).
    • Claim 8: Общая культура (common culture).
    • Claim 9: Общая граница (shared border) со страной пользователя.

    Эти пункты определяют критерии, по которым Google может группировать страны для обмена поведенческими сигналами.

    Где и как применяется

    Изобретение применяется на финальных этапах обработки запроса для корректировки ранжирования на основе поведенческих данных.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе (или в рамках отдельного процесса анализа логов) система обрабатывает Result Selection Logs. Поведенческие данные (клики) агрегируются и сохраняются в виде country-specific click measures. Также должна существовать база данных или сервис, определяющий совместимость стран (Predefined Compatibility).

    RANKING – Ранжирование / RERANKING – Переранжирование
    Основное применение патента. После того как базовое ранжирование определило кандидатов, в работу включаются Rank Refiner Engine и Rank Modifier Engine.

    1. Уточнение данных (Refining): Rank Refiner Engine определяет местоположение пользователя и идентифицирует список совместимых стран.
    2. Агрегация (Aggregation): Для документов-кандидатов система генерирует Combined Click Measure, агрегируя данные только из совместимых стран.
    3. Модификация ранга (Rank Modification): Rank Modifier Engine использует Combined Click Measure как сигнал для корректировки итогового ранжирования.

    Входные данные:

    • Поисковый запрос и географическое положение пользователя.
    • База данных совместимости стран (общие характеристики).
    • Исторические поведенческие данные (Result Selection Logs).
    • Набор документов-кандидатов.

    Выходные данные:

    • Скорректированный рейтинг результатов поиска, учитывающий агрегированные поведенческие сигналы из совместимых регионов.

    На что влияет

    • Географические факторы и Локальный поиск: Наибольшее влияние оказывается на локализованное ранжирование. Система использует географию и культуру как ключ для агрегации поведенческих сигналов.
    • Международные сайты: Влияет на сайты, работающие в нескольких странах, особенно если эти страны формируют культурные или географические кластеры (например, DACH, Скандинавия, Северная Америка).
    • Специфические запросы: Влияет на запросы, где наблюдается различное поведение пользователей в разных регионах или где локальных данных недостаточно.

    Когда применяется

    • Триггеры активации: Алгоритм применяется при обработке поискового запроса, когда система может определить контекст пользователя (местоположение/язык).
    • Условия (Борьба с разреженностью данных): Особенно актуален, когда данных из страны пользователя недостаточно для надежной оценки. Агрегация из совместимых стран позволяет получить более надежный поведенческий сигнал без использования зашумленных глобальных данных.

    Пошаговый алгоритм

    Процесс А: Использование географической совместимости (на основе Claim 1)

    1. Получение запроса и локации: Система получает запрос и определяет географическую локацию (страну) пользователя.
    2. Определение совместимости: Система проверяет предопределенные правила, чтобы найти страны, имеющие общие характеристики (границы, культуру, климат) со страной пользователя.
    3. Выбор совместимых стран: Формируется список совместимых стран.
    4. Идентификация результатов: Определяется набор документов, релевантных запросу.
    5. Извлечение данных о кликах: Для каждой пары [документ, запрос] извлекаются исторические country-specific click measures.
    6. Фильтрация по совместимости: Система отфильтровывает меры кликов, оставляя только те, которые относятся к списку совместимых стран. Данные из несовместимых стран исключаются.
    7. Агрегация: Отфильтрованные меры кликов объединяются для создания Combined Click Measure для каждого документа (например, путем суммирования или взвешенного усреднения).
    8. Ранжирование: Combined Click Measure используется как фактор для ранжирования или переранжирования результатов.

    Процесс Б: Использование лингвистической совместимости (на основе Detailed Description и FIG. 4)

    1. Анализ данных по языкам: Для пары [документ, запрос] анализируются данные о кликах (например, Click Fraction) по разным языкам.
    2. Упорядочивание: Языки упорядочиваются на основе их доли кликов.
    3. Определение несовместимости: Система определяет языки, которые считаются несовместимыми с языком текущего пользователя.
    4. Корректировка данных: Данные, связанные с несовместимыми языками, удаляются из расчета или пессимизируются.
    5. Пересчет и переупорядочивание: Метрики пересчитываются для оставшихся (совместимых) языков.
    6. Применение в ранжировании: Скорректированные данные используются для расчета финального сигнала ранжирования (например, с использованием Language Demotion Score).

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Критически важные данные. Используются Result Selection Logs, содержащие информацию о кликах, запросах (Q), выбранных документах (D).
    • Географические факторы: Страна пользователя (C), определенная, например, по IP. Используется для определения совместимости.
    • Пользовательские факторы (Язык): Язык (L), используемый пользователем. Используется в механизмах лингвистической совместимости.
    • Системные/Справочные данные: Предопределенные данные о совместимости стран (на основе культуры, климата, границ) и языков.

    Какие метрики используются и как они считаются

    • Country-Specific Click Measure: Конкретный расчет в патенте не детализирован, но это мера популярности документа в конкретной стране по данному запросу (например, CTR).
    • Combined Click Measure: Рассчитывается путем агрегации отфильтрованных Country-Specific Click Measures. Методы агрегации (Claims 4, 5):
      • Суммирование соответствующих метрик.
      • Расчет соотношения суммы соответствующих метрик кликов к сумме кликов для всего запроса.
    • Взвешивание (Claim 2): При комбинировании метрик может применяться взвешивание (applying a weight).

    В Detailed Description также упоминаются:

    • Click Fraction: Используется в примере с языками для оценки популярности в сегменте.
    • Language Demotion Score (LD) / Country Demotion Score (CD): Вероятностные оценки (от 0 до 1.0), измеряющие совместимость пользователя и документа.
    • Формулы комбинирования уровней: Патент предлагает формулы для интеграции данных из разных уровней совместимости. Например, для языковой совместимости: LD*B+(1-LD)*L+ (где B — общие данные, L+ — данные совместимых языков). Это позволяет сгладить переход между использованием специфичных и общих данных.

    Выводы

    1. Поведенческие сигналы агрегируются по кластерам совместимости: Google не рассматривает страны и языки изолированно. Ранжирование в одном сегменте может зависеть от поведения пользователей в других сегментах, если они признаны «совместимыми» (например, соседние страны или родственные языки).
    2. Селективное использование данных и активное исключение шума: Система целенаправленно агрегирует данные из совместимых контекстов и активно исключает данные из несовместимых (согласно Claim 1). Это позволяет бороться с разреженностью данных, минимизируя при этом шум от нерелевантных аудиторий.
    3. География, Культура и Язык как факторы совместимости: Патент явно указывает на использование общих границ, культуры, климата (в Claims) и языковой близости (в Detailed Description) как критериев для группировки поведенческих данных.
    4. Усиление локализации через агрегацию: Механизм позволяет улучшить локальную релевантность, опираясь на коллективный опыт схожих аудиторий, даже если данных по конкретной стране недостаточно.
    5. Критичность User Experience (UX) сигналов в контексте: Патент подчеркивает важность не просто глобального UX, а UX в рамках релевантного культурного или географического кластера.

    Практика

    Best practices (это мы делаем)

    • Кластеризация рынков в международном SEO: При разработке международной стратегии группируйте страны не только по языку, но и по географической близости и культурной совместимости (например, Скандинавия, DACH, СНГ, Северная Америка). Ожидайте, что поведенческие сигналы внутри этих кластеров будут влиять друг на друга.
    • Оптимизация поведенческих факторов на уровне кластера: Успешное вовлечение пользователей (высокий CTR, вовлеченность) на одном рынке может положительно сказаться на видимости сайта на совместимых рынках. Необходимо уделять внимание качеству сниппетов и релевантности контента для всего регионального кластера.
    • Локализация и Культурная Адаптация: Убедитесь, что контент адаптирован под культурные особенности целевых рынков. Поскольку «общая культура» является критерием совместимости, адаптация повышает шансы на положительный перенос поведенческих сигналов между близкими рынками.
    • Мониторинг выдачи в соседних странах: Анализируйте SERP и поведение конкурентов не только в целевой стране, но и в соседних или культурно близких странах. Это может дать представление о том, какие типы контента предпочитает Google в данном кластере.

    Worst practices (это делать не надо)

    • Игнорирование поведенческих сигналов на «малых» рынках: Нельзя пренебрегать оптимизацией UX на рынках с малым трафиком, так как эти сигналы могут агрегироваться и влиять на более крупные совместимые рынки (и наоборот).
    • Применение единой стратегии для разных культурных кластеров: Использование одинакового подхода, например, для Великобритании и Индии (несмотря на общий язык), может быть неэффективным, если система не считает их совместимыми. Система может отфильтровать сигналы из несовместимых стран.
    • Накрутка поведенческих факторов в нерелевантных регионах: Попытки манипулировать кликами из стран, которые система считает несовместимыми с целевым рынком, будут неэффективны, так как патент явно описывает механизм исключения (excludes) таких данных.

    Стратегическое значение

    Патент подтверждает стратегическую важность контекстуализации поведенческих сигналов. Google стремится понять намерения пользователей, опираясь на коллективный опыт схожих аудиторий. Для международного SEO это означает переход от управления отдельными странами к управлению кластерами рынков. Стратегия должна быть направлена на завоевание авторитета и обеспечение положительного пользовательского опыта в рамках всего культурно-географического кластера.

    Практические примеры

    Сценарий 1: Использование географической совместимости (Claim 1)

    1. Контекст: Пользователь в Канаде ищет «лучшие зимние шины».
    2. Анализ совместимости: Google определяет, что США имеют общую границу (Claim 9) и схожий климат (Claim 7) с Канадой. Страны признаются совместимыми.
    3. Использование данных: При ранжировании результатов для канадского пользователя система извлекает исторические данные о кликах по этому запросу как из Канады, так и из США. Данные из Австралии исключаются как несовместимые.
    4. Результат: Ранжирование в Канаде формируется на основе Combined Click Measure из Канады и США. Сайт, популярный в США, получает преимущество в Канаде.

    Сценарий 2: Использование культурной совместимости (DACH регион)

    1. Контекст: Пользователь ищет товар в Австрии.
    2. Анализ совместимости: Google определяет, что Германия имеет схожую культуру (Claim 8) и язык с Австрией.
    3. Использование данных: Система видит мало кликов из Австрии, но много положительных поведенческих сигналов из Германии.
    4. Результат: Документ получает повышение в ранжировании в Австрии благодаря хорошим поведенческим сигналам из Германии, несмотря на разреженность данных в самой Австрии.

    Вопросы и ответы

    Что означает «совместимость» (compatibility) стран в контексте этого патента?

    Совместимость означает, что страны имеют определенные «общие характеристики». Патент явно перечисляет три примера таких характеристик в Claims: общая граница, общая культура или общий климат. Если страны совместимы, Google может объединять поведенческие данные (клики) из этих стран для влияния на ранжирование.

    Как этот патент влияет на международное SEO?

    Он имеет критическое значение. Он предполагает, что SEO-стратегии должны учитывать не только отдельные страны, но и кластеры совместимых стран. Успех (и хорошие поведенческие сигналы) на одном рынке может напрямую улучшить ранжирование на другом совместимом рынке. Это требует более целостного подхода к оптимизации внутри культурных и географических кластеров.

    Может ли низкий CTR в одной стране понизить мой сайт в другой стране?

    Да, если эти страны признаны совместимыми. Если пользователи в Германии постоянно игнорируют ваш сайт в выдаче, это может негативно сказаться на ранжировании вашего сайта в Австрии, поскольку система агрегирует поведенческие сигналы из Германии для пользователей в Австрии.

    Что произойдет, если я попытаюсь накрутить клики из Индии для сайта в США?

    Согласно патенту (Claim 1), это будет неэффективно. Если система определит, что Индия и США не являются совместимыми по релевантным характеристикам для данного контекста, данные о кликах из Индии будут активно исключены (excludes country-specific click measures) при расчете метрик для пользователя из США.

    Патент фокусируется на странах в Claims. Применяется ли тот же принцип к языкам?

    Да. Хотя выданные Claims (Формула изобретения) сосредоточены на странах, Detailed Description патента подробно обсуждает совместимость языков (например, русский и украинский) и использует их в примерах (FIG. 4) и формулах (Language Demotion Score). Логично предположить, что аналогичный механизм селективной агрегации применяется и к совместимым языкам.

    Как Google определяет, что страны имеют «общую культуру» или «общий климат»?

    Патент не раскрывает методы определения, указывая лишь, что это предопределенные данные (predefined compatibility). Вероятно, Google использует комбинацию источников данных: Knowledge Graph, анализ паттернов поиска, лингвистическую близость и, возможно, данные из внешних справочников для классификации стран по кластерам.

    Зачем используется такой механизм вместо простого использования глобальных данных о кликах?

    Глобальные данные часто содержат слишком много шума и могут быть нерелевантны для локального контекста пользователя. Например, предпочтения пользователей в разных странах могут сильно отличаться. Селективная агрегация позволяет использовать больше данных, чем только локальные (решая проблему разреженности), но сохраняет релевантность, ограничивая сбор данных схожими аудиториями.

    Как этот механизм помогает в странах с небольшим объемом данных?

    Это одно из ключевых преимуществ. Если данных о кликах в маленькой стране (например, Люксембурге) недостаточно для надежных выводов, система может агрегировать данные из совместимых соседних стран (Германия, Франция, Бельгия), чтобы получить статистически значимый сигнал и улучшить качество ранжирования.

    Что такое механизм локального продвижения (Multiple Languages, Single Location), упомянутый в описании?

    Этот механизм помогает пользователям, которые ищут на не основном языке страны (например, англоговорящий в Германии). Вместо использования глобальных английских данных, система может проанализировать, какие сайты популярны у местных пользователей (немецкоговорящих) по этому запросу, и продвинуть эти локальные сайты в выдаче. Это повышает локальную релевантность.

    Как я могу определить, какие страны Google считает совместимыми с моим целевым рынком?

    Google не публикует эти данные, но патент дает четкие указания: соседние страны (общая граница), страны с похожей культурой и климатом. SEO-специалистам следует опираться на эти критерии для формирования гипотез о кластерах (например, Скандинавия, DACH) и анализировать выдачу в этих регионах.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.