Как Google определяет географический масштаб (город, регион или страна) и локальный интент запросов

Google анализирует логи поиска, чтобы определить географический масштаб (Catchment Area) запроса. Система сравнивает местоположение пользователя (Origin Location) с местоположением контента, на который он кликает или который упоминает в запросе (Content Location). Это позволяет понять, относится ли интент запроса к уровню города, региона или страны, и использовать эти данные для автоматической локализации поисковой выдачи.

Описание

Какую задачу решает

Патент решает задачу определения неявного географического интента и масштаба поискового запроса. Система стремится понять, ищет ли пользователь что-то в своем городе, регионе или в масштабах страны, даже если он явно не указал местоположение в запросе (например, [пиццерия] или [налоговый кодекс]). Это улучшает релевантность поиска за счет автоматической локализации результатов в соответствии с предполагаемой географической областью интереса.

Что запатентовано

Запатентована система для определения Catchment Area (Зоны охвата) для поисковых запросов путем анализа исторических данных из логов поиска (Search Log Data). Система анализирует агрегированное поведение пользователей, сравнивая Origin Location (откуда отправлен запрос) и Content Location (географическую привязку связанного контента). На основе этого анализа запросу присваивается наиболее подходящий географический масштаб (например, Город, Метрополия, Штат).

Как это работает

Система работает в офлайн-режиме, обрабатывая логи поиска:

Сбор данных: Для каждого вхождения запроса фиксируется Origin Location пользователя и Content Location.
Определение Content Location (Два метода): Используется либо Document Location (географическая привязка кликнутого результата), либо Location Term (явное упоминание локации в запросе).
Определение совпадений (Catchment Area Matches): Система проверяет, попадают ли Origin Location и Content Location в одни и те же географические зоны (Город, Метрополия, Штат) согласно строгим правилам.
Нормализация: Применяются механизмы Capping (ограничение влияния крупных городов) и Diversity Threshold (требование схожего поведения в разных локациях) для обеспечения статистической значимости.
Скоринг и Выбор: Рассчитываются Catchment Area Scores. На основе иерархической модели и пороговых значений выбирается итоговая Catchment Area для запроса.

Актуальность для SEO

Критически высокая. Понимание неявного локального интента является фундаментальной частью современного поиска Google. Механизмы, описанные в патенте, лежат в основе того, как Google решает, активировать ли локальные результаты (Local Pack, локализованная органика) для запросов без явного указания местоположения.

Важность для SEO

Патент имеет фундаментальное значение (90/100) для SEO, особенно для локального продвижения (Local SEO). Он описывает механизм, который определяет, будет ли запрос интерпретирован как локальный и каков его географический масштаб. Если для запроса определена узкая Catchment Area (например, Город), локальные бизнесы получат приоритет. Понимание этих механизмов критично для обеспечения корректной географической привязки сайта (Document Location) и оптимизации контента под правильный масштаб.

Детальный разбор

Термины и определения

Catchment Area (Зона охвата): Определенный географический масштаб (например, Город, Метрополия/Регион, Штат/Страна), который присваивается запросу для обозначения его предполагаемой географической области интереса.
Catchment Area Match (Совпадение зоны охвата): Событие, фиксируемое, когда Origin Location и Content Location соответствуют определенной Catchment Area согласно правилам анализа.
Catchment Area Score (Оценка зоны охвата): Метрика, указывающая на уровень интереса к определенному типу Catchment Area для данного запроса, основанная на количестве Catchment Area Matches.
Capping (Ограничение/Кэппинг): Механизм ограничения максимального вклада одной конкретной географической области (например, крупного города) в общий Catchment Area Score. Используется для предотвращения статистических перекосов из-за плотности населения.
Constituent Catchment Area Score (Составляющая оценка зоны охвата): Оценка совпадений для конкретного экземпляра зоны охвата (например, для города «Москва»). Общая оценка типа зоны охвата (например, «Город») агрегирует эти составляющие оценки.
Content Location (Местоположение контента): Географическая локация, связанная с контентом запроса. Определяется независимо от Origin Location. Может быть Document Location или Location Term.
Diversity Threshold (Порог разнообразия): Требование, чтобы запрос демонстрировал интерес в достаточном количестве различных географических областей одного типа (например, во многих разных городах), прежде чем этот тип Catchment Area будет присвоен запросу.
Document Location (Местоположение документа): Географическая привязка ресурса (веб-страницы). Например, физический адрес бизнеса, указанный на сайте.
Location Term (Термин местоположения): Явное указание географического названия в тексте поискового запроса (например, «Москва» в запросе [погода Москва]).
Origin Location (Местоположение источника): Географическое местоположение, откуда пользователь отправил поисковый запрос.
Search Log Data (Данные логов поиска): Хранилище исторических данных о запросах, местоположении пользователей и их взаимодействии с результатами поиска (кликах).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод определения географической зоны интереса для запросов из Search Log Data, с акцентом на сложный иерархический выбор.

Система анализирует вхождения запросов, определяя Catchment Area Matches на основе Origin Location и Content Location.
Определяется иерархия зон охвата: Первая зона (например, Город) является подобластью Второй (Метрополия), которая является подобластью Третьей (Штат).
Для каждой зоны вычисляется Catchment Area Score.
Определяются различные пороговые значения (thresholds) для Первого, Второго и Третьего типов зон.
Происходит выбор Catchment Area по строгой иерархической логике:
- Выбирается Первый тип (самый узкий), ЕСЛИ его оценка достигает порога, А оценки Второго и Третьего типов НЕ достигают своих порогов.
- Выбирается Второй тип, ЕСЛИ его оценка достигает порога, А оценка Третьего типа НЕ достигает своего порога.
- Выбирается Третий тип (самый широкий), ЕСЛИ его оценка достигает порога.

Эта логика позволяет системе предпочитать более специфичные географические зоны (Город), только если сигналы для них достаточно сильны, и при этом интерес к более широким зонам (Штат) не является доминирующим, согласно установленным порогам.

Claim 2, 3 (Зависимые): Уточняют Метод 1 (Анализ кликов). Content Location определяется как Document Location кликнутого ресурса. Catchment Area Match засчитывается только для зон, которые содержат И Origin Location, И Document Location.

Claim 4 (Зависимый): Уточняет Метод 2 (Анализ терминов). Catchment Area Match засчитывается, только если Location Term в запросе указывает на ту зону охвата, в которой находится Origin Location пользователя. (Например, запрос [пицца Москва] из Берлина не даст совпадения).

Claim 5, 6 (Зависимые): Описывают механизмы нормализации: применение Capping (ограничения количества совпадений) и расчет общего Catchment Area Score на основе Constituent Catchment Area Scores из разных областей (поддержка Diversity Threshold).

Где и как применяется

Изобретение применяется на этапе предварительной обработки данных и понимания запросов, влияя на последующее ранжирование.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна определить и сохранить Document Location для ресурсов (например, физический адрес бизнеса). Эта географическая привязка сохраняется в индексе.

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основное применение патента. Система работает офлайн, анализируя Search Log Data (исторические запросы, клики, локации). Она вычисляет Catchment Area Scores и определяет доминирующую Catchment Area для каждого значимого запроса. Результаты сохраняются в базе данных (Query Catchment Data).

RANKING / RERANKING – Ранжирование / Переранжирование (Онлайн-применение)
Во время обработки запроса пользователя в реальном времени система использует предварительно рассчитанные данные. Если для запроса определена Catchment Area (например, «Город»), система корректирует ранжирование. Ресурсы, чьи Document Locations находятся внутри соответствующей зоны охвата пользователя (его текущего города), могут получить повышение (boost) в выдаче.

Входные данные:

Search Log Data (исторические запросы, клики, Origin Locations).
Search Index (с данными о Document Locations ресурсов).
Определения географических границ (городов, штатов и т.д.).

Выходные данные:

Query Catchment Data: База данных, сопоставляющая запросы с их определенными Catchment Areas.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы с неявным локальным интентом (например, [ресторан], [автосервис], [юрист]).
Конкретные типы контента и ниши: Критически важно для локального бизнеса, сферы услуг, ритейла (Local SEO), где географическое положение пользователя определяет релевантность контента.

Когда применяется

Временные рамки: Анализ логов и расчет Catchment Area происходит периодически в офлайн-режиме. Применение результатов происходит в реальном времени при обработке запросов.
Условия применения: Алгоритм анализа применяется к запросам, которые имеют достаточный объем данных в Search Log Data для статистически значимого анализа.
Фильтрация: Механизмы Capping и Diversity Threshold используются во время офлайн-анализа, чтобы гарантировать, что Catchment Area присваивается только при универсальном интересе в разных локациях.

Пошаговый алгоритм

Процесс офлайн-определения Catchment Area для запроса Q.

Сбор данных: Извлечение всех вхождений запроса Q из Search Log Data.
Определение локаций (для каждого вхождения):
1. Определяется Origin Location (OL) (откуда пришел запрос).
2. Определяется Content Location (CL). Это может быть Document Location кликнутого ресурса ИЛИ Location Term из текста запроса.
Определение совпадений (Catchment Area Matches): Для различных типов зон (Город, Метрополия, Штат) проверяется совпадение по соответствующим правилам:
- Если используется Document Location: Совпадение, если И OL, И CL находятся внутри одной и той же зоны.
- Если используется Location Term: Совпадение, если OL находится внутри зоны, указанной в CL.
Расчет составляющих оценок (Constituent Scores): Совпадения группируются по конкретным географическим областям (например, Москва, Санкт-Петербург).
Применение Capping: Если оценка для какой-либо отдельной области превышает установленный лимит, она ограничивается этим лимитом.
Расчет общих оценок (Catchment Area Scores): Составляющие оценки суммируются для каждого типа зоны (Общая оценка для «Город», «Метрополия», «Штат»).
Проверка порога разнообразия (Diversity Threshold): Система проверяет, достаточно ли много разных областей внесли вклад в общую оценку типа. Если нет, тип может быть дисквалифицирован.
Иерархический выбор: Система сравнивает итоговые оценки с предопределенными порогами для каждого типа зоны, используя иерархическую логику (описанную в Claim 1), чтобы выбрать один наилучший тип Catchment Area для запроса Q.
Сохранение результата: Соответствие между запросом Q и выбранной Catchment Area сохраняется.

Какие данные и как использует

Данные на входе

Поведенческие факторы (Критично): Используются Search Log Data, включающие историю запросов и данные о кликах (выбранных результатах). Это основа для анализа агрегированного поведения.
Географические факторы (Критично): Origin Location пользователя (IP-адрес, данные геолокации) и географические границы Catchment Areas.
Контентные/Структурные факторы: Система использует данные на страницах или данные из Карт (Map Data) для определения географической привязки (Document Location) ресурса. Также анализируется текст запроса для извлечения Location Terms.

Какие метрики используются и как они считаются

Catchment Area Match Count: Количество раз, когда пара (Origin Location, Content Location) удовлетворяет правилам совпадения для определенной зоны.
Constituent Catchment Area Score: Агрегированный счетчик совпадений для конкретной географической области (например, Москва).
Capping Value: Пороговое значение для ограничения Constituent Catchment Area Score.
Catchment Area Score: Сумма (возможно, нормализованная) Constituent Catchment Area Scores для определенного типа зоны (например, Город). Может рассчитываться как отношение количества совпадений к общему количеству вхождений запроса.
Diversity Threshold: Минимальное количество различных географических областей одного типа, которые должны иметь значимые составляющие оценки.
Hierarchical Score Thresholds: Предопределенные пороги оценок для каждого типа Catchment Area, используемые в финальном иерархическом выборе (Claim 1).

Выводы

Географический интент определяется поведением пользователей: Google определяет, является ли запрос локальным, не только на основе ключевых слов, а на основе анализа того, откуда люди ищут и на какие географически привязанные результаты они кликают (Document Locations).
Два пути анализа локальности: Система использует как неявные сигналы (клики на Document Locations), так и явные (Location Terms в запросе). Правила обработки этих сигналов различаются, но оба вносят вклад в определение Catchment Area.
Критичность корректной географической привязки контента: Для работы системы крайне важно, чтобы у ресурсов была точно определена Document Location (например, физический адрес бизнеса).
Защита от статистических аномалий (Capping и Diversity): Google активно фильтрует данные. Capping не позволяет крупным городам искажать статистику. Diversity Threshold гарантирует, что запрос признается локальным (например, на уровне города), только если он ведет себя одинаково в РАЗНЫХ городах.
Иерархическая модель локальности: Система использует сложную иерархическую модель с порогами (Город > Метрополия > Штат), чтобы выбрать наиболее подходящий географический масштаб для запроса, предпочитая специфичность при наличии сильных сигналов.

Практика

Best practices (это мы делаем)

Обеспечение четкой географической привязки (Document Location): Критически важно иметь четкую и последовательную информацию о местоположении (NAP — Name, Address, Phone) на сайте, в микроразметке (LocalBusiness) и в Google Business Profile. Это позволяет Google точно определить Document Location, который используется в анализе кликов.
Оптимизация под неявные локальные запросы: Необходимо выявлять запросы в вашей нише, которые Google классифицирует как имеющие узкую Catchment Area (например, Город), анализируя выдачу. Если запрос локализован, фокусируйтесь на стандартных факторах Local SEO.
Создание контента для разных географических масштабов: Адаптируйте стратегию под определенный Google масштаб. Если бизнес работает на региональном уровне, создавайте контент, релевантный для запросов с Catchment Area «Штат» или «Метрополия», помимо страниц, оптимизированных под конкретные города.
Стимулирование локального взаимодействия: Поскольку система основана на поведении, важно, чтобы пользователи из вашей целевой локации находили ваш контент релевантным и кликали на него. Это укрепляет связь между запросом, вашей локацией и вашим Document Location в данных Google.

Worst practices (это делать не надо)

Непоследовательная или ложная географическая информация: Указание некорректных адресов или противоречивая информация NAP путает систему при определении Document Location. Это снижает шансы на участие в анализе Catchment Area и ухудшает локальное ранжирование.
Игнорирование локального интента для широких запросов: Ошибка считать, что общие запросы (например, [купить шины]) всегда являются национальными. Если Google определил для них локальную Catchment Area, попытки ранжироваться по ним без локальной привязки будут неэффективны.
Манипуляции с Location Terms (Дорвеи): Создание множества страниц вида [услуга + город] для городов, где вы не присутствуете. Патент указывает, что при анализе Location Term совпадение засчитывается, только если пользователь физически находится в указанном городе (Origin Location внутри Location Term area), что усложняет эффективность таких стратегий.

Стратегическое значение

Патент подтверждает, что локальное ранжирование управляется данными и поведением пользователей. Этот механизм является фундаментом для Local SEO, определяя «правила игры» для запросов с неявным локальным интентом. Он подчеркивает переход от простого сопоставления ключевых слов к глубокому пониманию географического контекста запроса. Стратегия должна строиться на обеспечении максимально точных данных о географической привязке бизнеса (Document Location).

Практические примеры

Сценарий 1: Определение интента запроса [адвокат по разводам] (Неявный интент)

Анализ Google: Система анализирует логи. Она видит, что пользователи в Москве, ищущие [адвокат по разводам], в 80% случаев кликают на сайты адвокатов, чьи офисы (Document Location) также находятся в Москве.
Проверка разнообразия: Это поведение наблюдается и в других городах (Diversity Threshold достигнут).
Результат: Google присваивает запросу [адвокат по разводам] зону охвата «Город».
Действие SEO: Локальным юридическим фирмам необходимо фокусироваться на оптимизации под свой город, так как Google будет автоматически локализовывать выдачу по этому запросу.

Сценарий 2: Анализ запроса [ремонт iphone Москва] (Явный интент)

Анализ Google (Метод Location Term): Система идентифицирует Location Term «Москва» (тип Город).
Проверка правил: Если пользователь находится в Москве (Origin Location = Москва), система засчитывает совпадение для Catchment Area «Город». Если пользователь находится в Самаре, совпадение по этому методу НЕ засчитывается.
Результат: Это укрепляет понимание того, что запрос [ремонт iphone] имеет сильный локальный интент на уровне города.
Действие SEO: Подтверждает важность создания локализованных посадочных страниц, но также показывает, что система верифицирует релевантность через местоположение пользователя при интерпретации этих запросов.

Вопросы и ответы

Как Google определяет, является ли запрос локальным, если в нем нет названия города?

Google анализирует агрегированное поведение пользователей. Система смотрит, откуда пользователи вводят этот запрос (Origin Location) и на результаты с какой географической привязкой (Document Location) они кликают. Если пользователи преимущественно кликают на результаты в своем же городе, запрос классифицируется как локальный (присваивается Catchment Area «Город»).

Что такое Catchment Area (Зона охвата) в контексте этого патента?

Это предполагаемый географический масштаб запроса. Система определяет, ищет ли пользователь информацию на уровне Города, Метрополии (региона) или Штата (страны). Например, для [пиццерия] это может быть Город, а для [законодательство о страховании] — Штат или Страна.

Что важнее для определения локальности: клики пользователей или упоминание города в запросе?

Патент описывает оба метода как способы определения Content Location. Анализ кликов (использующий Document Location) позволяет понять неявный интент общих запросов. Анализ терминов (Location Term) обрабатывает явные указания. Оба метода вносят вклад в итоговое определение Catchment Area, но используют разные правила для засчитывания совпадений.

Как обеспечить правильную географическую привязку моего сайта (Document Location)?

Необходимо предоставлять четкую, последовательную и полную информацию о физическом адресе вашего бизнеса (NAP) на страницах сайта, использовать микроразметку Schema.org (LocalBusiness) и поддерживать актуальность данных в Google Business Profile. Это помогает Google точно определить Document Location вашего ресурса.

Что такое Diversity Threshold и почему это важно?

Это порог разнообразия. Он требует, чтобы запрос демонстрировал схожее локальное поведение в нескольких разных городах (или регионах), прежде чем он будет классифицирован глобально. Это предотвращает ситуацию, когда особенности поведения пользователей в одном крупном городе влияют на классификацию запроса для всей страны.

Что такое Capping и как он влияет на анализ?

Capping — это ограничение максимального вклада одной географической области в общую оценку. Это сделано для того, чтобы очень крупные города (например, Москва или Нью-Йорк) не искажали статистику для общих запросов только за счет своего размера и плотности населения. Это обеспечивает более точную оценку интента запроса.

Если я создам страницы под [услуга + город] для всех городов (дорвеи), поможет ли это ранжированию?

Патент указывает на специфическое правило для анализа Location Term: совпадение засчитывается, только если пользователь физически находится в городе, указанном в запросе. Это означает, что Google стремится верифицировать релевантность через местоположение пользователя, что снижает эффективность стратегии массового создания гео-страниц без реального присутствия и локальной релевантности.

Влияет ли этот патент на ранжирование в Google Картах (Local Pack)?

Да, напрямую. Определение Catchment Area запроса является фундаментальным триггером для активации локального поиска. Если система определяет, что запрос имеет узкую зону охвата (например, Город), она с большей вероятностью покажет Local Pack и отдаст приоритет локализованным результатам.

Что означает иерархический выбор зоны охвата, описанный в Claim 1?

Это означает, что Google использует разные пороговые значения для разных уровней (Город, Метрополия, Штат) и применяет строгую логику выбора. Система стремится выбрать наиболее специфичную зону (Город), но только при условии, что интерес к более широким зонам не является доминирующим согласно установленным порогам. Это сложный механизм балансировки.

Работает ли этот алгоритм в реальном времени?

Нет. Анализ логов поиска, расчет оценок и определение Catchment Area для запросов происходят в офлайн-режиме. В реальном времени система ранжирования использует уже готовые, предварительно рассчитанные данные о географическом масштабе запроса для корректировки выдачи.