Google улучшает геолокацию пользователей, анализируя «повторяющиеся запросы» (Recurrent Queries) — запросы, популярность которых резко возрастает в конкретных регионах в определенное время (например, локальные праздники или события). Когда пользователь вводит такой запрос в соответствующий период, система с высокой уверенностью определяет его местоположение, даже если другие сигналы (IP, GPS) неоднозначны.
Описание
Какую задачу решает
Патент решает задачу повышения точности определения географического местоположения пользователя (геолокации). Традиционные методы (IP-адрес, GPS, явные указания локации в запросе) могут быть неточными, недоступными или неоднозначными (например, при использовании VPN). Изобретение предоставляет дополнительный, надежный сигнал для определения местоположения, основанный на анализе поведенческих, сезонных и культурных паттернов поиска.
Что запатентовано
Запатентована система и метод идентификации и использования «Повторяющихся запросов» (Recurrent Queries) для геолокации. Recurrent Query — это запрос, который демонстрирует значительный всплеск трафика (Query Peak или Spike) в течение определенного повторяющегося периода времени и преимущественно из конкретного географического региона. Система анализирует исторические логи для выявления таких закономерностей и использует их для определения местоположения пользователя в реальном времени.
Как это работает
Система работает в двух основных режимах:
- Офлайн-анализ (Идентификация): Система анализирует исторические логи запросов, чтобы найти запросы, имеющие статистически значимые пики популярности (Query Peaks) одновременно по времени и по местоположению (например, запрос «Mother’s Day» в США в мае). Для подтверждения значимости пика используются статистические методы, включая расчет энтропии (Entropy).
- Онлайн-применение (Геолокация): Когда пользователь отправляет запрос, система проверяет, является ли он Recurrent Query и соответствует ли текущее время его пиковому периоду. Если да, Geolocation Engine повышает вероятность (Measure of Confidence) того, что пользователь находится в ассоциированном географическом регионе.
Актуальность для SEO
Высокая. Точное определение местоположения пользователя остается фундаментальной задачей для поисковых систем, критически важной для мобильного поиска и предоставления локальных результатов. Описанный метод предоставляет устойчивый сигнал геолокации, основанный на реальном поведении пользователей и культурных событиях, что сохраняет его актуальность в 2025 году.
Важность для SEO
Патент имеет значительное влияние на SEO (7/10), особенно для Local SEO и International SEO. Хотя он описывает инфраструктурный механизм понимания контекста пользователя (его местоположения), а не ранжирование контента, точная геолокация фундаментально влияет на формирование выдачи. Это подчеркивает стратегическую важность адаптации контента под локальные события, праздники и сезонные тренды целевых регионов.
Детальный разбор
Термины и определения
- Recurrent Query (Повторяющийся запрос)
- Запрос (или кластер похожих запросов), который преимущественно поступает из определенного географического региона в течение определенного периода времени. Характеризуется предсказуемыми пиками трафика.
- Query Peak / Spike (Пик запроса / Всплеск)
- Значительное увеличение количества запросов по сравнению со средним уровнем. Должен удовлетворять Peak Count Criteria.
- Geolocation Engine (Механизм геолокации)
- Компонент поисковой системы, отвечающий за определение географического происхождения запросов.
- Peak Count Criteria (Критерии пикового значения)
- Условия, которым должен удовлетворять всплеск трафика, чтобы считаться значимым пиком. Ключевое требование: запрос должен иметь пик как по времени, так и по местоположению.
- Entropy (Энтропия)
- Мера неопределенности вероятностного распределения. Используется для оценки того, насколько концентрирован трафик запроса в конкретном регионе или периоде времени. Низкая энтропия указывает на высокую концентрацию (сильный сигнал).
- Measure of Confidence (Мера уверенности)
- Оценка или вероятность того, что запрос, идентифицированный как Recurrent Query, действительно произошел из ассоциированного географического региона.
- Query Log Data (Логи запросов)
- Исторические данные о полученных запросах, включая текст, время и предполагаемое географическое происхождение.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает процесс использования повторяющихся запросов в реальном времени (онлайн).
- Система получает запрос от клиентского устройства.
- Система определяет, что запрос является Recurrent Query (запросом, который преимущественно поступает из определенного географического региона в определенный период времени).
- Система определяет местоположение клиентского устройства, основываясь, по крайней мере частично, на этом определенном географическом регионе.
Claim 2 (Независимый пункт): Описывает процесс идентификации повторяющихся запросов (офлайн).
- Из лога запросов идентифицируется множество запросов, связанных с кандидатом в Recurrent Query.
- Определяется множество подсчетов (counts). Каждый подсчет представляет количество раз, когда запросы были получены из одного из географических регионов И в течение одного из периодов времени.
- Среди подсчетов идентифицируется пиковое значение (Peak Count), удовлетворяющее Peak Count Criteria для первого региона и первого периода времени.
- Определяется, что кандидат является Recurrent Query для этого региона и периода времени.
Claim 3 (Зависимый от 2): Уточняет один из методов идентификации пика.
Идентификация Peak Count включает определение того, что отношение (ratio) подсчета к среднему значению подсчетов превышает определенный порог. Это количественный метод обнаружения всплесков трафика.
Claim 4 (Зависимый от 2): Уточняет альтернативный метод идентификации пика с использованием теории информации.
- Определяется вероятностное распределение на основе подсчетов.
- Определяется, что энтропия (Entropy) этого распределения удовлетворяет пороговому значению. (Примечание: Хотя в патенте используется фраза «exceeds a threshold», контекст указывает на поиск концентрированного распределения, что соответствует низкой энтропии).
- Идентифицируется географический регион и период времени с наивысшей вероятностью в распределении.
Claims 5 и 6 (Зависимые от 2): Указывают на гибкость анализа входных данных.
Анализ может проводиться как для идентичных запросов (Claim 5), так и для кластеров похожих запросов (Claim 6), например, с учетом синонимов или семантически близких формулировок.
Claim 7 (Зависимый от 2): Указывает на гибкость анализа гранулярности.
Анализ может проводиться на разных уровнях гранулярности географических регионов (страна, город) или периодов времени (месяц, неделя).
Где и как применяется
Изобретение применяется на этапе понимания запроса для уточнения контекста пользователя.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Geolocation Engine использует описанный механизм для интерпретации запроса с целью определения местоположения пользователя.
- Офлайн-компонент (Анализ данных): Система периодически анализирует Query Log Data для идентификации Recurrent Queries. Это часть глобального анализа поисковых трендов и событий.
- Онлайн-компонент (Контекстуализация): Когда запрос поступает в реальном времени, система проверяет его на соответствие базе Recurrent Queries и текущему времени. Если соответствие найдено, эта информация используется для уточнения геолокации пользователя.
RANKING / RERANKING
Результаты работы этого алгоритма (уточненное местоположение) передаются на этапы ранжирования для формирования локализованной выдачи и применения твидлеров локализации.
Входные данные (Офлайн):
- Логи запросов (Query Log Data), включая текст, временные метки и исходные данные о геолокации (например, IP).
Входные данные (Онлайн):
- Входящий запрос пользователя.
- Текущее время.
- База данных идентифицированных Recurrent Queries.
Выходные данные:
- Уточненные данные о географическом местоположении пользователя (например, повышенная Measure of Confidence для конкретного региона).
На что влияет
- Специфические запросы: Запросы, связанные с локальными событиями, праздниками, фестивалями, сезонными активностями, которые происходят в разное время в разных регионах (например, «День Матери», «рецепт индейки»).
- Конкретные ниши или тематики: Критически важно для Local SEO и International SEO. Влияет на e-commerce, туризм, новостные ресурсы, где локальный контекст событий имеет значение.
- Языковые и географические ограничения: Помогает различать интент пользователей в разных странах с одним языком, но разными культурными календарями.
Когда применяется
- Триггеры активации: Входящий запрос совпадает (или похож) на запрос из набора Recurrent Queries.
- Условия применения: Текущее время попадает в период времени (Time Period), ассоциированный с Query Peak для данного запроса. Механизм особенно полезен, когда другие сигналы геолокации слабы или неоднозначны.
Пошаговый алгоритм
Процесс А: Офлайн-идентификация Recurrent Queries
- Сбор и подготовка данных: Доступ к логам запросов. Группировка похожих запросов в кластеры (например, «рецепт индейки» и «как приготовить индейку»).
- Расчет статистики: Подсчет количества вхождений запросов (Query Counts) для множества географических регионов и периодов времени. Гранулярность может варьироваться. В патенте упоминается возможность корректировки подсчетов по населению регионов.
- Определение пиков (Peak Detection): Анализ подсчетов для выявления Query Peaks. Пик должен быть выражен одновременно:
- Во времени: Всплеск в конкретный период по сравнению с другими периодами для этого региона.
- В пространстве: Всплеск в конкретном регионе по сравнению с другими регионами в этот период.
- Применение критериев (Peak Count Criteria): Проверка пика по пороговым значениям с использованием методов:
- Метод отношений: Сравнение отношения пикового значения к среднему значению.
- Метод энтропии: Расчет Entropy вероятностного распределения. Низкая энтропия указывает на сильный пик.
- Расчет уверенности: Вычисление Measure of Confidence. Если пик наблюдается в нескольких регионах одновременно, уверенность может быть ниже или распределена между ними. Система может ограничивать максимальное количество регионов.
- Сохранение: Если критерии выполнены, запрос добавляется в набор Recurrent Queries с ассоциацией региона, периода времени и меры уверенности.
Процесс Б: Онлайн-геолокация запроса
- Получение запроса: Система получает запрос от пользователя.
- Проверка на повторяемость: Система определяет, является ли входящий запрос Recurrent Query.
- Проверка времени: Система определяет, был ли запрос получен в течение периода Query Peak.
- Расчет геолокации: Если обе проверки положительны, система обновляет Measure of Confidence того, что запрос произошел из ассоциированного региона.
- Интеграция сигналов: Эта мера используется для корректировки результатов других классификаторов геолокации (например, на основе IP), возможно, с использованием алгоритмов типа Adaptive Boosting (упомянуто в описании патента).
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Логи запросов (Query Log Data) являются основным источником данных. Анализируется частота и распределение запросов.
- Временные факторы: Время получения запроса. Анализ проводится по временным периодам различной гранулярности (недели, месяцы).
- Географические факторы: Исходные данные о геолокации запросов в логах (на основе IP, настроек пользователя и т.д.). Анализ проводится по регионам различной гранулярности (страны, штаты, города).
Какие метрики используются и как они считаются
- Query Counts (Подсчеты запросов ): Прямой подсчет количества вхождений запроса для пары (Регион k, Время).
- Отношение к среднему (Ratio to Average): Сравнение текущего подсчета со средним значением. Используется для обнаружения всплесков (Claim 3).
- Вероятностное распределение : Вероятность того, что запрос поступил из региона в течение периода времени. Рассчитывается как:
- Entropy (Энтропия): Мера концентрации распределения X. Рассчитывается (в общем виде) как:
- Measure of Confidence (Мера уверенности): Итоговая оценка, основанная на силе пика и количестве других регионов, где также наблюдается пик.
Выводы
- Геолокация на основе поведения и культуры: Патент подтверждает, что Google использует не только технические данные (IP, GPS), но и анализирует исторические поведенческие паттерны, связанные с культурой, событиями и сезонностью, для определения местоположения пользователя.
- Требование двойного пика (Время и Место): Ключевым моментом является то, что запрос должен демонстрировать всплеск одновременно в конкретном регионе и в конкретное время. Глобальные события (пик только по времени) или постоянный локальный интерес (пик только по месту) не являются Recurrent Queries в этом контексте.
- Статистическая значимость и Энтропия: Система использует анализ энтропии для оценки надежности сигнала. События, уникальные для одного места и времени (низкая энтропия), являются сильными сигналами. События, происходящие повсеместно (высокая энтропия), имеют меньшую различительную способность.
- Гибкость идентификации (Кластеризация и Гранулярность): Система учитывает кластеры семантически похожих запросов (а не только точные совпадения) и может адаптировать гранулярность анализа (время и местоположение) для поиска наиболее сильного сигнала.
- Геолокация как комбинация сигналов: Recurrent Queries используются как один из входов в общую систему геолокации (в комбинации с классификаторами на основе IP и другими данными), повышая общую точность определения местоположения пользователя.
Практика
Best practices (это мы делаем)
- Анализ региональных календарей и трендов (International SEO): Тщательно изучайте календарь событий, праздников и сезонных активностей в целевых рынках. Используйте Google Trends для выявления географически и темпорально специфичных всплесков интереса (Recurrent Queries) в вашей нише.
- Своевременная локализация контента: Создавайте и продвигайте контент, приуроченный к локальным событиям, в нужное время. Убедитесь, что материалы проиндексированы до наступления Query Peak.
- Использование региональной терминологии: Используйте термины и формулировки, специфичные для вашего целевого региона. Как показано в патенте на примере «dia de la madre» (Аргентина) и «mother’s day» (США), язык и время являются ключевыми для правильной геолокации запроса.
- Усиление локальных сигналов (Local SEO): Поскольку этот механизм повышает точность геолокации пользователя, важность стандартных факторов локального SEO возрастает. Фокусируйтесь на освещении гиперлокальных событий и новостей, чтобы усилить связь сайта с конкретным регионом.
Worst practices (это делать не надо)
- Игнорирование региональных различий во времени: Применение единой контент-стратегии для разных регионов. Например, запуск кампании ко Дню Матери по единому календарю для всех стран.
- Таргетинг глобальных событий без локализации: Попытка охватить глобальные события (например, Новый Год) без учета региональных различий. Система может не использовать такие запросы для геолокации из-за высокой энтропии (низкой различительной способности).
- Предположение о статичной геолокации: Полагать, что Google локализует результаты только по IP или когда пользователь явно указывает название города. Локализация может произойти динамически на основе темы запроса и текущего времени.
Стратегическое значение
Патент подчеркивает стратегическую важность понимания контекста пользователя, который включает не только его намерение, но и его точное местоположение и текущее время. Он демонстрирует, что Google рассматривает поиск как динамическую активность, тесно связанную с реальными событиями. Для SEO это означает, что успешная стратегия должна быть не только географически точной, но и своевременной, выравнивая контент с культурными ритмами и событиями целевого региона.
Практические примеры
Сценарий: Международный интернет-магазин и таргетинг на «День Матери»
- Анализ (Основываясь на патенте): SEO-команда определяет, что «День Матери» является сильным Recurrent Query, но его пики происходят в разное время:
- США: Запрос «Mother’s Day» – пик в мае.
- Аргентина: Запрос «Día de la Madre» – пик в октябре (как показано в патенте, 40-я неделя).
- Действие SEO: Создаются отдельные локализованные лендинги (например, site.com/us/mothers-day, site.com/ar/dia-de-la-madre). Контентные кампании запускаются синхронно с локальным календарем (в США – в апреле/мае, в Аргентине – в сентябре/октябре).
- Ожидаемый результат: Когда пользователь вводит «Día de la Madre» в октябре, Google использует этот запрос и время как сильный сигнал для определения местоположения пользователя как Аргентина (даже если IP неоднозначен). Система предоставляет пользователю аргентинскую версию сайта (site.com/ar/), что повышает релевантность и конверсию.
Вопросы и ответы
Влияет ли этот патент напрямую на алгоритмы ранжирования контента?
Нет, напрямую не влияет. Это патент о геолокации (этап QUNDERSTANDING). Он улучшает способность Google понять, где находится пользователь. Однако это имеет критическое косвенное влияние: точное определение местоположения позволяет Google применить соответствующие локальные алгоритмы ранжирования или выбрать правильный региональный индекс для поиска.
Заменяет ли этот механизм геолокацию по IP-адресу или GPS?
Нет, он ее дополняет. Патент описывает Recurrent Queries как дополнительный надежный сигнал для Geolocation Engine. Он используется в сочетании с другими сигналами для повышения общей точности или для корректировки вероятностей, особенно когда данные IP неоднозначны (например, при использовании VPN) или данные GPS недоступны.
Как система обрабатывает события, которые происходят в нескольких странах одновременно?
Патент учитывает это. Если запрос достигает пика в нескольких регионах (например, «Boxing Day» в Англии и Канаде), система вычисляет более низкую Measure of Confidence для каждого отдельного региона или распределяет вероятность между ними. Если слишком много регионов имеют пик (глобальное событие), ценность такого запроса для геолокации падает.
Как SEO-специалист может определить Recurrent Queries для своей ниши и региона?
Необходимо использовать Google Trends для анализа исторических данных по ключевым запросам за несколько лет, установив фильтры по целевому региону. Ищите запросы, которые демонстрируют четкие, повторяющиеся пики в одно и то же время. Также изучайте культурный и событийный календарь целевого региона.
Учитывает ли Google похожие запросы или только точные совпадения?
Учитывает похожие запросы. В патенте явно упоминается анализ кластеров похожих (similar) или связанных запросов. Например, система кластеризует семантически близкие запросы, такие как «рецепт индейки» и «как приготовить индейку», для анализа пиков.
Что такое «Энтропия» в контексте этого патента и почему она важна?
Энтропия — это мера неопределенности или равномерности распределения. Если запрос равномерно распределен по многим странам в течение года (высокая энтропия), он бесполезен для геолокации. Если же 95% запросов приходятся на одну страну в одну конкретную неделю (низкая энтропия, высокая концентрация), это очень сильный сигнал, указывающий на местоположение пользователя.
Может ли этот механизм ошибочно определить мое местоположение, если я ищу информацию о событии в другой стране?
Теоретически да, если вы используете точную формулировку Recurrent Query в его пиковое время. Однако система использует Measure of Confidence и комбинирует этот сигнал с другими данными. Если другие сигналы (например, ваш IP-адрес, история поиска, настройки языка) сильно противоречат местоположению, предложенному Recurrent Query, система может скорректировать результат.
Имеет ли значение гранулярность региона?
Да. Патент описывает, что система может регулировать уровень гранулярности географического региона (от страны до города или почтового индекса) или временного периода (от месяца до недели), чтобы найти наиболее точный и сильный сигнал.
Происходит ли анализ данных в реальном времени?
Идентификация того, какие именно запросы являются Recurrent Queries, выполняется офлайн путем анализа исторических логов. Однако применение этих данных для определения местоположения конкретного пользователя по его текущему запросу происходит в реальном времени.
Насколько важна скорость публикации контента для использования этого механизма?
Своевременность критически важна. Контент должен быть проиндексирован и доступен до начала пикового периода (Time Period) соответствующего Recurrent Query. Планирование контент-стратегии с учетом сезонности и локальных событий необходимо для извлечения максимальной выгоды из этого механизма геолокации.