Google анализирует локальные всплески поисковых запросов («excess queries»), чтобы найти города с похожими интересами, но смещенными во времени. Определяя, какие города лидируют в трендах, а какие следуют за ними, Google может предсказать предстоящий локальный интерес и соответствующим образом таргетировать контент или корректировать ранжирование.
Описание
Какую задачу решает
Патент решает задачу прогнозирования возникающего пользовательского интереса в конкретных географических точках для улучшения таргетинга контента (включая рекламу и потенциально органические результаты). Система позволяет не реагировать на тренды постфактум, а предсказывать их распространение, выявляя схожие паттерны поведения между разными локациями, смещенные во времени.
Что запатентовано
Запатентована система анализа excess queries (запросов с необычно высоким локальным объемом) в разных географических точках и временных периодах. Система идентифицирует локации, которые демонстрируют схожие паттерны excess queries, но смещенные во времени (displaced in time). На основе этого вычисляется time offset (временное смещение), которое используется для предиктивного таргетинга контента.
Как это работает
Система работает в несколько этапов:
- Вычисление базовых линий: Определяются ожидаемые частоты запросов (Expected Query Count) на основе глобальной статистики (Query Share).
- Идентификация локального интереса: В разных локациях выявляются excess queries – запросы, частота которых значительно превышает базовую линию.
- Поиск схожести во времени: Система сравнивает паттерны excess queries между разными локациями, ища схожие тренды, но с временным лагом.
- Расчет смещения: Вычисляется time offset между лидирующей локацией (Target Geographic Feature) и следующей за ней (Candidate Geographic Feature).
- Предиктивный таргетинг: Контент, который был актуален в лидирующей локации, таргетируется на следующую локацию с учетом рассчитанного временного смещения.
Актуальность для SEO
Высокая. Прогнозирование трендов, персонализация и локализация являются ключевыми направлениями развития поиска. Понимание того, как тренды распространяются географически, критически важно для оптимизации пользовательского опыта, рекламного таргетинга и обеспечения релевантности локальной выдачи.
Важность для SEO
Патент имеет значительное влияние на SEO (7.5/10), особенно в области локального поиска и трендового контента. Хотя механизм в значительной степени ориентирован на таргетинг рекламы, в патенте прямо упоминается возможность использования этих данных для повышения ранжирования контента (например, в патенте указано, что связанный с темой контент может ранжироваться выше в наборе результатов поиска пользователя). Это дает представление о том, как Google понимает и прогнозирует локализованный интент, что критически важно для стратегий Local SEO и своевременного реагирования на возникающие тренды.
Детальный разбор
Термины и определения
- Excess Query (Избыточный запрос)
- Запрос, полученный для определенной географической локации, количество которого (Geo-Query Count) превышает ожидаемое количество (Expected Query Count) на пороговую величину. Указывает на необычно высокий локальный интерес к теме.
- Expected Query Count (Ожидаемое количество запросов)
- Базовое количество запросов, которое ожидается получить из данной локации за определенный период. Рассчитывается на основе глобальной доли запроса (Query Share) и общего объема запросов из этой локации.
- Geographic Feature (Географический объект/Локация)
- Определенное местоположение (например, город, регион), для которого анализируются запросы и таргетируется контент.
- Geo-Query Count (Локальное количество запросов)
- Фактическое количество раз, когда поисковый запрос был получен из определенной локации за указанный период.
- Query Share (Доля запроса)
- Мера частоты запроса относительно общего числа запросов в базовом регионе (например, в стране). Используется для расчета Expected Query Count.
- Time Offset / Displacement in Time (Временное смещение)
- Временной лаг между моментом, когда паттерн excess queries появляется в одной локации, и моментом, когда схожий паттерн появляется в другой локации.
- Similarity Threshold (Порог схожести)
- Минимальное количество общих excess queries, необходимое для признания двух локаций схожими.
- Dissimilarity Threshold (Порог несхожести)
- Максимально допустимое количество несхожих excess queries. Превышение этого порога может привести к тому, что локации не будут считаться схожими, даже если у них есть общие запросы.
- Quality (Качество Excess Queries)
- Метрика для взвешивания важности общих запросов. Может основываться на объеме запросов, CTR или семантической кластеризации.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод прогнозирования и таргетинга.
- Система определяет excess queries для целевой географической локации (Target Geographic Feature). Excess query определяется как запрос, число получений которого превышает ожидаемое число для этого объекта.
- Эти excess queries сравниваются с запросами из других локаций.
- Определяется кандидатная локация (Candidate Geographic Feature), имеющая схожие excess queries, но смещенные во времени (displaced in time).
- Вычисляется time offset (временное смещение) между целевой и кандидатной локациями на основе этого смещения.
- Контент таргетируется на кандидатную локацию с использованием time offset и на основе контента, который был таргетирован на целевую локацию.
Система идентифицирует локальные тренды в Локации А, находит Локацию Б, где происходят те же тренды, но позже, рассчитывает задержку и использует этот прогноз для проактивного таргетинга контента в Локации Б.
Claim 3 (Зависимый): Детализирует механизм определения excess queries.
Для запроса генерируется Geo-Query Count (фактическое количество в локации). Оно сравнивается с Expected Query Count (базовое ожидаемое количество). Если фактическое количество превышает ожидаемое на пороговую величину (threshold amount), запрос классифицируется как Excess Query.
Claim 5, 6, 7 (Зависимые): Определяют критерии схожести локаций.
Схожесть определяется на основе количества общих excess queries между двумя локациями. Это количество должно превышать определенный Similarity Threshold (порог схожести).
Claim 8, 9, 10, 11 (Зависимые): Вводят понятие качества (Quality) общих excess queries.
При определении схожести учитывается не только количество общих запросов, но и их качество. Качество может измеряться на основе объема запросов (Claim 9), показателей кликабельности (click-through rates), связанных с этими запросами (Claim 10), или с помощью семантической кластеризации терминов (semantic clustering) (Claim 11).
Claim 12, 13 (Зависимые): Вводят механизм учета несхожести.
Определение схожести также зависит от количества несхожих excess queries. Если количество несхожих запросов превышает Dissimilarity Threshold (порог несхожести), локации могут быть признаны не схожими.
Где и как применяется
Изобретение затрагивает офлайн-анализ данных и применение результатов в реальном времени для таргетинга.
Offline Analysis (Аналитическая обработка данных / Вне рамок стандартных этапов поиска)
Основная часть работы алгоритма происходит в режиме офлайн-обработки. Система анализирует исторические данные из Search Log Data для построения предиктивной модели. Процессы включают:
- Расчет глобальных Query Shares (базовых линий).
- Анализ запросов по различным Geographic Features и временным периодам.
- Вычисление Excess Queries для каждой локации.
- Сравнение паттернов и идентификация схожих локаций со смещением во времени.
- Расчет Time Offsets.
RANKING / RERANKING – Ранжирование и Переранжирование (Применение)
Результаты офлайн-анализа используются на этапе ранжирования для «таргетинга контента». Если система прогнозирует всплеск интереса к определенной теме в конкретной локации в ближайшем будущем:
- Может повышаться релевантность соответствующих рекламных объявлений.
- В патенте также упоминается, что соответствующий контент может ранжироваться выше в результатах поиска пользователя (например, в контексте таргетинга контента о Yosemite).
Входные данные:
- Search Log Data: запросы, местоположение пользователя (или запроса), временные метки.
- Данные для расчета базовых линий (глобальные объемы запросов).
Выходные данные:
- Идентифицированные пары/группы схожих Geographic Features.
- Рассчитанные Time Offsets для этих пар.
- Сигналы для таргетинга контента (повышающие коэффициенты для рекламы или органического контента) в кандидатных локациях.
На что влияет
- Специфические запросы: В первую очередь влияет на локальные запросы и запросы, связанные с возникающими трендами, сезонностью или событиями, которые распространяются географически (например, погодные явления, эпидемии, модные тренды, туры артистов).
- Конкретные типы контента: Контент, имеющий сильную локальную привязку или связанный с трендами (новости, события, товары, услуги, актуальные в определенный момент времени).
- Конкретные ниши: Высокое влияние в нишах, связанных с технологиями, модой, развлечениями, туризмом и сезонными товарами.
Когда применяется
- Триггеры активации: Обнаружение статистически значимых паттернов excess queries в одной или нескольких локациях, что указывает на всплеск локального интереса.
- Условия применения: Когда система идентифицирует схожую локацию с определенным time offset. Таргетинг активируется, когда рассчитанное временное смещение предполагает, что тренд скоро достигнет кандидатной локации.
- Пороговые значения: Применение зависит от достижения Similarity Threshold и не превышения Dissimilarity Threshold. Также требуется, чтобы Excess Query Count превышал порог значимости.
Пошаговый алгоритм
Процесс А: Офлайн-анализ и расчет схожести
- Сбор данных: Доступ к журналам поисковых запросов (Search Log Data) с указанием локаций и времени.
- Расчет базовых линий: Вычисление Query Share для каждого запроса на глобальном уровне (например, по стране).
- Локальный анализ (повторяется для каждой локации и временного периода):
- Вычисление фактического количества запросов (Geo-Query Count).
- Расчет ожидаемого количества запросов (Expected Query Count) на основе Query Share и общего объема запросов в локации.
- Идентификация Excess Queries: запросы, где Geo-Query Count превышает Expected Query Count на пороговое значение.
- Сравнение паттернов: Сравнение наборов excess queries (временных рядов) между разными локациями (например, Город А и Город Б) с использованием различных временных лагов (Delta Time). Для сравнения могут использоваться методы вроде косинусного сходства (cosine similarity) или суммы квадратов разностей.
- Оценка схожести: Определение схожести локаций на основе:
- Количества общих excess queries (должно быть выше Similarity Threshold).
- Качества (Quality) общих запросов (объем, CTR, семантика).
- Количества несхожих запросов (должно быть ниже Dissimilarity Threshold).
- Расчет смещения: Для схожих пар определяется оптимальный Time Offset, который наилучшим образом описывает временной лаг между их паттернами запросов.
- Сохранение модели: Сохранение данных о схожих локациях и их временных смещениях.
Процесс Б: Предиктивный таргетинг
- Мониторинг лидирующей локации: Идентификация контента (например, успешной рекламной кампании или популярного органического результата), таргетированного на целевую (лидирующую) локацию.
- Идентификация следующих локаций: Определение кандидатных (следующих) локаций на основе сохраненной модели схожести.
- Применение смещения: Использование рассчитанного Time Offset для определения времени активации таргетинга в кандидатной локации.
- Таргетинг контента: Таргетирование контента на кандидатную локацию в соответствующее время (например, повышение ранжирования или запуск рекламы).
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Журналы поисковых запросов (Search Log Data). Анализируются конкретные термины, объем и частота запросов. Также могут использоваться CTR (Click-Through Rates) для оценки качества запросов (Claim 10).
- Географические факторы: Местоположение пользовательского устройства (IP-адрес, GPS-данные, данные профиля пользователя) или местоположение, указанное в самом запросе. Это критически важно для определения Geographic Feature.
- Временные факторы: Временные метки запросов. Данные агрегируются по временным периодам (часы, дни, недели) для выявления паттернов и трендов.
- Пользовательские факторы: Упоминается возможность разделения анализа для мобильных устройств и десктопов, так как поведение пользователей на них различается.
Какие метрики используются и как они считаются
- Query Share: Доля запроса на глобальном уровне. Формула: (Количество запроса в базовом регионе) / (Общее количество всех запросов в базовом регионе).
- Geo-Query Count: Фактическое количество запроса в конкретной локации.
- Expected Query Count: Ожидаемое количество запроса в локации. Формула: (Query Share) * (Общее количество всех запросов в локации).
- Excess Query Count: Избыточное количество запросов. Может рассчитываться как абсолютная разница (Geo-Query Count — Expected Query Count) или как соотношение/процент превышения.
- Similarity Threshold / Dissimilarity Threshold: Пороги для признания схожести/несхожести на основе количества общих или различных excess queries.
- Time Offset (Delta Time): Временной лаг, обеспечивающий наилучшее совпадение паттернов между двумя локациями.
- Quality of Excess Queries: Метрика для взвешивания важности общих запросов. Учитывает объем превышения, редкость запроса, CTR связанных терминов, а также семантическую кластеризацию (semantic clustering).
Выводы
- Предиктивный поиск на основе географии: Google использует моделирование распространения географических трендов. Система не просто реагирует на то, что ищут пользователи сейчас, но и предсказывает, что они будут искать в ближайшем будущем, наблюдая за другими локациями.
- Локальный интерес измеряется отклонением от нормы: Ключевым показателем локального интереса является Excess Query – всплеск запросов выше ожидаемой нормы (Expected Query Count). Это позволяет отфильтровать глобально популярные темы и сфокусироваться на локально значимых трендах.
- Идентификация «Лидеров» и «Последователей»: Система формализует концепцию городов-«индикаторов» (лидеров трендов) и городов-«последователей». Схожесть между локациями определяется не географической близостью, а общими паттернами интересов, смещенными во времени.
- Комплексная оценка схожести: Схожесть локаций – это баланс между общими трендами (Similarity Threshold) и уникальными локальными особенностями (Dissimilarity Threshold), с учетом важности (Quality) общих запросов.
- Применение к ранжированию: Механизм используется для таргетинга контента. Это явно включает рекламу, но патент также подтверждает возможность повышения органического ранжирования для контента, соответствующего прогнозируемым интересам.
Практика
Best practices (это мы делаем)
- Мониторинг региональных трендов за пределами целевой зоны: Анализируйте тренды в других регионах/городах, которые могут быть «лидирующими индикаторами» для вашей ниши. Если определенный тип продукта или услуги начинает набирать популярность в одном регионе, готовьтесь к его появлению в других.
- Предиктивная подготовка контента: Используйте данные о распространении трендов для заблаговременной подготовки и оптимизации контента. Если вы знаете, что сезонный тренд (например, спрос на зимнее оборудование) обычно приходит в ваш регион позже, чем в другие, готовьте контент заранее, чтобы захватить начало всплеска.
- Углубленное локальное исследование ключевых слов: Применяйте концепцию Excess Queries в своем исследовании. Используйте инструменты (например, Google Trends с географической разбивкой), чтобы найти запросы, которые необычно популярны именно в вашей локации по сравнению с национальным уровнем. Это указывает на сильный локальный интент.
- Оптимизация под возникающие локальные интенты: Если прогнозируется всплеск интереса, усиливайте локальные сигналы для соответствующего контента и страниц в Google Business Profile, чтобы повысить шансы на высокое ранжирование в момент пика спроса.
- Анализ семантики локальных трендов: Обращайте внимание на точную семантику всплесков интереса. Патент упоминает использование семантической кластеризации (semantic clustering) для оценки качества схожести, что подчеркивает важность понимания локального интента.
Worst practices (это делать не надо)
- Игнорирование географической специфики трендов: Предполагать, что сезонность, тренды и пользовательский интерес возникают одновременно во всех локациях. Это приведет к опозданию с контент-стратегией в «отстающих» регионах.
- Фокус только на национальных данных по объему запросов: Игнорирование локальных всплесков интереса (excess queries) и опора только на средние национальные показатели не позволит выявить специфические локальные потребности.
- Реактивная контент-стратегия: Создание контента в ответ на уже возникший спрос вместо предиктивной работы на основе анализа распространения трендов.
Стратегическое значение
Патент подчеркивает переход к предиктивному и высоко локализованному поиску. Google стремится удовлетворить потребность пользователя еще до того, как она станет массовой в его регионе. Для SEO это означает, что стратегии должны быть достаточно гибкими, чтобы предвидеть и использовать географически смещающиеся тренды. Это также усиливает важность понимания локализованного интента за пределами простых запросов типа «услуга рядом со мной», охватывая тренды, события и локальные новости.
Практические примеры
Сценарий: Прогнозирование распространения трендового товара
- Обнаружение тренда: Система Google обнаруживает значительное количество excess queries по новому типу гаджета в Сан-Франциско (Target Geographic Feature). Рекламные кампании и органический контент показывают высокую эффективность.
- Анализ схожести: Офлайн-анализ показывает, что Чикаго (Candidate Geographic Feature) имеет схожие паттерны поискового поведения по технологическим запросам, но с лагом в 10 дней (Time Offset).
- Предиктивный таргетинг (Действия Google): Через 8-10 дней Google начинает предиктивно повышать релевантность рекламы этого гаджета для пользователей в Чикаго. Также возможно небольшое повышение в органической выдаче для качественных обзоров этого гаджета для пользователей из Чикаго.
- Действия SEO-специалиста: SEO-специалист интернет-магазина в Чикаго, отслеживая тренды в Сан-Франциско (как в лидирующем технологическом хабе), замечает всплеск интереса. Он заблаговременно (за 10 дней) готовит и публикует подробный обзор гаджета, оптимизирует карточки товара и запускает локальную кампанию, захватывая начало тренда в своем городе.
Вопросы и ответы
Что такое «Excess Query» (Избыточный запрос) и почему это важно?
Это запрос, который в данной локации ищут значительно чаще, чем ожидалось бы, исходя из средних показателей (например, по стране). Это ключевой индикатор локального интереса или возникающего тренда. Для SEO это сигнал о том, что в данной местности существует специфический спрос, который необходимо удовлетворить.
Как этот патент влияет на органический поиск по сравнению с рекламой?
Основной фокус патента – таргетинг контента, и в первую очередь упоминаются рекламные кампании. Однако в патенте также прямо говорится, что этот механизм может использоваться для того, чтобы релевантный контент «ранжировался выше в результатах поиска пользователя». Это означает, что Google может использовать предиктивные сигналы для корректировки органической выдачи.
Как Google определяет, что две локации похожи?
Схожесть определяется не демографией или географией, а паттернами поискового поведения. Две локации считаются схожими, если они разделяют значительное количество excess queries (превышая Similarity Threshold) и не имеют слишком много различий (не превышая Dissimilarity Threshold). Также учитывается качество (Quality) общих запросов.
Что такое «Time Offset» (Временное смещение)?
Это рассчитанный временной лаг между появлением определенного тренда (паттерна excess queries) в одной локации и его появлением в другой схожей локации. Например, если тренд появляется в Нью-Йорке, а затем через 5 дней в Лос-Анджелесе, Time Offset составляет 5 дней.
Можем ли мы самостоятельно определить города-«индикаторы» для своей ниши?
Да, хотя у нас нет доступа к внутренним данным Google, мы можем эмулировать этот процесс. Используя Google Trends с детальной географической разбивкой и анализируя исторические данные по своим ключевым запросам, можно выявить, в каких регионах тренды начинаются раньше. Эти регионы можно использовать как лидирующие индикаторы для прогнозирования спроса в других локациях.
Применяется ли этот механизм ко всем типам запросов?
Нет, он фокусируется на запросах, демонстрирующих локальные всплески (excess queries). Это наиболее актуально для трендов, сезонных явлений, локальных событий, новостей или продуктов, интерес к которым распространяется географически. Он менее применим к вечнозеленым темам с равномерным глобальным спросом.
Что подразумевается под «качеством» (Quality) избыточного запроса?
Патент предлагает несколько метрик качества (Claim 8-11). Это может быть объем (насколько сильно превышен ожидаемый показатель), редкость запроса, семантическая кластеризация или поведенческие метрики, такие как CTR (Click-Through Rates), связанные с этими запросами. Более качественные общие запросы сильнее влияют на определение схожести локаций.
Важна ли географическая близость для определения схожести локаций?
Нет. В патенте указано, что города не обязательно должны быть географически близки. Схожесть основана исключительно на паттернах поисковых запросов. Например, технологические хабы на разных побережьях могут быть более схожими между собой, чем с соседними городами.
Все ли вычисления происходят в реальном времени?
Нет. Основная аналитическая работа — расчет Excess Queries, анализ временных рядов, поиск схожести и вычисление Time Offsets — происходит офлайн путем обработки больших объемов исторических данных. В реальном времени применяется уже готовая модель для таргетинга контента.
Какие данные Google использует для определения местоположения пользователя в этом патенте?
Патент упоминает использование данных профиля пользователя, анонимизированных IP-адресов, а также данные от служб геолокации (например, GPS) для мобильных устройств. Также могут использоваться локации, указанные в самом запросе.