Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google анализирует локальные аномалии в поисковых запросах для определения похожих городов и таргетинга контента

    FINDING SIMILAR CITIES USING GEO-RELATED QUERIES (Поиск похожих городов с использованием геозависимых запросов)
    • US9135271B1
    • Google LLC
    • 2015-09-15
    • 2013-08-05
    2013 Shumeet Baluja Патенты Google Персонализация Поведенческие сигналы Свежесть контента

    Google использует систему для выявления уникальных интересов пользователей в конкретных городах путем идентификации «избыточных запросов» — тем, которые ищут значительно чаще, чем в среднем по стране. Анализируя эти паттерны во времени, система находит другие города с похожим поисковым поведением. Эта информация используется для переноса данных таргетинга между похожими локациями.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу идентификации схожести между различными географическими объектами (например, городами) на основе анализа поискового поведения пользователей, а не традиционных демографических или географических данных. Цель — понять уникальные локальные интересы и использовать эту информацию для улучшения таргетинга контента и рекламы. Если контент популярен в одном городе, система позволяет предположить, что он будет также популярен в другом городе с похожим профилем поисковых интересов.

    Что запатентовано

    Запатентована система для определения схожести географических объектов путем анализа Excess Queries (избыточных запросов). Excess Query — это запрос, который поступает из определенного региона значительно чаще, чем ожидалось, исходя из базового уровня (например, национального). Система сравнивает профили этих избыточных запросов разных городов за несколько периодов времени и определяет схожесть на основе общих паттернов поискового поведения.

    Как это работает

    Механизм работает в несколько этапов:

    • Расчет ожидаемого уровня: Для каждого запроса определяется его доля (Query Share) в общем объеме поиска в базовом регионе (например, в стране).
    • Анализ локальных данных: В целевом регионе (городе) подсчитывается фактическое количество запросов (Geo-query count).
    • Вычисление ожидаемого количества (Expected query count): Доля запроса (Query Share) умножается на общий объем поиска в целевом регионе.
    • Идентификация избытка: Если Geo-query count превышает Expected query count на определенный порог, запрос классифицируется как Excess Query.
    • Сравнение регионов: Профили Excess Queries разных городов за несколько временных периодов сравниваются.
    • Определение схожести: Города, имеющие значительное количество общих Excess Queries и не слишком много различий, признаются похожими.

    Актуальность для SEO

    Средняя/Высокая. Понимание локального контекста и интересов пользователей остается критически важным для Google, особенно в Local Search и для рекламной платформы (Google Ads). Этот патент описывает фундаментальный статистический подход к использованию поисковых данных для географического анализа. Хотя современные методы могут включать более сложные ML-модели, базовая концепция профилирования локаций на основе отклонений от нормы остается актуальной.

    Важность для SEO

    Патент имеет умеренное значение для SEO-стратегии (55/100). Он не описывает алгоритмы органического ранжирования напрямую. Однако он раскрывает механизм, с помощью которого Google профилирует географические регионы и понимает уникальные локальные интересы (Excess Queries). Это критически важно для Local SEO и контент-маркетинга, так как позволяет понять, какой контент система считает особенно релевантным для конкретной локации, и как она может переносить эти знания на похожие рынки.

    Детальный разбор

    Термины и определения

    Excess Query (Избыточный запрос)
    Запрос, для которого Geo-query count в определенном регионе превышает Expected query count на заданный пороговый уровень. Указывает на повышенный локальный интерес к теме.
    Expected query count (Ожидаемое количество запросов)
    Базовое количество запросов, которое ожидается получить из данного региона за определенный период. Рассчитывается как произведение Query Share запроса на общий объем поиска в регионе.
    Geographic Feature (Географический объект)
    Определенная локация, например, город или регион.
    Geo-query count (Локальное количество запросов)
    Фактическое количество раз, когда конкретный запрос был получен от пользователей в определенном географическом регионе за указанный период.
    Query Share (Доля запроса)
    Метрика, показывающая, какую долю составляет конкретный запрос от общего числа запросов в базовом (референсном) географическом регионе (например, в стране).
    Similarity Threshold (Порог схожести)
    Минимальное количество общих Excess Queries, которое должны иметь два географических объекта, чтобы считаться похожими.
    Dissimilarity Threshold (Порог несхожести)
    Показатель, основанный на количестве или проценте несовпадающих избыточных запросов. Если он превышен, объекты не считаются похожими.
    Quality of Excess Queries (Качество избыточных запросов)
    Метрика важности Excess Query. Может основываться на объеме запросов (например, насколько сильно превышен ожидаемый уровень) или семантической кластеризации терминов (semantic clustering of terms by meaning).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод определения схожести географических объектов.

    1. Система определяет excess queries за несколько периодов времени для двух или более географических объектов.
    2. Система сравнивает эти объекты на предмет схожести, основываясь на связанных с ними excess queries.
    3. Для целевого объекта система определяет один или более похожих объектов и электронно связывает их в набор.

    Ключевая часть Claim 1 детализирует процесс определения excess queries:

    1. Генерация geo-query count (фактическое количество).
    2. Получение expected query count (базовое ожидаемое количество).
    3. Сравнение фактического и ожидаемого количества.
    4. Если фактическое количество превышает ожидаемое по крайней мере на пороговое значение (threshold amount), запрос классифицируется как excess query.

    Claim 6 (Зависимый): Уточняет механизм сравнения.

    Сравнение включает определение Similarity Threshold — минимального числа общих excess queries, необходимых для признания схожести. Похожими признаются объекты, у которых число общих excess queries превышает этот порог.

    Claim 7 и 8 (Зависимые): Уточняют, что сравнение может включать определение quality общих excess queries.

    Качество может измеряться на основе объема запросов или семантической кластеризации терминов.

    Claim 9 (Зависимый): Вводит механизм учета различий.

    Определение схожести включает сравнение числа общих (shared) и числа различных (dissimilar) excess queries. Если число различных запросов превышает Dissimilarity Threshold, объекты признаются непохожими.

    Claim 10 (Зависимый): Описывает применение метода.

    Информация (например, targeting information или label), связанная с одним объектом, атрибутируется (attributing information) похожему объекту и используется для таргетинга контента (target content) на этот похожий объект.

    Где и как применяется

    Изобретение в первую очередь связано с анализом данных о поведении пользователей для профилирования географических локаций.

    INDEXING – Индексирование и извлечение признаков (Анализ данных)
    Основная работа алгоритма происходит на этом этапе в режиме офлайн-анализа данных. Система (Query Analysis Subsystem) обрабатывает Search Log Data:

    1. Анализируются логи запросов с привязкой к географии.
    2. Вычисляются Query Shares (базовые частоты).
    3. Для каждого региона вычисляются Excess Queries за множество временных периодов.
    4. Строятся профили регионов (например, в виде двумерных векторов, как упомянуто в патенте).
    5. Проводится сравнение и определяются наборы похожих географических объектов.

    QUNDERSTANDING – Понимание Запросов
    Результаты этого анализа помогают системе лучше понимать локальный контекст пользователя. Зная, какие темы являются Excess Queries в текущем местоположении пользователя, система может точнее интерпретировать его интент.

    RERANKING – Переранжирование (Локализация и Таргетинг)
    Информация о схожести городов и локальных интересах используется для таргетинга контента и рекламы. Как указано в Claim 10, информация, атрибутированная от одного города к другому, используется для таргетинга контента. Это может включать повышение релевантности определенного контента или рекламы в похожих городах.

    Входные данные:

    • Search Log Data: Журналы запросов с указанием географического происхождения запроса и времени.
    • Определение базового и целевых географических объектов.
    • Пороговые значения (Thresholds) для определения Excess Queries, Similarity и Dissimilarity.

    Выходные данные:

    • Профили географических объектов (списки Excess Queries и их объемы за разные периоды).
    • Наборы (sets) похожих географических объектов.
    • Атрибутированная информация для таргетинга контента.

    На что влияет

    • Локальный поиск (Local Search) и Географические факторы: Влияет на понимание того, какие типы запросов и контента наиболее релевантны для пользователей в определенной местности, даже если запрос не содержит явных локальных модификаторов.
    • Таргетинг контента и рекламы: Основное применение — улучшение таргетинга путем переноса успешных кампаний из одного города в другой с похожими интересами.
    • Специфические запросы: Влияет на запросы, которые демонстрируют локальные всплески интереса, отклоняющиеся от национальных тенденций (Excess Queries).

    Когда применяется

    • Триггеры активации (Анализ): Процесс анализа данных происходит периодически (офлайн) для обработки накопленных логов и обновления профилей городов и матриц схожести.
    • Условия применения (Таргетинг): Результаты анализа используются в реальном времени при обработке запроса пользователя, когда система принимает решение о таргетинге контента или локализации выдачи.
    • Временные рамки: Анализ обязательно проводится за несколько временных периодов (multiple time periods), что позволяет учитывать тренды и сезонность, а не разовые всплески интереса.

    Пошаговый алгоритм

    Этап А: Расчет базовых метрик (Офлайн)

    1. Сбор данных: Доступ к журналу поисковых запросов (Search Log Data) в базовом регионе (например, стране).
    2. Вычисление Query Share: Для каждого запроса рассчитывается его доля от общего объема поиска в базовом регионе за определенный период.

    Этап Б: Идентификация Excess Queries для региона (Периодически)

    1. Выбор региона и периода: Выбирается целевой географический объект (город) и временной период.
    2. Подсчет локального объема: Определяется общее количество всех запросов из этого региона за период.
    3. Подсчет Geo-query count: Для конкретного запроса подсчитывается, сколько раз он был получен из этого региона.
    4. Расчет Expected query count: Ожидаемое количество рассчитывается как (Общий локальный объем * Query Share запроса).
    5. Сравнение и классификация: Geo-query count сравнивается с Expected query count. Если превышение составляет пороговую величину (threshold amount), запрос классифицируется как Excess Query, и вычисляется объем избытка.
    6. Повторение и Хранение: Процесс повторяется для всех значимых запросов, всех регионов и нескольких временных периодов. Данные сохраняются (например, в виде двумерных массивов).

    Этап В: Определение схожести (Периодически)

    1. Сравнение профилей: Профили Excess Queries двух городов сравниваются. Это может включать подсчет количества общих запросов, векторное сравнение или взвешенное сравнение с учетом Quality of Excess Queries.
    2. Применение порогов: Проверяется, превышает ли уровень схожести Similarity Threshold и не превышает ли уровень различий Dissimilarity Threshold.
    3. Формирование наборов: Города, удовлетворяющие критериям, объединяются в наборы похожих географических объектов.
    4. Атрибуция информации: Информация (например, метки, данные таргетинга) переносится с одного объекта на похожий для последующего использования в таргетинге контента.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Ядро патента. Используются журналы поисковых запросов (Search Log Data) для анализа частоты и объема запросов.
    • Географические факторы: Критически важные данные. Каждый запрос в логе должен иметь географический идентификатор, указывающий местоположение устройства пользователя (с согласия пользователя), для агрегации данных по Geographic Features.
    • Временные факторы: Анализ проводится за определенные периоды времени (specified period), и сравнение выполняется за несколько периодов (multiple time periods) для выявления трендов.

    Какие метрики используются и как они считаются

    • Query Share: (Количество запроса в базовом регионе) / (Общее количество запросов в базовом регионе).
    • Geo-query count: Прямой подсчет запроса в целевом регионе.
    • Expected query count: (Общее количество запросов в целевом регионе) * Query Share.
    • Excess Query Count (Объем избытка): Geo-query count — Expected query count. Может быть абсолютным числом или процентом.
    • Порог избыточности (Threshold amount): Минимальное значение Excess Query Count для классификации запроса как избыточного.
    • Similarity Score (Оценка схожести): Может рассчитываться как количество общих Excess Queries, взвешенная оценка схожести или с использованием векторных методов (например, косинусное расстояние, упомянутое в описании патента).
    • Quality of Excess Queries: Метрика важности, основанная на объеме избытка или семантической кластеризации.

    Выводы

    1. Локальный интерес определяется через аномалии: Google определяет уникальность и интересы конкретного города не по абсолютным цифрам поиска, а по тому, что там ищут непропорционально много по сравнению с базовым уровнем (например, страной). Именно Excess Queries формируют профиль города.
    2. Поведенческая схожесть важнее географии: Система позволяет находить «города-побратимы» по поисковому поведению. Два географически удаленных города могут быть признаны похожими, если пользователи в них проявляют схожие аномальные интересы.
    3. Временное измерение критично: Анализ проводится за несколько периодов времени (multiple time periods). Это позволяет отличать устойчивые интересы и тренды от временных всплесков и учитывать сезонность при определении схожести.
    4. Сложные метрики схожести: Схожесть определяется не только простым совпадением. Система использует пороги схожести и несхожести (Similarity/Dissimilarity Thresholds), а также «качество» (Quality) общих запросов (их объем, значимость, семантику).
    5. Применение для таргетинга: Основная цель изобретения — перенос знаний о популярности контента или рекламы из одного города в похожий (Claim 10). Это подтверждает, что Google активно использует поведенческие данные для оптимизации релевантности контента в разных локациях.

    Практика

    Best practices (это мы делаем)

    • Анализ локальных трендов и аномалий (Поиск Excess Queries): Необходимо глубоко понимать, что именно является уникально популярным в целевых регионах. Используйте Google Trends и анализ собственной статистики запросов по регионам, чтобы выявить локальные аномалии спроса. Создавайте контент, отвечающий на эти уникальные локальные интересы.
    • Идентификация «похожих рынков» для экспансии: При масштабировании бизнеса используйте подход, описанный в патенте, для поиска городов со схожими интересами. Если ваша услуга популярна в Городе А, ищите города с похожим профилем поискового поведения (а не только схожей демографией) для запуска в них.
    • Глубокая локализация контент-стратегии: Адаптируйте контент под специфические интересы аудитории в конкретном городе, которые отличаются от национальных трендов. Это повысит вероятность того, что система сочтет ваш контент высокорелевантным для этой локации.
    • Семантическая кластеризация локальных интересов: При анализе локальных запросов группируйте их в семантические кластеры. Патент упоминает, что Quality может измеряться с помощью семантической кластеризации. Это поможет выявить более широкие темы интересов, а не только отдельные ключевые слова.

    Worst practices (это делать не надо)

    • Применение единой SEO-стратегии ко всем регионам: Игнорирование уникальных локальных интересов (Excess Queries) и применение универсальной стратегии снижает потенциальную релевантность в конкретных городах.
    • Фокус только на высокочастотных запросах: Игнорирование нишевых запросов, которые могут иметь низкую частотность на национальном уровне, но являться значимыми Excess Queries в целевом регионе, указывающими на сильный локальный интент.
    • Игнорирование временных трендов и сезонности: Оценка схожести рынков на основе данных за короткий период может привести к неверным выводам, так как система Google анализирует данные за multiple time periods.
    • Оценка рынков только по географии: Предполагать, что соседние города имеют одинаковые потребности и интересы.

    Стратегическое значение

    Патент подтверждает важность анализа поискового поведения для понимания географического контекста. Он показывает, что Google строит сложные профили локаций, выходящие за рамки карт и списков организаций. Для SEO это означает, что релевантность в Local Search определяется не только близостью и наличием ключевых слов, но и соответствием контента уникальным поведенческим паттернам пользователей в данной местности. Стратегически важно переходить от базовой оптимизации под Local Pack к глубокому пониманию и удовлетворению локального интента.

    Практические примеры

    Сценарий: Оптимизация контента для регионального интернет-магазина электроники

    1. Анализ (Имитация Google): SEO-команда анализирует Google Trends и данные GSC по Городу А (например, Остин, Техас). Они обнаруживают, что запросы, связанные с «DIY электроникой» и «компонентами для умного дома», имеют значительно более высокий интерес, чем в среднем по стране (это их потенциальные Excess Queries).
    2. Выявление похожих городов: Команда ищет другие города (Город Б и В), где наблюдаются схожие аномалии в интересе к DIY электронике и умному дому, даже если общий объем рынка там меньше.
    3. Применение (Таргетинг контента):
      • В Городе А магазин усиливает контент-маркетинг по этим темам (гайды, обзоры компонентов).
      • В Городах Б и В (похожих рынках) магазин запускает аналогичную контент-стратегию и таргетированную рекламу, ожидая высокого уровня вовлеченности, так как профили интересов схожи.
    4. Ожидаемый результат: Повышение локальной релевантности и трафика в Городе А за счет удовлетворения уникального спроса, а также успешный выход на рынки Городов Б и В за счет использования данных о схожести интересов.

    Вопросы и ответы

    Что такое «Excess Query» (Избыточный запрос) простыми словами?

    Это тема или ключевое слово, которое жители определенного города ищут значительно чаще, чем ожидается, исходя из среднего показателя по стране. Например, если в среднем по стране запрос «купить каяк» составляет 0.01% всех запросов, а в городе у озера он составляет 0.5%, это Excess Query. Он указывает на уникальный локальный интерес.

    Как Google рассчитывает, сколько запросов «ожидается» от города?

    Система рассчитывает Expected query count. Для этого она берет общую популярность запроса в стране (Query Share) и умножает ее на общее количество всех поисковых запросов, сделанных в этом конкретном городе. Это дает базовый уровень, с которым сравнивается фактическое количество запросов (Geo-query count).

    Зачем Google нужно знать, какие города похожи друг на друга?

    Основная цель, указанная в патенте (Claim 10), — улучшение таргетинга контента и рекламы. Если рекламная кампания или определенный тип контента очень популярен в одном городе, Google может предположить, что он будет также успешен в другом городе с похожим профилем поисковых интересов (Excess Queries), и использовать эту информацию для повышения релевантности.

    Влияет ли этот патент напрямую на ранжирование в органическом поиске?

    Патент не описывает алгоритм ранжирования напрямую. Однако он описывает механизм профилирования локаций, который помогает системе понять локальный контекст и интересы. Эта информация может использоваться как сигнал для локализации и персонализации выдачи на этапе переранжирования (Reranking), потенциально влияя на то, какой контент будет считаться более релевантным для пользователей в данном регионе.

    Как SEO-специалист может использовать информацию из этого патента?

    SEO-специалисты могут использовать этот подход для анализа рынка. Во-первых, для глубокого понимания уникальных интересов (Excess Queries) в своих целевых регионах и создания соответствующего контента. Во-вторых, для поиска новых перспективных рынков (городов) со схожими профилями интересов для масштабирования бизнеса или запуска кампаний.

    Учитывает ли система только количество общих Excess Queries для определения схожести?

    Нет, система использует более сложный подход. Она учитывает пороги схожести (Similarity Threshold) и несхожести (Dissimilarity Threshold) — то есть важно не только иметь много общего, но и не иметь слишком много различий. Также учитывается «качество» (Quality) общих запросов — их объем, семантика и значимость.

    Важно ли время при анализе схожести городов?

    Да, это критически важно. Патент подчеркивает, что анализ проводится за multiple time periods (несколько временных периодов). Это позволяет системе учитывать тренды, сезонность и отличать устойчивые локальные интересы от кратковременных всплесков популярности, обеспечивая более надежное определение схожести.

    Могут ли два совершенно разных по размеру и демографии города быть признаны похожими?

    Да. Если пользователи в обоих городах демонстрируют схожие паттерны аномального поискового поведения (имеют общие Excess Queries), система может признать их похожими с точки зрения интересов. Например, маленький университетский город и крупный технологический хаб могут быть похожи по интересу к определенной области науки или технологии.

    Как можно выявить Excess Queries для моего бизнеса в конкретном городе?

    Прямого инструмента нет, но можно имитировать подход. Используйте Google Trends для сравнения интереса к вашим ключевым темам в целевом городе и в среднем по стране. Также анализируйте данные Google Search Console, сегментированные по географии, чтобы выявить запросы, которые приводят непропорционально много трафика из определенных регионов.

    Что такое «качество» (Quality) избыточных запросов?

    Патент упоминает, что качество может измеряться объемом запросов или семантической кластеризацией. Вероятно, совпадение по более частотному или семантически значимому кластеру Excess Queries имеет больший вес при определении схожести городов, чем совпадение по низкочастотному или случайному запросу.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.