Google анализирует логи локальных поисковых запросов для обнаружения новых бизнесов. Система отслеживает термины, отсутствующие в текущей базе данных. Если частота использования такого термина в определенном регионе резко возрастает по сравнению с историческим уровнем, система идентифицирует его как название нового бизнеса и инициирует процесс его проверки (включая анализ отзывов) и добавления в индекс.
Описание
Какую задачу решает
Патент решает проблему поддержания актуальности баз данных бизнес-листингов (например, Google Maps/Local). Традиционные методы обновления (ручной обход территорий, покупка данных) медленны и дороги, из-за чего база быстро устаревает. Изобретение предлагает автоматизированный и экономически эффективный способ обнаружения новых бизнесов на основе анализа поведения пользователей.
Что запатентовано
Запатентована система (new-business detector) для автоматического обнаружения новых бизнесов путем анализа логов поисковых запросов. Система идентифицирует термины, которые не соответствуют известным бизнесам, и отслеживает частоту их появления в локальных запросах. Резкое увеличение частоты использования термина по сравнению с его историческим базовым уровнем (шум, опечатки) интерпретируется как сигнал о появлении нового бизнеса.
Как это работает
Система работает следующим образом:
- Гео-кластеризация: Запросы из логов группируются по географическому признаку (local search queries).
- Обнаружение новых терминов: В каждом локальном логе выявляются термины, отсутствующие в существующем бизнес-листинге (business listing).
- Частотный анализ: Для каждого нового термина рассчитывается историческая частота (Historical Rate, включая среднее значение и вариативность) и недавняя частота (Recent Rate).
- Сравнение: Система сравнивает Recent Rate с пороговым значением (Threshold Rate), основанным на Historical Rate (например, превышение на несколько стандартных отклонений).
- Идентификация: Если Recent Rate значительно превышает порог, термин помечается как потенциальное название нового бизнеса.
- Валидация: Кандидаты проверяются автоматически (например, поиском упоминаний в отзывах, как указано в Claim 1) или вручную перед добавлением в индекс.
Актуальность для SEO
Высокая. Автоматическое обнаружение и индексация новых локальных сущностей критически важны для поддержания качества локального поиска и карт. Использование поискового поведения пользователей как механизма сбора данных (Data Acquisition) является фундаментальным подходом Google для индексации физического мира.
Важность для SEO
Патент имеет высокое значение (7.5/10) для Local SEO и стратегического понимания процессов индексации сущностей. Он демонстрирует, что локализованный поисковый спрос (Search Interest) напрямую управляет процессом обнаружения и индексации новых бизнес-объектов. Для SEO-специалистов это означает, что генерация реального поискового интереса к новому бизнесу является ключевым фактором для его быстрого и корректного появления в Google Maps и локальной выдаче.
Детальный разбор
Термины и определения
- Business Listing (Бизнес-листинг)
- База данных, содержащая названия и местоположение известных компаний. Используется для ответов на запросы и геокодирования.
- Historical Rate (Историческая частота)
- Базовая частота появления нераспознанного термина в запросах за длительный период. Характеризуется мерой центральной тенденции (например, средним значением) и мерой вариативности (например, стандартным отклонением).
- Local Search Queries (Локальные поисковые запросы)
- Поисковые запросы, сгруппированные по географическому признаку (например, по городу, почтовому индексу или динамическому кластеру).
- New Term (Новый термин / Unrecognized query term)
- Термин (слово или фраза) из поискового запроса, который не соответствует названию ни одного бизнеса в существующем Business Listing.
- Query Log (Лог запросов)
- Хранилище отправленных пользователями поисковых запросов, включающее метки времени и геолокационные данные.
- Recent Rate (Недавняя частота)
- Частота появления нераспознанного термина в запросах за короткий недавний период (например, последние 7 или 30 дней). Может рассчитываться для нескольких временных окон.
- Threshold Rate (Пороговая частота)
- Значение, которое должна превысить Recent Rate, чтобы термин был идентифицирован как новый бизнес. Рассчитывается на основе Historical Rate и его вариативности.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод идентификации нового бизнеса, включая автоматическую валидацию.
- Система получает лог local search queries.
- Идентифицирует термин, отсутствующий в business listing.
- Определяет количество недавних и исторических запросов с этим термином.
- Определяет Threshold Rate на основе исторических запросов.
- Определяет, что Recent Rate превышает Threshold Rate.
- Идентифицирует термин как название нового бизнеса.
- [Автоматическая валидация] В ответ на это система ищет термин в отзывах (reviews) о новых бизнесах.
- Определяет, что название появляется в отзывах.
- Идентифицирует термин как подтвержденный новый бизнес.
Ядро изобретения — использование статистического анализа временных рядов (изменение частоты запросов) для обнаружения новых локальных сущностей, с последующей автоматической валидацией через другой источник данных (отзывы).
Claim 4 (Зависимый от 1): Подчеркивает важность локализации.
Поисковые запросы сначала кластеризуются по географическому местоположению. Новый термин идентифицируется внутри конкретного географического кластера. Это помогает отличить локальный бизнес от глобальных трендов или шума.
Claim 5 и 6 (Зависимые от 1) и Claim 17 (Независимый): Описывают ручной путь валидации.
Термин добавляется в список задач (work-list) для проверки человеком (асессором), который может использовать мобильное устройство (Claim 17). С термином ассоциируется географическая область, определенная на основе контекста локальных запросов (геолокация пользователя, упоминание адресов), чтобы облегчить проверку (Claim 6).
Claim 12 и 13 (Зависимые от 1): Определяют статистический метод расчета порога.
Threshold Rate определяется на основе дисперсии (variance) и меры центральной тенденции (central tendency) исторической частоты. Конкретный пример: порог устанавливается более чем на два стандартных отклонения выше среднего значения.
Claim 15 (Зависимый от 1) и Claim 18 (Независимый): Описывают использование нескольких временных окон.
- Рассчитывается несколько Recent Rates для разных периодов (например, неделя, месяц, полгода).
- Проверяется, превышает ли какая-либо из них соответствующий порог.
- Пороги для более длительных периодов ниже, чем для коротких.
Это позволяет обнаруживать не только резкие всплески (короткий период, высокий порог), но и постепенный, устойчивый рост интереса (длинный период, низкий порог).
Где и как применяется
Изобретение является ключевым компонентом системы сбора данных Google для локального поиска и карт.
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Основное применение патента. Система использует логи поисковых запросов как источник данных для обнаружения новых сущностей (бизнесов), которые еще не известны поисковой системе. Это механизм сбора данных, основанный на поведении пользователей.
INDEXING – Индексирование и извлечение признаков
После обнаружения и подтверждения (автоматически через отзывы или вручную) новый бизнес добавляется в Business Listing (Индекс локальных сущностей / Knowledge Graph). На этом этапе извлекаются признаки, такие как местоположение и категория.
Входные данные:
- Query Log (запросы с метками времени).
- Геолокационные данные запросов (IP, GPS, видимая область карты (viewport), упоминание локаций в тексте).
- Существующий Business Listing.
- Отзывы о бизнесах (для валидации).
Выходные данные:
- Идентифицированные названия и предполагаемые местоположения новых бизнесов.
- Список задач (work-list) для ручной проверки.
- Обновленный Business Listing.
На что влияет
- Конкретные типы контента: Бизнес-листинги, профили компаний (Google Business Profile), точки интереса (POI) на картах.
- Специфические запросы: Локальные запросы и брендовые запросы новых компаний.
- Конкретные ниши или тематики: Наибольшее влияние в нишах с высокой динамикой открытия новых точек: ритейл, общественное питание, услуги.
Когда применяется
- Условия работы алгоритма: Алгоритм работает непрерывно, анализируя логи запросов.
- Триггеры активации: Статистически значимый всплеск частоты использования нераспознанного термина в конкретном географическом кластере. Всплеск должен превысить Threshold Rate.
- Временные рамки: Анализ проводится в разных временных окнах (неделя, месяц и т.д.) для обнаружения как быстрых, так и постепенных изменений.
Пошаговый алгоритм
Этап 1: Подготовка данных и обнаружение терминов
- Сбор и кластеризация запросов: Данные из Query Log группируются по географическому признаку для создания логов локальных поисковых запросов (Claim 4).
- Идентификация новых терминов: Каждый термин сравнивается с Business Listing. Термины, отсутствующие в листинге, помечаются как New Terms.
- Фильтрация шума: Удаляются стоп-слова, общие термины и запросы, для которых пользователь выбрал исправление орфографии (подтвержденные опечатки, Claim 3).
Этап 2: Расчет и сравнение частот
- Расчет исторической частоты (Historical Rate): Для каждого New Term анализируются исторические данные. Рассчитывается средняя частота и стандартное отклонение.
- Расчет недавней частоты (Recent Rate): Рассчитывается частота термина за один или несколько недавних периодов (например, 7 дней, 30 дней) (Claims 15, 18).
- Нормализация: Частоты могут быть нормализованы с учетом общего объема запросов за соответствующие периоды, чтобы исключить влияние сезонности или роста аудитории (Claim 14).
- Расчет пороговой частоты (Threshold Rate): Для каждого временного окна определяется порог на основе исторической вариативности (Claims 12, 13). Например: N∗SDHistorical (где N может быть 2, 3 или 4).
- Сравнение: Recent Rate сравнивается с Threshold Rate. Если порог превышен, система переходит к Этапу 3.
Этап 3: Идентификация и валидация
- Идентификация кандидата: Термин идентифицируется как потенциальное название нового бизнеса. Может быть рассчитана оценка уверенности (Confidence Score).
- Определение местоположения: Анализируется контекст запросов (геолокация пользователей, упоминаемые адреса), чтобы определить вероятное местоположение бизнеса (Claims 6, 9).
- Валидация:
- Автоматическая (Claim 1): Система ищет упоминания термина в отзывах. Если найдено достаточно отзывов, бизнес считается подтвержденным.
- Ручная (Claim 5, 17): Термин и предполагаемое местоположение добавляются в work-list для проверки ревизором.
- Обновление индекса: После подтверждения новый бизнес добавляется в Business Listing.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Логи поисковых запросов (Query Log) — основной источник данных. Анализируется текст, частота, временные метки и действия пользователя (например, отказ в пользу исправления орфографии, Claim 3).
- Географические факторы: Критически важны для кластеризации и локализации. Используются IP-адреса, GPS-сигналы мобильных устройств, видимая область карты (map extent/viewport) у пользователя, а также названия локаций, упомянутые в тексте запроса.
- Контентные факторы (Внешние): Текст отзывов (reviews) используется на этапе автоматической валидации для подтверждения существования бизнеса (Claim 1).
Какие метрики используются и как они считаются
- Historical Rate (Историческая частота): Среднее количество появлений термина за единицу времени в прошлом.
- Standard Deviation/Variance (Стандартное отклонение/Дисперсия): Мера вариативности Historical Rate. Используется для определения статистической значимости изменений.
- Recent Rate (Недавняя частота): Количество появлений термина за недавний период. Рассчитывается для нескольких временных окон.
- Threshold Rate (Пороговая частота): Динамически рассчитываемый порог. Функция от Historical Rate и его вариативности (например, среднее + N стандартных отклонений).
- Normalization Factors (Факторы нормализации): Общий объем поисковых запросов за анализируемые периоды. Используются для нормировки частот (Claim 14).
Выводы
- Поисковый спрос как драйвер индексации локальных сущностей: Патент демонстрирует, как Google использует анализ поведения пользователей (поисковые запросы) в качестве основного механизма для обнаружения новых локальных бизнесов. Реальный всплеск интереса инициирует процесс индексации.
- Важность локализации сигналов: Система специально кластеризует запросы географически (Claim 4). Всплеск интереса должен быть локализован, чтобы отличить открытие нового местного бизнеса от общих трендов или случайных опечаток.
- Статистический подход к обнаружению аномалий: Обнаружение основано на выявлении статистически значимых отклонений (Recent Rate vs Historical Rate). Система ищет сигналы, которые не могут быть объяснены случайными флуктуациями (Claims 12, 13).
- Многоуровневый анализ временных рядов: Использование нескольких временных окон с адаптивными порогами (Claims 15, 18) позволяет системе быть чувствительной как к резким, так и к постепенным изменениям в поисковом поведении.
- Обязательная валидация через разные источники: Google не полагается только на анализ запросов. Обнаруженные кандидаты проходят проверку: автоматическую через анализ отзывов (Claim 1) или ручную (Claim 5, 17). Это подчеркивает важность наличия сигналов о бизнесе в разных источниках (запросы + отзывы).
Практика
Best practices (это мы делаем)
- Генерация локального поискового спроса при открытии: При запуске нового бизнеса или локации критически важно стимулировать реальный локальный поисковый интерес к бренду и адресу. Это напрямую активирует описанный механизм и ускоряет обнаружение и индексацию. Используйте локальный PR, рекламу, мероприятия.
- Стимулирование ранних отзывов: Поскольку анализ отзывов является методом автоматической валидации (Claim 1), необходимо мотивировать клиентов оставлять отзывы сразу после открытия. Наличие отзывов с упоминанием названия компании поможет системе быстрее подтвердить новый бизнес.
- Выбор уникального названия (Brand Uniqueness): Используйте уникальное название. Общие названия (например, «Лучшая кофейня») имеют высокую базовую частоту (Historical Rate), и всплеск интереса к новой точке может быть статистически незначимым на общем фоне. Уникальное название имеет низкий Historical Rate, делая всплеск более заметным.
- Обеспечение консистентности NAP и локационного контекста: Убедитесь, что NAP консистентны на сайте и в соцсетях. В маркетинговых коммуникациях четко указывайте адрес, чтобы стимулировать запросы типа [Бренд + Улица]. Это поможет системе быстрее определить местоположение.
Worst practices (это делать не надо)
- Имитация поискового спроса (Накрутка запросов): Попытки манипулировать системой путем генерации фейковых локальных запросов неэффективны. Система использует статистический анализ и многофакторную валидацию (отзывы, ручная проверка). Аномальное поведение без подтверждения из других источников будет отфильтровано.
- Пассивное ожидание индексации («Тихое открытие»): Не стоит полагаться на то, что Google самостоятельно обнаружит новый бизнес, если о нем никто не ищет и не пишет. Отсутствие поискового интереса замедлит процесс обнаружения.
Стратегическое значение
Этот патент подтверждает стратегию Google по использованию поведения пользователей как основного источника данных о реальном мире (Ground Truth). Для Local SEO это означает, что факторы популярности и известности (Prominence) начинают играть роль еще до момента индексации бизнеса. Стратегия продвижения нового локального бизнеса должна включать маркетинговые активности, направленные на генерацию реального локализованного спроса, как неотъемлемую часть SEO.
Практические примеры
Сценарий: Ускорение индексации новой кофейни
- Задача: Открывается новая кофейня «Зерно дня» по адресу ул. Ленина, 10. Нужно максимально быстро появиться в Google Maps.
- Действия: Запускается таргетированная локальная реклама и посты в соцсетях. Проводится мероприятие в день открытия. Гостей мотивируют искать маршрут по названию («Зерно дня Ленина 10») и активно оставлять отзывы сразу после посещения.
- Как работает система (по патенту):
- Система фиксирует рост запросов с термином «Зерно дня» в соответствующем географическом кластере.
- New-term detector определяет, что «Зерно дня» отсутствует в Business Listing.
- Rate-comparison module фиксирует, что Recent Rate (за неделю открытия) значительно превышает Historical Rate (близкий к нулю). Триггер срабатывает.
- Система определяет вероятное местоположение (ул. Ленина, 10) на основе текста запросов и геолокации пользователей.
- Система ищет валидацию и находит свежие отзывы о «Зерно дня» (Claim 1).
- Результат: Бизнес обнаруживается, автоматически валидируется через отзывы и быстро добавляется в индекс Google Maps.
Вопросы и ответы
Что является главным триггером для обнаружения нового бизнеса согласно патенту?
Главным триггером является статистически значимое увеличение частоты поисковых запросов, содержащих название нового бизнеса, в определенной географической области. Система сравнивает недавнюю частоту (Recent Rate) с историческим уровнем (Historical Rate) и реагирует на резкий всплеск.
Как система отличает название нового бизнеса от опечатки?
Патент описывает два механизма. Во-первых, частота опечаток обычно стабильна во времени (постоянный Historical Rate), тогда как открытие нового бизнеса вызывает резкий всплеск запросов. Во-вторых, система может отфильтровывать запросы, для которых пользователь выбрал предложенное Google исправление орфографии (Claim 3), считая их подтвержденными опечатками.
Насколько важна геолокация в этом процессе?
Геолокация критически важна (Claim 4). Система кластеризует запросы по географическому признаку. Всплеск частоты должен быть локализован, чтобы отличить открытие местного бизнеса от общих трендов. Также геолокация запросов помогает системе определить вероятное местоположение нового бизнеса.
Как Google проверяет, что обнаруженный бизнес реален?
Патент описывает два пути валидации. Автоматический путь (Claim 1) предполагает поиск упоминаний названия бизнеса в отзывах (reviews). Если отзывы найдены, это служит подтверждением. Ручной путь (Claim 5, 17) предполагает добавление кандидата в список задач для проверки человеком (ревизором).
Как этот патент влияет на стратегию Local SEO для нового бизнеса?
Он подчеркивает необходимость активного маркетинга при открытии. Для быстрого попадания в индекс Local SEO стратегия должна включать генерацию реального локального поискового спроса на бренд и стимулирование ранних отзывов. Пассивное ожидание индексации неэффективно.
Что означает использование нескольких временных окон для анализа (Claim 15/18)?
Система анализирует частоту запросов за разные периоды (например, неделя, месяц, полгода) и применяет к ним разные пороги срабатывания. Это позволяет улавливать как резкие всплески интереса (характерные для громкого открытия), так и более медленный, но устойчивый рост популярности бизнеса.
Как этот патент влияет на выбор названия для нового локального бизнеса?
Он подчеркивает важность выбора уникального названия. Если вы используете общее название (например, «Автосервис»), системе будет сложно идентифицировать всплеск интереса именно к вашему бизнесу на фоне высокого Historical Rate этих терминов. Уникальное название делает всплеск запросов статистически более значимым.
Заменяет ли этот механизм необходимость регистрации в Google Business Profile (GBP)?
Нет. Регистрация в GBP остается лучшей практикой для управления информацией. Этот патент описывает, как Google обнаруживает бизнесы автономно. Цель SEO — использовать этот механизм для ускорения первичной индексации, а затем взять точку под контроль через GBP.
Как система определяет местоположение бизнеса, если в запросе нет адреса?
Система использует агрегированные контекстуальные данные, связанные с запросами (Claims 6, 9). Сюда входят геолокация устройств пользователей (GPS, IP), видимая область карты (viewport) в момент запроса. Если много людей ищут термин, находясь в определенном радиусе, система предполагает местоположение в центре этого кластера.
Что такое нормализация частот и зачем она нужна?
Нормализация (Claim 14) — это корректировка частоты использования термина с учетом общего объема поисковых запросов за период. Это необходимо, чтобы избежать ложных срабатываний, вызванных общим ростом трафика (например, в праздники или из-за роста популярности поиска), а не открытием конкретного нового бизнеса.