
Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
Патент решает проблему семантической неоднозначности (ambiguity) терминов, которые могут выступать как географическими названиями, так и объектами другого типа. Система должна уметь отличать локальный интент (например, "new york pizza", где "new york" — локация) от общего интента (например, "orange juice", где "orange" — не локация, хотя такой город существует). Также патент решает задачу фильтрации ложных срабатываний локального поиска для терминов, содержащих топонимы, но не относящихся к географии (например, "Orlando Bloom" или "Victoria's Secret").
Запатентован метод автоматической идентификации Standalone Locations (автономных местоположений) и генерации Location Blacklist (черного списка локаций). Метод основан на анализе журналов запросов (Query Logs) из специализированного интерфейса (Two-Box Interface), где пользователи явно разделяют ввод на "Что" (Non-Location Box) и "Где" (Location Box).
Система собирает статистику использования терминов в Two-Box Interface. Для каждого термина (t) подсчитывается, как часто он вводился в поле "Где" (формируя Location Score ) и как часто в поле "Что" (формируя Non-Location Score ). Затем вычисляется нормализованный индикатор (Normalized Location Indicator ). Если этот индикатор высок (выше порога TH_STANDALONE), термин считается Standalone Location. Если он очень низок (ниже порога TH_BLACKLIST), но содержит признаки локации, он попадает в Location Blacklist.
Средняя/Высокая. Хотя патент подан в 2007 году и специфический метод сбора данных через Two-Box Interface может быть менее актуален сегодня, базовая проблема (распознавание географических сущностей и локального интента) критически важна для современного поиска. Принцип использования данных из специализированных локальных сервисов (например, Google Maps) для обучения основного поиска остается фундаментальным. Вероятно, эти данные использовались как обучающая выборка для более сложных NLP-моделей.
Влияние на SEO значительно (7/10). Патент описывает механизм, относящийся к этапу Понимания Запросов (Query Understanding). От того, как Google классифицирует термин — как локацию или нет — зависит активация локальных алгоритмов ранжирования, показ Local Pack и общая интерпретация интента. Это имеет прямое влияние на стратегии Local SEO и управление брендами, чьи названия пересекаются с географическими объектами.
Two-Box Interface, используемая для анализа частоты появления терминов в разных полях.Location Box.Non-Location Box.Location Blacklist.Claim 1 (Независимый пункт): Описывает основной метод идентификации Standalone Location.
Non-Location Score на основе логов (log data), показывающих частоту ввода термина в Non-Location Input Box ("Что").Location Score на основе логов, показывающих частоту ввода термина в Location Input Box ("Где").Standalone Location.Claim 6 (Независимый пункт): Описывает метод идентификации термина для Location Blacklist.
Non-Location Score и Location Score (аналогично Claim 1).Location Blacklist (критерий: термин содержит название географического места, но не относится к нему).Claim 16 (Зависимый от 1) и Claim 18 (Зависимый от 6): Детализируют математический подход к принятию решения.
Normalized Location Indicator () как отношение Location Score к сумме Location Score и Non-Location Score.Standalone Location (Claim 16): должен быть выше порога (standalone threshold).Location Blacklist (Claim 18): должен быть ниже порога (blacklist threshold).Claim 5 и Claim 8 (Зависимые): Описывают использование Location Extraction Server (LES) или location-extraction engine для уточнения Location Blacklist.
Для попадания в Location Blacklist может требоваться не только низкий , но и подтверждение от LES, что термин действительно содержит компонент, похожий на название локации. Это позволяет отфильтровать обычные слова (например, "Пицца"), у которых низкий, но которые не являются географически неоднозначными.
Изобретение охватывает сбор данных, их офлайн-обработку и применение результатов для понимания запросов в реальном времени.
CRAWLING – Сканирование и Сбор данных
Система собирает Query Logs из специализированного интерфейса (Two-Box Interface). Это процесс сбора явной обратной связи от пользователей о том, как они классифицируют термины.
INDEXING – Индексирование и извлечение признаков (Офлайн-обработка)
На этом этапе происходит анализ накопленных логов. Система (Standalone Location/Blacklist Generator) вычисляет метрики для терминов и формирует списки Standalone Locations и Location Blacklist. Эти списки сохраняются и становятся доступными для поисковой системы.
QUNDERSTANDING – Понимание Запросов (Онлайн-применение)
Основной этап применения. При получении пользовательского запроса система использует созданные списки для интерпретации терминов. Это определяет, будет ли запрос классифицирован как локальный и следует ли игнорировать потенциальные географические сигналы (если термин в Location Blacklist).
RANKING – Ранжирование
Если запрос идентифицирован как локальный благодаря распознаванию Standalone Location, система использует информацию о местоположении при ранжировании результатов (например, активируя Local Pack или предпочитая локализованные результаты).
Входные данные:
Query Logs из Two-Box Interface (частоты L и N).Location Extraction Server (LES).Выходные данные:
List of Standalone Locations.Location Blacklist.TH_STANDALONE и TH_BLACKLIST, которые могут динамически корректироваться.Процесс офлайн-генерации списков:
Query Logs извлекаются счетчики: Location Count (L) — сколько раз термин появился в Location Box, и Non-Location Count (N) — сколько раз в Non-Location Box.Location Score и Non-Location Score . Используется логарифмическое сглаживание: и .Normalized Location Indicator . Формула: Standalone Location.Location Blacklist, избегая нерелевантной активации локального поиска по брендовым запросам.Standalone Location, такой контент может не ранжироваться по локальным запросам.Патент подчеркивает фундаментальную важность этапа Понимания Запросов (Query Understanding) и классификации интента. То, как Google интерпретирует ключевые слова в запросе — как местоположение или как объект/субъект, — определяет всю дальнейшую логику ранжирования (активацию локального поиска vs. глобального). Долгосрочная SEO-стратегия должна учитывать эти механизмы интерпретации, особенно при работе с локальным бизнесом и сущностями, имеющими географические названия.
Сценарий 1: Оптимизация для бизнеса в городе с неоднозначным названием.
Standalone Location (у него будет средний , так как пользователи часто уточняют штат).Сценарий 2: Работа с брендом, содержащим название города (Location Blacklist).
Location Blacklist.Что такое "Standalone Location" простыми словами?
Это географическое название, которое однозначно идентифицирует местоположение без дополнительных уточнений. Например, "San Francisco" или "Берлин" обычно являются Standalone Locations. В отличие от них, "Washington" или "Орёл" могут требовать уточнения (штат, округ или контекст), так как эти названия неоднозначны или имеют другие распространенные значения.
Как Google собирает данные для работы этого алгоритма, если интерфейс с двумя полями ("Что" и "Где") сейчас редкость?
Патент описывает конкретный источник данных (Two-Box Interface), который был популярен ранее. Сегодня Google может собирать аналогичные сигналы из других источников, например, анализируя поведение пользователей в Google Maps (поиск "X рядом с Y"). Кроме того, данные, собранные этим методом в прошлом, могли послужить ценной обучающей выборкой для современных NLP-моделей.
Что такое "Location Blacklist" и зачем он нужен?
Это список терминов, которые содержат название города или места, но по факту не относятся к географии. Примеры: "Orlando Bloom" (актер) или "Victoria's Secret" (бренд). Он необходим для предотвращения ошибочной активации локального поиска (Local Pack, карты) и подмешивания нерелевантных локальных результатов для таких запросов.
Как рассчитывается вероятность того, что термин является локацией (Normalized Location Indicator)?
Он рассчитывается на основе соотношения того, как часто термин появлялся в поле "Где" (Location Score), по сравнению с общей частотой его использования в обоих полях ("Что" + "Где"). Формула: . Чем ближе значение к 1, тем выше вероятность, что это локация.
Как система определяет, что термин нужно добавить в Blacklist, а не просто считать его обычным словом?
Для этого используется дополнительная проверка через Location Extraction Server (LES). Если индикатор низкий (пользователи не используют его как локацию), но LES подтверждает, что термин содержит компонент, похожий на топоним (например, "Orlando" в "Orlando Bloom"), термин добавляется в Location Blacklist. Обычные слова (например, "Пицца") не вызовут срабатывания LES.
Как этот патент влияет на локальное SEO?
Он напрямую влияет на то, будет ли активирован локальный поиск по конкретному запросу. Если название вашего города не распознается как Standalone Location из-за неоднозначности, системе сложнее понять локальный интент пользователя. В таких случаях критически важно использовать полные географические спецификаторы (штат, регион) в контенте и GBP.
Что делать, если мой бренд совпадает с названием города и Google путает их?
Необходимо усилить сигналы, указывающие на тип вашей сущности (что это компания, а не город). Работайте над развитием Knowledge Graph для бренда, используйте соответствующую микроразметку (Organization). Цель — показать Google, что доминирующий интент при поиске вашего названия связан с брендом, а не с географией.
Почему в формулах расчета оценок используется логарифм (log(L+1))?
Использование логарифма позволяет сгладить частотные данные и уменьшить влияние экстремально высоких значений. Добавление +1 (Laplace smoothing) гарантирует, что даже при нулевом количестве использований результат будет определен (log(1)=0), что предотвращает ошибки деления на ноль при расчете .
Применяется ли этот метод к русскому языку?
В патенте явно упоминаются английский, китайский, японский и корейский языки. Однако принципы, описанные в патенте, универсальны и основаны на статистике использования интерфейса, а не на лингвистике. Логично предположить, что аналогичные механизмы используются для всех языков, где доступны сервисы типа Google Maps.
Является ли этот патент основным способом распознавания локаций в 2025 году?
Вероятно, нет. Современные системы Google используют гораздо более сложные методы машинного обучения (BERT, MUM) и данные из Knowledge Graph для распознавания сущностей и контекста. Описанный метод, скорее всего, является одним из исторических подходов или используется как один из множества сигналов в современной архитектуре.

Local SEO
Семантика и интент

Local SEO
Семантика и интент
SERP

Local SEO
Семантика и интент

Local SEO
Семантика и интент

Local SEO
Семантика и интент
Индексация

SERP
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

SERP
EEAT и качество
Персонализация

Антиспам
Ссылки
SERP

SERP
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Ссылки
Поведенческие сигналы
SERP
