
Google использует механизм для автоматического определения географической релевантности веб-ресурсов путем анализа местоположения их посетителей (через IP-адреса). Система применяет кластерный анализ к этим данным: если аудитория сконцентрирована в определенных регионах, сайт признается локально релевантным этим регионам. Эти данные используются для повышения ранжирования сайта для пользователей из этих же регионов.
Патент решает проблему автоматического и точного определения географической релевантности веб-документов (сайтов, страниц, рекламы). Он устраняет недостатки существовавших методов: ручная классификация не масштабируется; автоматический парсинг текста (поиск адресов или индексов) ненадежен, так как географические термины могут использоваться на сайтах глобального значения; использование IP-адреса веб-сервера неточно, так как хостинг часто находится далеко от целевой аудитории контента. Изобретение предлагает метод, определяющий релевантность на основе фактического местоположения аудитории ресурса.
Запатентована система и метод для определения географической релевантности веб-ресурса путем анализа местоположения пользователей, которые его посещают. Система собирает сетевые адреса (IP-адреса) посетителей, сопоставляет их с физическими локациями и применяет кластерный анализ (Cluster Analysis) к полученным данным. Наличие плотных географических кластеров аудитории указывает на то, что ресурс релевантен для этих конкретных местоположений. Эта информация затем используется для улучшения поисковой выдачи или показа рекламы.
Механизм работает в два основных этапа:
Этап 1: Определение релевантности ресурса (Офлайн)
k-means). Данные могут нормализоваться с учетом плотности населения, чтобы избежать искажений от крупных городов.Этап 2: Применение в поиске (Онлайн)
Gaussian model)).Критически высокая. Географическая релевантность является основой локального поиска (Local SEO). Описанный механизм, определяющий локальность на основе аудитории, а не только контента или местоположения сервера, остается фундаментальным подходом в современных поисковых системах. Хотя методы геолокации эволюционировали (например, использование GPS), базовая концепция остается неизменной.
Патент имеет критическое значение (9/10), особенно для локального SEO. Он демонстрирует, что географическая релевантность определяется не только контентом на странице или заявленным адресом компании, но и тем, откуда фактически приходят посетители. Это означает, что привлечение целевой локальной аудитории напрямую влияет на то, как Google классифицирует сайт географически, что, в свою очередь, влияет на ранжирование в этом регионе.
Патент фокусируется на определении географической релевантности через анализ аудитории и применении этой информации в поиске.
Claim 1 (Независимый пункт): Описывает основной метод предоставления документов с учетом географии.
location information) первых пользователей, которые получают доступ к ресурсу.geographic relevance) ресурса.Claim 6 (Зависимый от 1): Уточняет, что анализ включает выполнение кластерного анализа (cluster analysis).
Claim 9 (Независимый пункт): Описывает реализацию в рамках поисковой системы.
Geographic relevance component генерирует информацию о релевантности путем: (i) сбора сетевых адресов пользователей; (ii) преобразования адресов в location data points; (iii) выполнения кластерного анализа этих точек для нахождения кластеров, которые указывают на области географической релевантности.
Claim 12 и 13 (Зависимые от 9): Уточняют процесс анализа.
При выполнении кластерного анализа компонент нормализует (normalize) точки данных о местоположении. Нормализация основывается на населении (population), связанном с этими точками.
Claim 14 (Независимый пункт): Описывает метод определения вероятности географического совпадения пользователя и ресурса.
center point) и мерой дисперсии (measure of dispersion).statistical model), примененной к кластеру.Claim 22 (Зависимый от 14): Уточняет, что статистическая модель основана на модели Гаусса (Gaussian model).
Изобретение затрагивает несколько этапов поиска, выполняя вычисления как офлайн, так и в реальном времени.
INDEXING – Индексирование и извлечение признаков
Основная часть работы алгоритма происходит на этом этапе в офлайн-режиме. Система собирает данные о посещениях (URL и IP посетителя) из различных источников (логи серверов, клиентские приложения, например, тулбары). Затем происходит обработка: маппинг IP в локации, нормализация и кластерный анализ. Результат — информация о географической релевантности ресурса (описание кластеров) — сохраняется в индексе и ассоциируется с документом как признак (feature).
QUNDERSTANDING – Понимание Запросов
На этом этапе система определяет местоположение пользователя или интересующую его локацию. Это может быть сделано на основе терминов запроса (например, "pizza San Francisco"), IP-адреса, истории просмотров или GPS данных.
RANKING / RERANKING – Ранжирование и Переранжирование
На этом этапе система использует предварительно рассчитанную географическую релевантность и определенное местоположение пользователя. Используя статистическую модель (например, Гаусса), система вычисляет вероятность совпадения. Эта вероятность используется как сигнал ранжирования для повышения позиций географически релевантных документов.
Входные данные (Офлайн):
Выходные данные (Офлайн):
Входные данные (Онлайн):
Выходные данные (Онлайн):
Процесс А: Определение географической релевантности ресурса (Офлайн)
predetermined amount of time), для отсева случайных визитов.factor proportional to the population). Это делается для устранения смещения в сторону крупных городов.k-means).Процесс Б: Использование географической релевантности при поиске (Онлайн)
Gaussian model). Форма модели (ширина кривой) зависит от дисперсии кластера. Плотные кластеры имеют узкую кривую, размытые — широкую.Патент явно указывает на использование следующих типов данных:
Internet Protocol (IP) addresses). Система также различает статические и динамические IP-адреса, придавая больший вес статическим.browsing habits), история поиска (search history). Данные о посещениях из логов, тулбаров, плагинов. Время, проведенное на сайте (как фильтр для значимых посещений).Cluster Analysis (например, k-means) для группировки данных.Cluster Analysis для автоматического выявления концентрации аудитории. Это позволяет масштабировать процесс и нивелировать неизбежные ошибки, свойственные геолокации по IP. Плотные кластеры указывают на локальную релевантность.dense cluster) посетителей.Geographic Relevance.Этот патент является фундаментальным для понимания Local SEO. Он подтверждает стратегию Google по использованию реальных пользовательских данных для оценки релевантности ресурсов. Для долгосрочной стратегии это означает, что построение реальной локальной клиентской базы и узнаваемости бренда в регионе является не просто маркетинговой задачей, но и ключевым фактором ранжирования, так как это напрямую формирует сигналы географической релевантности.
Сценарий 1: Усиление локального ранжирования для ресторана
dense cluster) с центром в городе N. Сайт получает высокую оценку географической релевантности для этого города.Gaussian model).Сценарий 2: Корректная локализация для бизнеса в небольшом городе (Нормализация)
Что такое кластерный анализ в контексте этого патента?
Это процесс группировки географических координат посетителей сайта. Если координаты сконцентрированы в определенных областях, формируются кластеры. Наличие плотных кластеров указывает на то, что сайт географически релевантен этим областям. Если посетители равномерно распределены по миру, кластеры не формируются, и сайт считается глобальным.
Как система борется с неточностью определения местоположения по IP и использованием VPN?
Патент признает, что ошибки случаются. Система компенсирует их за счет анализа больших объемов данных и кластеризации, что позволяет фильтровать шум. Также упоминается возможность фильтрации или понижения веса менее надежных данных, например, динамических IP-адресов. Если достаточное количество реальных локальных пользователей посещает сайт без VPN, система сможет выявить общие тенденции.
Что такое нормализация по населению и почему она важна?
Нормализация (normalization) корректирует количество посетителей из города с учетом его размера. Это необходимо, чтобы избежать смещения в сторону крупных городов. Например, 100 визитов из Москвы могут быть нормой для любого сайта, но 100 визитов из маленького поселка указывают на высокую локальную релевантность. Нормализация позволяет выявить эту относительную релевантность.
Как именно географическая релевантность влияет на ранжирование?
Когда пользователь выполняет поиск, система рассчитывает вероятность того, что он попадает в географические кластеры потенциальных результатов. Эта вероятность рассчитывается с помощью статистической модели (Гауссовой). Чем выше вероятность географического соответствия, тем больший буст получает документ в ранжировании для этого пользователя.
Если я владелец локального бизнеса, что мне делать согласно этому патенту?
Ваша главная задача — привлекать на сайт посетителей из вашего целевого региона. Используйте локальный маркетинг, создавайте контент, интересный местным жителям. Чем больше локальных пользователей посетит ваш сайт, тем плотнее будет ваш географический кластер в данных Google, и тем выше будет ваша географическая релевантность для этого региона.
Может ли сайт быть релевантным сразу нескольким географическим областям?
Да. Если анализ данных о посетителях выявит несколько отдельных плотных кластеров (например, один в Москве и один в Санкт-Петербурге), система пометит сайт как географически релевантный обеим этим областям. Это актуально для компаний с несколькими филиалами.
Что означает "дисперсия кластера" и как она влияет на ранжирование?
Дисперсия характеризует разброс точек в кластере. Низкая дисперсия означает плотный кластер. При расчете вероятности соответствия (по Гауссовой модели) плотные кластеры дают более высокий балл, если пользователь находится близко к центру, но этот балл быстрее падает при удалении от центра, чем у широких кластеров (высокая дисперсия).
Учитывает ли система тип IP-адреса при анализе?
Да, в патенте упоминается возможность учета того, является ли IP-адрес статическим или динамическим. Данные от статических IP-адресов считаются более надежными для определения местоположения, и им может придаваться больший вес при анализе, в то время как динамические могут фильтроваться или иметь меньший вес.
Откуда Google берет данные о том, кто посещает мой сайт?
В патенте упоминаются несколько возможных источников для сбора IP-адресов и посещенных URL: приложения, работающие на компьютере пользователя (например, браузер, тулбар, плагин), логи веб-сайта или логи прокси-серверов. Также могут использоваться данные из аккаунтов пользователей.
Заменяет ли этот механизм необходимость в Google Business Profile (GBP) для локального SEO?
Нет, не заменяет. GBP предоставляет верифицированные данные о физическом местоположении бизнеса. Описанный механизм дополняет эту информацию, определяя географическую релевантность веб-сайта на основе поведения пользователей. GBP определяет, *где* находится бизнес, а этот патент помогает понять, *откуда* приходят его онлайн-клиенты.

Local SEO
Поведенческие сигналы

Local SEO
Ссылки
SERP

Local SEO
Семантика и интент
Индексация

Local SEO
SERP

Local SEO
SERP

Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Поведенческие сигналы
SERP

Ссылки
Антиспам
SERP

Поведенческие сигналы
Семантика и интент
EEAT и качество

Local SEO
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Ссылки
Knowledge Graph

Knowledge Graph
Свежесть контента
Семантика и интент

Поведенческие сигналы
Индексация
Техническое SEO
