SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет географическую релевантность сайта, анализируя местоположение его посетителей

DETERMINING GEOGRAPHICAL RELEVANCE OF WEB DOCUMENTS (Определение географической релевантности веб-документов)
  • US8086690B1
  • Google LLC
  • 2003-09-22
  • 2011-12-27
  • Local SEO
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для автоматического определения географической релевантности веб-ресурсов путем анализа местоположения их посетителей (через IP-адреса). Система применяет кластерный анализ к этим данным: если аудитория сконцентрирована в определенных регионах, сайт признается локально релевантным этим регионам. Эти данные используются для повышения ранжирования сайта для пользователей из этих же регионов.

Описание

Какую проблему решает

Патент решает проблему автоматического и точного определения географической релевантности веб-документов (сайтов, страниц, рекламы). Он устраняет недостатки существовавших методов: ручная классификация не масштабируется; автоматический парсинг текста (поиск адресов или индексов) ненадежен, так как географические термины могут использоваться на сайтах глобального значения; использование IP-адреса веб-сервера неточно, так как хостинг часто находится далеко от целевой аудитории контента. Изобретение предлагает метод, определяющий релевантность на основе фактического местоположения аудитории ресурса.

Что запатентовано

Запатентована система и метод для определения географической релевантности веб-ресурса путем анализа местоположения пользователей, которые его посещают. Система собирает сетевые адреса (IP-адреса) посетителей, сопоставляет их с физическими локациями и применяет кластерный анализ (Cluster Analysis) к полученным данным. Наличие плотных географических кластеров аудитории указывает на то, что ресурс релевантен для этих конкретных местоположений. Эта информация затем используется для улучшения поисковой выдачи или показа рекламы.

Как это работает

Механизм работает в два основных этапа:

Этап 1: Определение релевантности ресурса (Офлайн)

  1. Сбор и Маппинг: Система собирает IP-адреса посетителей сайта и преобразует их в географические координаты.
  2. Кластерный анализ и Нормализация: К данным применяется кластерный анализ (например, k-means). Данные могут нормализоваться с учетом плотности населения, чтобы избежать искажений от крупных городов.
  3. Определение релевантности: Если обнаружены плотные кластеры, сайт помечается как географически релевантный этим областям.

Этап 2: Применение в поиске (Онлайн)

  1. Определение локации пользователя: Система определяет местоположение или географический интерес текущего пользователя.
  2. Расчет вероятности: Система вычисляет вероятность того, что местоположение пользователя попадает в географические кластеры документа, используя статистическую модель (например, Гауссову модель (Gaussian model)).
  3. Ранжирование: Документы с высокой вероятностью географического соответствия получают повышение в ранжировании.

Актуальность для SEO

Критически высокая. Географическая релевантность является основой локального поиска (Local SEO). Описанный механизм, определяющий локальность на основе аудитории, а не только контента или местоположения сервера, остается фундаментальным подходом в современных поисковых системах. Хотя методы геолокации эволюционировали (например, использование GPS), базовая концепция остается неизменной.

Важность для SEO

Патент имеет критическое значение (9/10), особенно для локального SEO. Он демонстрирует, что географическая релевантность определяется не только контентом на странице или заявленным адресом компании, но и тем, откуда фактически приходят посетители. Это означает, что привлечение целевой локальной аудитории напрямую влияет на то, как Google классифицирует сайт географически, что, в свою очередь, влияет на ранжирование в этом регионе.

Детальный разбор

Термины и определения

Cluster Analysis (Кластерный анализ)
Статистический метод (в патенте упомянут "k-means"), используемый для группировки местоположений посетителей сайта. Наличие плотных кластеров указывает на географическую релевантность.
Dispersion (Дисперсия) / Density (Плотность)
Параметры кластера, характеризующие разброс точек данных. Низкая дисперсия (высокая плотность) означает, что посетители сконцентрированы на небольшой территории, что указывает на сильную географическую связь.
Geographic Relevance Component (Компонент географической релевантности)
Система, отвечающая за определение географической релевантности веб-ресурсов на основе локаций посетителей и за расчет вероятности соответствия между пользователем и ресурсом.
Location Data Points (Точки данных о местоположении)
Двумерные координаты (например, широта и долгота), полученные путем преобразования сетевых адресов (IP) посетителей.
Normalization (Нормализация)
Процесс корректировки частоты посещений из разных регионов с учетом численности населения или количества интернет-пользователей в этих регионах. Используется для предотвращения искажений, вызванных крупными городами.
Statistical Model / Gaussian Model (Статистическая модель / Модель Гаусса)
Математическая модель, используемая для описания географических кластеров. Используется для определения вероятности того, что местоположение нового пользователя попадает в зону релевантности ресурса, учитывая центр и дисперсию кластера.
Static/Dynamic IP addresses (Статические/Динамические IP-адреса)
Типы IP-адресов. В патенте упоминается, что статические адреса могут считаться более надежными индикаторами местоположения, чем динамические.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на определении географической релевантности через анализ аудитории и применении этой информации в поиске.

Claim 1 (Независимый пункт): Описывает основной метод предоставления документов с учетом географии.

  1. Сбор информации о местоположении (location information) первых пользователей, которые получают доступ к ресурсу.
  2. Анализ собранной информации для определения географической релевантности (geographic relevance) ресурса.
  3. Определение местоположения второго пользователя.
  4. Предоставление документа (например, результата поиска или рекламы) второму пользователю на основе сопоставления географической релевантности ресурса и местоположения второго пользователя.

Claim 6 (Зависимый от 1): Уточняет, что анализ включает выполнение кластерного анализа (cluster analysis).

Claim 9 (Независимый пункт): Описывает реализацию в рамках поисковой системы.

Geographic relevance component генерирует информацию о релевантности путем: (i) сбора сетевых адресов пользователей; (ii) преобразования адресов в location data points; (iii) выполнения кластерного анализа этих точек для нахождения кластеров, которые указывают на области географической релевантности.

Claim 12 и 13 (Зависимые от 9): Уточняют процесс анализа.

При выполнении кластерного анализа компонент нормализует (normalize) точки данных о местоположении. Нормализация основывается на населении (population), связанном с этими точками.

Claim 14 (Независимый пункт): Описывает метод определения вероятности географического совпадения пользователя и ресурса.

  1. Определение географического местоположения пользователя.
  2. Получение информации о географической релевантности ресурса. Эта информация включает как минимум один кластер, характеризующийся центральной точкой (center point) и мерой дисперсии (measure of dispersion).
  3. Определение вероятности того, что местоположение пользователя географически релевантно ресурсу, на основе статистической модели (statistical model), примененной к кластеру.
  4. Возврат результатов поиска пользователю на основе этой вероятности.

Claim 22 (Зависимый от 14): Уточняет, что статистическая модель основана на модели Гаусса (Gaussian model).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, выполняя вычисления как офлайн, так и в реальном времени.

INDEXING – Индексирование и извлечение признаков
Основная часть работы алгоритма происходит на этом этапе в офлайн-режиме. Система собирает данные о посещениях (URL и IP посетителя) из различных источников (логи серверов, клиентские приложения, например, тулбары). Затем происходит обработка: маппинг IP в локации, нормализация и кластерный анализ. Результат — информация о географической релевантности ресурса (описание кластеров) — сохраняется в индексе и ассоциируется с документом как признак (feature).

QUNDERSTANDING – Понимание Запросов
На этом этапе система определяет местоположение пользователя или интересующую его локацию. Это может быть сделано на основе терминов запроса (например, "pizza San Francisco"), IP-адреса, истории просмотров или GPS данных.

RANKING / RERANKING – Ранжирование и Переранжирование
На этом этапе система использует предварительно рассчитанную географическую релевантность и определенное местоположение пользователя. Используя статистическую модель (например, Гаусса), система вычисляет вероятность совпадения. Эта вероятность используется как сигнал ранжирования для повышения позиций географически релевантных документов.

Входные данные (Офлайн):

  • Выборка IP-адресов посетителей для данного URL/ресурса.
  • Данные для маппинга IP-адресов в физические локации (широта/долгота).
  • Данные о населении регионов (для нормализации).

Выходные данные (Офлайн):

  • Информация о географической релевантности ресурса (описание кластеров: центр, дисперсия, масса).

Входные данные (Онлайн):

  • Местоположение пользователя (полученное из IP, GPS, истории поиска, профиля или интента запроса).
  • Информация о географической релевантности (кластеры) для документов-кандидатов.

Выходные данные (Онлайн):

  • Вероятностная оценка совпадения местоположения пользователя и географической релевантности документа.

На что влияет

  • Конкретные типы контента и ниши: Критически важно для Local SEO. Это затрагивает сайты локальных бизнесов (магазины, услуги, рестораны), региональные новостные порталы, местные организации. Для сайтов с национальным охватом этот механизм определит отсутствие четких географических кластеров.
  • Специфические запросы: Влияет на запросы с локальным интентом (явным или подразумеваемым). Если пользователь ищет услугу, система использует его местоположение и данные о географической релевантности сайтов для формирования локализованной выдачи.

Когда применяется

  • Условия работы алгоритма (Офлайн): Применяется периодически для обновления данных о географической релевантности сайтов по мере накопления достаточного объема данных о посетителях.
  • Условия работы алгоритма (Онлайн): Активируется при обработке поискового запроса, когда система может определить местоположение пользователя или его локальный интент, и когда среди документов-кандидатов есть ресурсы с рассчитанной географической релевантностью.
  • Ограничения: Точность механизма зависит от точности маппинга IP-адресов. Патент признает наличие ошибок и использует кластерный анализ для их фильтрации на больших объемах данных.

Пошаговый алгоритм

Процесс А: Определение географической релевантности ресурса (Офлайн)

  1. Сбор данных о посетителях: Для веб-сайта собирается выборка IP-адресов посетителей. Может применяться фильтрация по времени, проведенному на сайте (predetermined amount of time), для отсева случайных визитов.
  2. Маппинг местоположений: Каждый IP-адрес преобразуется в предполагаемое географическое местоположение (например, ближайший город, а затем в координаты широты и долготы).
  3. Фильтрация и взвешивание (Опционально): Система может понижать вес данных от динамических IP-адресов, так как они менее надежны, и повышать вес статических IP или данных из аккаунтов пользователей.
  4. Нормализация (Опционально, но важно): Частота посещений из определенного города корректируется с учетом его населения (factor proportional to the population). Это делается для устранения смещения в сторону крупных городов.
  5. Кластерный анализ: К полученному набору точек применяется алгоритм кластеризации (например, k-means).
  6. Оценка кластеров: Анализируются параметры полученных кластеров: центр кластера (координаты), плотность или дисперсия (разброс). Плотные кластеры считаются индикатором релевантности.
  7. Генерация географической информации: Если обнаружены плотные кластеры, веб-сайт ассоциируется с их географическими центрами. Эта информация (параметры кластеров, включая массу — процент посетителей) сохраняется.

Процесс Б: Использование географической релевантности при поиске (Онлайн)

  1. Определение местоположения пользователя: Система определяет текущее местоположение пользователя или интересующую его локацию.
  2. Получение географической информации ресурса: Для документов-кандидатов извлекается информация о географических кластерах (Процесс А).
  3. Статистическое моделирование: Кластеры моделируются статистически, например, с помощью модели Гаусса (Gaussian model). Форма модели (ширина кривой) зависит от дисперсии кластера. Плотные кластеры имеют узкую кривую, размытые — широкую.
  4. Расчет вероятности: Система определяет вероятность того, что местоположение пользователя попадает в географический кластер ресурса. Вероятность может быть определена как взвешенная сумма вероятностей по всем кластерам ресурса, где весами выступают массы кластеров.
  5. Применение в ранжировании: Полученная вероятность используется поисковой системой для корректировки ранжирования, отдавая предпочтение географически релевантным документам.

Какие данные и как использует

Данные на входе

Патент явно указывает на использование следующих типов данных:

  • Сетевые и Технические факторы: IP-адреса посетителей (Internet Protocol (IP) addresses). Система также различает статические и динамические IP-адреса, придавая больший вес статическим.
  • Поведенческие факторы: Паттерны веб-браузинга (browsing habits), история поиска (search history). Данные о посещениях из логов, тулбаров, плагинов. Время, проведенное на сайте (как фильтр для значимых посещений).
  • Пользовательские данные: Информация из аккаунтов пользователей (почтовые адреса, адреса выставления счетов, номера телефонов). Данные из cookies или профилей пользователей.
  • Контентные факторы: Поисковые запросы, введенные пользователем (для определения локального интента).
  • Географические факторы: Базы данных для сопоставления IP с локациями. Данные GPS или триангуляция вышек сотовой связи (для мобильных устройств). Данные о населении городов (для нормализации).

Какие метрики используются и как они считаются

  • Параметры кластера:
    • Центр кластера (Center): Географические координаты (широта/долгота).
    • Плотность или Дисперсия (Density/Dispersion): Мера разброса точек. Используется для оценки качества кластера и определения формы статистической модели.
    • Вероятностная масса (Probability mass): Процент посетителей в кластере. Используется как вес при агрегации вероятностей.
  • Нормализованная частота посещений: Количество посетителей из города, масштабированное на коэффициент, пропорциональный населению города.
  • Статистическая модель Гаусса (Gaussian model): Используется для моделирования кластеров и расчета вероятности принадлежности пользователя к кластеру. Вероятность выше для пользователей, находящихся ближе к центру плотного кластера.
  • Методы анализа: Используется Cluster Analysis (например, k-means) для группировки данных.

Выводы

  1. Аудитория определяет географическую релевантность: Ключевой вывод заключается в том, что Google определяет географическую релевантность сайта на основе того, *откуда* приходят его посетители. Это независимый сигнал от контента сайта или заявленного адреса бизнеса.
  2. Кластеризация как основа локальности и фильтр шума: Система использует Cluster Analysis для автоматического выявления концентрации аудитории. Это позволяет масштабировать процесс и нивелировать неизбежные ошибки, свойственные геолокации по IP. Плотные кластеры указывают на локальную релевантность.
  3. Важность нормализации данных: Патент подчеркивает необходимость нормализации данных по населению, чтобы избежать смещения в сторону крупных городов. Это критически важно для корректного определения релевантности сайтов в небольших населенных пунктах.
  4. Вероятностное сопоставление (Gaussian Model): Географическое соответствие не бинарно. Использование статистических моделей (Гаусса) позволяет рассчитывать вероятность совпадения, учитывая близость пользователя к центру кластера и плотность (дисперсию) самого кластера.
  5. Комплексный подход к данным: Система учитывает потенциальные искажения данных, предлагая методы нормализации и возможность придавать больший вес более надежным данным (например, статическим IP-адресам или фильтрации по времени на сайте).

Практика

Best practices (это мы делаем)

  • Привлекать целевую локальную аудиторию: Это ключевая стратегия для Local SEO, подтвержденная патентом. Сосредоточьте маркетинговые усилия (локальная реклама, местные мероприятия, локальный PR) на привлечении посетителей из целевого региона. Это напрямую укрепит вашу географическую релевантность, формируя плотный кластер (dense cluster) посетителей.
  • Использовать локальный контент для привлечения аудитории: Создавайте контент (новости, обзоры, события), интересный жителям целевого региона. Это способствует формированию нужного географического профиля посетителей.
  • Локальное ссылочное продвижение: Получение ссылок с других локально релевантных сайтов (местные СМИ, каталоги, партнеры) может привести к переходам локальных пользователей, усиливая сигнал Geographic Relevance.
  • Анализировать географию трафика: Регулярно проверяйте в системах аналитики, соответствует ли география трафика географии вашего бизнеса. Убедитесь, что вы являетесь доминирующим ресурсом в своей нише в вашем городе, чтобы выделиться после нормализации по населению.
  • Для многофилиальных компаний: Создавайте отдельные посадочные страницы для каждого филиала и работайте над привлечением аудитории именно из региона этого филиала. Это поможет системе сформировать отдельные кластеры для каждого местоположения.

Worst practices (это делать не надо)

  • Покупка некачественного трафика из нецелевых регионов: Приобретение большого объема трафика из регионов, не связанных с бизнесом, "размывает" географические кластеры (увеличивает дисперсию). Это может привести к тому, что система классифицирует сайт как глобальный, а не локальный, ухудшая его видимость в локальном поиске.
  • Имитация локального трафика (боты): Попытки накрутить трафик из определенного региона, скорее всего, будут неэффективны. Система может использовать дополнительные фильтры, упомянутые в патенте (время на сайте, качество и тип IP-адресов), для оценки качества данных.
  • Игнорирование пользовательских сигналов: Нельзя полагаться только на технические аспекты (например, указание адреса на сайте), если реальная аудитория сайта географически не соответствует целям бизнеса. Поведение пользователей является определяющим сигналом в этом алгоритме.

Стратегическое значение

Этот патент является фундаментальным для понимания Local SEO. Он подтверждает стратегию Google по использованию реальных пользовательских данных для оценки релевантности ресурсов. Для долгосрочной стратегии это означает, что построение реальной локальной клиентской базы и узнаваемости бренда в регионе является не просто маркетинговой задачей, но и ключевым фактором ранжирования, так как это напрямую формирует сигналы географической релевантности.

Практические примеры

Сценарий 1: Усиление локального ранжирования для ресторана

  1. Ситуация: Ресторан в городе N хочет улучшить видимость в поиске по запросу "итальянская кухня".
  2. Действия: Ресторан запускает локальную маркетинговую кампанию (реклама в местных соцсетях, партнерство с местными блогерами), привлекая посетителей на сайт из города N.
  3. Работа алгоритма (Офлайн): Google анализирует IP-адреса посетителей и обнаруживает плотный кластер (dense cluster) с центром в городе N. Сайт получает высокую оценку географической релевантности для этого города.
  4. Работа алгоритма (Онлайн): При поиске "итальянская кухня" пользователем из города N, система рассчитывает высокую вероятность географического совпадения (по Gaussian model).
  5. Итог для SEO: Сайт ресторана получает бустинг в ранжировании.

Сценарий 2: Корректная локализация для бизнеса в небольшом городе (Нормализация)

  1. Ситуация: Магазин в Малом Городе (население 10 тыс.) получает 100 визитов в день из своего города и 150 визитов из соседнего Мегаполиса (население 1 млн.).
  2. Работа алгоритма (Без нормализации): Система может ошибочно посчитать Мегаполис более важным регионом из-за большего абсолютного числа визитов.
  3. Работа алгоритма (С нормализацией): Система корректирует данные по населению. 100 визитов из Малого Города имеют гораздо больший относительный вес, чем 150 визитов из Мегаполиса.
  4. Итог для SEO: Система корректно определяет Малый Город как основную зону географической релевантности магазина, обеспечивая ему приоритет в локальной выдаче именно там.

Вопросы и ответы

Что такое кластерный анализ в контексте этого патента?

Это процесс группировки географических координат посетителей сайта. Если координаты сконцентрированы в определенных областях, формируются кластеры. Наличие плотных кластеров указывает на то, что сайт географически релевантен этим областям. Если посетители равномерно распределены по миру, кластеры не формируются, и сайт считается глобальным.

Как система борется с неточностью определения местоположения по IP и использованием VPN?

Патент признает, что ошибки случаются. Система компенсирует их за счет анализа больших объемов данных и кластеризации, что позволяет фильтровать шум. Также упоминается возможность фильтрации или понижения веса менее надежных данных, например, динамических IP-адресов. Если достаточное количество реальных локальных пользователей посещает сайт без VPN, система сможет выявить общие тенденции.

Что такое нормализация по населению и почему она важна?

Нормализация (normalization) корректирует количество посетителей из города с учетом его размера. Это необходимо, чтобы избежать смещения в сторону крупных городов. Например, 100 визитов из Москвы могут быть нормой для любого сайта, но 100 визитов из маленького поселка указывают на высокую локальную релевантность. Нормализация позволяет выявить эту относительную релевантность.

Как именно географическая релевантность влияет на ранжирование?

Когда пользователь выполняет поиск, система рассчитывает вероятность того, что он попадает в географические кластеры потенциальных результатов. Эта вероятность рассчитывается с помощью статистической модели (Гауссовой). Чем выше вероятность географического соответствия, тем больший буст получает документ в ранжировании для этого пользователя.

Если я владелец локального бизнеса, что мне делать согласно этому патенту?

Ваша главная задача — привлекать на сайт посетителей из вашего целевого региона. Используйте локальный маркетинг, создавайте контент, интересный местным жителям. Чем больше локальных пользователей посетит ваш сайт, тем плотнее будет ваш географический кластер в данных Google, и тем выше будет ваша географическая релевантность для этого региона.

Может ли сайт быть релевантным сразу нескольким географическим областям?

Да. Если анализ данных о посетителях выявит несколько отдельных плотных кластеров (например, один в Москве и один в Санкт-Петербурге), система пометит сайт как географически релевантный обеим этим областям. Это актуально для компаний с несколькими филиалами.

Что означает "дисперсия кластера" и как она влияет на ранжирование?

Дисперсия характеризует разброс точек в кластере. Низкая дисперсия означает плотный кластер. При расчете вероятности соответствия (по Гауссовой модели) плотные кластеры дают более высокий балл, если пользователь находится близко к центру, но этот балл быстрее падает при удалении от центра, чем у широких кластеров (высокая дисперсия).

Учитывает ли система тип IP-адреса при анализе?

Да, в патенте упоминается возможность учета того, является ли IP-адрес статическим или динамическим. Данные от статических IP-адресов считаются более надежными для определения местоположения, и им может придаваться больший вес при анализе, в то время как динамические могут фильтроваться или иметь меньший вес.

Откуда Google берет данные о том, кто посещает мой сайт?

В патенте упоминаются несколько возможных источников для сбора IP-адресов и посещенных URL: приложения, работающие на компьютере пользователя (например, браузер, тулбар, плагин), логи веб-сайта или логи прокси-серверов. Также могут использоваться данные из аккаунтов пользователей.

Заменяет ли этот механизм необходимость в Google Business Profile (GBP) для локального SEO?

Нет, не заменяет. GBP предоставляет верифицированные данные о физическом местоположении бизнеса. Описанный механизм дополняет эту информацию, определяя географическую релевантность веб-сайта на основе поведения пользователей. GBP определяет, *где* находится бизнес, а этот патент помогает понять, *откуда* приходят его онлайн-клиенты.

Похожие патенты

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Как Google определяет, когда игнорировать местоположение пользователя и показывать глобальные результаты для уникальных сущностей
Google использует систему для динамического выбора между показом результатов, привязанных к предполагаемому местоположению пользователя (например, по IP или GPS), и глобальными результатами. Если глобальные результаты географически тесно сгруппированы вокруг определенного места, система может решить, что пользователь ищет конкретную уникальную сущность (например, известный ресторан в другом городе), и предпочтет эти глобальные результаты локальным.
  • US10037357B1
  • 2018-07-31
  • Local SEO

  • SERP

Как Google группирует локальные результаты поиска вокруг физических адресов и динамически определяет радиус поиска
Google использует систему для организации локальной выдачи, кластеризуя веб-документы вокруг конкретного физического адреса или номера телефона. Система определяет «область интереса», используя динамический радиус поиска, который меняется в зависимости от типа запроса (например, поиск ресторана или автодилера). Результаты ранжируются на основе баланса близости и релевантности.
  • US8346770B2
  • 2013-01-01
  • Local SEO

  • SERP

Популярные патенты

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google динамически регулирует влияние фактора близости в локальном поиске в зависимости от тематики запроса и региона
Google использует систему для определения того, насколько важна близость (расстояние) для конкретного поискового запроса и региона. Анализируя исторические данные о кликах и запросах маршрутов, система вычисляет «Фактор важности расстояния». Для запросов типа «Кофе» близость критична, и удаленные результаты пессимизируются. Для запросов типа «Аэропорт» близость менее важна, и качественные результаты могут ранжироваться высоко. Система также учитывает плотность региона (город или село), адаптируя ожидания пользователей по расстоянию.
  • US8463772B1
  • 2013-06-11
  • Local SEO

  • Поведенческие сигналы

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

seohardcore