SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей

IDENTIFYING RESOURCE LOCATIONS (Идентификация местоположений ресурсов)
  • US9552430B1
  • Google LLC
  • 2010-12-28
  • 2017-01-24
  • Local SEO
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.

Описание

Какую проблему решает

Патент решает проблему точного определения географической релевантности и локального интереса к ресурсу (веб-странице), особенно в случаях, когда сам ресурс не содержит явных географических идентификаторов (например, адреса). Вместо того чтобы полагаться исключительно на анализ контента ресурса, изобретение предлагает метод, основанный на анализе географии его аудитории. Это позволяет поисковой системе лучше понимать, для какого региона ресурс наиболее актуален.

Что запатентовано

Запатентована система и метод определения местоположения ресурса (Resource Location) на основе агрегированных данных о физическом местоположении пользователей, которые проявили интерес к этому ресурсу. Интерес определяется через действия пользователя, такие как выбор ресурса из результатов поиска (клик) и длительное его изучение. Система анализирует пространственное распределение этих пользователей для вычисления географического центра интереса (Center) и области его распространения (Dispersion).

Как это работает

Система работает в два этапа:

  1. Офлайн-вычисления: Система собирает данные о кликах и местоположении пользователей (IP, GPS, сотовые вышки). Она фильтрует взаимодействия, учитывая только те, которые свидетельствуют об интересе (long clicks), и отбрасывая быстрые отказы (short clicks). Затем для ресурса вычисляется географический центр (Center) и область популярности (Dispersion). Ресурсы с малой дисперсией помечаются как локальные (Local Resource).
  2. Ранжирование в реальном времени: При получении запроса система определяет местоположение пользователя и сравнивает его с вычисленными Center и Dispersion ресурсов-кандидатов. Ресурсы, географически релевантные местоположению пользователя, могут получать повышение в ранжировании.

Актуальность для SEO

Высокая. В условиях доминирования мобильного поиска и критической важности локализации (Local SEO), методы точного определения географической релевантности контента являются ключевыми для Google. Описанный механизм, основанный на реальных данных о местоположении пользователей, является мощным инструментом для валидации локального интента и улучшения качества выдачи по геозависимым запросам.

Важность для SEO

Патент имеет высокое значение для SEO, особенно в локальном сегменте (8/10). Он демонстрирует механизм, при котором географическая релевантность сайта определяется не только и не столько заявленным на странице контентом (например, адресом), сколько реальным физическим расположением его целевой аудитории. Это означает, что для успешного локального ранжирования критически важно привлекать на сайт реальных пользователей из целевого региона и обеспечивать их вовлеченность (длительные сессии).

Детальный разбор

Термины и определения

Center (Центр) / Mean Center (Средний центр)
Географическая точка, представляющая собой центр распределения местоположений пользователей, заинтересованных в ресурсе. Вычисляется как среднее значение координат (широты и долготы). Может быть взвешенным (Weighted Mean Center).
Click Data Log (Лог данных о кликах)
Хранилище данных, регистрирующее выбор пользователями результатов поиска, связанные запросы и информацию о местоположении пользователя в момент клика.
Dispersion (Дисперсия, Рассеивание)
Статистическая мера пространственного распределения интереса к ресурсу вокруг Центра. Определяет географическую область, где ресурс наиболее часто выбирается. Может быть выражена как радиус или эллипс. Чем меньше дисперсия, тем более локализован ресурс.
Expression Location / Selection Location (Местоположение выражения интереса / Местоположение выбора)
Физическое местоположение пользователя в момент, когда он проявил интерес к ресурсу.
Expression of Interest (Выражение интереса)
Действие пользователя, указывающее на заинтересованность в ресурсе. В контексте патента это выбор результата поиска, прошедший фильтрацию по времени просмотра (long click).
Local Resource (Локальный ресурс)
Ресурс, релевантный для небольшой географической области. Определяется как ресурс, у которого радиус дисперсии меньше определенного порога (например, 25, 50 или 100 миль).
Long Click / Short Click (Длинный клик / Короткий клик)
Классификация кликов на основе времени, проведенного пользователем на ресурсе (Dwell Time). Long clicks указывают на интерес пользователя и учитываются в расчетах; short clicks (быстрый возврат к выдаче) — игнорируются.
Resource Location (Местоположение ресурса)
Вычисленное географическое местоположение (Центр), ассоциированное с ресурсом, основанное на анализе местоположений его аудитории.

Ключевые утверждения (Анализ Claims)

Патент содержит всего 2 пункта формулы изобретения.

Claim 1 (Независимый пункт): Описывает полный цикл использования географических данных для ранжирования результатов поиска.

  1. Предварительный расчет (до получения запроса): Система ассоциирует результат поиска с местоположением (Center) и дисперсией (Dispersion). Это делается путем:
    • Получения данных о кликах (click data), связывающих результат с зарегистрированными местоположениями пользователей, которые ранее выбирали этот результат.
    • Определения Центра этих местоположений (средняя широта и долгота).
    • Определения Области Дисперсии (рассчитывается как радиус на основе стандартного отклонения).
  2. Обработка запроса и Ранжирование: Система получает запрос и местоположение пользователя. Результат ранжируется, основываясь на местоположении пользователя, Центре результата и его Дисперсии. Дисперсия используется как статистическая мера локализации: чем она меньше, тем более локализован результат.

Claim 2 (Независимый пункт): Описывает метод определения местоположения ресурса и его использования в ранжировании, с критически важным акцентом на фильтрацию данных.

  1. Сбор данных и Определение местоположения: Система определяет местоположение ресурса и его дисперсию на основе местоположений пользователей, выбравших этот результат.
  2. Фильтрация данных (Ключевой момент): При определении местоположения ресурса система исключает из расчета местоположения тех пользователей, которые запросили другой ресурс менее чем через пороговое количество времени после того, как им был представлен первый ресурс. (Это механизм фильтрации коротких кликов (short clicks) или быстрых отказов).
  3. Ранжирование: При получении другого запроса система ранжирует ресурс на основе местоположения нового пользователя, вычисленного местоположения ресурса и его дисперсии.

Где и как применяется

Изобретение применяется на нескольких этапах поисковой архитектуры, разделяясь на офлайн-вычисления и применение в реальном времени.

INDEXING – Индексирование и извлечение признаков (Офлайн/Пакетная обработка)

  • Обработка логов: Система анализирует Click Data Log и Query Logs. Происходит извлечение признаков: идентификация Expressions of Interest (с обязательной фильтрацией short clicks) и определение соответствующих Expression Locations.
  • Вычисление географических признаков: Location Identification Engine агрегирует данные по каждому ресурсу и выполняет статистический пространственный анализ для вычисления Center и Dispersion.
  • Индексирование признаков: Рассчитанные географические признаки (координаты Центра, параметры Дисперсии, флаг Local Resource) сохраняются в индексе и ассоциируются с соответствующим URL.

RANKING / RERANKING – Ранжирование / Переранжирование (Реальное время)

  • Применение географических сигналов: Ranking Engine извлекает предварительно рассчитанные географические признаки (Center, Dispersion) для ресурсов-кандидатов и сравнивает их с текущим местоположением пользователя.
  • Корректировка оценки: Ranking Score ресурса корректируется на основе расстояния между пользователем и Центром ресурса, а также с учетом Дисперсии. Например, оценка повышается, если пользователь находится внутри области Дисперсии.

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние оказывается на локальные бизнесы (рестораны, магазины, услуги), местные новости, события. Влияет на все ниши, где географическое положение аудитории имеет значение для определения релевантности.
  • Специфические запросы: Влияет на запросы с локальным интентом (явным или неявным), например, "пицца рядом" или просто "ресторан".

Когда применяется

  • Условия работы алгоритма: Алгоритм вычисления местоположения ресурса применяется, когда для данного ресурса накоплено достаточное количество данных. Патент упоминает возможность требования минимального числа пользователей (например, 50) или минимального уровня уверенности (confidence level).
  • Триггеры активации (в ранжировании): Механизм корректировки активируется, когда система может определить местоположение текущего пользователя и когда у ресурсов-кандидатов есть рассчитанные географические признаки.
  • Исключения: Данные о взаимодействии исключаются из расчета, если это был short click (Claim 2). Также могут исключаться статистические выбросы (outliers) — пользователи, находящиеся слишком далеко от основного кластера.

Пошаговый алгоритм

Фаза А: Сбор и фильтрация данных (Непрерывный процесс)

  1. Получение взаимодействия: Система регистрирует выбор пользователем результата поиска.
  2. Определение местоположения пользователя: Location Identification Engine определяет Expression Location пользователя (используя IP, GPS, историю запросов и т.д.) и присваивает ему фактор уверенности (Confidence Factor).
  3. Оценка интереса (Фильтрация): Система анализирует длительность сессии (Dwell Time). Если пользователь возвращается к поиску быстрее порогового значения, взаимодействие помечается как short click и игнорируется.
  4. Логирование: Если интерес подтвержден (long click), данные (URL ресурса, Expression Location, вес/уверенность) сохраняются в Click Data Log.

Фаза Б: Вычисление местоположения ресурса (Офлайн/Пакетная обработка)

  1. Агрегация данных: Для конкретного ресурса извлекаются все валидные Expression Locations за определенный период (например, три месяца) или до достижения порога.
  2. Предварительная обработка: Фильтрация статистических выбросов (outliers).
  3. Расчет Центра (Center): Вычисляется среднее значение широты и долготы. Используется взвешенное среднее (Weighted Mean Center), если учитываются веса (например, длительность просмотра или Confidence Factor).
  4. Расчет Дисперсии (Dispersion): Вычисляется стандартное отклонение расстояний от Центра (радиус) или параметры стандартного эллипса отклонения (если распределение неравномерное).
  5. Классификация: Если радиус Дисперсии меньше порога (например, 50 миль), ресурс классифицируется как Local Resource.
  6. Сохранение: Рассчитанные Center и Dispersion ассоциируются с URL ресурса в индексе.

Фаза В: Применение в ранжировании (Реальное время)

  1. Получение запроса: Система получает запрос и определяет текущее местоположение пользователя.
  2. Расчет географической релевантности: Система оценивает популярность ресурса в точке нахождения пользователя, используя функцию пространственного распределения (например, Гауссово распределение), основанную на расстоянии до Center и параметрах Dispersion.
  3. Корректировка ранжирования: Ranking Score ресурса корректируется на основе географической релевантности. Корректировка может быть более агрессивной для Local Resource.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы:
    • Клики (Clicks): Основной сигнал выражения интереса.
    • Время на сайте / Dwell Time: Критически важно для фильтрации кликов (short clicks vs long clicks). Длительные просмотры могут также увеличивать вес соответствующего местоположения.
    • История запросов (Query history): Используется для определения или уточнения местоположения пользователя, если прямые сигналы недоступны.
  • Географические факторы:
    • IP-адрес: Приблизительное местоположение.
    • GPS-координаты: Точные данные с мобильных устройств.
    • Данные сотовых вышек (Cellular tower location): Местоположение мобильных устройств.
  • Пользовательские факторы:
    • Cookies / Данные сессии: Используются для отслеживания истории запросов пользователя для определения местоположения.

Какие метрики используются и как они считаются

Патент детально описывает статистические методы пространственного анализа.

1. Center (Центр)

Средний центр (Mean Center) вычисляется как среднее арифметическое координат (широты Y и долготы X).

Xˉ=∑i=1NXiN;Yˉ=∑i=1NYiN\bar{X} = \sum_{i=1}^{N}\frac{X_{i}}{N} ; \bar{Y} = \sum_{i=1}^{N}\frac{Y_{i}}{N}

Взвешенный средний центр (Weighted Mean Center) учитывает веса (w), например, основанные на длительности просмотра или Confidence Factor.

Xˉ=∑i=1NwiXi∑i=1Nwi;Yˉ=∑i=1NwiYi∑i=1Nwi\bar{X} = \frac{\sum_{i=1}^{N}w_{i}X_{i}}{\sum_{i=1}^{N}w_{i}} ; \bar{Y} = \frac{\sum_{i=1}^{N}w_{i}Y_{i}}{\sum_{i=1}^{N}w_{i}}

2. Dispersion (Дисперсия)

Стандартное отклонение расстояния (Standard deviation of the distance). Определяет радиус области популярности.

SXY=∑i=1N(di)2N−1S_{XY} = \sqrt{\sum_{i=1}^{N}\frac{(d_{i})^{2}}{N-1}} Где dᵢ - расстояние между i-й точкой и Центром.

Стандартный эллипс отклонения (Standard Deviational Ellipse). Используется, если дисперсия зависит от направления (например, вдоль автомагистрали).

3. Пороговые значения

  • Порог Dwell Time: Минимальное время на ресурсе для учета взаимодействия (Claim 2).
  • Порог количества взаимодействий: Минимальное количество пользователей (например, 50), необходимое для надежного расчета.
  • Порог Дисперсии для Local Resource: Максимальный радиус дисперсии (например, 25, 50, 100 миль), при котором ресурс считается локальным.

Выводы

  1. География аудитории определяет географию ресурса: Ключевой вывод патента — местоположение веб-страницы определяется тем, где физически находятся пользователи, проявляющие к ней интерес. Это смещение парадигмы от анализа контента страницы к анализу её аудитории.
  2. Валидация интереса через поведение (Dwell Time): Не все клики одинаково полезны. Система специально фильтрует короткие клики и быстрые отказы (Claim 2). Учитываются только те взаимодействия, которые демонстрируют реальную заинтересованность (long clicks).
  3. Локализация как измеримая величина (Дисперсия): Патент вводит понятие Дисперсии как меры локализации. Если интерес к ресурсу географически сконцентрирован (малая дисперсия), ресурс считается локальным (Local Resource). Если интерес распределен широко, ресурс имеет национальный или глобальный охват.
  4. Статистическая строгость анализа: Google использует продвинутые методы пространственной статистики (стандартные отклонения, эллипсы распределения, ковариационные матрицы) для точного определения областей популярности, а не просто усредняет координаты.
  5. Географические данные как фактор ранжирования: Рассчитанные Center и Dispersion используются как прямые сигналы в Ranking Engine для повышения или понижения ресурса в зависимости от текущего местоположения пользователя.

Практика

Best practices (это мы делаем)

  • Привлечение релевантной локальной аудитории: Для локальных бизнесов критически важно, чтобы их сайт посещали реальные пользователи из целевого региона. Это формирует четкий географический кластер (малую Дисперсию) вокруг физического местоположения бизнеса, что усиливает локальные сигналы ранжирования.
  • Оптимизация вовлеченности и снижение отказов (User Satisfaction): Поскольку система фильтрует short clicks (Claim 2), необходимо работать над качеством контента и UX, чтобы пользователи проводили на сайте достаточно времени. Только long clicks участвуют в определении местоположения ресурса.
  • Стимулирование естественного локального спроса: Используйте офлайн-рекламу, локальные СМИ и локальные маркетинговые активности для привлечения трафика из нужного региона. Этот трафик, конвертируясь в long clicks, напрямую влияет на формирование Resource Location.
  • Техническая оптимизация для мобильных устройств: Обеспечьте корректную работу сайта на мобильных устройствах. Точные данные о местоположении (GPS) могут иметь больший вес (Confidence Factor), чем приблизительные (IP), что позволяет точнее определить Center.

Worst practices (это делать не надо)

  • Привлечение нерелевантного глобального трафика: Покупка трафика из других регионов или создание вирусного контента, привлекающего широкую, но нецелевую аудиторию, приведет к увеличению Дисперсии. Это «размывает» локальную привязку и может ухудшить ранжирование в целевом регионе.
  • Игнорирование качества трафика и поведенческих факторов: Фокус только на количестве кликов без учета их качества (длительности сессии) неэффективен. Трафик с высоким показателем отказов не будет учитываться при определении местоположения.
  • Накрутка поведенческих факторов: Попытки манипуляций с помощью ботов будут неэффективны из-за фильтрации short clicks и механизмов обнаружения выбросов (outliers).
  • Манипуляции с локальными сигналами на сайте: Создание множества страниц под разные города (doorway pages) без реального присутствия может быть неэффективным, если реальный трафик на эти страницы идет из других локаций. Система валидирует заявленную географию через фактическую географию аудитории.

Стратегическое значение

Патент подтверждает, что Google активно использует данные о реальном поведении и физическом местоположении пользователей для валидации географической релевантности сайтов. Это снижает зависимость от он-страничных факторов (таких как адреса в тексте) и повышает роль реального взаимодействия аудитории с бизнесом. Стратегия локального SEO должна строиться на комплексном подходе: техническая оптимизация должна поддерживать привлечение и удержание реальной локальной аудитории.

Практические примеры

Сценарий 1: Определение локализации ресторана

  1. Ситуация: Новый ресторан в Москве создал сайт.
  2. Действия пользователей: В течение месяца сайт посетили 500 человек. 450 из них находились в радиусе 5 км от ресторана (определено по GPS/IP) и провели на сайте более минуты (long clicks). 50 человек были из других городов или быстро покинули сайт.
  3. Работа алгоритма: Система анализирует 450 валидных взаимодействий. Она вычисляет Center, который совпадает с районом ресторана, и малую Dispersion (радиус 5 км). Ресурс помечается как Local Resource.
  4. Результат: Когда новые пользователи ищут "ресторан рядом", находясь в этом районе, сайт ресторана получает значительное повышение в выдаче.

Сценарий 2: Размытие локализации из-за нецелевого трафика

  1. Ситуация: Локальный магазин автозапчастей в Самаре опубликовал вирусную статью о тюнинге, не связанную напрямую с ассортиментом.
  2. Действия пользователей: Статья привлекла большой трафик со всей России и СНГ.
  3. Работа алгоритма: Система анализирует взаимодействия. Географическое распределение пользователей очень широкое. Dispersion увеличивается до национального уровня.
  4. Результат: Хотя общий трафик вырос, локальная привязка сайта к Самаре ослабла. Ранжирование по запросу "купить автозапчасти в Самаре" может ухудшиться, так как система больше не считает сайт строго локальным ресурсом.

Вопросы и ответы

Как система определяет физическое местоположение пользователя?

Патент упоминает несколько методов: IP-адрес клиентского устройства, GPS-координаты (особенно с мобильных устройств), данные от провайдеров сотовой связи (местоположение вышек). Кроме того, система может определять местоположение на основе истории запросов пользователя (Query Logs) и данных, сохраненных в cookies или сессии пользователя.

Что такое «Дисперсия» (Dispersion) и почему она важна?

Дисперсия — это статистическая мера того, насколько широко географически распределены пользователи, заинтересованные в ресурсе. Она определяет область популярности ресурса. Малая дисперсия (например, радиус 10 км) указывает на сильный локальный интерес (Local Resource), а большая — на национальный или глобальный. Это критически важно для ранжирования: система стремится показывать локальные ресурсы пользователям поблизости.

Все ли клики учитываются при определении местоположения ресурса?

Нет. В патенте (Claim 2) четко указано, что система исключает из расчета взаимодействия пользователей, которые быстро покинули ресурс и запросили другой (short clicks или быстрые отказы). Учитываются только те взаимодействия (long clicks), которые демонстрируют реальную заинтересованность пользователя в контенте.

Заменяет ли этот механизм необходимость указывать адрес и телефон на сайте?

Он не заменяет, но существенно дополняет. Если данные об аудитории убедительны, система может определить местоположение даже без адреса на сайте. Однако наличие адреса остается важным фактором ранжирования и UX. В идеале, данные об аудитории должны подтверждать данные, указанные на сайте.

Как SEO-специалист может повлиять на рассчитываемое местоположение ресурса?

Основной способ влияния — это привлечение качественного трафика из целевого региона. Необходимо сфокусироваться на маркетинговых активностях (включая офлайн), которые приводят на сайт локальных пользователей, и обеспечивать их вовлеченность (длительные сессии), чтобы их местоположение было учтено системой.

Что произойдет, если пользователи заходят на сайт через VPN из разных стран?

Если система определяет местоположение по IP-адресу, использование VPN может внести шум в данные. Это приведет к увеличению Дисперсии и размытию локальной привязки. Однако Google использует комплекс методов (GPS, данные сотовых сетей, история запросов), которые менее подвержены влиянию VPN, что позволяет снизить этот эффект.

Как система определяет, является ли ресурс «Локальным»?

Ресурс классифицируется как Local Resource, если его радиус Дисперсии меньше определенного порога. В патенте приводятся примеры порогов: 25, 50 или 100 миль. Это означает, что подавляющее большинство заинтересованных пользователей находится в этой ограниченной географической области.

Может ли привлечение большого количества трафика из другого региона изменить локализацию сайта?

Да. Если сайт, который ранее считался локальным (например, для Воронежа), начнет привлекать много качественного трафика из Москвы, его Center сместится, а Dispersion увеличится. Это может привести к улучшению ранжирования в Москве, но потенциально ухудшить позиции в Воронеже по локальным запросам.

Учитывает ли система разницу в точности определения местоположения (GPS vs IP)?

Да. Патент упоминает использование Confidence Factor (фактора уверенности) для взвешивания данных о местоположении. Данные с высокой точностью (например, GPS) могут иметь больший вес при расчете Weighted Mean Center, чем приблизительные данные (например, IP-адрес или история запросов).

Что такое «Стандартный девиационный эллипс» (Standard Deviational Ellipse)?

Это метод пространственной статистики для описания распределения точек, упомянутый в описании патента. В отличие от простого радиуса (круга), эллипс учитывает направление. Например, если бизнес обслуживает клиентов вдоль определенной автомагистрали, его область интереса будет вытянутой. Эллипс позволяет более точно описать такую зону обслуживания, чем круг.

Похожие патенты

Как Google определяет географическую релевантность сайта, анализируя местоположение его посетителей
Google использует механизм для автоматического определения географической релевантности веб-ресурсов путем анализа местоположения их посетителей (через IP-адреса). Система применяет кластерный анализ к этим данным: если аудитория сконцентрирована в определенных регионах, сайт признается локально релевантным этим регионам. Эти данные используются для повышения ранжирования сайта для пользователей из этих же регионов.
  • US8086690B1
  • 2011-12-27
  • Local SEO

  • SERP

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google определяет, когда игнорировать местоположение пользователя и показывать глобальные результаты для уникальных сущностей
Google использует систему для динамического выбора между показом результатов, привязанных к предполагаемому местоположению пользователя (например, по IP или GPS), и глобальными результатами. Если глобальные результаты географически тесно сгруппированы вокруг определенного места, система может решить, что пользователь ищет конкретную уникальную сущность (например, известный ресторан в другом городе), и предпочтет эти глобальные результаты локальным.
  • US10037357B1
  • 2018-07-31
  • Local SEO

  • SERP

Как Google выбирает, какое местоположение использовать для локализации поисковой выдачи, когда сигналы конфликтуют
Google использует иерархическую систему правил для выбора единственной «геолокации запроса» из множества доступных сигналов. Система анализирует физическое местоположение пользователя, локации в тексте запроса, историю поиска и настройки профиля. Затем она применяет строгую логику приоритетов, чтобы определить, какая локация наиболее релевантна для текущего интента, и соответствующим образом корректирует (смещает) ранжирование результатов.
  • US20150234889A1
  • 2015-08-20
  • Local SEO

  • Персонализация

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Популярные патенты

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
  • US7617205B2
  • 2009-11-10
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore