SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует сезонные и локальные события (Recurrent Queries) для определения местоположения пользователя

DETERMINING EVENT ORIGIN (Определение происхождения события)
  • US20150169596A1
  • Google LLC
  • 2013-02-19
  • 2015-06-18
  • Local SEO
  • Поведенческие сигналы
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google улучшает геолокацию пользователей, анализируя «повторяющиеся запросы» (Recurrent Queries) — запросы, популярность которых резко возрастает в конкретных регионах в определенное время (например, локальные праздники или события). Когда пользователь вводит такой запрос в соответствующий период, система с высокой уверенностью определяет его местоположение, даже если другие сигналы (IP, GPS) неоднозначны.

Описание

Какую проблему решает

Патент решает задачу повышения точности определения географического местоположения пользователя (геолокации). Традиционные методы (IP-адрес, GPS, явные указания локации в запросе) могут быть неточными, недоступными или неоднозначными (например, при использовании VPN). Изобретение предоставляет дополнительный, надежный сигнал для определения местоположения, основанный на анализе поведенческих, сезонных и культурных паттернов поиска.

Что запатентовано

Запатентована система и метод идентификации и использования «Повторяющихся запросов» (Recurrent Queries) для геолокации. Recurrent Query — это запрос, который демонстрирует значительный всплеск трафика (Query Peak или Spike) в течение определенного повторяющегося периода времени и преимущественно из конкретного географического региона. Система анализирует исторические логи для выявления таких закономерностей и использует их для определения местоположения пользователя в реальном времени.

Как это работает

Система работает в двух основных режимах:

  • Офлайн-анализ (Идентификация): Система анализирует исторические логи запросов, чтобы найти запросы, имеющие статистически значимые пики популярности (Query Peaks) одновременно по времени и по местоположению (например, запрос "Mother's Day" в США в мае). Для подтверждения значимости пика используются статистические методы, включая расчет энтропии (Entropy).
  • Онлайн-применение (Геолокация): Когда пользователь отправляет запрос, система проверяет, является ли он Recurrent Query и соответствует ли текущее время его пиковому периоду. Если да, Geolocation Engine повышает вероятность (Measure of Confidence) того, что пользователь находится в ассоциированном географическом регионе.

Актуальность для SEO

Высокая. Точное определение местоположения пользователя остается фундаментальной задачей для поисковых систем, критически важной для мобильного поиска и предоставления локальных результатов. Описанный метод предоставляет устойчивый сигнал геолокации, основанный на реальном поведении пользователей и культурных событиях, что сохраняет его актуальность в 2025 году.

Важность для SEO

Патент имеет значительное влияние на SEO (7/10), особенно для Local SEO и International SEO. Хотя он описывает инфраструктурный механизм понимания контекста пользователя (его местоположения), а не ранжирование контента, точная геолокация фундаментально влияет на формирование выдачи. Это подчеркивает стратегическую важность адаптации контента под локальные события, праздники и сезонные тренды целевых регионов.

Детальный разбор

Термины и определения

Recurrent Query (Повторяющийся запрос)
Запрос (или кластер похожих запросов), который преимущественно поступает из определенного географического региона в течение определенного периода времени. Характеризуется предсказуемыми пиками трафика.
Query Peak / Spike (Пик запроса / Всплеск)
Значительное увеличение количества запросов по сравнению со средним уровнем. Должен удовлетворять Peak Count Criteria.
Geolocation Engine (Механизм геолокации)
Компонент поисковой системы, отвечающий за определение географического происхождения запросов.
Peak Count Criteria (Критерии пикового значения)
Условия, которым должен удовлетворять всплеск трафика, чтобы считаться значимым пиком. Ключевое требование: запрос должен иметь пик как по времени, так и по местоположению.
Entropy (Энтропия)
Мера неопределенности вероятностного распределения. Используется для оценки того, насколько концентрирован трафик запроса в конкретном регионе или периоде времени. Низкая энтропия указывает на высокую концентрацию (сильный сигнал).
Measure of Confidence (Мера уверенности)
Оценка или вероятность того, что запрос, идентифицированный как Recurrent Query, действительно произошел из ассоциированного географического региона.
Query Log Data (Логи запросов)
Исторические данные о полученных запросах, включая текст, время и предполагаемое географическое происхождение.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает процесс использования повторяющихся запросов в реальном времени (онлайн).

  1. Система получает запрос от клиентского устройства.
  2. Система определяет, что запрос является Recurrent Query (запросом, который преимущественно поступает из определенного географического региона в определенный период времени).
  3. Система определяет местоположение клиентского устройства, основываясь, по крайней мере частично, на этом определенном географическом регионе.

Claim 2 (Независимый пункт): Описывает процесс идентификации повторяющихся запросов (офлайн).

  1. Из лога запросов идентифицируется множество запросов, связанных с кандидатом в Recurrent Query.
  2. Определяется множество подсчетов (counts). Каждый подсчет представляет количество раз, когда запросы были получены из одного из географических регионов И в течение одного из периодов времени.
  3. Среди подсчетов идентифицируется пиковое значение (Peak Count), удовлетворяющее Peak Count Criteria для первого региона и первого периода времени.
  4. Определяется, что кандидат является Recurrent Query для этого региона и периода времени.

Claim 3 (Зависимый от 2): Уточняет один из методов идентификации пика.

Идентификация Peak Count включает определение того, что отношение (ratio) подсчета к среднему значению подсчетов превышает определенный порог. Это количественный метод обнаружения всплесков трафика.

Claim 4 (Зависимый от 2): Уточняет альтернативный метод идентификации пика с использованием теории информации.

  1. Определяется вероятностное распределение на основе подсчетов.
  2. Определяется, что энтропия (Entropy) этого распределения удовлетворяет пороговому значению. (Примечание: Хотя в патенте используется фраза "exceeds a threshold", контекст указывает на поиск концентрированного распределения, что соответствует низкой энтропии).
  3. Идентифицируется географический регион и период времени с наивысшей вероятностью в распределении.

Claims 5 и 6 (Зависимые от 2): Указывают на гибкость анализа входных данных.

Анализ может проводиться как для идентичных запросов (Claim 5), так и для кластеров похожих запросов (Claim 6), например, с учетом синонимов или семантически близких формулировок.

Claim 7 (Зависимый от 2): Указывает на гибкость анализа гранулярности.

Анализ может проводиться на разных уровнях гранулярности географических регионов (страна, город) или периодов времени (месяц, неделя).

Где и как применяется

Изобретение применяется на этапе понимания запроса для уточнения контекста пользователя.

QUNDERSTANDING – Понимание Запросов

Это основной этап применения патента. Geolocation Engine использует описанный механизм для интерпретации запроса с целью определения местоположения пользователя.

  1. Офлайн-компонент (Анализ данных): Система периодически анализирует Query Log Data для идентификации Recurrent Queries. Это часть глобального анализа поисковых трендов и событий.
  2. Онлайн-компонент (Контекстуализация): Когда запрос поступает в реальном времени, система проверяет его на соответствие базе Recurrent Queries и текущему времени. Если соответствие найдено, эта информация используется для уточнения геолокации пользователя.

RANKING / RERANKING
Результаты работы этого алгоритма (уточненное местоположение) передаются на этапы ранжирования для формирования локализованной выдачи и применения твидлеров локализации.

Входные данные (Офлайн):

  • Логи запросов (Query Log Data), включая текст, временные метки и исходные данные о геолокации (например, IP).

Входные данные (Онлайн):

  • Входящий запрос пользователя.
  • Текущее время.
  • База данных идентифицированных Recurrent Queries.

Выходные данные:

  • Уточненные данные о географическом местоположении пользователя (например, повышенная Measure of Confidence для конкретного региона).

На что влияет

  • Специфические запросы: Запросы, связанные с локальными событиями, праздниками, фестивалями, сезонными активностями, которые происходят в разное время в разных регионах (например, "День Матери", "рецепт индейки").
  • Конкретные ниши или тематики: Критически важно для Local SEO и International SEO. Влияет на e-commerce, туризм, новостные ресурсы, где локальный контекст событий имеет значение.
  • Языковые и географические ограничения: Помогает различать интент пользователей в разных странах с одним языком, но разными культурными календарями.

Когда применяется

  • Триггеры активации: Входящий запрос совпадает (или похож) на запрос из набора Recurrent Queries.
  • Условия применения: Текущее время попадает в период времени (Time Period), ассоциированный с Query Peak для данного запроса. Механизм особенно полезен, когда другие сигналы геолокации слабы или неоднозначны.

Пошаговый алгоритм

Процесс А: Офлайн-идентификация Recurrent Queries

  1. Сбор и подготовка данных: Доступ к логам запросов. Группировка похожих запросов в кластеры (например, "рецепт индейки" и "как приготовить индейку").
  2. Расчет статистики: Подсчет количества вхождений запросов (Query Counts) для множества географических регионов и периодов времени. Гранулярность может варьироваться. В патенте упоминается возможность корректировки подсчетов по населению регионов.
  3. Определение пиков (Peak Detection): Анализ подсчетов для выявления Query Peaks. Пик должен быть выражен одновременно:
    • Во времени: Всплеск в конкретный период по сравнению с другими периодами для этого региона.
    • В пространстве: Всплеск в конкретном регионе по сравнению с другими регионами в этот период.
  4. Применение критериев (Peak Count Criteria): Проверка пика по пороговым значениям с использованием методов:
    • Метод отношений: Сравнение отношения пикового значения к среднему значению.
    • Метод энтропии: Расчет Entropy вероятностного распределения. Низкая энтропия указывает на сильный пик.
  5. Расчет уверенности: Вычисление Measure of Confidence. Если пик наблюдается в нескольких регионах одновременно, уверенность может быть ниже или распределена между ними. Система может ограничивать максимальное количество регионов.
  6. Сохранение: Если критерии выполнены, запрос добавляется в набор Recurrent Queries с ассоциацией региона, периода времени и меры уверенности.

Процесс Б: Онлайн-геолокация запроса

  1. Получение запроса: Система получает запрос от пользователя.
  2. Проверка на повторяемость: Система определяет, является ли входящий запрос Recurrent Query.
  3. Проверка времени: Система определяет, был ли запрос получен в течение периода Query Peak.
  4. Расчет геолокации: Если обе проверки положительны, система обновляет Measure of Confidence того, что запрос произошел из ассоциированного региона.
  5. Интеграция сигналов: Эта мера используется для корректировки результатов других классификаторов геолокации (например, на основе IP), возможно, с использованием алгоритмов типа Adaptive Boosting (упомянуто в описании патента).

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Логи запросов (Query Log Data) являются основным источником данных. Анализируется частота и распределение запросов.
  • Временные факторы: Время получения запроса. Анализ проводится по временным периодам различной гранулярности (недели, месяцы).
  • Географические факторы: Исходные данные о геолокации запросов в логах (на основе IP, настроек пользователя и т.д.). Анализ проводится по регионам различной гранулярности (страны, штаты, города).

Какие метрики используются и как они считаются

  • Query Counts (Подсчеты запросов TkT_kTk): Прямой подсчет количества вхождений запроса для пары (Регион k, Время).
  • Отношение к среднему (Ratio to Average): Сравнение текущего подсчета со средним значением. Используется для обнаружения всплесков (Claim 3).
  • Вероятностное распределение P(xk)P(x_k)P(xk): Вероятность того, что запрос поступил из региона xkx_kxk в течение периода времени. Рассчитывается как: P(xk)=Tk∑i=1NTiP(x_k) = \frac{T_k}{\sum_{i=1}^{N} T_i}P(xk)=∑i=1N​TiTk​
  • Entropy H(X)H(X)H(X) (Энтропия): Мера концентрации распределения X. Рассчитывается (в общем виде) как: H(X)=−∑iP(xi)log2P(xi)H(X) = -\sum_{i} P(x_i)log_2P(x_i)H(X)=−∑iP(xi)log2P(xi)
  • Measure of Confidence (Мера уверенности): Итоговая оценка, основанная на силе пика и количестве других регионов, где также наблюдается пик.

Выводы

  1. Геолокация на основе поведения и культуры: Патент подтверждает, что Google использует не только технические данные (IP, GPS), но и анализирует исторические поведенческие паттерны, связанные с культурой, событиями и сезонностью, для определения местоположения пользователя.
  2. Требование двойного пика (Время и Место): Ключевым моментом является то, что запрос должен демонстрировать всплеск одновременно в конкретном регионе и в конкретное время. Глобальные события (пик только по времени) или постоянный локальный интерес (пик только по месту) не являются Recurrent Queries в этом контексте.
  3. Статистическая значимость и Энтропия: Система использует анализ энтропии для оценки надежности сигнала. События, уникальные для одного места и времени (низкая энтропия), являются сильными сигналами. События, происходящие повсеместно (высокая энтропия), имеют меньшую различительную способность.
  4. Гибкость идентификации (Кластеризация и Гранулярность): Система учитывает кластеры семантически похожих запросов (а не только точные совпадения) и может адаптировать гранулярность анализа (время и местоположение) для поиска наиболее сильного сигнала.
  5. Геолокация как комбинация сигналов: Recurrent Queries используются как один из входов в общую систему геолокации (в комбинации с классификаторами на основе IP и другими данными), повышая общую точность определения местоположения пользователя.

Практика

Best practices (это мы делаем)

  • Анализ региональных календарей и трендов (International SEO): Тщательно изучайте календарь событий, праздников и сезонных активностей в целевых рынках. Используйте Google Trends для выявления географически и темпорально специфичных всплесков интереса (Recurrent Queries) в вашей нише.
  • Своевременная локализация контента: Создавайте и продвигайте контент, приуроченный к локальным событиям, в нужное время. Убедитесь, что материалы проиндексированы до наступления Query Peak.
  • Использование региональной терминологии: Используйте термины и формулировки, специфичные для вашего целевого региона. Как показано в патенте на примере "dia de la madre" (Аргентина) и "mother's day" (США), язык и время являются ключевыми для правильной геолокации запроса.
  • Усиление локальных сигналов (Local SEO): Поскольку этот механизм повышает точность геолокации пользователя, важность стандартных факторов локального SEO возрастает. Фокусируйтесь на освещении гиперлокальных событий и новостей, чтобы усилить связь сайта с конкретным регионом.

Worst practices (это делать не надо)

  • Игнорирование региональных различий во времени: Применение единой контент-стратегии для разных регионов. Например, запуск кампании ко Дню Матери по единому календарю для всех стран.
  • Таргетинг глобальных событий без локализации: Попытка охватить глобальные события (например, Новый Год) без учета региональных различий. Система может не использовать такие запросы для геолокации из-за высокой энтропии (низкой различительной способности).
  • Предположение о статичной геолокации: Полагать, что Google локализует результаты только по IP или когда пользователь явно указывает название города. Локализация может произойти динамически на основе темы запроса и текущего времени.

Стратегическое значение

Патент подчеркивает стратегическую важность понимания контекста пользователя, который включает не только его намерение, но и его точное местоположение и текущее время. Он демонстрирует, что Google рассматривает поиск как динамическую активность, тесно связанную с реальными событиями. Для SEO это означает, что успешная стратегия должна быть не только географически точной, но и своевременной, выравнивая контент с культурными ритмами и событиями целевого региона.

Практические примеры

Сценарий: Международный интернет-магазин и таргетинг на "День Матери"

  1. Анализ (Основываясь на патенте): SEO-команда определяет, что "День Матери" является сильным Recurrent Query, но его пики происходят в разное время:
    • США: Запрос "Mother's Day" – пик в мае.
    • Аргентина: Запрос "Día de la Madre" – пик в октябре (как показано в патенте, 40-я неделя).
  2. Действие SEO: Создаются отдельные локализованные лендинги (например, site.com/us/mothers-day, site.com/ar/dia-de-la-madre). Контентные кампании запускаются синхронно с локальным календарем (в США – в апреле/мае, в Аргентине – в сентябре/октябре).
  3. Ожидаемый результат: Когда пользователь вводит "Día de la Madre" в октябре, Google использует этот запрос и время как сильный сигнал для определения местоположения пользователя как Аргентина (даже если IP неоднозначен). Система предоставляет пользователю аргентинскую версию сайта (site.com/ar/), что повышает релевантность и конверсию.

Вопросы и ответы

Влияет ли этот патент напрямую на алгоритмы ранжирования контента?

Нет, напрямую не влияет. Это патент о геолокации (этап QUNDERSTANDING). Он улучшает способность Google понять, где находится пользователь. Однако это имеет критическое косвенное влияние: точное определение местоположения позволяет Google применить соответствующие локальные алгоритмы ранжирования или выбрать правильный региональный индекс для поиска.

Заменяет ли этот механизм геолокацию по IP-адресу или GPS?

Нет, он ее дополняет. Патент описывает Recurrent Queries как дополнительный надежный сигнал для Geolocation Engine. Он используется в сочетании с другими сигналами для повышения общей точности или для корректировки вероятностей, особенно когда данные IP неоднозначны (например, при использовании VPN) или данные GPS недоступны.

Как система обрабатывает события, которые происходят в нескольких странах одновременно?

Патент учитывает это. Если запрос достигает пика в нескольких регионах (например, "Boxing Day" в Англии и Канаде), система вычисляет более низкую Measure of Confidence для каждого отдельного региона или распределяет вероятность между ними. Если слишком много регионов имеют пик (глобальное событие), ценность такого запроса для геолокации падает.

Как SEO-специалист может определить Recurrent Queries для своей ниши и региона?

Необходимо использовать Google Trends для анализа исторических данных по ключевым запросам за несколько лет, установив фильтры по целевому региону. Ищите запросы, которые демонстрируют четкие, повторяющиеся пики в одно и то же время. Также изучайте культурный и событийный календарь целевого региона.

Учитывает ли Google похожие запросы или только точные совпадения?

Учитывает похожие запросы. В патенте явно упоминается анализ кластеров похожих (similar) или связанных запросов. Например, система кластеризует семантически близкие запросы, такие как "рецепт индейки" и "как приготовить индейку", для анализа пиков.

Что такое «Энтропия» в контексте этого патента и почему она важна?

Энтропия — это мера неопределенности или равномерности распределения. Если запрос равномерно распределен по многим странам в течение года (высокая энтропия), он бесполезен для геолокации. Если же 95% запросов приходятся на одну страну в одну конкретную неделю (низкая энтропия, высокая концентрация), это очень сильный сигнал, указывающий на местоположение пользователя.

Может ли этот механизм ошибочно определить мое местоположение, если я ищу информацию о событии в другой стране?

Теоретически да, если вы используете точную формулировку Recurrent Query в его пиковое время. Однако система использует Measure of Confidence и комбинирует этот сигнал с другими данными. Если другие сигналы (например, ваш IP-адрес, история поиска, настройки языка) сильно противоречат местоположению, предложенному Recurrent Query, система может скорректировать результат.

Имеет ли значение гранулярность региона?

Да. Патент описывает, что система может регулировать уровень гранулярности географического региона (от страны до города или почтового индекса) или временного периода (от месяца до недели), чтобы найти наиболее точный и сильный сигнал.

Происходит ли анализ данных в реальном времени?

Идентификация того, какие именно запросы являются Recurrent Queries, выполняется офлайн путем анализа исторических логов. Однако применение этих данных для определения местоположения конкретного пользователя по его текущему запросу происходит в реальном времени.

Насколько важна скорость публикации контента для использования этого механизма?

Своевременность критически важна. Контент должен быть проиндексирован и доступен до начала пикового периода (Time Period) соответствующего Recurrent Query. Планирование контент-стратегии с учетом сезонности и локальных событий необходимо для извлечения максимальной выгоды из этого механизма геолокации.

Похожие патенты

Как Google использует данные о запросах маршрутов и готовность пользователей путешествовать для ранжирования в локальном поиске
Google использует историю запросов маршрутов (Directions Queries) для определения реальной популярности местных бизнесов. Система учитывает, как часто люди ищут маршрут до конкретного места, как далеко они готовы ехать (Historical Travel Distance), а также время суток и день недели. Эти данные о реальном поведении используются как ключевой сигнал для ранжирования в локальном поиске наряду с близостью.
  • US8538973B1
  • 2013-09-17
  • Local SEO

  • Поведенческие сигналы

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google выбирает, какое местоположение использовать для локализации поисковой выдачи, когда сигналы конфликтуют
Google использует иерархическую систему правил для выбора единственной «геолокации запроса» из множества доступных сигналов. Система анализирует физическое местоположение пользователя, локации в тексте запроса, историю поиска и настройки профиля. Затем она применяет строгую логику приоритетов, чтобы определить, какая локация наиболее релевантна для текущего интента, и соответствующим образом корректирует (смещает) ранжирование результатов.
  • US20150234889A1
  • 2015-08-20
  • Local SEO

  • Персонализация

Как Google использует данные о закладках, сообществах и поведении пользователей для персонализации и контекстуализации поиска
Патент описывает раннюю систему персонализации поиска, которая собирает и анализирует закладки (content pointers) пользователей и групп, организованные в иерархические категории. Эта информация используется для создания профилей интересов (content vectors), которые затем применяются для дополнения поисковых запросов (query augmentation) и переранжирования результатов (contextualization) с учетом личного контекста, интересов сообщества и недавней активности пользователя.
  • US7031961B2
  • 2006-04-18
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю поиска и контекст (время, местоположение) для проактивного предложения релевантных прошлых результатов на разных устройствах
Google патентует систему, которая анализирует историю поиска пользователя и использует контекстуальные сигналы (время, местоположение и прошлое поведение, такое как клики и время на сайте), чтобы определить актуальность прошлых результатов. Система проактивно предлагает эти результаты в виде информационных элементов на разных устройствах, устраняя необходимость повторного поиска, например, показывая ресторан, который пользователь искал ранее и рядом с которым находится сейчас.
  • US8805828B1
  • 2014-08-12
  • Персонализация

  • Поведенческие сигналы

Популярные патенты

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

seohardcore