SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически определяет поисковые запросы в URL-адресах рефереров для таргетинга рекламы

METHODS AND SYSTEMS FOR IDENTIFYING USER INPUT DATA FOR MATCHING CONTENT TO USER INTERESTS (Методы и системы для идентификации данных, введенных пользователем, для сопоставления контента с интересами пользователя)
  • US9330093B1
  • Google LLC
  • 2012-08-02
  • 2016-05-03
  • Семантика и интент
  • Персонализация
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для автоматического определения того, какой параметр в URL предыдущей посещенной страницы содержит поисковый запрос пользователя. Анализируя разнообразие значений параметров (Diversity Metric), система создает шаблоны для извлечения этих запросов из реферальных URL. Извлеченные данные затем используются для показа релевантной рекламы на текущей странице.

Описание

Какую проблему решает

Патент решает проблему автоматического извлечения интересов пользователя, в частности его предыдущих поисковых запросов (User Input Data), из URL-адреса источника перехода (Referring URL). Поисковые запросы являются сильным сигналом о намерениях пользователя. Сложность заключается в том, что разные сайты используют разные структуры URL и имена параметров для кодирования этих запросов (например, ?q=, ?search=). Изобретение автоматизирует идентификацию нужного параметра для извлечения запроса и его использования при таргетинге контента (в частности, рекламы).

Что запатентовано

Запатентована система для автоматического обучения извлечению пользовательских данных из URL. Система анализирует большие объемы Referring URLs и вычисляет Diversity Metric (метрику разнообразия) для параметров URL. Если параметр демонстрирует высокое разнообразие значений, система классифицирует его как содержащий пользовательский ввод (поисковый запрос) и генерирует шаблон (Template) для парсинга этого параметра в будущем.

Как это работает

Система работает в два этапа: обучение и применение.

  • Обучение (Офлайн): Система агрегирует Referring URLs из логов. Для каждой пары (Сайт, Параметр), например (foo.com, q), она подсчитывает количество уникальных значений. На основе этого рассчитывается Diversity Metric. Если метрика превышает порог, система предполагает, что параметр содержит поисковые запросы, и создает Template.
  • Применение (В реальном времени): Когда пользователь посещает страницу, система получает Referring URL. Если для этого сайта существует Template, система использует его для извлечения поискового запроса из URL. Затем этот запрос используется для выбора релевантного контента (Content Item), например, рекламы.

Актуальность для SEO

Высокая (для AdTech). Понимание контекста и интересов пользователя критически важно для эффективного таргетинга рекламы. Хотя практическое применение может быть ограничено современными политиками конфиденциальности (например, Referrer-Policy), базовый принцип автоматического анализа структуры URL для извлечения семантической информации остается фундаментальным.

Важность для SEO

Влияние на органическое SEO минимально (1/10). Патент описывает инфраструктурный механизм для Content Management Systems (рекламных серверов, таких как Google AdSense/Ad Manager), а не для ранжирования в веб-поиске. Он не раскрывает сигналов ранжирования и не дает практических рекомендаций для SEO-специалистов. Он лишь демонстрирует технические возможности Google по масштабному анализу структуры URL сторонних сайтов.

Детальный разбор

Термины и определения

Content Item (Единица контента)
Контент, предназначенный для показа пользователю. В патенте прямо указано, что это может быть реклама (advertisement).
Content Management System (CMS) (Система управления контентом)
Система, отвечающая за анализ URL, генерацию шаблонов и выбор Content Items. В контексте патента функционирует как рекламный сервер.
Diversity Metric (Метрика разнообразия)
Ключевая метрика, используемая для оценки разнообразия значений конкретного параметра URL для данного сайта. Высокое значение предполагает, что параметр содержит пользовательский ввод (например, поисковый запрос), а не статическое значение.
Parameter / Parameter Value (Параметр / Значение параметра)
Компоненты URL. Например, в URL ?q=cars, 'q' — это параметр, а 'cars' — значение параметра.
Query Parameter (Параметр запроса)
Параметр URL, который система идентифицировала (на основе Diversity Metric) как содержащий пользовательский ввод или поисковый запрос.
Referring URL (Реферальный URL / URL источника перехода)
URL-адрес предыдущей веб-страницы, с которой пользователь перешел на текущую страницу.
Template (Шаблон)
Набор правил, сгенерированный системой для автоматического парсинга и извлечения значений параметров из Referring URLs конкретного сайта.
Website Parameter Pair (Пара (Сайт, Параметр))
Комбинация идентификатора сайта (например, домена) и имени параметра, используемая для анализа. Например, (foo.com, q).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обучения системы (идентификация параметров запроса).

  1. Анализ множества Referring URLs для одного и того же веб-сайта.
  2. Идентификация конкретного параметра и различных значений этого параметра в проанализированных URL.
  3. Определение того, является ли данный параметр Query Parameter для этого сайта. Критерий определения: количество различных значений параметра (Diversity Metric) достигает заданного порогового числа (specified threshold number).
  4. Генерация шаблона (Template) для парсинга будущих Referring URLs этого сайта. Шаблон идентифицирует значения данного параметра как поисковый термин (query term).

Ядро изобретения — использование статистического разнообразия значений как индикатора того, что параметр содержит пользовательский ввод.

Claim 2 (Зависимый от 1): Описывает применение сгенерированного шаблона в реальном времени.

  1. Получение запроса на контент (content item request) для страницы, который включает Referring URL.
  2. Парсинг значения параметра из Referring URL с использованием ранее сгенерированного шаблона.
  3. Выбор единицы контента (Content Item) на основе извлеченного значения параметра.
  4. Предоставление выбранного контента для отображения на странице.

Claim 6 (Зависимый от 1): Уточняет тип контента.

Единица контента (Content Item) является рекламой (advertisement).

Где и как применяется

Этот патент не вписывается в стандартную архитектуру органического поиска Google (CRAWLING, INDEXING, RANKING и т.д.). Он описывает инфраструктуру рекламных технологий (AdTech), функционирующую внутри Content Management System (например, Google AdSense/Ad Manager).

Этап 1: Офлайн-анализ и обучение
Этот этап включает анализ данных и машинное обучение, применяемое к логам Referring URLs.

  • Система анализирует исторические данные о переходах пользователей для выявления закономерностей в структуре URL различных сайтов.
  • На этом этапе вычисляются Diversity Metrics и генерируются Templates.

Этап 2: Применение в реальном времени (Content Serving)
Этот этап происходит в момент запроса рекламы при загрузке страницы у пользователя.

  • Система получает запрос на контент, содержащий Referring URL.
  • Она применяет соответствующий Template для извлечения query term.
  • Извлеченный термин используется как ключевое слово для выбора наиболее релевантной рекламы.

Входные данные:

  • (Офлайн): Логи, содержащие множество Referring URLs.
  • (Онлайн): Запрос на контент (Content item request), включающий текущий Referring URL.

Выходные данные:

  • (Офлайн): База данных шаблонов (Templates) для парсинга конкретных пар (Сайт, Параметр).
  • (Онлайн): Выбранная единица контента (Реклама).

На что влияет

  • Типы контента: Влияет исключительно на выбор рекламы (advertisements), отображаемой на сайтах издателей (publisher websites) в рамках рекламной сети. Не влияет на органическое ранжирование.
  • Специфические сайты: Влияет на сайты, которые генерируют исходящий трафик и чьи URL содержат пользовательский ввод (например, поисковые системы, E-commerce с внутренним поиском).

Когда применяется

  • Условия работы (Офлайн): Применяется периодически для анализа накопленных логов URL и обновления базы шаблонов.
  • Триггеры активации (Офлайн): Генерация шаблона происходит, когда Diversity Metric для конкретной пары (Сайт, Параметр) превышает установленный порог (determined threshold).
  • Условия работы (Онлайн): Применяется при каждом запросе рекламы, при условии доступности Referring URL и наличия для него сгенерированного шаблона.

Пошаговый алгоритм

Процесс разделен на две фазы: обучение (генерация шаблонов) и применение (выбор контента).

Фаза А: Обучение и генерация шаблонов (Офлайн)

  1. Сбор данных: Анализ множества Referring URLs из логов.
  2. Извлечение компонентов: Из каждого URL извлекаются данные сайта (домен), параметры и их значения.
  3. Генерация пар: Формирование пар (Сайт, Параметр).
  4. Агрегация значений: Группировка всех значений, связанных с каждой конкретной парой (Сайт, Параметр). Например, для (foo.com, q) значениями могут быть "cars", "trucks", "motorcycles".
  5. Расчет метрики разнообразия: Определение Diversity Metric для каждой пары (например, путем подсчета количества уникальных значений).
  6. Применение порога: Выбор пар, у которых Diversity Metric превышает заданный порог. Эти параметры классифицируются как Query Parameters.
  7. Генерация шаблонов: Создание и сохранение шаблона (Template) для парсинга выбранных пар. Шаблон определяет, как интерпретировать значение параметра как поисковый термин.

Фаза Б: Применение и выбор контента (Онлайн)

  1. Получение запроса: Поступление запроса на предоставление контента (рекламы). Запрос включает Referring URL.
  2. Выбор шаблона: Поиск и извлечение соответствующего Template, сгенерированного на Фазе А для сайта из Referring URL.
  3. Парсинг URL: Применение шаблона к Referring URL для извлечения значения Query Parameter (поискового термина).
  4. Выбор контента: Использование извлеченного поискового термина для выбора релевантного Content Item (рекламы).
  5. Предоставление контента: Отправка выбранного контента для отображения на странице пользователя.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на анализе структуры URL.

  • Технические факторы:
    • Referring URLs: Основной источник данных. Анализируется структура URL, наличие и имена параметров (например, CGI-параметры), значения этих параметров.
    • Данные сайта (Домены): Используются для группировки URL по сайтам.
  • Поведенческие/Пользовательские факторы:
    • Подразумеваемый интерес пользователя, выраженный через User Input Data (поисковый запрос), встроенный в реферальный URL.

Какие метрики используются и как они считаются

  • Diversity Metric (Метрика разнообразия): Ключевая метрика изобретения. Она рассчитывается для каждой пары (Сайт, Параметр).
    • Метод расчета: Определяется как количество различных или уникальных значений параметра. Например: для (websitel.com, q) значения "cars", "trucks", "motorcycles" дают метрику 3.
  • Determined Threshold / Specified Threshold Number (Определенный порог): Пороговое значение для Diversity Metric.
    • Применение: Если Diversity Metric > Порог, то параметр считается Query Parameter.
    • Определение порога: Порог может быть фиксированным (например, 3) или определяться динамически на основе анализа метрик для сайтов, о которых уже известно, что их параметры содержат поисковые запросы (benchmarking).

Выводы

Патент описывает внутренние инфраструктурные процессы Google, ориентированные на систему управления контентом (рекламой), без прямых рекомендаций для органического SEO.

  1. Фокус на AdTech, а не на SEO: Все описанные механизмы направлены на улучшение таргетинга рекламы (advertisements) и не связаны с алгоритмами ранжирования органического поиска.
  2. Автоматическое обучение парсингу URL: Система Google способна автоматически, без ручного вмешательства, учиться понимать структуру URL сторонних сайтов и определять, какие части URL содержат семантически значимую информацию (пользовательский ввод).
  3. Diversity Metric как индикатор интента: Ключевая инновация заключается в использовании метрики разнообразия для автоматического определения того, содержит ли параметр URL поисковый запрос. Система предполагает, что параметры с высокой вариативностью значений содержат пользовательский ввод.
  4. Понимание интента из рефереров: Механизм позволяет Google понимать намерение пользователя на основе его предыдущих поисков (даже на сторонних сайтах) и использовать это для таргетинга рекламы на последующих страницах.

Практика

Патент является инфраструктурным для рекламных технологий (AdTech) и не дает практических выводов для влияния на органическое ранжирование (SEO).

Best practices (это мы делаем)

В патенте нет информации о лучших практиках для SEO. Однако, исходя из того, что патент демонстрирует способность Google анализировать структуру URL, можно вывести общие технические рекомендации:

  • Использование понятной структуры URL для внутреннего поиска: Для страниц внутреннего поиска рекомендуется использовать стандартные и очевидные параметры запросов (например, ?q=, ?s=). Это является хорошей практикой, которая облегчает анализ поведения пользователей системами веб-аналитики (например, Google Analytics), которые могут использовать схожие механизмы для идентификации поисковых терминов.

Worst practices (это делать не надо)

В патенте нет информации о худших практиках для SEO.

  • Использование запутанных параметров для ключевой информации: Передача поисковых запросов через неоднозначные или зашифрованные параметры URL может затруднить автоматический анализ этих данных внешними системами аналитики.

Стратегическое значение

Стратегическое значение для органического SEO минимально. Патент подтверждает способность Google проводить глубокий анализ структуры URL в масштабах всего интернета и автоматически адаптироваться к различным реализациям сайтов. Хотя данный конкретный патент применяется в AdTech, аналогичные методы анализа URL критически важны и в Google Search для понимания структуры сайта и управления краулингом.

Практические примеры

Практических примеров применения для органического SEO нет. Ниже приведен пример работы механизма в контексте AdTech для иллюстрации изобретения.

Сценарий (AdTech): Автоматическое определение параметра запроса

  1. Анализ логов: Google анализирует логи реферальных URL с сайта Example.com:
    • http://www.example.com/search?q=cars&lang=en
    • http://www.example.com/search?q=trucks&lang=en
    • http://www.example.com/search?q=bikes&lang=en
  2. Расчет метрик:
    • Пара (example.com, q) имеет значения: "cars", "trucks", "bikes". Diversity Metric = 3.
    • Пара (example.com, lang) имеет значение: "en". Diversity Metric = 1.
  3. Применение порога: Если порог равен 2, параметр 'q' идентифицируется как параметр запроса.
  4. Генерация шаблона: Создается шаблон для извлечения значения параметра 'q' из URL example.com.
  5. Применение: Пользователь ищет "red cars" на example.com и переходит на сайт Publisher.com. Google получает реферальный URL http://www.example.com/search?q=red+cars&lang=en.
  6. Результат: Используя шаблон, Google извлекает запрос "red cars" и показывает релевантную рекламу на Publisher.com.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в органическом поиске Google?

Нет. Этот патент описывает исключительно механизмы для выбора и таргетинга рекламных объявлений (advertisements) на основе анализа реферальных URL. Он не содержит информации о факторах, влияющих на ранжирование в органическом поиске.

Что такое «Diversity Metric» (Метрика разнообразия) и как она работает?

Diversity Metric — это показатель того, насколько разнообразны значения определенного URL-параметра для данного сайта. Если параметр имеет много разных значений (высокое разнообразие), например, тысячи разных поисковых запросов, система предполагает, что он содержит пользовательский ввод. Если значений мало (низкое разнообразие), это, скорее всего, технический параметр (например, язык).

Как система определяет, что параметр содержит именно поисковый запрос?

Система делает вывод на основе статистики. Если Diversity Metric параметра превышает определенный порог, система классифицирует его как Query Parameter. Предполагается, что только пользовательский ввод может генерировать такое высокое разнообразие значений.

Применяется ли этот патент к Google Поиску или к Google Рекламе?

Он применяется к Google Рекламе, в частности к контекстно-медийной сети (Google Display Network) и системам, которые показывают рекламу на сайтах издателей (например, AdSense/Ad Manager). Он не применяется к алгоритмам органического поиска.

Должен ли я оптимизировать свои URL-параметры под этот патент?

Специально для целей SEO — нет. Однако для целей аналитики и удобства использования рекомендуется применять стандартные и понятные параметры для внутреннего поиска (например, ?q= или ?s=). Это упрощает отслеживание поведения пользователей в системах аналитики.

Может ли эта система неправильно классифицировать технический параметр как поисковый запрос?

Да, это возможно. Если технический параметр имеет высокое разнообразие значений (например, уникальный идентификатор сессии или временная метка), система может ошибочно классифицировать его как поисковый запрос, если полагаться только на Diversity Metric.

Как система определяет порог для Diversity Metric?

Патент упоминает, что порог может быть заранее определенным значением (например, 3 уникальных значения) или может определяться динамически на основе анализа сайтов, для которых уже известно, какие параметры являются поисковыми (использование известных сайтов в качестве эталона).

Работает ли этот механизм, если браузер или сайт блокирует передачу реферера?

Нет. Если URL реферера недоступен (например, из-за настроек Referrer-Policy), система не получит входных данных и не сможет извлечь информацию о предыдущих действиях пользователя. Эффективность этого метода снижается по мере ужесточения политик конфиденциальности.

Что такое «Content Management System», упомянутая в патенте?

В контексте данного патента это не CMS сайта (как WordPress), а рекламный сервер (Ad Server). Это система, которая выбирает и предоставляет Content Items (рекламу), например, часть инфраструктуры Google Ads или Google Ad Manager.

Анализирует ли система только рефереры с поисковых систем?

Нет, система спроектирована для анализа рефереров с любых веб-сайтов. Она может извлекать пользовательский ввод из URL внутреннего поиска сайтов электронной коммерции, форумов и любых других ресурсов, которые кодируют ввод пользователя в параметры URL.

Похожие патенты

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю поисковых запросов пользователя для таргетинга рекламы на сторонних сайтах (Поисковый ретаргетинг)
Патент описывает технологию Google для улучшения релевантности контекстной рекламы. Система сохраняет информацию о предыдущих поисковых запросах пользователя (например, в cookie) и использует её для выбора рекламы на последующих страницах, которые посещает пользователь, даже если эти страницы уже не содержат контекста исходного поиска.
  • US8024316B2
  • 2011-09-20
  • Персонализация

  • Поведенческие сигналы

Как Google анализирует поведение пользователей для выбора разнообразных связанных запросов и диверсификации контента на выдаче
Google использует механизм для диверсификации предложений на странице результатов (например, связанных запросов или рекламных блоков), основанный на анализе сессий пользователей. Система отбирает подсказки, которые часто следуют за исходным запросом (высокая «Utility»), но при этом редко следуют друг за другом (высокая «Diversity»). Это позволяет покрыть разные намерения пользователя, исходящие из одного неоднозначного запроса.
  • US8631030B1
  • 2014-01-14
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google анализирует страницу-источник перехода для формирования рекомендаций медиаконтента
Google анализирует контекст запроса медиаконтента (например, видео), определяя источник перехода (referral source). Система сканирует исходную страницу, чтобы найти другой контент, размещенный на ней (например, другие встроенные видео), и использует эту информацию для формирования списка рекомендаций, показываемых пользователю после просмотра.
  • US9563627B1
  • 2017-02-07
  • Семантика и интент

  • Персонализация

  • Краулинг

Популярные патенты

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)
Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.
  • US9558233B1
  • 2017-01-31
  • Ссылки

  • Поведенческие сигналы

  • Антиспам

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
  • US7617205B2
  • 2009-11-10
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph
Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).
  • US9208229B2
  • 2015-12-08
  • Knowledge Graph

  • Ссылки

  • EEAT и качество

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

seohardcore