SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует агрегированные поведенческие данные для корректировки ранжирования на основе шаблонов запросов

IDENTIFYING QUERY PATTERNS AND ASSOCIATED AGGREGATE STATISTICS AMONG SEARCH QUERIES (Идентификация шаблонов запросов и связанной агрегированной статистики среди поисковых запросов)
  • US9953185B2
  • Google LLC
  • 2015-11-24
  • 2018-04-24
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует логи поисковых запросов для выявления общих шаблонов (Query Patterns), удаляя при этом приватную информацию. Для каждого шаблона система вычисляет агрегированную статистику поведения пользователей (клики, отказы). Если будущий запрос соответствует определенному шаблону, эта статистика используется для корректировки ранжирования результатов или предложений, оптимизируя выдачу под типичное поведение пользователей для данного класса запросов.

Описание

Какую проблему решает

Патент решает задачу использования логов поисковых запросов для улучшения качества поиска (ранжирования и подсказок) при строгом соблюдении конфиденциальности пользователей. Анализ логов, особенно из приватных систем (таких как электронная почта или хранилище документов), содержит ценные поведенческие данные, но также и конфиденциальную информацию (имена, номера счетов). Изобретение предлагает метод агрегации и анонимизации этих данных для их безопасного использования.

Что запатентовано

Запатентована система для анализа логов поисковых запросов и связанной с ними активности после поиска (post-search activity) с целью генерации Query Patterns (шаблонов запросов) без раскрытия конфиденциальной информации. Система идентифицирует часто встречающиеся n-граммы (считающиеся «неприватными») и использует их для создания обобщенных шаблонов, заменяя редкие или приватные n-граммы подстановочными знаками (wildcards). Для каждого шаблона вычисляется агрегированная статистика поисковой активности (ASAS).

Как это работает

Система работает в несколько этапов:

  • Фильтрация конфиденциальности: Анализируется лог запросов для выявления n-грамм, которые встречаются достаточно часто, чтобы удовлетворить Privacy Criterion (критерий конфиденциальности).
  • Генерация шаблонов: Создаются Query Patterns, состоящие из этих частых n-грамм. Редкие (приватные) n-граммы заменяются wildcards (например, "резюме *").
  • Расчет статистики: Для каждого шаблона агрегируется статистика поведения пользователей (например, Click Rate, Abandonment Rate) по всем запросам, соответствующим этому шаблону.
  • Применение: Когда поступает новый запрос, соответствующий определенному шаблону, система использует его ASAS для изменения методологии ранжирования или представления результатов, если статистика удовлетворяет Performance Criterion.

Актуальность для SEO

Высокая. Использование агрегированных поведенческих данных при одновременном решении проблем конфиденциальности является центральным элементом современных поисковых систем. Этот патент предоставляет конкретную инфраструктуру для корректировки ранжирования на основе шаблонов запросов, что критически важно для понимания намерений пользователя в масштабе и улучшения качества поиска.

Важность для SEO

Патент имеет высокое значение (85/100). Хотя он сфокусирован на приватных логах поиска (например, Gmail, Google Drive), описанная методология применима и к публичному веб-поиску. Он подчеркивает переход от анализа отдельных ключевых слов к пониманию Query Patterns. Если целевые запросы сайта попадают в шаблон, где пользователи последовательно демонстрируют определенное поведение (например, предпочитают свежесть или определенный тип контента), логика ранжирования адаптируется на основе этих агрегированных данных, потенциально перекрывая традиционные сигналы релевантности.

Детальный разбор

Термины и определения

Abandonment Rate (Показатель отказов)
Частота, с которой пользователи не совершают кликов после отправки запросов, соответствующих данному шаблону. Ключевая метрика для оценки неудовлетворенности.
Aggregate Search Activity Statistics (ASAS) (Агрегированная статистика поисковой активности)
Статистика, собранная по всем поисковым запросам в логе, которые соответствуют определенному Query Pattern. Включает агрегированную post-search activity.
Click Position Statistics (Статистика позиций кликов)
Агрегированные данные о том, на какие элементы пользователи нажимали после отправки запросов, соответствующих шаблону (например, позиция веб-результата, подсказка, вертикальный блок).
Non-private N-grams (Неприватные N-граммы)
N-граммы (слова или фразы), которые удовлетворяют Privacy Criterion (например, встречаются в логе достаточно часто) и считаются безопасными для использования в шаблонах.
Performance Criterion (Критерий производительности)
Пороговое значение, применяемое к ASAS. Если критерий удовлетворен (например, Abandonment Rate превышает порог), это инициирует изменение методологии ранжирования или представления.
Post-Search Activity (Активность после поиска)
Действия пользователя после отправки запроса и получения результатов. Включает клики на результаты (и их ранг), отсутствие кликов (отказ) или клики на другие элементы интерфейса.
Privacy Criterion (Критерий конфиденциальности)
Условие, используемое для определения, является ли n-грамма приватной. Основано на частоте встречаемости n-граммы в логе (порог частоты или минимальное количество раз/пользователей).
Query Patterns (Шаблоны запросов)
Обобщенные представления групп запросов. Генерируются на основе Non-private N-grams, часто включают подстановочные знаки (Wildcards) вместо приватной информации. Пример: "[Название продукта] обзор *".
Wildcards (Подстановочные знаки)
Символы (например, *), используемые в Query Patterns для замены приватных n-грамм, которые не удовлетворяют Privacy Criterion.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод анализа логов и применения результатов для ранжирования.

  1. Система анализирует лог приватных поисковых запросов и post-search activity.
  2. Идентифицируются неприватные n-граммы (удовлетворяющие Privacy Criterion) и приватные n-граммы.
  3. Генерируются Query Patterns на основе неприватных n-грамм. Приватные n-граммы заменяются на Wildcards.
  4. Для каждого шаблона вычисляется ASAS, основанная на всех различных запросах, соответствующих этому шаблону.
  5. Определяется, что ASAS для данного шаблона удовлетворяет Performance Criterion.
  6. При получении нового поискового запроса:
  7. ЕСЛИ новый запрос соответствует данному шаблону И Performance Criterion был удовлетворен, ТО ранжирование поисковых подсказок или результатов для нового запроса основывается, по крайней мере частично, на ASAS этого шаблона.
  8. Ранжированные подсказки или результаты предоставляются пользователю.

Ядро изобретения — процесс генерации анонимизированных шаблонов запросов из логов и использование агрегированной поведенческой статистики этих шаблонов для динамической корректировки ранжирования будущих результатов или подсказок.

Claim 2 и 3 (Зависимые): Уточняют Privacy Criterion. Он удовлетворяется, если n-граммы встречаются в логе с частотой, удовлетворяющей пороговому значению (Claim 2), или встречаются минимальное количество раз (Claim 3).

Claim 7-10 (Зависимые): Детализируют состав ASAS. Он включает агрегированную статистику post-search activity (Claim 7), Click Position Statistics (Claim 8), частоту кликов (Click Rate) (Claim 9) или Abandonment Rate (Claim 10).

Claim 11 (Зависимый от 10): Уточняет Performance Criterion. Он может быть удовлетворен, если Abandonment Rate удовлетворяет минимальному порогу (т.е. слишком высок).

Где и как применяется

Изобретение затрагивает этапы понимания запросов (в режиме офлайн-анализа) и ранжирования (в режиме реального времени).

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основная часть обработки происходит здесь. Query Analysis Engine работает в фоновом режиме, анализируя Search Log.

  • Взаимодействие: Компоненты Privacy Engine, Query Pattern Generation Engine и Query Pattern Statistics Engine обрабатывают логи для генерации базы данных Query Patterns и связанных с ними ASAS.
  • Входные данные: Лог поисковых запросов и соответствующая post-search activity.
  • Выходные данные: База данных, содержащая соответствия между Query Patterns и их ASAS.

RANKING / RERANKING – Ранжирование и Переранжирование (Реальное время)
Применение результатов анализа происходит на этом этапе.

  • Взаимодействие: Когда поступает новый запрос, система проверяет его на соответствие существующим Query Patterns. Если найдено соответствие и удовлетворен Performance Criterion, Ranking Engine и Presentation Engine используют связанную ASAS для изменения методологии генерации данных.
  • Входные данные: Новый поисковый запрос; База данных Query Patterns и ASAS.
  • Выходные данные: Ранжированные поисковые результаты или поисковые подсказки, скорректированные на основе ASAS соответствующего шаблона.

На что влияет

  • Специфические запросы: Влияет на запросы, которые можно сгруппировать в общие шаблоны на основе часто встречающихся терминов (например, "[Название продукта] обзор", "[Название города] погода").
  • Типы контента и форматы: Может влиять на то, какие типы контента или элементы интерфейса показываются. Например, если Click Position Statistics показывают, что для шаблона пользователи предпочитают видео, система может повысить ранжирование видеоконтента.
  • Ниши и тематики: Особенно актуально в нишах с четко выраженными повторяющимися интентами и структурами запросов. Хотя патент мотивирован приватным поиском (Email, Documents), методология применима и к веб-поиску.

Когда применяется

  • Условия работы алгоритма (Офлайн): Алгоритм генерации шаблонов применяется к логам поиска периодически или непрерывно в фоновом режиме.
  • Триггеры активации (Реальное время): Корректировка ранжирования активируется при выполнении двух условий:
    1. Поступивший запрос соответствует существующему Query Pattern.
    2. Агрегированная статистика (ASAS) этого шаблона удовлетворяет определенному Performance Criterion (например, высокий показатель отказов или специфическое поведение кликов).

Пошаговый алгоритм

Процесс разделен на две основные фазы: Офлайн-анализ логов и Применение в реальном времени.

Фаза А: Офлайн-анализ и генерация шаблонов

  1. Сбор данных: Система получает доступ к Search Log, содержащему поисковые запросы и post-search activity.
  2. Идентификация неприватного контента (Privacy Engine): Лог анализируется для идентификации n-грамм. Применяется Privacy Criterion (например, порог частоты). N-граммы, удовлетворяющие критерию, помечаются как неприватные.
  3. Генерация шаблонов (Query Pattern Generation Engine): На основе неприватных n-грамм генерируются Query Patterns. Контент запроса, который не соответствует неприватным n-граммам (т.е. приватный контент), заменяется Wildcards.
  4. Вычисление статистики (Query Pattern Statistics Engine): Для каждого сгенерированного шаблона система определяет все соответствующие ему запросы в логе. Затем вычисляется ASAS (включая Click Position Statistics, Abandonment Rate и т.д.).
  5. Хранение: Сгенерированные шаблоны и их ASAS сохраняются в базе данных.

Фаза Б: Применение в реальном времени

  1. Получение запроса: Система получает новый поисковый запрос от пользователя.
  2. Сопоставление с шаблоном: Система проверяет, соответствует ли новый запрос какому-либо из сохраненных Query Patterns.
  3. Проверка критерия производительности: Система определяет, удовлетворяет ли ASAS соответствующего шаблона установленному Performance Criterion.
  4. Изменение методологии: Если условия выполнены, система изменяет методологию генерации данных (ранжирования или представления). Примеры изменений:
    • Корректировка ранжирования результатов (например, повышение веса свежести, если ASAS показывает предпочтение недавним результатам для этого шаблона).
    • Корректировка ранжирования поисковых подсказок.
    • Предложение альтернативных запросов или исправлений (если ASAS показывает высокий Abandonment Rate для этого шаблона).
    • Изменение представления элементов интерфейса (например, выделение определенных блоков).
  5. Предоставление результатов: Скорректированные результаты или подсказки предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных из Search Log.

  • Контентные факторы: Полный текст поисковых запросов (n-граммы). Используется для идентификации неприватных n-грамм и генерации Query Patterns.
  • Поведенческие факторы: Это ключевые данные для расчета ASAS.
    • Post-search activity: Ранг результата, на который кликнул пользователь.
    • Индикация отказа (Abandonment): Отсутствие кликов после отправки запроса.
    • Клики на другие элементы: Клики на поисковые подсказки, вертикальные блоки (Картинки, Новости), рекламные объявления или информационные блоки.
  • Пользовательские факторы: Идентификаторы пользователей (могут использоваться для расчета частоты n-грамм по уникальным пользователям для Privacy Criterion, но сами идентификаторы не сохраняются в шаблонах).

Какие метрики используются и как они считаются

  • Privacy Criterion (Метрики конфиденциальности):
    • Порог частоты (Frequency Threshold): Минимальная частота, с которой n-грамма должна появляться в логе, чтобы считаться неприватной.
    • Минимальное количество (Minimum Number): Минимальное количество раз или уникальных пользователей, которое n-грамма должна иметь в логе.
  • Aggregate Search Activity Statistics (ASAS) (Метрики поведения):
    • Click Rate (Частота кликов): Процент запросов, соответствующих шаблону, которые привели к клику.
    • Abandonment Rate (Показатель отказов): Процент запросов, соответствующих шаблону, которые не привели к клику.
    • Click Position Statistics: Распределение кликов по различным позициям результатов или типам элементов интерфейса.
    • Mean Reciprocal Rank (MRR): (Упоминается в описании). Средняя величина, обратная рангу первого релевантного результата.
  • Performance Criterion (Пороги производительности): Пороги, применяемые к метрикам ASAS (например, Abandonment Rate > X%) для активации изменения методологии ранжирования.

Выводы

  1. Ранжирование на основе шаблонов (Pattern-Based Ranking): Патент описывает механизм, позволяющий Google корректировать логику ранжирования не на основе отдельного запроса, а на основе Query Pattern, которому этот запрос соответствует. Система использует агрегированные поведенческие данные, специфичные для этого класса запросов.
  2. Агрегированные поведенческие данные как сигналы ранжирования: Агрегированная статистика (ASAS), такая как Click Position Statistics, частота кликов и Abandonment Rate для определенного шаблона, напрямую влияет на ранжирование и представление результатов для будущих запросов, соответствующих этому шаблону.
  3. Динамическая адаптация весов сигналов: Методология ранжирования может быть изменена для конкретного шаблона. Например, если агрегированные данные показывают, что пользователи предпочитают самые свежие результаты для шаблона "* новости", система может увеличить вес сигнала свежести для всех запросов этого класса.
  4. Механизм защиты конфиденциальности при анализе поведения: Система фильтрует редкие (потенциально приватные) n-граммы, полагаясь только на часто встречающиеся термины и Wildcards. Это демонстрирует, как поведенческие данные могут использоваться в масштабе с применением техник анонимизации.
  5. Использование "Негативных" сигналов для улучшения: Высокий Abandonment Rate для шаблона используется как триггер для улучшения качества выдачи, например, путем инициирования более агрессивных поисковых подсказок или исправлений (даже для словарных слов, если они не соответствуют интенту).

Практика

Best practices (это мы делаем)

  • Анализ интента на уровне шаблонов запросов (Кластеров): Необходимо анализировать, как пользователи взаимодействуют с SERP для целых категорий или шаблонов запросов, а не только для отдельных ключевых слов. Если пользователи постоянно ищут свежесть для определенного шаблона (например, "обновления [тема] *"), приоритет в контент-стратегии должен отдаваться свежести.
  • Оптимизация под удовлетворенность пользователя (User Satisfaction): Высокие показатели отказов (Abandonment Rate) на уровне шаблона могут привести к изменениям в ранжировании. Критически важно убедиться, что контент четко удовлетворяет интент, связанный с шаблоном, чтобы минимизировать отказы (включая возврат к выдаче / pogo-sticking) и сигнализировать о положительном пользовательском опыте.
  • Мониторинг поведения в разрезе кластеров/шаблонов: Отслеживайте метрики производительности (CTR, поведение на сайте) по группам схожих запросов (шаблонам). Это поможет понять, как агрегированные данные могут влиять на ранжирование в вашей нише.
  • Адаптация контент-стратегии под поведение в SERP: Используйте данные о том, какие типы результатов предпочитают пользователи для разных шаблонов (на основе Click Position Statistics). Если для информационных шаблонов пользователи предпочитают быстрые ответы, оптимизируйте под Featured Snippets. Если для коммерческих – карточки товаров или видеообзоры.
  • Семантическое покрытие: Патент упоминает группировку семантически схожих запросов (например, "resume" и "CV"). Используйте синонимы и широкий семантический охват темы для соответствия различным формулировкам в рамках одного шаблона интента.

Worst practices (это делать не надо)

  • Игнорирование широкого шаблона запроса: Фокусироваться исключительно на оптимизации под точное соответствие ключевому слову, игнорируя более широкий шаблон или категорию. Логика ранжирования может определяться агрегированным поведением всего шаблона.
  • Публикация "вечнозеленого" контента для быстро меняющихся шаблонов: Полагаться на статический контент в нишах, где шаблоны запросов демонстрируют явное предпочтение свежести. Если агрегированные данные показывают, что пользователи ищут актуальную информацию, устаревший контент может быть понижен.
  • Использование Clickbait: Использование заголовков, которые вводят в заблуждение и приводят к высокому Abandonment Rate. Если такое поведение будет зафиксировано на агрегированном уровне (в ASAS) для определенного шаблона, это может привести к пессимизации.

Стратегическое значение

Патент подтверждает критическую важность поведенческих данных в агрегированной форме. Он показывает техническую реализацию использования этих данных как фактора ранжирования без необходимости отслеживания отдельных пользователей (решая проблему "privacy wall"). SEO-стратегии должны учитывать, как Google обобщает поведение пользователей по схожим запросам (шаблонам). Это также подчеркивает способность Google применять различные модели ранжирования к разным классам запросов на основе наблюдаемого поведения пользователей.

Практические примеры

Сценарий 1: Корректировка ранжирования на основе предпочтения свежести

  1. Офлайн-анализ (Google): Google анализирует логи и идентифицирует шаблон "[Название события] билеты *". Система вычисляет ASAS и обнаруживает, что для этого шаблона пользователи overwhelmingly кликают на результаты, обновленные в течение последних 24 часов.
  2. Performance Criterion: Срабатывает критерий, указывающий на сильное предпочтение свежести для этого шаблона.
  3. Применение в реальном времени: Пользователь вводит запрос "Концерт Metallica билеты Москва".
  4. Изменение методологии: Система распознает соответствие шаблону. Ranking Engine изменяет методологию, значительно увеличивая вес сигнала свежести при ранжировании результатов.
  5. Результат для SEO: Страницы с самой актуальной информацией о наличии билетов ранжируются выше, даже если они имеют меньше ссылок, чем более старые, авторитетные страницы.

Сценарий 2: Генерация подсказок из-за высокого показателя отказов (Пример из патента)

  1. Офлайн-анализ (Google): Система идентифицирует шаблон "no replay *" (с опечаткой) в логах поиска по электронной почте. ASAS показывает чрезвычайно высокий Abandonment Rate (95%). Система также идентифицирует похожий шаблон "no reply *", у которого Abandonment Rate низкий (10%).
  2. Performance Criterion: Срабатывает критерий высокого показателя отказов для шаблона "no replay *".
  3. Применение в реальном времени: Пользователь вводит запрос "no replay important".
  4. Изменение методологии: Система распознает соответствие низкопроизводительному шаблону. Presentation Engine изменяет методологию представления, генерируя подсказку или исправление.
  5. Результат: Пользователю показывается блок "Возможно, вы имели в виду: no reply important", несмотря на то, что "replay" является существующим словом (т.е. стандартный спеллчекер мог бы пропустить это).

Вопросы и ответы

Что такое "Query Pattern" в контексте этого патента и чем он отличается от ключевого слова?

Query Pattern (шаблон запроса) — это обобщенное представление группы схожих поисковых запросов. В отличие от фиксированного ключевого слова, шаблон часто содержит подстановочные знаки (Wildcards), заменяющие переменные части запроса. Например, "обзор * 2025" является шаблоном, которому соответствуют запросы "обзор iphone 2025" и "обзор samsung 2025". Google анализирует поведение пользователей на уровне этого шаблона, а не только по отдельным запросам.

Как Google определяет, какие части запроса являются "приватными", а какие нет?

Патент использует Privacy Criterion, основанный на частоте встречаемости n-грамм в логах поиска. Если n-грамма встречается часто (выше установленного порога или у достаточного количества пользователей), она считается неприватной и может быть включена в шаблон. Если n-грамма редкая (например, имя человека или номер счета), она считается приватной и заменяется подстановочным знаком в шаблоне.

Какое значение этот патент имеет для SEO, если он фокусируется на приватных логах (почта, документы)?

Хотя примеры в патенте касаются приватных систем (Gmail, Google Drive), описанная методология — генерация шаблонов запросов и использование агрегированных поведенческих данных для корректировки ранжирования — является фундаментальной и переносимой на публичный веб-поиск. Этот патент дает представление о том, как Google может использовать поведенческие данные в масштабе, группируя запросы и применяя к ним специфическую логику ранжирования, соблюдая при этом принципы анонимизации данных.

Что такое "Aggregate Search Activity Statistics" (ASAS) и как они влияют на ранжирование?

ASAS — это набор метрик, агрегированных для всех запросов, соответствующих определенному шаблону. Он включает частоту кликов, показатель отказов (Abandonment Rate) и статистику позиций кликов (Click Position Statistics). Если ASAS удовлетворяет Performance Criterion (например, показывает специфическое поведение пользователей или низкое качество выдачи), система может изменить методологию ранжирования для будущих запросов, соответствующих этому шаблону.

Может ли этот механизм изменить вес сигналов ранжирования для моих запросов?

Да. Если ваши целевые запросы попадают в определенный Query Pattern, и агрегированные данные (ASAS) показывают, что для этого шаблона пользователи ведут себя определенным образом, система может скорректировать веса сигналов. Например, если для шаблона "рецепт *" пользователи предпочитают видео, система может повысить вес видеоконтента при ранжировании всех запросов, соответствующих этому шаблону.

Что означает, если у шаблона высокий "Abandonment Rate"?

Высокий Abandonment Rate (показатель отказов) означает, что пользователи часто отправляют запросы, соответствующие этому шаблону, но не кликают ни на один из результатов. Это сигнализирует о низком качестве выдачи или о проблеме с самим шаблоном запроса (например, частая опечатка). В ответ система может инициировать изменения, такие как предложение альтернативных запросов, исправлений или изменение способа ранжирования результатов.

Как SEO-специалисту адаптироваться к ранжированию на основе шаблонов?

Необходимо перейти от анализа отдельных ключевых слов к анализу кластеров или шаблонов запросов. Определите основные шаблоны в вашей нише и проанализируйте, какой тип контента, формат или характеристики (например, свежесть, детализация) предпочитают пользователи для каждого шаблона. Оптимизация должна быть направлена на удовлетворение интента на уровне шаблона, обеспечивая хорошие поведенческие сигналы.

Что такое "Click Position Statistics" и что они показывают?

Click Position Statistics показывают, на какие элементы интерфейса пользователи чаще всего кликают для данного шаблона запроса. Это может включать не только позиции стандартных результатов поиска, но и клики на рекламные блоки, поисковые подсказки, элементы Knowledge Graph или вертикальные блоки (Картинки, Новости). Эти данные позволяют системе понять, какой тип информации наиболее востребован для данного шаблона, и скорректировать выдачу.

Как система использует эти данные для тестирования новых алгоритмов?

В описании патента упоминается, что этот механизм может использоваться для сравнения производительности экспериментальных и текущих алгоритмов. Анализируя, как меняется ASAS (например, MRR, частота кликов) для конкретных Query Patterns при внедрении нового алгоритма, Google может точно определить, какие типы запросов улучшились, а какие ухудшились, что помогает в отладке и оптимизации алгоритмов.

Влияет ли этот патент на генерацию поисковых подсказок (Query Suggestions)?

Да, Claim 1 прямо указывает, что система может использовать ASAS для ранжирования поисковых подсказок. Если определенный шаблон имеет низкую производительность (например, высокий Abandonment Rate), система может предложить подсказки, основанные на похожих, но более высокопроизводительных шаблонах, например, для исправления распространенных опечаток или переформулирования запроса.

Похожие патенты

Как Google использует агрегированные поведенческие данные для маркировки результатов поиска и подсказок индикаторами ожидаемых действий
Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет к нему визуальный индикатор (значок или бейдж), чтобы помочь другим пользователям понять вероятный исход клика.
  • US11132406B2
  • 2021-09-28
  • Поведенческие сигналы

  • SERP

Как Google использует историю запросов в сессии для эффективного распознавания фраз (N-грамм) и понимания уточнений пользователя
Google оптимизирует процесс распознавания фраз (N-грамм) в запросе, анализируя предыдущий запрос пользователя в той же сессии. Если пользователь уточняет запрос, добавляя новые слова, система исключает эти новые слова из анализа N-грамм в сочетании со старыми терминами. Это повышает эффективность и позволяет точнее понять, какие слова являются единым понятием, а какие — дополнительными уточнениями.
  • US8359326B1
  • 2013-01-22
  • Семантика и интент

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует логи поисковых запросов для поиска похожих сайтов и генерации лидов для рекламодателей
Google использует систему для поиска сайтов, похожих на заданный "примерный ресурс". Система анализирует логи поисковых запросов, чтобы определить, по каким запросам пользователи находили этот ресурс, а затем находит другие сайты, которые также появлялись в выдаче по этим же запросам. Это позволяет генерировать списки потенциальных клиентов (лидов) или площадок для рекламодателей.
  • US8612459B1
  • 2013-12-17
  • Поведенческие сигналы

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Популярные патенты

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи
Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.
  • US8825639B2
  • 2014-09-02
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео
Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.
  • US8903812B1
  • 2014-12-02
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore