SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией

ADJUSTING RANKING OF SEARCH RESULTS BASED ON UTILITY (Корректировка ранжирования результатов поиска на основе полезности)
  • US9223897B1
  • Google LLC
  • 2011-05-26
  • 2015-12-29
  • Поведенческие сигналы
  • Индексация
  • Техническое SEO
  • Краулинг
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.

Описание

Какую проблему решает

Патент решает проблему неоптимального ранжирования и сложности объективной оценки эффективности документа из-за позиционного смещения (position bias). Основная задача — интегрировать поведенческие сигналы в ранжирование, нейтрализовав влияние позиции документа в выдаче. Изобретение предлагает механизм корректировки рейтинга путем сравнения ожидаемого и фактического взаимодействия пользователя с документом.

Что запатентовано

Запатентована система для вычисления Correction Factor (коэффициента корректировки) для документов. Этот коэффициент основан на соотношении фактической полезности документа (Actual Utility Rate) и его ожидаемой полезности (Expected Utility Rate). Ожидаемая полезность нормализуется с использованием Rank Position Map. Важно, что Correction Factor используется не только для корректировки Ranking Score, но и для влияния на решения о сканировании (Crawl Score) и индексации (Index Score).

Как это работает

Система работает следующим образом:

  • Сбор данных: Отслеживаются показы (Search Events) на конкретных позициях и взаимодействия (Utilization Events).
  • Расчет ожидаемой полезности (EUR): Используется Rank Position Map, определяющая среднюю полезность для каждой позиции. Вычисляется средневзвешенная ожидаемая полезность документа на основе истории его показов.
  • Расчет фактической полезности (AUR): Анализируются только "хорошие" взаимодействия (Good Utilization Events) — например, клики с достаточным временем пребывания (Dwell Time), которые не приводят к быстрому возврату в выдачу (pogo-sticking).
  • Временной учет: Для EUR и AUR используется затухающее среднее (Decaying Average), придавая больший вес недавним данным.
  • Вычисление Correction Factor: Рассчитывается как соотношение среднего AUR к среднему EUR.
  • Учет достоверности и агрегация: Фактор корректируется на основе уровня достоверности (Confidence Level). При недостатке данных используются агрегированные данные по группе документов (например, по домену).
  • Применение: Скорректированный фактор применяется для изменения Ranking Score, Crawl Score или Index Score.

Актуальность для SEO

Высокая. Использование поведенческих сигналов и метрик удовлетворенности пользователей является фундаментальным аспектом современных поисковых систем. Принципы нормализации данных по позиции, использование затухающего среднего для учета свежести сигналов и дифференциация между "хорошими" и "плохими" кликами остаются критически важными концепциями в Information Retrieval и практике поиска.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO. Он напрямую связывает удовлетворенность пользователя (а не просто CTR) с корректировками ранжирования. Он подчеркивает необходимость создания контента, который полностью удовлетворяет интент и предотвращает возврат пользователя обратно в SERP. Кроме того, патент явно указывает, что низкая полезность может привести к снижению краулингового бюджета или исключению из индекса.

Детальный разбор

Термины и определения

Actual Utility Rate (Фактический уровень полезности)
Метрика, отражающая реальную эффективность документа. Рассчитывается как отношение количества Good Utilization Events к общему количеству Search Events (показов).
Aggregated Correction Factor (Агрегированный коэффициент корректировки)
Correction Factor, рассчитанный для набора связанных документов (например, одного домена, тематики, автора). Используется, если индивидуальные данные документа слишком разрежены (низкий Confidence Level).
Confidence Level (Уровень достоверности)
Мера надежности рассчитанного Correction Factor. Зависит от объема собранных данных (например, общего количества Search Events или времени нахождения документа в индексе).
Correction Factor (Коэффициент корректировки)
Ключевая метрика патента. Рассчитывается как отношение Decaying Average Actual Utility Rate к Decaying Average Expected Utility Rate. Используется для корректировки различных оценок документа.
Crawl Score (Оценка сканирования)
Метрика, используемая краулером для определения приоритетности и необходимости сканирования документа. Может корректироваться с помощью Correction Factor (Claim 13).
Decay Constant (Константа затухания)
Параметр (D), используемый при расчете Decaying Average. Определяет вес свежих данных по отношению к историческим. Может отличаться для разных типов контента (например, новости vs статьи).
Decaying Average (Затухающее среднее / Скользящее среднее с затуханием)
Метод расчета среднего значения, при котором недавние события имеют больший вес, чем старые.
Expected Utility Rate (Ожидаемый уровень полезности)
Метрика, предсказывающая, насколько эффективным должен быть документ, исходя из того, на каких позициях он показывался. Рассчитывается с использованием Rank Position Map.
Good Utilization Event (Событие хорошего использования)
Качественное взаимодействие пользователя. Определяется как клик, после которого пользователь провел на документе не менее определенного времени (Dwell Time) И затем совершил действие, не связанное с исходным запросом (Claim 11).
Index Score (Оценка индексации)
Метрика, используемая индексером для определения, следует ли включать документ в индекс или сохранять его там. Может корректироваться с помощью Correction Factor (Claim 12).
Rank Position Map (Карта позиций ранжирования)
Структура данных, определяющая ожидаемую полезность (например, средний CTR) для каждой позиции в результатах поиска. Может быть разной для разных языков, типов документов или типов запросов.
Search Event (Событие поиска)
Показ документа в наборе результатов поиска на определенной позиции (импрешн).
Utilization Event (Событие использования)
Взаимодействие пользователя с документом в результатах поиска (например, клик по ссылке).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод корректировки ранжирования с включением механизма агрегации.

  1. Система получает Rank Position Map.
  2. Определяется Expected Utility Rate (EUR) для документа на основе карты и истории показов документа на разных позициях.
  3. Определяется Actual Utility Rate (AUR) на основе фактических выборов и общего количества показов.
  4. Вычисляется Correction Factor (на основе AUR и EUR).
  5. Определяется Confidence Level для этого фактора, и фактор корректируется на его основе.
  6. Механизм агрегации: Если Confidence Level ниже порога (aggregation threshold), выбирается набор связанных документов.
  7. Вычисляется Aggregated Correction Factor для набора.
  8. Этот агрегированный фактор используется вместо индивидуального для данного документа.
  9. Оценка (Score) документа корректируется на основе итогового Correction Factor.
  10. Предоставляется список результатов, ранжированный на основе скорректированных оценок.

Claim 2 и 3 (Зависимые): Уточняют расчет полезности.

Определяется Decaying Average (затухающее среднее) как для Expected Utility Rate (Claim 2), так и для Actual Utility Rate (Claim 3), используя константу затухания (Decay Constant). Correction Factor рассчитывается на основе этих затухающих средних, приоритизируя свежие данные.

Claim 10 и 11 (Зависимые): Определяют качество взаимодействий.

Система использует только события определенного типа (Good Utilization Event) для расчета Actual Utility Rate. Claim 11 определяет критерии: (i) доступ к документу в течение как минимум определенного количества времени (Dwell Time), И (ii) последующее действие пользователя, не связанное с исходным поисковым запросом. Это механизм фильтрации pogo-sticking.

Claim 12 и 13 (Зависимые): Расширяют применение фактора.

Correction Factor применяется для корректировки Index Score (решение об индексации — Claim 12) и Crawl Score (решение о сканировании — Claim 13).

Где и как применяется

Изобретение охватывает несколько ключевых этапов поисковой архитектуры, связывая поведенческие данные с основными процессами.

CRAWLING – Сканирование и Сбор данных
Механизм используется для управления краулинговым бюджетом. Correction Factor применяется к Crawl Score документа (Claim 13). Документы с низкой полезностью могут получать более низкий приоритет сканирования.

INDEXING – Индексирование и извлечение признаков
Механизм используется для принятия решения о включении документа в индекс. Correction Factor применяется к Index Score (Claim 12). Если скорректированная оценка ниже порога (indexing threshold), документ может быть не проиндексирован или удален из индекса.

RANKING / RERANKING – Ранжирование и Переранжирование
Основной этап применения патента. Ranking Scores, полученные на этапе RANKING, корректируются с использованием Correction Factor (индивидуального или агрегированного, скорректированного по Confidence Level). Происходит финальное переранжирование списка документов.

Входные данные:

  • Логи показов (Search Events) с указанием позиций ранжирования.
  • Логи взаимодействий (Utilization Events), включая данные о времени доступа (Dwell Time) и последующих действиях пользователя.
  • Rank Position Map.
  • Начальные оценки документа (Ranking Score, Crawl Score, Index Score).

Выходные данные:

  • Скорректированные оценки (Adjusted Scores).
  • Переранжированный список результатов поиска.
  • Решения о приоритете сканирования и индексации.

На что влияет

  • Конкретные типы контента и запросы: Влияет на все типы, но патент упоминает, что Rank Position Map и константы затухания (Decay Constants) могут различаться в зависимости от контекста: языка, типа документа (например, новости более чувствительны ко времени, чем описания продуктов) или типа запроса (например, коммерческие, медицинские запросы).
  • Длиннохвостые запросы и новые страницы: Влияет на них через механизм агрегации. Даже если у страницы мало собственных данных, она может быть скорректирована на основе общей производительности сайта (домена) или тематического раздела.

Когда применяется

  • Частота применения: Расчет Correction Factor может происходить офлайн (в пакетном режиме) на основе данных за определенный период. Применение фактора к Ranking Score происходит онлайн при ответе на запрос.
  • Триггеры активации (Агрегация): Механизм агрегации активируется (FIG. 8), когда Confidence Level для индивидуального Correction Factor документа ниже установленного порога (first aggregation threshold). Агрегированный фактор применяется, если он превышает второй порог значимости (second aggregation threshold).

Пошаговый алгоритм

Процесс А: Расчет Correction Factor (FIG. 7) (Офлайн/Пакетный режим)

  1. Сбор данных (Search Events): Запись количества показов документа на каждой позиции ранжирования за период времени.
  2. Расчет Expected Utility Rate (EUR): Вычисление ожидаемой полезности по формуле (взвешенное среднее), используя Rank Position Map (Equation 1):

    EUR=∑(EURRX∗SERX)SETOTALEUR = \frac{\sum(EUR\_{RX}*SE\_{RX})}{SE\_{TOTAL}}

    (где EUR – ожидаемая полезность на позиции X, SE – количество показов на позиции X).
  3. Сбор данных (Utilization Events): Запись общего количества взаимодействий за период.
  4. Фильтрация взаимодействий: Отбор только Good Utilization Events. Проверка критериев: минимальное время доступа (Dwell Time) И последующее несвязанное действие.
  5. Расчет Actual Utility Rate (AUR): (Количество Good Utilization Events) / (Общее количество Search Events).
  6. Расчет затухающего среднего (Decaying Average): Применение формулы затухания к EUR и AUR для приоритизации недавних данных (Equation 2):

    URDECAY=URAVGD+D−1D∗URAVG−1UR\_{DECAY} = \frac{UR\_{AVG}}{D} + \frac{D-1}{D}*UR\_{AVG-1}

    (где D – константа затухания).
  7. Вычисление Correction Factor: (Decaying Average AUR) / (Decaying Average EUR).
  8. Расчет Confidence Level и Агрегация (FIG. 8): Оценка достоверности. Если Confidence Level низкий, вычисление и использование Aggregated Correction Factor.

Процесс Б: Применение Correction Factor (Онлайн/Офлайн)

  1. Корректировка фактора: Correction Factor (индивидуальный или агрегированный) корректируется на основе Confidence Level.
  2. Применение к оценкам:
    1. Ранжирование (Онлайн, FIG. 6): Adjusted Ranking Score = Ranking Score * Adjusted Correction Factor. Документы переранжируются.
    2. Индексация (Офлайн, FIG. 9A): Adjusted Index Score = Index Score * Adjusted Correction Factor. Сравнение с порогом индексации.
    3. Сканирование (Офлайн, FIG. 9B): Adjusted Crawl Score = Crawl Score * Adjusted Correction Factor. Сравнение с порогом сканирования.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих и временных данных для корректировки оценок.

  • Поведенческие факторы:
    • Search Events: Показы документа с обязательной фиксацией позиции ранжирования.
    • Utilization Events: Взаимодействия (клики, выборы).
    • Время доступа (Dwell Time): Время, проведенное пользователем на документе после клика. Критично для определения Good Utilization Event.
    • Последующие действия пользователя: Активность после доступа к документу (возврат в SERP, новый запрос, закрытие сессии). Критично для определения Good Utilization Event.
  • Временные факторы:
    • Временные метки событий: Используются для расчета Decaying Average.
    • Время нахождения в индексе: Может использоваться для расчета Confidence Level.
  • Структурные/Системные факторы:
    • Принадлежность к группе: Домен, сайт, категория, тип контента, автор (используется для агрегации).
    • Rank Position Map: Глобальные данные о полезности по позициям (могут зависеть от языка, типа документа, типа запроса).
    • Decay Constant: Системная переменная для расчета затухания (может зависеть от типа документа).

Какие метрики используются и как они считаются

  • Expected Utility Rate (EUR): Ожидаемая полезность, нормализованная по позиции. Рассчитывается как средневзвешенное значение ожидаемых полезностей из Rank Position Map на основе истории показов документа (Формула 1).
  • Actual Utility Rate (AUR): Фактическая полезность. Рассчитывается как доля Good Utilization Events от общего числа Search Events.
  • Decaying Average: Затухающее среднее для EUR и AUR, придающее больший вес недавним данным (Формула 2).
  • Correction Factor: Основная метрика корректировки. Рассчитывается как отношение затухающего среднего AUR к затухающему среднему EUR.
  • Confidence Level: Метрика статистической значимости Correction Factor. Упоминается расчет на основе распределения Пуассона и нормализация к значению от 0 до 1.

Выводы

  1. Нормализация по позиции критически важна (Position Bias Mitigation): Система оценивает производительность документа относительно ожиданий для той позиции, на которой он был показан. Недостаточно иметь высокий raw CTR; необходимо превосходить ожидания (Expected Utility Rate) для своей позиции.
  2. Удовлетворенность пользователя (Satisfaction) важнее кликов (Clicks): Ключевым элементом является концепция Good Utilization Event. Патент явно определяет это как взаимодействие, включающее достаточное время пребывания на странице (Dwell Time) И последующее действие, не связанное с запросом. Это прямой механизм борьбы с pogo-sticking и кликбейтом.
  3. Приоритет недавней производительности: Использование Decaying Average означает, что система адаптируется к изменениям в качестве контента или поведении пользователей, придавая больший вес недавним данным. Исторические заслуги со временем теряют вес.
  4. Агрегация данных для борьбы с разреженностью: Механизм Aggregated Correction Factor позволяет применять сигналы полезности на уровне сайта или раздела к отдельным страницам с низким трафиком (низкий Confidence Level). Качество всего сайта влияет на производительность отдельных страниц.
  5. Влияние полезности на весь жизненный цикл поиска: Патент явно распространяет использование Correction Factor за пределы ранжирования. Низкая полезность несет риски не только для ранжирования, но и для базовых процессов сканирования (влияние на Crawl Score) и индексации (влияние на Index Score).

Практика

Best practices (это мы делаем)

  • Оптимизация под удовлетворение интента (Intent Satisfaction) и Dwell Time: Фокусируйтесь на создании контента, который полностью отвечает на запрос пользователя и удерживает его на странице. Контент должен быть исчерпывающим, чтобы минимизировать возврат пользователя в SERP (pogo-sticking). Это максимизирует Good Utilization Events.
  • Улучшение сниппетов для точности и привлекательности: Работайте над Title и Description, чтобы повысить кликабельность относительно конкурентов на той же позиции (превзойти Expected Utility Rate), но при этом точно отражать содержание, чтобы не провоцировать быстрые отказы.
  • Улучшение общего пользовательского опыта сайта (Site-wide UX): Поскольку система использует агрегацию (Aggregated Correction Factor), сильный общий UX и высокая удовлетворенность пользователей на уровне сайта могут положительно повлиять на ранжирование отдельных страниц, особенно новых или низкочастотных.
  • Регулярное обновление контента: Из-за механизма временного затухания (Decaying Average) необходимо поддерживать актуальность и полезность контента, чтобы сохранять высокий Correction Factor.
  • Оптимизация краулингового бюджета через качество: Поддерживайте высокую полезность контента, чтобы гарантировать достаточный Crawl Score и Index Score. Регулярно улучшайте или удаляйте контент с низкой вовлеченностью.

Worst practices (это делать не надо)

  • Использование кликбейта (Clickbait): Создание заголовков, направленных на получение клика, но не соответствующих содержанию. Это приведет к высокому CTR, но низкому количеству Good Utilization Events (из-за pogo-sticking), что снизит Correction Factor и приведет к пессимизации.
  • Создание тонкого (Thin) контента: Контент, который не удовлетворяет интент пользователя, будет иметь низкий Actual Utility Rate, даже если он технически оптимизирован под ключевые слова.
  • Игнорирование скорости загрузки и UX: Плохой пользовательский опыт, ведущий к быстрым отказам, будет интерпретироваться как низкая полезность, негативно влияя на Dwell Time.
  • Накрутка поведенческих факторов "в лоб": Попытки симулировать клики без обеспечения качества взаимодействия. Система фильтрует Good Utilization Events, использует нормализацию и Confidence Level, что делает простые накрутки CTR неэффективными и рискованными.

Стратегическое значение

Этот патент подтверждает, что Google использует сложные поведенческие метрики для оценки качества и удовлетворенности пользователей, выходящие далеко за рамки простого CTR. Стратегически важно понимать, что производительность документа оценивается в контексте его позиции. Патент подчеркивает системный подход Google: низкая полезность несет риски не только для ранжирования, но и для базовых процессов сканирования и индексации. Долгосрочная SEO-стратегия должна быть сосредоточена на обеспечении максимальной ценности и удовлетворенности пользователя.

Практические примеры

Сценарий 1: Борьба с кликбейтом в ранжировании

  1. Ситуация: На позиции 2 находится статья с кликбейтным заголовком, а на позиции 4 — детальное руководство.
  2. Данные: Статья на Поз. 2 имеет высокий CTR, но пользователи быстро возвращаются в SERP (низкий Dwell Time). Статья на Поз. 4 имеет более низкий CTR (из-за позиции), но пользователи, которые кликают, проводят много времени на странице.
  3. Расчеты:
    • Поз. 2: Высокий Expected Utility Rate, но низкий Actual Utility Rate (мало Good Utilization Events). Correction Factor < 1.
    • Поз. 4: Более низкий Expected Utility Rate, но высокий Actual Utility Rate. Correction Factor > 1.
  4. Результат: Система корректирует Ranking Scores. Руководство повышается в выдаче, а кликбейтная статья понижается.

Сценарий 2: Влияние на краулинговый бюджет в E-commerce

  1. Ситуация: Большой интернет-магазин имеет раздел со старыми моделями товаров. Эти страницы имеют низкий трафик и высокий показатель отказов.
  2. Расчеты: Система вычисляет низкий Actual Utility Rate для этих страниц. Aggregated Correction Factor для всего раздела также оказывается значительно ниже 1.
  3. Применение к Crawl Score: Correction Factor применяется к Crawl Score страниц этого раздела.
  4. Результат: Googlebot начинает реже сканировать эти страницы, экономя краулинговый бюджет магазина для более полезных и популярных разделов.

Вопросы и ответы

Что такое "Good Utilization Event" и почему это важнее, чем просто CTR?

Good Utilization Event — это показатель удовлетворенности пользователя. Согласно патенту (Claim 11), это взаимодействие, при котором пользователь проводит на странице определенное минимальное время (Dwell Time) И затем совершает действие, не связанное с исходным запросом. Это важнее CTR, потому что система фокусируется на качестве клика, отсеивая pogo-sticking (быстрые возвраты в SERP). Высокий CTR при низкой удовлетворенности приведет к пессимизации.

Как система учитывает, что на первой позиции CTR всегда выше, чем на десятой (Position Bias)?

Для этого используется Rank Position Map. Эта карта содержит ожидаемые уровни полезности (Expected Utility Rate) для каждой позиции в выдаче. Система рассчитывает ожидаемую полезность документа, учитывая, сколько раз он был показан на каждой конкретной позиции. Фактическая полезность сравнивается с этой нормализованной ожидаемой полезностью, что устраняет позиционное смещение.

Что произойдет, если у моей страницы мало трафика и недостаточно данных для расчета Correction Factor?

Если данных недостаточно, Confidence Level будет низким. В этом случае активируется механизм агрегации (Claim 1). Система может использовать Aggregated Correction Factor, рассчитанный для группы связанных документов (например, всего вашего сайта, раздела или тематики). Это позволяет новым страницам на авторитетных сайтах наследовать положительные сигналы.

Как этот патент влияет на краулинговый бюджет?

Патент явно указывает (Claim 13), что Correction Factor может применяться к Crawl Score. Если у документа или раздела сайта постоянно низкая полезность (низкий Correction Factor), система может снизить приоритет их сканирования. Это означает, что Googlebot будет реже посещать эти URL, чтобы сосредоточить ресурсы на более полезном контенте.

Может ли страница быть удалена из индекса из-за низкой полезности?

Да. Патент описывает (Claim 12) применение Correction Factor к Index Score. Если скорректированная оценка индексации падает ниже определенного порога (indexing threshold) из-за низкой полезности документа, система может принять решение не индексировать документ или удалить его из существующего индекса.

Имеет ли значение, как давно произошли взаимодействия с пользователем?

Да, имеет большое значение. Система использует Decaying Average (затухающее среднее) для расчета полезности. Это означает, что недавние взаимодействия имеют значительно больший вес, чем старые данные. Система быстро адаптируется к текущему уровню удовлетворенности пользователей.

Влияет ли тип контента (например, новости vs. статьи) на расчеты полезности?

Да. Патент предполагает, что могут использоваться разные Rank Position Maps и разные константы затухания (Decay Constants). Например, для новостей затухание может происходить быстрее, так как их актуальность быстро теряется, а ожидания по CTR могут отличаться от статейного контента.

Как SEO-специалисту измерить "Good Utilization Events"?

Напрямую измерить эту метрику Google невозможно. Однако можно использовать прокси-метрики в системах аналитики: анализировать время на странице (Dwell Time), показатели отказов (особенно сегментированные) и достижение микро-целей. Главная задача — минимизировать сценарии, когда пользователь возвращается из вашего сайта обратно в Google для поиска по тому же запросу (pogo-sticking).

Что означает, если Correction Factor больше 1?

Это означает, что фактическая полезность (Actual Utility Rate) документа превышает ожидаемую полезность (Expected Utility Rate) для тех позиций, на которых он показывался. Документ удовлетворяет пользователей лучше, чем в среднем по системе. В результате Ranking Score документа будет увеличен, что приведет к повышению его позиций.

Что важнее для SEO в контексте этого патента: качество страницы или качество сниппета?

Оба аспекта критически важны и взаимосвязаны. Качество сниппета необходимо для привлечения клика и превосходства над Expected Utility Rate. Качество страницы необходимо для удержания пользователя и генерации Good Utilization Event. Если страница не соответствует ожиданиям, созданным сниппетом (кликбейт), это приведет к пессимизации.

Похожие патенты

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Популярные патенты

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства
Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.
  • US8868592B1
  • 2014-10-21
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.
  • US20150154610A1
  • 2015-06-04
  • Local SEO

  • Антиспам

  • Поведенческие сигналы

seohardcore