SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи

MODIFYING SEARCH RESULT RANKING BASED ON A TEMPORAL ELEMENT OF USER FEEDBACK (Модификация ранжирования результатов поиска на основе временного элемента обратной связи от пользователей)
  • US9092510B1
  • Google LLC
  • 2007-04-30
  • 2015-07-28
  • Свежесть контента
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.

Описание

Какую проблему решает

Патент решает проблему «самоусиления» (self-reinforcement) в моделях ранжирования, основанных на поведенческих факторах (кликах). Самоусиление возникает, когда популярный результат закрепляется в топе за счет большого объема исторических кликов и продолжает их собирать только благодаря своей позиции, даже если его актуальность снизилась. Это приводит к стагнации выдачи и мешает новым или более релевантным документам занять высокие позиции.

Что запатентовано

Запатентован метод модификации ранжирования, который учитывает временной аспект (temporal element) неявной обратной связи от пользователей (implicit user feedback). Система корректирует measure of relevance документа, используя два ключевых механизма: (1) применение временного распада (Recency Weighting) к старым кликам для снижения их влияния и (2) анализ трендов кликов (click trends) для выявления документов с изменяющейся популярностью.

Как это работает

Система модифицирует стандартную модель оценки кликов с учетом времени:

  • Временной распад (Recency Weighting): К историческим кликам применяется понижающий коэффициент в зависимости от их возраста. Например, клики старше 8 недель могут терять 90% веса.
  • Пороги активации: Эта корректировка часто применяется только для частых запросов (frequent queries, например, >100 кликов), где проблема самоусиления наиболее актуальна.
  • Анализ трендов (Trend Analysis): Система сравнивает скорость изменения объема кликов во времени для конкретного документа (Модель M2) с трендом для фоновой популяции (background population, Модель M1).
  • Бустинг трендов: Если скорость роста кликов документа (M2) значительно превышает фоновую скорость (M1), документ получает повышение в ранжировании.

Актуальность для SEO

Высокая. Управление поведенческими сигналами и обеспечение актуальности выдачи (Freshness/QDF) остаются центральными задачами современных поисковых систем. Механизмы, предотвращающие стагнацию SERP и учитывающие текущие тренды пользовательского интереса, активно используются и развиваются для поддержания качества поиска.

Важность для SEO

Патент имеет критическое значение для понимания динамики ранжирования (8.5/10). Он показывает, что историческая популярность и накопленные клики не гарантируют вечных позиций. Для поддержания рейтинга необходимо обеспечивать стабильную или растущую вовлеченность актуальных пользователей. Контент, теряющий актуальность и клики в настоящем времени, будет вытесняться более свежими или трендовыми документами.

Детальный разбор

Термины и определения

Background Population (Фоновая популяция)
Набор документов и характеристик их предыдущих выборов, которые устанавливают базовые тренды. Используется как эталон для сравнения.
Click Trend (Тренд кликов)
Временное изменение объема кликов. Представляет собой набор пар (интервал времени, объем кликов), накопленных результатом в течение этого интервала.
Implicit User Feedback Model (Модель неявной обратной связи от пользователей)
Модель, которая интерпретирует действия пользователя (например, клики, время просмотра) как сигналы о качестве или релевантности документа.
Measure of Relevance (Мера релевантности)
Оценка, определяющая релевантность документа на основе пользовательской обратной связи. Используется для корректировки ранжирования.
M1 (Background Population Click Trend Model)
Статистическая модель, описывающая общую динамику изменения кликов для фоновой популяции с течением времени.
M2 (Document Click Trend Model)
Статистическая модель, описывающая динамику изменения кликов конкретного анализируемого документа с течением времени.
Rank Modifier Engine (Движок модификации ранга)
Компонент системы, который корректирует меру релевантности на основе временных элементов перед передачей в основной Ranking Engine.
Recency Weighting (Взвешивание по свежести / Временной распад)
Процесс применения понижающих коэффициентов к пользовательскому фидбеку в зависимости от его возраста. Более старые данные получают меньший вес.
Self-reinforcement (Самоусиление)
Эффект, при котором документ, занимающий высокую позицию, укрепляет свою позицию благодаря получаемым кликам, что затрудняет ранжирование новых или более релевантных документов.
Staytime / Dwell Time (Время пребывания)
Время, проведенное пользователем на документе после клика. Упоминается в патенте как фактор для определения качества клика (длинные vs короткие клики).
Temporal Element (Временной элемент)
Аспект данных обратной связи, связанный со временем. Включает возраст данных (recency) и изменение данных во времени (trends).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод корректировки релевантности, комбинирующий анализ трендов и учет возраста данных.

  1. Система получает обратную связь (клики) для Документа А и других документов (фоновая популяция).
  2. Система корректирует measure of relevance для Документа А путем:
    • Определения первого тренда кликов (first click trend) для Документа А и второго тренда кликов (second click trend) для фоновой популяции.
    • Ключевой момент 1 (Учет возраста): Вклад кликов в оба тренда зависит от временной дистанции (temporal distance) между текущим моментом и временем клика (т.е. применяется взвешивание по свежести).
    • Ключевой момент 2 (Анализ трендов): Сравнения трендов и определения, что скорость изменения (rate of change) первого тренда выше, чем второго.
    • Увеличения measure of relevance Документа А вследствие того, что его тренд растет быстрее фона.
  3. Система использует скорректированную меру релевантности для ранжирования.

Claim 3 (Зависимый от 1): Уточняет механизм взвешивания по свежести.

Корректировка включает взвешивание кликов на основе свежести, сгруппированного по категориям временных интервалов (time span categories). Система использует дискретные временные «корзины» для определения веса клика.

Claim 4 (Зависимый от 3): Вводит порог активации.

Взвешивание кликов инициируется только после того, как общее количество кликов в контексте поискового запроса превысит определенный порог. Механизм применяется только к достаточно популярным (частым) запросам.

Claim 5 (Зависимый от 3): Приводит конкретный пример временных интервалов и весов, демонстрирующий агрессивный временной распад:

  • Менее 2 недель: без понижения веса.
  • 2-4 недели: снижение веса минимум на 15%.
  • 4-6 недель: снижение веса минимум на 50%.
  • 6-8 недель: снижение веса минимум на 75%.
  • Более 8 недель: снижение веса минимум на 90%.

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса, используя накопленные данные о поведении пользователей.

INDEXING – Индексирование (Сбор и агрегация данных)
На этом этапе (или связанных процессах обработки логов) происходит сбор, агрегация и хранение данных о кликах (Click Data) в журналах (Result Selection Logs). Эти данные связываются с парами запрос-документ.

RANKING – Ранжирование / RERANKING – Переранжирование
Основное место применения. Rank Modifier Engine анализирует агрегированные данные о кликах, применяет временные корректировки и генерирует сигналы для основного Ranking Engine.

  1. Анализ поведенческих данных: Rank Modifier Engine извлекает исторические данные о кликах для запроса и документов.
  2. Временная корректировка: Система проверяет частотность запроса. Если порог превышен, применяются механизмы временного распада (Recency Weighting). Также проводится анализ трендов (Trend Analysis).
  3. Пересчет релевантности: Генерируется скорректированная measure of relevance для документов.
  4. Финальное ранжирование: Скорректированные оценки используются для модификации базовых IR-оценок и изменения порядка результатов.

Входные данные:

  • Логи выбора результатов (Result Selection Log(s)), содержащие данные о кликах: Запрос (Q), Документ (D), Время просмотра (T), Временные метки, Язык (L), Страна (C).

Выходные данные:

  • Скорректированная Measure of Relevance для документов (или коэффициент бустинга/демпфирования).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на частые (frequent) запросы, где накоплено достаточно данных и существует риск самоусиления позиций. Редкие запросы (infrequent queries) часто исключаются из этой обработки (Claim 4).
  • Конкретные ниши или тематики: Влияет на тематики, где актуальность информации быстро меняется (новости, технологии, мода). Помогает трендовому или «вирусному» контенту быстро подниматься в выдаче (связь с QDF).

Когда применяется

  • Триггеры активации (Временной распад): Механизм активируется, если общее количество кликов по запросу превышает установленный порог (например, 100 кликов, как указано в описании патента).
  • Триггеры активации (Анализ трендов): Активируется, когда статистический анализ показывает, что тренд кликов документа значительно (статистически значимо) отличается от фонового тренда.
  • Временные рамки: Применяется непрерывно при обработке запросов, но эффект зависит от возраста используемых данных.

Пошаговый алгоритм

Процесс можно разделить на два основных модуля.

Модуль А: Взвешивание по свежести (Recency Weighting)

  1. Сбор данных: Получение исторических данных о кликах для данного запроса (Q).
  2. Проверка порога: Определение, превышает ли общее количество кликов по запросу Q установленный порог.
    • Если НЕТ: Временной распад не применяется.
    • Если ДА: Перейти к шагу 3.
  3. Определение возраста кликов: Для каждого клика рассчитывается его возраст.
  4. Применение весов: Клики группируются по временным интервалам (согласно Claim 5), и к ним применяются соответствующие понижающие коэффициенты. Альтернативно может использоваться экспоненциальный распад.
  5. Расчет скорректированной релевантности: Вычисление итоговой measure of relevance на основе взвешенных кликов.

Модуль Б: Анализ трендов (Trend Analysis)

  1. Генерация фоновой модели (M1): Создание модели тренда кликов фоновой популяции (например, с помощью метода наименьших квадратов). Расчет средней квадратичной ошибки (E).
  2. Оценка отклонения документа: Расчет правдоподобия (likelihood) тренда кликов данного документа относительно фоновой модели M1 (например, используя Гауссово распределение с дисперсией E).
  3. Проверка значимости отклонения: Вычисление отношения правдоподобия (likelihood ratio). Если отношение проходит порог (т.е. документ ведет себя иначе, чем фон), перейти к шагу 4.
  4. Генерация модели документа (M2): Создание модели тренда кликов для данного документа.
  5. Сравнение скоростей изменения: Сравнение скорости изменения (rate of change) M2 и M1 (например, сравнение наклонов линий тренда).
  6. Модификация релевантности: Корректировка measure of relevance. Если скорость M2 выше M1, применяется бустинг. Патент предлагает формулу: B∗sqrt(M2M1)B*sqrt(M2/M1)B∗sqrt(M2/M1) (где B - нормальное значение буста).

Какие данные и как использует

Данные на входе

Система фокусируется на использовании поведенческих данных, собранных через логирование взаимодействий с поисковой выдачей.

  • Поведенческие факторы:
    • Клики (User Selections) на результаты поиска.
    • Время просмотра документа (Time T / Dwell Time / Staytime) – используется в Implicit User Feedback Model для базового взвешивания кликов (длинные vs короткие клики).
  • Временные факторы: Временные метки кликов. Критически важны для определения возраста клика (temporal distance) и построения трендов.
  • Пользовательские и Географические факторы:
    • Язык интерфейса (L) и Страна (C) – для сегментации данных.
    • Идентификаторы пользователя (Cookie, IP address, User Agent) – используются для фильтрации спама и анализа поведения.

Какие метрики используются и как они считаются

  • Weighted Clicks (Взвешенные клики, #WC): Клики, скорректированные с учетом времени просмотра и возраста клика (временной распад).
  • Click Fraction (Фракция кликов): Базовая метрика релевантности. Формула: BASE=[#WC(Q,D)]/[#WC(Q)+S0]BASE = [\#WC(Q,D)] / [\#WC(Q)+S0]BASE=[#WC(Q,D)]/[#WC(Q)+S0] (S0 - сглаживающий фактор).
  • Rate of Change (Скорость изменения): Показатель динамики тренда кликов. Для линейных моделей (M1, M2) это наклон линии тренда.
  • Likelihood Ratio (Отношение правдоподобия): Статистическая метрика для определения того, насколько сильно тренд кликов документа отличается от фонового тренда.
  • Формулы и алгоритмы расчета:
    • Временной распад: Дискретное взвешивание (Claim 5) или непрерывные функции, например, экспоненциальный распад: weight=exp(−0.05∗t)weight = exp(-0.05*t)weight=exp(−0.05∗t) (где t - возраст в неделях).
    • Анализ трендов: Метод наименьших квадратов (least squares) для построения моделей; формула бустинга B∗sqrt(M2M1)B*sqrt(M2/M1)B∗sqrt(M2/M1).

Выводы

  1. Ценность кликов агрессивно снижается со временем (Time Decay): Патент подтверждает, что Google активно обесценивает исторические поведенческие данные. Клики, полученные давно (старше 8 недель), могут терять до 90% своего веса по сравнению со свежими кликами.
  2. Борьба с самоусилением и стагнацией выдачи: Основная цель — предотвратить закрепление результатов в топе только за счет накопленной исторической популярности (self-reinforcement). Это позволяет новым и более актуальным документам конкурировать за высокие позиции.
  3. Идентификация и бустинг трендов: Система активно ищет документы с ускоряющимся ростом популярности. Документы, которые начинают быстро набирать клики по сравнению с фоном (M2 > M1), получают дополнительное повышение.
  4. Фокус на частых запросах: Механизмы временного распада применяются в первую очередь к частым запросам (где превышен порог кликов), так как именно там риск стагнации наиболее высок. Для редких запросов исторические данные сохраняют свой вес.
  5. Динамическая релевантность: Релевантность рассматривается как динамическая характеристика, зависящая от текущего поведения пользователей, а не только от статических факторов.

Практика

Best practices (это мы делаем)

  • Поддержание свежести контента и вовлеченности: Регулярно обновляйте ключевые страницы, чтобы они оставались актуальными и продолжали генерировать свежие положительные поведенческие сигналы (клики, Dwell Time). Это критически важно, так как вес старых заслуг быстро снижается.
  • Оптимизация под текущий CTR: Сосредоточьтесь на том, чтобы контент привлекал пользователей сегодня. Анализируйте и улучшайте сниппеты для поддержания высокого CTR на свежих данных.
  • Быстрая реакция на тренды (Trend Surfing): Отслеживайте новые тренды в вашей нише. Создание качественного контента на ранней стадии тренда может привести к быстрому росту позиций благодаря механизму бустинга ускоряющихся click trends (M2 > M1).
  • Мониторинг поведенческих метрик в динамике: Отслеживайте не только позиции, но и динамику CTR. Падение этих показателей по популярным запросам быстро приведет к потере позиций из-за временного распада исторических данных.

Worst practices (это делать не надо)

  • Почивать на лаврах исторического успеха: Рассчитывать, что страница, которая хорошо ранжировалась в прошлом году, сохранит позиции без изменений. Если текущие пользователи перестанут взаимодействовать с ней положительно, её позиции упадут из-за обесценивания старых кликов.
  • Игнорирование снижения CTR и вовлеченности: Допускать снижение кликабельности или ухудшение Dwell Time. Это напрямую влияет на click trend и может привести к тому, что скорость роста документа (M2) станет ниже фоновой (M1), что приведет к пессимизации.
  • Стратегия «сделал и забыл»: Создание контента без плана его дальнейшей актуализации. Такой контент будет быстро терять эффективность поведенческих сигналов, особенно по частым запросам.

Стратегическое значение

Патент подтверждает стратегический сдвиг Google в сторону динамической оценки релевантности, где поведение пользователей в реальном времени играет решающую роль. Он подтверждает важность стратегий, ориентированных на Freshness (QDF) и непрерывную оптимизацию пользовательского опыта. Долгосрочная SEO-стратегия должна включать процессы для постоянного мониторинга актуальности контента и его способности удовлетворять текущий интент пользователя.

Практические примеры

Сценарий 1: Вытеснение устаревшего лидера (Temporal Decay)

  1. Ситуация: По частотному запросу «лучшие смартфоны» в ТОП-1 находится обзор прошлого года с большим количеством исторических кликов.
  2. Действие алгоритма: Система применяет временной распад. Клики, полученные лидером более 8 недель назад, теряют 90% веса.
  3. Результат: Новый обзор, опубликованный недавно и получающий свежие клики с полным весом, быстро обходит старого лидера, даже если общее количество исторических кликов у него меньше.

Сценарий 2: Продвижение трендового контента (Trend Analysis)

  1. Ситуация: Происходит важное новостное событие. Разные сайты публикуют статьи об этом.
  2. Действие алгоритма: Система анализирует тренды кликов. Сайт А опубликовал статью быстрее и качественнее, и скорость набора кликов (M2) значительно превышает среднюю скорость по другим статьям на эту тему (M1).
  3. Результат: Система применяет бустинг к статье Сайта А (используя формулу B∗sqrt(M2M1)B*sqrt(M2/M1)B∗sqrt(M2/M1)), быстро поднимая её в топ выдачи по связанным запросам.

Вопросы и ответы

Что такое «самоусиление» (self-reinforcement) и почему Google с ним борется?

Самоусиление — это эффект, когда результат закрепляется на высокой позиции, потому что он там находится и собирает клики по инерции. Это создает замкнутый круг и приводит к стагнации выдачи, мешая новым или лучшим документам попасть в топ. Google борется с этим, чтобы обеспечить актуальность и качество SERP, снижая вес исторических данных.

Насколько быстро обесцениваются клики согласно патенту?

Патент предлагает агрессивную модель распада. В приведенном примере клики сохраняют полный вес первые 2 недели. Затем вес снижается: через 2-4 недели потеря 15%, а данные старше 8 недель могут терять до 90% ценности. Это подчеркивает критическую важность свежих поведенческих сигналов.

Применяется ли этот механизм ко всем запросам?

Нет. В патенте указано (Claim 4), что взвешивание по возрасту (временной распад) может инициироваться только после превышения определенного порога кликов по запросу (например, 100 кликов). Это сделано для того, чтобы сосредоточиться на частых запросах (frequent queries) и не искажать данные по редким запросам, где информации мало.

Что такое «анализ трендов» (Trend Analysis) и как он работает?

Это статистический метод сравнения скорости изменения объема кликов для конкретного документа (M2) со скоростью изменения кликов для фоновой популяции (M1). Если документ набирает популярность значительно быстрее фона (M2 > M1), система идентифицирует это как положительный тренд и повышает документ в выдаче.

Как этот патент связан с концепцией QDF (Query Deserves Freshness)?

Этот патент предоставляет конкретные механизмы реализации QDF через поведенческие сигналы. Временной распад помогает устаревшему контенту опускаться ниже, а анализ трендов помогает свежему или трендовому контенту, который активно интересует пользователей прямо сейчас, подниматься выше.

Означает ли это, что старый «вечнозеленый» контент обречен на падение позиций?

Не обязательно. Вечнозеленый контент сохранит позиции, если он продолжает быть актуальным и стабильно получает свежие клики и положительные сигналы вовлечения. Однако, если интерес пользователей к нему снизится, его исторические заслуги не удержат его в топе из-за механизма временного распада.

Учитывает ли система только факт клика (CTR) или также время на сайте (Dwell Time)?

В описании патента упоминается, что базовая Implicit User Feedback Model может учитывать время просмотра (Time T / Dwell Time) для первоначального взвешивания кликов (например, длинные клики лучше коротких). Временной распад и анализ трендов применяются уже к этим взвешенным значениям.

Как система определяет, что тренд документа отличается от фонового?

Используются статистические методы, в частности, расчет отношения правдоподобия (Likelihood Ratio). Система оценивает, насколько вероятно наблюдать данные клики документа при условии, что они соответствуют фоновой модели (M1). Если вероятность низкая и отношение проходит порог, система определяет, что тренд значимо отличается.

Как SEO-специалисту использовать знание об анализе трендов на практике?

Необходимо быстро выявлять зарождающиеся тренды и создавать релевантный контент. Если ваш контент «попадет в тренд» и начнет быстро набирать клики, система заметит ускорение (M2>M1) и даст дополнительный бустинг, что позволит быстро занять высокие позиции даже при наличии сильных старых конкурентов.

Что делать, если позиции начали падать, хотя контент не менялся?

Необходимо срочно анализировать свежие поведенческие данные (последние 1-2 месяца). Вероятно, снизился CTR или ухудшилась вовлеченность из-за устаревания информации или действий конкурентов. Нужно актуализировать контент и улучшить пользовательский опыт, чтобы восстановить приток свежих положительных сигналов.

Похожие патенты

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента
Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.
  • US9098511B1
  • 2015-08-04
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки
Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.
  • US8442984B1
  • 2013-05-14
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует историю чтения новостных сайтов для определения географических интересов пользователя и персонализации выдачи
Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, даже если пользователь физически находится в другом месте.
  • US20130246381A1
  • 2013-09-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
  • US8121991B1
  • 2012-02-21
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

seohardcore