SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)

DERIVING AND USING INTERACTION PROFILES (Получение и использование профилей взаимодействия)
  • US9223868B2
  • Google LLC
  • 2011-12-01
  • 2015-12-29
  • Поведенческие сигналы
  • SERP
  • Антиспам
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.

Описание

Какую проблему решает

Патент решает проблему ненадежности использования сырого показателя кликабельности (CTR) для оценки качества поисковой выдачи. Высокий CTR не гарантирует удовлетворенность пользователя, так как он может быть результатом кликбейта или манипуляций (спама). Изобретение предлагает методы для измерения фактической удовлетворенности пользователя (level of satisfaction) путем анализа его поведения после клика.

Что запатентовано

Запатентована система для создания и использования Interaction Profiles (Профилей взаимодействия), также называемых Click Profiles. Эти профили агрегируют детализированные поведенческие метрики, выходящие за рамки простого факта клика. Ключевые метрики включают длительность клика (Click Duration), последовательность кликов в сессии (Click Sequence) и данные об уточнении запроса (Query Refinement).

Как это работает

Система работает путем анализа логов поисковой системы:

  • Сбор данных: Логируются запросы, показанные результаты, клики и временные метки.
  • Анализ сессий: Данные группируются по пользователям и сессиям. Для каждого клика вычисляется длительность (время до возврата на SERP) и его тип (например, короткий, длинный, единственный, множественный).
  • Генерация профилей: Метрики агрегируются для создания Interaction Profiles для «объектов» (URL, доменов или алгоритмов).
  • Применение: Профили используются для сравнения эффективности разных алгоритмов ранжирования (A/B тестирование), оценки качества отдельных результатов с помощью вероятностных моделей (P(good)) и выявления спама (Manipulated Articles).

Актуальность для SEO

Крайне высокая. Этот патент описывает фундаментальные концепции анализа поведения пользователей для оценки качества поиска, такие как Dwell Time и Pogo-sticking. Эти принципы лежат в основе современных систем оценки удовлетворенности пользователя и процессов A/B тестирования Google.

Важность для SEO

Критическое влияние (10/10). Патент формализует использование поведения пользователя после клика как ключевых сигналов качества. Это фундаментально смещает фокус SEO с привлечения клика на удовлетворение интента и удержание пользователя. Стратегии, основанные на кликбейте или тонком контенте, напрямую контратакуются механизмами, описанными в этом изобретении.

Детальный разбор

Термины и определения

Interaction Profile / Click Profile (Профиль взаимодействия / Кликовый профиль)
Агрегированные данные, характеризующие взаимодействие пользователей с определенным объектом. Включает гистограмму типов и длительности взаимодействий.
Object (Объект)
Предмет анализа. Может быть отдельным результатом поиска (URL), набором результатов, доменом, алгоритмом ранжирования или классом запросов.
Metrics (Метрики)
Параметры измерения, указывающие на уровень удовлетворенности (level of satisfaction) пользователя.
Click Duration (Длительность клика)
Время между кликом на результат и возвратом пользователя к поисковой выдаче (Dwell Time).
Short Click (Короткий клик)
Клик, после которого пользователь быстро возвращается к выдаче. В патенте упоминается порог <80 секунд. Часто указывает на неудовлетворенность.
Medium Click (Средний клик)
Клик с умеренной длительностью. В патенте упоминается диапазон 80-200 секунд.
Long Click (Длинный клик)
Клик, после которого пользователь возвращается спустя значительное время. В патенте упоминается порог >200 секунд. Указывает на высокую удовлетворенность.
Last Click (Последний клик)
Клик, после которого пользователь не вернулся к результатам поиска. Часто указывает на удовлетворенность.
Click Sequence (Последовательность кликов)
Порядок и количество кликов в рамках одной сессии. Включает Single Click (один клик за сессию) и Multiple Clicks (несколько кликов за сессию, pogo-sticking).
Query Refinement (Уточнение запроса)
Отправка пользователем нового запроса, похожего на предыдущий, в рамках той же сессии. Указывает на неудовлетворенность исходной выдачей.
Manipulated Article / Spam (Манипулируемый документ / Спам)
Документ, модифицированный для обмана поисковой системы или пользователя (например, оптимизация сниппета для максимизации CTR без предоставления ценности).
P(good|observation) (Вероятность качества при наблюдении)
Рассчитанная вероятность того, что результат является "хорошим" (качественным), учитывая наблюдаемое поведение пользователя. Модель обучается на основе оценок асессоров.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод сравнения двух алгоритмов ранжирования (Scoring Algorithms).

  1. Система получает первый профиль (Profile 1) для Алгоритма 1 и второй профиль (Profile 2) для Алгоритма 2. Профили характеризуют историческое взаимодействие пользователей с результатами, отранжированными этими алгоритмами.
  2. Система определяет, указывают ли метрики взаимодействия в Profile 1 на более высокий уровень удовлетворенности пользователей (higher level of user satisfaction), чем метрики в Profile 2.
  3. Если да, система выводит индикацию, что Алгоритм 1 лучше Алгоритма 2.
  4. Ключевое определение метрик и удовлетворенности: Метрики включают "общее количество соответствующих выборов" (т.е. общее количество кликов). Более высокий уровень удовлетворенности определяется МЕНЬШИМ общим количеством кликов в Profile 1 по сравнению с Profile 2.

Техническая интерпретация: Лучший алгоритм позволяет пользователю найти ответ с меньшим количеством кликов.

Claim 2 (Зависимый от 1): Дополняет метрики.

  1. Метрики также включают "количество уточнений поисковых запросов" (number of refinements).
  2. Более высокий уровень удовлетворенности определяется МЕНЬШИМ количеством уточнений запросов.

Claim 3 (Зависимый от 1): Дополняет метрики.

  1. Метрики также включают "соотношение выборов с большой длительностью к выборам с короткой длительностью".
  2. Более высокий уровень удовлетворенности определяется БОЛЬШИМ значением этого соотношения (больше длинных кликов по сравнению с короткими).

Claim 4 (Зависимый от 1): Уточняет область применения.

  1. Сравнение профилей и определение лучшего алгоритма производится для определенной категории (класса) поисковых запросов.

Где и как применяется

Изобретение применяется для оценки качества поиска и влияет на несколько этапов архитектуры.

ОФЛАЙН-АНАЛИЗ И ОЦЕНКА СИСТЕМЫ (System Evaluation)
Основное применение патента.

  • A/B Тестирование: Сравнение эффективности различных версий алгоритмов ранжирования (как описано в Claims 1-3 и FIG. 5).
  • Обучение моделей: Обучение вероятностных моделей P(good|observation) путем сравнения данных о кликах с оценками асессоров (FIG. 3, Table 1).
  • Обнаружение спама: Выявление Manipulated Articles путем сравнения их профилей взаимодействия с эталонным профилем спама (FIG. 4).

INDEXING – Индексирование и извлечение признаков
На этом этапе (или в ходе офлайн-процессов) могут рассчитываться и сохраняться оценки качества (например, P(good)) для конкретных URL и доменов на основе агрегированных Interaction Profiles.

RANKING / RERANKING – Ранжирование и Переранжирование
Оценки качества, полученные из профилей, могут использоваться как сигналы ранжирования для корректировки позиций документов. Также используется для пессимизации выявленного спама.

Входные данные:

  • Логи поисковой системы: запросы, показанные результаты и их позиции, клики пользователей, временные метки, идентификаторы пользователей (IP/Cookies).
  • (Для обучения) Оценки качества результатов от асессоров.

Выходные данные:

  • Interaction Profiles для объектов.
  • Результаты сравнения алгоритмов ранжирования.
  • Оценки вероятности качества результата (P(good)).
  • Идентификация потенциального спама.

На что влияет

  • Специфические запросы: Влияет на все типы, но патент отмечает различия в поведении. Навигационные запросы имеют высокий процент одиночных кликов и низкий уровень уточнений. Информационные и коммерческие запросы чаще требуют анализа длительности и последовательности кликов для оценки качества.
  • Конкретные ниши: Сильное влияние в нишах, подверженных кликбейту или спаму, где высокий CTR часто не коррелирует с удовлетворенностью.

Когда применяется

  • Сбор данных: Происходит непрерывно при каждом взаимодействии пользователя с поиском.
  • Анализ и генерация профилей: Выполняется периодически в офлайн-режиме для обработки накопленных логов, тестирования алгоритмов и обновления моделей выявления спама.

Пошаговый алгоритм

Процесс А: Получение Профиля Взаимодействия (на основе FIG. 2)

  1. Сортировка данных: Данные из логов сортируются и группируются по пользователям.
  2. Идентификация сессии и запроса: Определяется начало сессии и первый поисковый запрос.
  3. Определение набора результатов: Фиксируется набор результатов, показанный пользователю.
  4. Анализ действий в сессии: Система последовательно анализирует действия пользователя:
    • Если Клик: Идентифицируется результат. Фиксируется время возврата пользователя на выдачу. Вычисляется длительность клика (Duration). Определяется последовательность (Sequence).
    • Если Новый запрос: Определяется, является ли он уточнением (Refinement).
  5. Агрегация сырых данных: Собранные метрики сохраняются (например, в формате (s,q,r) – сессия, запрос, результат).
  6. Построение профиля: Выбирается объект интереса (например, URL или Алгоритм). Все релевантные сырые данные агрегируются для создания итогового Interaction Profile.

Процесс Б: Оценка качества объекта (на основе FIG. 3 и Table 1)

  1. Обучение модели вероятности (Офлайн): Определение начальных оценок вероятности P(good|observation) путем сравнения поведения пользователей с ручными оценками качества (асессорами).
  2. Выбор объекта и получение профиля: Извлечение Interaction Profile для анализируемого объекта.
  3. Оценка качества: Расчет ожидаемого качества объекта (Expected Goodness) путем усреднения вероятностей P(good) по всем наблюдениям в профиле.

Какие данные и как использует

Данные на входе

Патент сосредоточен исключительно на поведенческих данных, извлеченных из логов поисковой системы.

  • Поведенческие факторы: Клики на результаты поиска, временные метки (timestamps) взаимодействий (для расчета длительности), последовательность кликов внутри сессии, текст исходных и уточненных запросов.
  • Пользовательские факторы: Идентификаторы пользователей (IP-адреса, Cookies) для группировки взаимодействий в сессии.
  • Системные данные: Позиция результата в выдаче (используется для учета позиционного смещения при анализе).

Какие метрики используются и как они считаются

  • Click Duration (Длительность клика): Рассчитывается как разница во времени между кликом и возвратом на SERP. Патент предлагает пороговые значения, изученные эмпирически:
    • Short Click: < 80 секунд.
    • Medium Click: 80-200 секунд.
    • Long Click: > 200 секунд.
  • Click Sequence (Последовательность кликов): Классификация кликов как Single (единственный в сессии) или Multiple (один из нескольких).
  • Total Number of Clicks (Общее количество кликов): Подсчет кликов за сессию или агрегировано (используется в Claim 1).
  • Number of Query Refinements (Количество уточнений запроса): Подсчет случаев изменения запроса в сессии (используется в Claim 2).
  • Ratios (Соотношения):
    • Соотношение Длинных к Коротким кликам (используется в Claim 3).
    • Соотношение Одиночных к Множественным кликам.
  • P(good|observation) (Вероятность качества): Рассчитывается с использованием моделей, обученных на данных асессоров. Пример из патента (Table 1): Single + Long Click имеет вероятность 0.9 быть "хорошим"; Multiple + Short Click имеет вероятность 0.2-0.299.

Выводы

  1. Удовлетворенность пользователя измерима и приоритетнее CTR: Google активно измеряет поведение после клика для оценки реальной удовлетворенности (user satisfaction). Высокий CTR не является самоцелью и может быть негативным сигналом, если сопровождается плохим взаимодействием.
  2. Формализация Dwell Time и Pogo-Sticking: Концепции времени пребывания на сайте и быстрого возврата к выдаче формализованы через метрики Click Duration (Short/Long) и Click Sequence (Multiple Clicks). Короткие клики и множественные клики часто указывают на низкое качество.
  3. Ключевые индикаторы качества: Положительные сигналы – Long Clicks и Single Clicks. Отрицательные сигналы – Short Clicks, Multiple Clicks и Query Refinements.
  4. Критерии "Хорошего" алгоритма (согласно Claims): Лучший алгоритм ранжирования – это тот, который приводит к: (1) Меньшему общему количеству кликов, (2) Меньшему количеству уточнений запроса и (3) Более высокому соотношению длинных кликов к коротким. Цель – минимизировать усилия пользователя.
  5. Механизм обнаружения спама и кликбейта: Система выявляет Manipulated Articles путем анализа аномалий в их Interaction Profiles (например, аномально высокий процент коротких кликов).
  6. Вероятностный подход к качеству: Качество результата оценивается вероятностно (P(good)) на основе моделей, обученных на человеческих оценках, что позволяет масштабировать оценку качества.

Практика

Best practices (это мы делаем)

  • Фокус на полном удовлетворении интента (Оптимизация под Long Click): Создавайте контент, который исчерпывающе отвечает на запрос пользователя. Цель – стать последним кликом в сессии (Last Click) или обеспечить длительное взаимодействие (Long Click > 200 сек). Если пользователь возвращается на выдачу (pogo-sticking), это сигнал неудовлетворенности.
  • Точность заголовков и сниппетов: Убедитесь, что Title и Meta Description точно отражают содержание страницы. Несоответствие ожиданиям приводит к Short Clicks, что является сильным негативным сигналом.
  • Улучшение UX, скорости загрузки и читабельности: Плохой пользовательский опыт, медленная загрузка или агрессивная реклама провоцируют пользователя быстро покинуть сайт. Это интерпретируется как Short Click, даже если контент релевантен.
  • Анализ контента по классам запросов: Понимайте разницу в поведении. Для информационных (исследовательских) запросов стремитесь к длительному вовлечению. Для запросов, подразумевающих быстрый ответ, убедитесь, что ответ легко найти и он исчерпывающий, чтобы пользователь не кликал на другие результаты.

Worst practices (это делать не надо)

  • Использование кликбейта: Применение вводящих в заблуждение заголовков для искусственного повышения CTR. Система обнаружит высокий процент Short Clicks и может классифицировать контент как низкокачественный или манипулятивный.
  • Создание поверхностного или тонкого контента (Thin Content): Контент, который не решает задачу пользователя, вынуждает его вернуться на выдачу и кликнуть на другой результат (Multiple Clicks) или уточнить запрос (Query Refinement).
  • Игнорирование технических проблем и мобильной адаптации: Технические сбои или неудобство использования на мобильных устройствах приводят к быстрым отказам и генерации негативных Interaction Profiles.

Стратегическое значение

Этот патент является фундаментальным подтверждением того, что удовлетворенность пользователя (User Satisfaction) является ключевой метрикой качества для Google. Долгосрочная SEO-стратегия должна быть направлена на оптимизацию под решение задачи пользователя, а не только на привлечение трафика. Это подтверждает стратегическую важность интеграции UX, контент-стратегии и SEO, смещая фокус с традиционной оптимизации на качество взаимодействия после клика.

Практические примеры

Сценарий: Сравнение кликбейта и качественного контента

  1. Запрос: "Лучшие смартфоны 2025 года".
  2. Результат А (Кликбейт): Заголовок обещает шокирующий рейтинг. Пользователь кликает, видит поверхностный обзор и много рекламы, возвращается на выдачу через 25 секунд.
    • Метрика: Short Click. Вероятность P(good) низкая.
  3. Результат Б (Качественный контент): Заголовок обещает детальное сравнение Топ-5 моделей. Пользователь кликает, изучает таблицы и текст 6 минут, затем закрывает вкладку.
    • Метрика: Long Click / Last Click. Вероятность P(good) высокая (например, 0.9).
  4. Результат В (Неполный контент): Пользователь кликает, читает 90 секунд, не находит нужную модель, возвращается в выдачу и кликает на Результат Б.
    • Метрика: Multiple Click (not last), Medium Duration. Вероятность P(good) средняя (например, 0.646).
  5. Итог: Система использует эти данные для оценки качества. Результат Б демонстрирует лучший Interaction Profile и, вероятно, будет ранжироваться выше. Результат А, несмотря на возможный высокий CTR, будет оценен как низкокачественный.

Вопросы и ответы

Что такое «длинный клик» (Long Click) и «короткий клик» (Short Click) согласно патенту?

Патент приводит конкретные примеры порогов, изученные эмпирически. Short Click – это быстрое возвращение пользователя на страницу результатов поиска после клика (например, <80 секунд). Long Click – это когда пользователь возвращается через значительное время (например, >200 секунд). Длинные клики интерпретируются как сигнал удовлетворенности контентом, а короткие – как сигнал неудовлетворенности.

Подтверждает ли этот патент, что Dwell Time является фактором ранжирования?

Да. Патент подтверждает, что Dwell Time (время между кликом и возвратом на SERP, или Click Duration) активно измеряется и используется для оценки удовлетворенности пользователей. Хотя основное внимание уделяется использованию этих данных для сравнения алгоритмов и выявления спама, патент также упоминает, что рассчитанная вероятность качества P(good) может использоваться как сигнал в алгоритме ранжирования для корректировки оценки результата.

Что такое Pogo-Sticking и как он связан с этим патентом?

Pogo-sticking — это поведение, когда пользователь переходит из поиска на сайт и быстро возвращается обратно, чтобы кликнуть на другой результат. В терминах патента это генерирует Short Click для первого результата и Multiple Clicks в рамках одной сессии. Это явный индикатор неудовлетворенности, что негативно сказывается на Interaction Profile страницы.

Означает ли этот патент, что оптимизация под CTR больше не важна?

Оптимизация под CTR важна для получения трафика, но патент подчеркивает, что высокий CTR в сочетании с плохими сигналами взаимодействия (короткими кликами) контрпродуктивен. Важно оптимизировать CTR за счет точности и релевантности сниппета, а не за счет кликбейта, чтобы обеспечить последующее положительное взаимодействие.

Как Google определяет вероятность того, что клик был «хорошим» (P(good))?

Система использует модели машинного обучения (например, таблицы условных вероятностей, как Table 1), обученные путем сравнения реального поведения пользователей с оценками качества результатов, выставленными людьми (асессорами). Например, единственный длинный клик имеет высокую вероятность быть «хорошим».

Что означает утверждение в Claim 1, что лучший алгоритм генерирует МЕНЬШЕЕ общее количество кликов?

Это метрика эффективности алгоритма в целом. Если алгоритм ранжирует идеальный ответ на 1-й позиции, пользователю нужен всего 1 клик для решения задачи. Если алгоритм плох, пользователю может потребоваться несколько кликов (pogo-sticking). Следовательно, лучший алгоритм минимизирует усилия пользователя, что выражается в меньшем общем количестве кликов за сессию.

Как система использует Click Profiles для обнаружения спама (Manipulated Articles)?

Система создает эталонный профиль для спама. Спам характеризуется аномальным поведением: очень короткими кликами и значительно более высоким соотношением коротких кликов к длинным по сравнению с качественными результатами. Если Click Profile анализируемого ресурса похож на профиль спама, он может быть помечен для проверки или пессимизирован.

Как система различает поведение при навигационных и информационных запросах?

Патент признает, что профили взаимодействия различаются для разных классов запросов. Например, для навигационных запросов характерен высокий процент Single Clicks и низкий процент уточнений. Система может анализировать алгоритмы и результаты отдельно для разных классов (Claim 4, FIG. 6), чтобы учесть эти различия.

Как можно улучшить Interaction Profile моего сайта?

Необходимо сфокусироваться на полном удовлетворении интента пользователя. Создавайте исчерпывающий контент, обеспечьте высокую скорость загрузки, удобный UX и точное соответствие сниппетов содержанию. Цель – сделать ваш сайт последним кликом в поисковой сессии пользователя и минимизировать возвраты на выдачу.

Могу ли я увидеть эти метрики (Short/Long Clicks) в Google Search Console?

Нет, это внутренние метрики Google для оценки качества. В Google Analytics вы можете видеть прокси-метрики, такие как "Bounce Rate" и "Avg. Session Duration", которые могут коррелировать с Interaction Profile, но они не являются прямым отражением того, как Google измеряет Click Duration (возврат на SERP).

Похожие патенты

Как Google определяет неудовлетворенность пользователя поисковой сессией и предлагает корректирующие действия
Google анализирует поведение пользователя во время поисковой сессии (клики, время на сайте, последующие запросы), чтобы определить уровень удовлетворенности. Если система фиксирует признаки неудовлетворенности (например, много коротких кликов или серия уточняющих запросов), она автоматически запускает "корректирующие операции": предлагает альтернативные запросы, ключевые слова из просмотренных страниц или запрашивает обратную связь.
  • US8316037B1
  • 2012-11-20
  • Поведенческие сигналы

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

seohardcore