SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google систематизирует сбор, хранение и анализ истории поисковых запросов и поведенческих данных пользователей

MAINTAINING A HISTORY OF QUERY RESULTS (Поддержание истории результатов запросов)
  • US9111284B2
  • Google LLC
  • 2004-05-21
  • 2015-08-18
  • Поведенческие сигналы
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google, описывающий инфраструктуру для перехвата, фильтрации, консолидации и хранения истории поисковых запросов и их результатов. Система детально фиксирует контекстную информацию, включая то, какие результаты просмотрел пользователь, когда и как часто. Эти данные формируют основу для анализа поведения пользователей и обучения систем ранжирования.

Описание

Какую проблему решает

Патент решает задачу эффективного сбора, хранения и организации огромного объема данных, генерируемых в процессе обработки поисковых запросов. Он обеспечивает инфраструктуру для систематического анализа истории запросов и взаимодействия пользователей с результатами поиска (User Behavior Data). Цель – создать хранилище данных о поиске, пригодное для дата-майнинга, бизнес-аналитики и оптимизации производительности (кэширования).

Что запатентовано

Запатентована система для поддержания истории запросов. Она перехватывает (intercepts) запросы и возвращаемые результаты, собирает детальную контекстную информацию (Context Information), включая действия пользователя с результатами. Затем система фильтрует и консолидирует эти данные (например, агрегируя повторяющиеся запросы для экономии ресурсов) и сохраняет их в отдельном хранилище (Query Storage) для последующего анализа другими процессами.

Как это работает

Система функционирует как слой логирования и анализа данных:

  • Перехват: Система фиксирует исходный запрос, набор возвращенных результатов и контекстную информацию (данные о пользователе, время запроса, взаимодействие с результатами).
  • Фильтрация: Данные могут быть отфильтрованы на основе заданных критериев (Filter Criteria), чтобы сохранить только релевантную информацию.
  • Консолидация: Система оптимизирует хранение, определяя повторяющиеся или схожие запросы и результаты. Вместо дублирования записей она может обновлять счетчики или агрегированные метрики (Consolidated Query Data).
  • Хранение и Кэширование: Обработанные данные сохраняются в хранилище истории запросов. Также система может кэшировать результаты для ускорения ответов на повторные запросы.

Актуальность для SEO

Высокая. Хотя патент подан в 2004 году, инфраструктура сбора, обработки и анализа логов является фундаментальной частью любой современной поисковой системы. Методы сбора поведенческих данных, описанные в патенте (например, фиксация того, какие результаты были просмотрены пользователем, время и частота просмотра), остаются крайне актуальными для обучения ML-моделей ранжирования в 2025 году.

Важность для SEO

Влияние на SEO значительное (7.5/10). Это не патент об алгоритме ранжирования. Однако он описывает инфраструктуру для сбора поведенческих данных (User Behavior Data) – что пользователь искал, что ему показали, и что он выбрал или просмотрел. Эти данные критически важны для оценки качества поиска и обучения систем ранжирования (например, для предсказания CTR и оценки удовлетворенности). Патент подтверждает техническую возможность и намерение Google детально и систематически отслеживать взаимодействие пользователя с выдачей.

Детальный разбор

Термины и определения

Context Information (Контекстная информация)
Данные, связанные с запросом и его результатами. Включают информацию о пользователе (cookies, профили), временные метки, часовой пояс, а также поведенческие данные: какие результаты пользователь просмотрел (selected to view), время просмотра, частоту просмотра конкретных результатов (viewed more than once), было ли прервано получение результатов.
Consolidation Criteria (Критерии консолидации)
Правила для объединения данных о запросах. Позволяют группировать повторяющиеся или схожие запросы и результаты для оптимизации хранения (например, хранить одну запись с счетчиком повторений).
Consolidated Query Data (Консолидированные данные запроса)
Агрегированные данные, полученные после применения критериев консолидации. Включают статистику (например, количество повторений запроса) и обновленный контекст.
Filter Criteria (Критерии фильтрации)
Правила для отбора информации, подлежащей сохранению. Например, сохранять данные только о запросах, касающихся определенных продуктов или только первые N результатов.
Query System (Система обработки запросов)
Компонент, который принимает запрос от пользователя, извлекает информацию из хранилища и возвращает результаты пользователю.
Query Storage (Хранилище истории запросов)
Отдельная система хранения (Storage System), предназначенная для сохранения перехваченной, отфильтрованной и консолидированной истории запросов и результатов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс логирования с оптимизацией хранения.

  1. Система обнаруживает запрос и полученные результаты.
  2. Применяется автоматическая фильтрация результатов на основе Filter Criteria.
  3. Определяется, выполнялся ли данный запрос (или его часть) ранее путем сравнения с данными в кэш-памяти (cache memory).
  4. Если запрос выполнялся ранее, определяется, являются ли результаты в целом такими же, как и предыдущие.
  5. Если результаты совпадают: Система обновляет Consolidated Query Data, связанные с предыдущим запросом, без повторного сохранения текущего запроса.

Claim 4 (Зависимый): Детализирует сбор контекстной информации, критически важной для анализа поведения.

Система собирает контекстную информацию, которая включает данные о том, какие именно результаты пользователь выбрал для просмотра (selected to view) из предложенного набора результатов.

Claim 14 (Независимый): Описывает механизм кэширования запросов и результатов для повышения производительности.

  1. Система обнаруживает первый запрос и сохраняет его в cache memory.
  2. Система обнаруживает первый набор результатов и сохраняет его в cache memory.
  3. При получении второго запроса система определяет, совпадает ли он (или его часть) с первым запросом в кэше.
  4. Если совпадение есть, второй набор результатов предоставляется на основе первого (кэшированного) набора результатов.

Claims 17, 18 (Зависимые от 14): Дополняют механизм кэширования сохранением детализированных поведенческих данных в контексте.

В кэше сохраняется контекстная информация, включающая:

  • Время, когда пользователь просмотрел предоставленный набор результатов (Claim 17).
  • Индикацию того, какие результаты были просмотрены пользователем более одного раза (Claim 18).

Где и как применяется

Этот патент описывает инфраструктурный механизм логирования (Data Acquisition Layer), который охватывает несколько этапов поискового процесса.

QUNDERSTANDING – Понимание Запросов
Система перехватывает входные данные – запрос пользователя и его первичный контекст (профиль, время).

RANKING / METASEARCH / RERANKING
Система перехватывает выходные данные этих процессов – сгенерированный набор результатов (SERP) и их порядок.

Взаимодействие с пользователем (Post-Search Behavior)
Критически важный аспект – сбор Context Information после предоставления результатов. Система фиксирует поведенческие сигналы: какие результаты были просмотрены, время и частота просмотра. Эти данные служат основой для оценки качества работы этапов RANKING/RERANKING.

Входные данные:

  • Текст запроса.
  • Набор результатов поиска (SERP).
  • Context Information: Идентификаторы пользователя (Cookies/Profile), временные метки, часовой пояс.
  • Действия пользователя: просмотры конкретных результатов, время просмотра.

Выходные данные:

  • Структурированные, отфильтрованные и консолидированные данные логов, сохраненные в Query Storage.

На что влияет

  • Аналитические возможности и ML: Патент напрямую влияет на способность поисковой системы анализировать поведение пользователей. Он предоставляет инфраструктуру для сбора данных (Training Data), необходимых для оценки качества поиска и обучения алгоритмов ранжирования.
  • Типы контента и запросов: Механизм универсален. В патенте особо упоминается возможность анализа коммерческих запросов (анализ цен продуктов, предложений магазинов), что подчеркивает его применимость в E-commerce.

Когда применяется

  • Триггеры активации: Механизм перехвата и логирования активируется при каждом взаимодействии между пользователем, системой обработки запросов и хранилищем данных.
  • Условия: Применение Filter Criteria определяет, какие данные будут сохранены. Consolidation Criteria определяют, будут ли данные агрегированы (например, при обнаружении повторяющегося запроса с идентичными результатами).

Пошаговый алгоритм

Процесс обработки и сохранения истории запроса

  1. Перехват запроса: Система фиксирует запрос, введенный пользователем или процессом.
  2. Перехват результатов: Система фиксирует набор результатов, возвращенный системой обработки запросов.
  3. Сбор контекстной информации: Собираются данные о пользователе, времени, а также поведенческие данные (просмотры результатов, время просмотра, повторные просмотры).
  4. Фильтрация (Опционально): К собранным данным применяются Filter Criteria для отсеивания ненужной информации.
  5. Консолидация (Опционально):
    • Система проверяет, выполнялся ли этот запрос ранее и были ли результаты идентичными (например, сверяясь с кэшем).
    • Если ДА (повтор): данные консолидируются. Обновляются счетчики повторений, добавляется новая контекстная информация к существующей записи (Consolidated Query Data).
    • Если НЕТ (новый запрос/результат): создается новая запись. Также патент упоминает возможность группировки схожих, но не идентичных запросов по общим критериям.
  6. Сохранение: Отфильтрованные и/или консолидированные данные сохраняются в Query Storage.
  7. Предоставление доступа: Сохраненные данные становятся доступны для запросов со стороны других процессов (например, систем аналитики, ML-пайплайнов).

Какие данные и как использует

Данные на входе

Система использует широкий спектр данных, перехваченных в процессе поиска:

  • Поведенческие факторы (Ключевые данные патента):
    • Какие результаты пользователь выбрал для просмотра (selected to view).
    • Время просмотра конкретных результатов.
    • Какие результаты были просмотрены более одного раза.
    • Был ли процесс получения результатов прерван (пользователем или системой).
  • Пользовательские факторы: Cookies, профили пользователей.
  • Временные факторы: Метка времени запроса, часовой пояс, время, затраченное на получение результатов, порядок и время возврата результатов.
  • Контентные факторы (в результатах): Сами данные, возвращенные в результатах (например, цены продуктов, названия магазинов, даты доставки).
  • Технические факторы (запроса): Текст запроса (например, SQL), инструмент, использованный для запроса (веб-форма, интерфейс).

Какие метрики используются и как они считаются

  • Счетчики повторений: Количество раз, когда был получен определенный запрос, и количество раз, когда был возвращен один и тот же результат.
  • Статистическая агрегация (для числовых результатов): Если результаты содержат числовые данные (например, цены), система может рассчитывать статистику: Максимум, Минимум, Среднее значение (Max, Min, Average) как для одного запроса, так и за период времени (например, за месяц).
  • Метрики взаимодействия: Агрегированные данные о просмотрах результатов (View Counts, View Times).

Выводы

  1. Систематический сбор поведенческих данных: Патент описывает инфраструктуру для масштабного и систематического сбора данных о взаимодействии пользователей с результатами поиска. Это подтверждает, что сбор User Behavior Data является стандартизированным процессом.
  2. Детализация поведенческих сигналов: В патенте явно указано (Claims 4, 17, 18), что система фиксирует не только факт запроса, но и детальные действия пользователя: какие результаты были просмотрены (кликнуты), время просмотра и частоту просмотра конкретных результатов.
  3. Инфраструктура для машинного обучения: Собираемые данные (запрос + показанные результаты + действия пользователя) являются критически важным набором данных ("топливом") для анализа качества поиска и обучения ML-моделей ранжирования. Эти данные используются для предсказания CTR, анализа удовлетворенности (Dwell Time, Pogo-sticking) и персонализации.
  4. Эффективность хранения и обработки логов: Механизмы фильтрации и консолидации (агрегация повторяющихся и схожих запросов) позволяют системе эффективно управлять огромными объемами генерируемых логов, делая их пригодными для анализа.
  5. Фокус на Post-Click анализе: Патент подчеркивает важность анализа того, что происходит после того, как результаты были показаны пользователю.

Практика

Best practices (это мы делаем)

  • Фокус на Post-Click User Experience: Поскольку система детально фиксирует взаимодействие пользователя с результатами (просмотр, время просмотра, повторные просмотры), необходимо уделять первостепенное внимание качеству пользовательского опыта на странице. Контент должен полностью удовлетворять интент пользователя, чтобы максимизировать время взаимодействия и минимизировать быстрые возвраты к выдаче.
  • Оптимизация сниппетов для релевантных кликов: Необходимо оптимизировать Title и Description для привлечения внимания и получения кликов от целевой аудитории. Сниппет должен точно отражать содержание страницы, чтобы ожидания пользователя совпадали с реальностью, генерируя положительные поведенческие сигналы.
  • Анализ удовлетворенности (User Satisfaction): Необходимо использовать доступные метрики (например, в Google Search Console, системах аналитики) для оценки того, насколько хорошо контент удовлетворяет запросы пользователей. Высокие позиции без качественного взаимодействия могут быть недолговечными, учитывая способность Google собирать эти данные.

Worst practices (это делать не надо)

  • Кликбейт и несоответствие заголовков контенту: Использование заголовков, которые привлекают клик, но не соответствуют содержанию страницы. Если система логирования фиксирует просмотр и его длительность, она сможет идентифицировать быстрое разочарование пользователя (например, короткий клик или pogo-sticking).
  • Игнорирование поведенческих факторов: Стратегии, направленные только на техническую оптимизацию и ссылки, без учета того, как реальные пользователи взаимодействуют с контентом на выдаче и на сайте.
  • Манипуляции с CTR без улучшения качества: Попытки искусственно накрутить CTR. Сложные системы логирования и анализа поведения (использующие собранный контекст, такой как профили пользователей и временные паттерны) могут выявить аномальные паттерны взаимодействия.

Стратегическое значение

Патент подтверждает фундаментальную важность поведенческих факторов в экосистеме Google. Хотя он описывает инфраструктуру сбора данных, а не алгоритм ранжирования, он ясно показывает, какие именно данные собираются и систематизируются. Долгосрочная SEO-стратегия должна быть направлена не только на достижение высоких позиций, но и на обеспечение высокого уровня удовлетворенности пользователя (User Satisfaction) и качественного взаимодействия с контентом.

Практические примеры

Сценарий: Оптимизация сниппетов на основе анализа поведенческих данных

Предположим, Google использует систему, описанную в патенте, для сбора данных о показах и просмотрах (кликах).

  1. Сбор данных (Системой Google): Система фиксирует, что страница А по запросу "купить кофемашину Nespresso" была показана 1000 раз на позиции 3. Также фиксируется (согласно Claim 4), что пользователи просмотрели (кликнули) этот результат 50 раз (CTR 5%).
  2. Анализ (Внешним процессом Google): Другая система (например, алгоритм ранжирования) анализирует эти Consolidated Query Data и сравнивает с ожидаемым CTR для позиции 3 (например, 8%). Выявлено отставание.
  3. Действие SEO-специалиста: Проанализировать сниппет страницы А (используя данные GSC). Текущий Title: "Кофемашины Nespresso - Модели и цены".
  4. Оптимизация: Изменить сниппет для повышения привлекательности и добавления УТП. Новый Title: "Купить кофемашину Nespresso: Все модели в наличии + 20 капсул в подарок".
  5. Результат: Система логирования фиксирует новый CTR в 9%. Внешний процесс анализа данных подтверждает улучшение взаимодействия, что может положительно сказаться на оценке качества страницы.

Вопросы и ответы

Является ли этот патент описанием алгоритма ранжирования?

Нет, это инфраструктурный патент. Он описывает систему для сбора, фильтрации, консолидации и хранения истории запросов и результатов. Он не описывает, как эти данные используются для ранжирования, но он определяет, какие именно данные доступны для систем ранжирования.

Какие именно поведенческие данные упоминаются в патенте?

Патент явно упоминает сбор следующих данных: какие результаты пользователь выбрал для просмотра (selected to view, Claim 4), время, когда пользователь просмотрел конкретные результаты (Claim 17), и какие результаты были просмотрены более одного раза (Claim 18). Также упоминается фиксация того, был ли процесс получения результатов прерван.

Что это значит для SEO? Подтверждает ли это использование CTR в ранжировании?

Это подтверждает техническую возможность и намерение Google систематически собирать данные, необходимые для расчета CTR и других поведенческих метрик (Dwell Time, Pogo-sticking). Наличие такой инфраструктуры делает высоковероятным использование этих данных в качестве входных сигналов для ML-моделей ранжирования.

Что такое "консолидация" (Consolidation) данных в контексте этого патента?

Консолидация – это механизм оптимизации хранения логов. Если один и тот же запрос вводился много раз и возвращал одинаковые результаты, система не будет сохранять каждую сессию отдельно. Вместо этого она сохранит одну запись и обновит счетчик (сколько раз это произошло) и добавит контекстную информацию о новых сессиях.

Может ли система группировать неидентичные запросы?

Да, патент упоминает возможность группировки схожих, но не идентичных запросов. Например, запросы "продукт P1, цвет КРАСНЫЙ" и "продукт P1, цвет ЗЕЛЕНЫЙ" могут быть сгруппированы по критерию "продукт P1, цвет указан", что полезно для анализа спроса.

Как механизмы фильтрации (Filter Criteria) влияют на собираемые данные?

Filter Criteria позволяют системе сохранять только интересующую информацию. Например, система может быть настроена сохранять только первые 20 результатов или только запросы, касающиеся определенной категории товаров. Это делает анализ более сфокусированным и экономит ресурсы.

Патент подан в 2004 году. Актуален ли он сейчас?

Фундаментальные принципы логирования и анализа поведения пользователей остаются неизменными и критически важными. Хотя конкретная реализация инфраструктуры наверняка эволюционировала, задачи, описанные в патенте (сбор, фильтрация, консолидация поведенческих данных), сегодня еще более актуальны в связи с развитием машинного обучения в поиске.

Как эта система связана с Google Analytics или Search Console?

Эта система описывает внутреннюю инфраструктуру сбора данных поисковой системы. Данные, собранные этой системой, вероятно, являются источником для отчетов, которые мы видим в Google Search Console (показы, клики, CTR, позиции). Google Analytics собирает данные на стороне сайта, в то время как эта система собирает данные на стороне поисковой выдачи (SERP).

Что важнее для SEO в контексте этого патента: получить позицию или получить качественное взаимодействие?

Оба аспекта важны, но патент подчеркивает важность того, что происходит после показа (Post-Click). Наличие инфраструктуры для детального анализа взаимодействия пользователя с результатами означает, что просто занять позицию недостаточно. Необходимо обеспечить качественное взаимодействие (релевантный клик и удовлетворение интента на странице).

Могут ли эти данные использоваться для чего-то еще, кроме улучшения поиска?

Да, патент прямо указывает на использование этих данных для дата-майнинга, бизнес-аналитики, анализа потребностей пользователей и даже для автоматических процессов, таких как обновление цен продуктов на основе анализа спроса и предложений конкурентов, зафиксированных в истории поиска.

Похожие патенты

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов
Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.
  • US7565345B2
  • 2009-07-21
  • Поведенческие сигналы

  • SERP

Как Google персонализирует рекомендации популярных запросов на основе истории поиска и браузинга пользователя
Google анализирует глобальные тренды поисковых запросов и сопоставляет их с индивидуальной историей пользователя (посещенные сайты, прошлые запросы, категории интересов). Если популярный запрос соответствует выявленным интересам пользователя, он будет рекомендован. Система также применяет фильтры, исключающие запросы, которые пользователь вводил недавно.
  • US9443022B2
  • 2016-09-13
  • Персонализация

  • Поведенческие сигналы

  • Свежесть контента

Как Google отслеживает, анализирует и использует историю поведения пользователя для персонализации поиска и визуализации активности
Патент Google описывает инфраструктуру для сбора и анализа истории действий пользователя (запросы, клики по органике и рекламе, просмотры страниц). Система использует эти данные, включая метрики вовлеченности вроде «stay-time», для определения «предпочитаемых местоположений» и персонализации выдачи. Также описан метод графической визуализации объема этой активности.
  • US7694212B2
  • 2010-04-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов
Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.
  • US20190278836A1
  • 2019-09-12
  • Семантика и интент

  • Персонализация

  • EEAT и качество

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

seohardcore