
Патент Google, описывающий инфраструктуру для перехвата, фильтрации, консолидации и хранения истории поисковых запросов и их результатов. Система детально фиксирует контекстную информацию, включая то, какие результаты просмотрел пользователь, когда и как часто. Эти данные формируют основу для анализа поведения пользователей и обучения систем ранжирования.
Патент решает задачу эффективного сбора, хранения и организации огромного объема данных, генерируемых в процессе обработки поисковых запросов. Он обеспечивает инфраструктуру для систематического анализа истории запросов и взаимодействия пользователей с результатами поиска (User Behavior Data). Цель – создать хранилище данных о поиске, пригодное для дата-майнинга, бизнес-аналитики и оптимизации производительности (кэширования).
Запатентована система для поддержания истории запросов. Она перехватывает (intercepts) запросы и возвращаемые результаты, собирает детальную контекстную информацию (Context Information), включая действия пользователя с результатами. Затем система фильтрует и консолидирует эти данные (например, агрегируя повторяющиеся запросы для экономии ресурсов) и сохраняет их в отдельном хранилище (Query Storage) для последующего анализа другими процессами.
Система функционирует как слой логирования и анализа данных:
Filter Criteria), чтобы сохранить только релевантную информацию.Consolidated Query Data).Высокая. Хотя патент подан в 2004 году, инфраструктура сбора, обработки и анализа логов является фундаментальной частью любой современной поисковой системы. Методы сбора поведенческих данных, описанные в патенте (например, фиксация того, какие результаты были просмотрены пользователем, время и частота просмотра), остаются крайне актуальными для обучения ML-моделей ранжирования в 2025 году.
Влияние на SEO значительное (7.5/10). Это не патент об алгоритме ранжирования. Однако он описывает инфраструктуру для сбора поведенческих данных (User Behavior Data) – что пользователь искал, что ему показали, и что он выбрал или просмотрел. Эти данные критически важны для оценки качества поиска и обучения систем ранжирования (например, для предсказания CTR и оценки удовлетворенности). Патент подтверждает техническую возможность и намерение Google детально и систематически отслеживать взаимодействие пользователя с выдачей.
selected to view), время просмотра, частоту просмотра конкретных результатов (viewed more than once), было ли прервано получение результатов.Storage System), предназначенная для сохранения перехваченной, отфильтрованной и консолидированной истории запросов и результатов.Claim 1 (Независимый пункт): Описывает основной процесс логирования с оптимизацией хранения.
Filter Criteria.cache memory).Consolidated Query Data, связанные с предыдущим запросом, без повторного сохранения текущего запроса.Claim 4 (Зависимый): Детализирует сбор контекстной информации, критически важной для анализа поведения.
Система собирает контекстную информацию, которая включает данные о том, какие именно результаты пользователь выбрал для просмотра (selected to view) из предложенного набора результатов.
Claim 14 (Независимый): Описывает механизм кэширования запросов и результатов для повышения производительности.
cache memory.cache memory.Claims 17, 18 (Зависимые от 14): Дополняют механизм кэширования сохранением детализированных поведенческих данных в контексте.
В кэше сохраняется контекстная информация, включающая:
Этот патент описывает инфраструктурный механизм логирования (Data Acquisition Layer), который охватывает несколько этапов поискового процесса.
QUNDERSTANDING – Понимание Запросов
Система перехватывает входные данные – запрос пользователя и его первичный контекст (профиль, время).
RANKING / METASEARCH / RERANKING
Система перехватывает выходные данные этих процессов – сгенерированный набор результатов (SERP) и их порядок.
Взаимодействие с пользователем (Post-Search Behavior)
Критически важный аспект – сбор Context Information после предоставления результатов. Система фиксирует поведенческие сигналы: какие результаты были просмотрены, время и частота просмотра. Эти данные служат основой для оценки качества работы этапов RANKING/RERANKING.
Входные данные:
Context Information: Идентификаторы пользователя (Cookies/Profile), временные метки, часовой пояс.Выходные данные:
Query Storage.Training Data), необходимых для оценки качества поиска и обучения алгоритмов ранжирования.Filter Criteria определяет, какие данные будут сохранены. Consolidation Criteria определяют, будут ли данные агрегированы (например, при обнаружении повторяющегося запроса с идентичными результатами).Процесс обработки и сохранения истории запроса
Filter Criteria для отсеивания ненужной информации.Consolidated Query Data).Query Storage.Система использует широкий спектр данных, перехваченных в процессе поиска:
selected to view).User Behavior Data является стандартизированным процессом.Патент подтверждает фундаментальную важность поведенческих факторов в экосистеме Google. Хотя он описывает инфраструктуру сбора данных, а не алгоритм ранжирования, он ясно показывает, какие именно данные собираются и систематизируются. Долгосрочная SEO-стратегия должна быть направлена не только на достижение высоких позиций, но и на обеспечение высокого уровня удовлетворенности пользователя (User Satisfaction) и качественного взаимодействия с контентом.
Сценарий: Оптимизация сниппетов на основе анализа поведенческих данных
Предположим, Google использует систему, описанную в патенте, для сбора данных о показах и просмотрах (кликах).
Consolidated Query Data и сравнивает с ожидаемым CTR для позиции 3 (например, 8%). Выявлено отставание.Является ли этот патент описанием алгоритма ранжирования?
Нет, это инфраструктурный патент. Он описывает систему для сбора, фильтрации, консолидации и хранения истории запросов и результатов. Он не описывает, как эти данные используются для ранжирования, но он определяет, какие именно данные доступны для систем ранжирования.
Какие именно поведенческие данные упоминаются в патенте?
Патент явно упоминает сбор следующих данных: какие результаты пользователь выбрал для просмотра (selected to view, Claim 4), время, когда пользователь просмотрел конкретные результаты (Claim 17), и какие результаты были просмотрены более одного раза (Claim 18). Также упоминается фиксация того, был ли процесс получения результатов прерван.
Что это значит для SEO? Подтверждает ли это использование CTR в ранжировании?
Это подтверждает техническую возможность и намерение Google систематически собирать данные, необходимые для расчета CTR и других поведенческих метрик (Dwell Time, Pogo-sticking). Наличие такой инфраструктуры делает высоковероятным использование этих данных в качестве входных сигналов для ML-моделей ранжирования.
Что такое "консолидация" (Consolidation) данных в контексте этого патента?
Консолидация – это механизм оптимизации хранения логов. Если один и тот же запрос вводился много раз и возвращал одинаковые результаты, система не будет сохранять каждую сессию отдельно. Вместо этого она сохранит одну запись и обновит счетчик (сколько раз это произошло) и добавит контекстную информацию о новых сессиях.
Может ли система группировать неидентичные запросы?
Да, патент упоминает возможность группировки схожих, но не идентичных запросов. Например, запросы "продукт P1, цвет КРАСНЫЙ" и "продукт P1, цвет ЗЕЛЕНЫЙ" могут быть сгруппированы по критерию "продукт P1, цвет указан", что полезно для анализа спроса.
Как механизмы фильтрации (Filter Criteria) влияют на собираемые данные?
Filter Criteria позволяют системе сохранять только интересующую информацию. Например, система может быть настроена сохранять только первые 20 результатов или только запросы, касающиеся определенной категории товаров. Это делает анализ более сфокусированным и экономит ресурсы.
Патент подан в 2004 году. Актуален ли он сейчас?
Фундаментальные принципы логирования и анализа поведения пользователей остаются неизменными и критически важными. Хотя конкретная реализация инфраструктуры наверняка эволюционировала, задачи, описанные в патенте (сбор, фильтрация, консолидация поведенческих данных), сегодня еще более актуальны в связи с развитием машинного обучения в поиске.
Как эта система связана с Google Analytics или Search Console?
Эта система описывает внутреннюю инфраструктуру сбора данных поисковой системы. Данные, собранные этой системой, вероятно, являются источником для отчетов, которые мы видим в Google Search Console (показы, клики, CTR, позиции). Google Analytics собирает данные на стороне сайта, в то время как эта система собирает данные на стороне поисковой выдачи (SERP).
Что важнее для SEO в контексте этого патента: получить позицию или получить качественное взаимодействие?
Оба аспекта важны, но патент подчеркивает важность того, что происходит после показа (Post-Click). Наличие инфраструктуры для детального анализа взаимодействия пользователя с результатами означает, что просто занять позицию недостаточно. Необходимо обеспечить качественное взаимодействие (релевантный клик и удовлетворение интента на странице).
Могут ли эти данные использоваться для чего-то еще, кроме улучшения поиска?
Да, патент прямо указывает на использование этих данных для дата-майнинга, бизнес-аналитики, анализа потребностей пользователей и даже для автоматических процессов, таких как обновление цен продуктов на основе анализа спроса и предложений конкурентов, зафиксированных в истории поиска.

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Свежесть контента

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
SERP

Ссылки
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
Семантика и интент

Семантика и интент
Персонализация
EEAT и качество

Поведенческие сигналы
Семантика и интент
SERP

Ссылки
EEAT и качество
Антиспам

Свежесть контента
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент
