
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
Патент решает задачу повышения релевантности поисковой выдачи путем адаптации результатов под индивидуальные интересы пользователя. Стандартное ранжирование может не учитывать контекст и предпочтения пользователя. Изобретение предлагает механизм для динамической корректировки ранжирования на основе анализа контента, который пользователь потреблял ранее, фокусируясь на семантически значимых фразах и концепциях.
Запатентована система персонализации поиска, которая строит модель пользователя (User Model) на основе фраз и тематических кластеров, извлеченных из документов, с которыми пользователь ранее взаимодействовал. При получении нового запроса система идентифицирует фразы, связанные с запросом, и проверяет их наличие в User Model. Результаты поиска переранжируются путем повышения веса документов, содержащих фразы, которые пересекаются с интересами пользователя.
Система работает в несколько этапов:
Related Phrases) и кластеры (Clusters). Эта информация формирует User Model, которая может также включать счетчики интереса к кластерам (Cluster Counts).Related Phrases.Related Phrases запроса и фразами в User Model.Mask Bit Vector) или взвешивание по Cluster Counts.Высокая. Персонализация является ключевым элементом современных поисковых систем. Хотя конкретные технические реализации, описанные в патенте (например, использование битовых векторов и расчет Information Gain), могли эволюционировать в сторону нейросетевых подходов и векторных представлений (embeddings), фундаментальный принцип использования истории взаимодействия пользователя для адаптации выдачи остается крайне актуальным в 2025 году.
Патент имеет высокое значение для SEO (7/10). Он описывает конкретный механизм того, как поведение пользователя и история его взаимодействия с сайтами напрямую влияют на его будущую поисковую выдачу. Это подчеркивает стратегическую важность не только привлечения трафика, но и удержания пользователя, поощрения глубокого взаимодействия с контентом и формирования лояльности, чтобы сайт стал частью User Model пользователя для определенной тематики.
Information Gain по отношению хотя бы к одной другой фразе в наборе. Представляет собой тему или концепцию.User Model, показывающие, как часто фразы из определенного кластера встречались в документах, потребленных пользователем.Related Phrases запроса и User Model. Биты устанавливаются только для тех фраз, которые присутствуют в обоих наборах.Information Gain между ними превышает высокий порог. Это указывает на сильную семантическую связь.Related Phrases данной фразы также присутствуют в этом документе. Биты упорядочены по убыванию Information Gain.Cluster Counts), извлеченных из документов, которые пользователь ранее посещал или с которыми взаимодействовал.Патент фокусируется на методах использования фраз, извлеченных из истории поведения пользователя, для изменения результатов поиска.
Claim 1 (Независимый пункт): Описывает базовый метод персонализации.
Related Phrases (первые связанные фразы).User Model, включающая эти первые связанные фразы.Related Phrases запроса (вторые связанные фразы), которые также присутствуют в User Model (пересечение интересов).scores) результатов поиска взвешиваются (корректируются) в соответствии с этими общими фразами.Claims 2-6 (Зависимые от 1): Уточняют, что такое "обращение к документу" (accessed by a user). Это включает действия высокого интереса: печать (Claim 2), сохранение (Claim 3), добавление в закладки (Claim 4), отправка по email (Claim 5) или удержание документа открытым в браузере в течение определенного времени (Claim 6).
Claim 11 (Независимый пункт): Уточняет механизм идентификации общих фраз с использованием битовых векторов.
Процесс аналогичен Claim 1, но детализирует, как происходит идентификация общих фраз: для фразы запроса извлекается Related Phrase Bit Vector, определяется, какие из связанных фраз есть в User Model, и формируется Related Phrase Bit Mask (маска). Эта маска затем используется для взвешивания (как описано в Claim 12).
Claim 13 (Независимый пункт): Описывает альтернативный метод персонализации с использованием кластеров.
Процесс аналогичен Claim 1, но User Model состоит из Cluster Counts (счетчиков интереса к темам/кластерам). Взвешивание результатов поиска происходит на основе этих Cluster Counts для фраз, связанных с запросом.
Изобретение затрагивает несколько этапов поиска, опираясь на инфраструктуру фразового индексирования и влияя на финальное ранжирование.
CRAWLING – Сбор данных (Data Acquisition)
На этом этапе происходит сбор данных о поведении пользователя (через логи сервера, cookies или клиентские инструменты) для фиксации документов, с которыми он взаимодействует, что необходимо для построения User Model.
INDEXING – Индексирование и извлечение признаков
Вся инфраструктура создается здесь: идентификация Good Phrases, расчет Information Gain, определение Related Phrases, формирование Clusters и индексация документов с созданием Related Phrase Bit Vectors.
QUNDERSTANDING – Понимание Запросов
Система идентифицирует фразы в запросе пользователя и извлекает для них список связанных фраз (Qr).
RERANKING – Переранжирование (Персонализация)
Основное применение патента. На этом этапе система использует User Model для корректировки стандартных оценок ранжирования.
User Model.Mask Bit Vector или используются Cluster Counts для расчета персонализированного веса.Входные данные:
User Model (набор фраз и/или Cluster Counts).Related Phrase Bit Vectors, данные о Clusters).Выходные данные:
User Model.Related Phrases текущего запроса и фразами/кластерами в User Model.User Model может строиться на основе последних K запросов и P документов (в патенте упоминается около 250 каждого), может быть ограничена сессией или сохраняться длительное время с понижением веса старых данных.Процесс А: Построение User Model (Фоновый процесс)
Good Phrases.Related Phrases и Clusters, ассоциированные с извлеченными фразами.Related Phrases и информация о Clusters добавляются в User Model пользователя.Cluster Count в User Model.Процесс Б: Персонализация поиска (Обработка запроса)
User Model.Related Phrases (Qr).User Model.Mask Bit Vector. Биты устанавливаются только для тех Qr, которые найдены в User Model.Mask Bit Vector применяется (например, через операцию AND) к Related Phrase Bit Vector каждого документа. Это обнуляет вклад фраз, не интересующих пользователя.Cluster Counts из User Model используются для взвешивания оценок документов, которые содержат фразы из соответствующих кластеров.Патент фокусируется на использовании поведенческих данных для персонализации, опираясь на инфраструктуру фразового индексирования.
Good Phrases), присутствующие в посещенных документах и в документах из результатов поиска.Related Phrase Bit Vectors для документов. Данные о Related Phrases и Clusters. Метрики Information Gain.Body Hit Score). Документы с большим количеством высокозначимых связанных фраз получают более высокую оценку.User Model, отражающие интерес пользователя к определенным темам (кластерам фраз). Используются как весовые коэффициенты при ранжировании.Related Phrase Bit Vector Value.User Model на основе Related Phrases и Clusters, что позволяет понять глубокие тематические интересы пользователя, а не просто набор посещенных им страниц или введенных запросов.User Model формируется из контента, который пользователь активно потреблял. Поведение пользователя напрямую влияет на его будущую выдачу, причем учитывается глубина взаимодействия (просмотр vs. сохранение/печать).Mask Bit Vector), отсекая или понижая контент, не соответствующий интересам пользователя, даже если он релевантен запросу. Альтернативно, она работает как бустинг (через Cluster Counts), повышая контент из интересующих пользователя тематик.Related Phrases), с большей вероятностью попадет в User Model пользователя и будет лучше ранжироваться в персонализированной выдаче.User Model строится на основе потребленного контента (особенно выделены действия в Claims 2-6), эти действия укрепляют модель пользователя в вашу пользу.Related Phrases и Clusters). Это увеличивает вероятность того, что контент станет частью User Model пользователя в данной тематике.User Model, насыщенную фразами вашего сайта, что даст вам преимущество в их персонализированной выдаче.User Model не будет эффективно сформирована в пользу вашего ресурса.User Model и не формирует сильных кластеров интересов.Патент подтверждает, что для Google долгосрочное взаимодействие пользователя с контентом является фактором ранжирования через механизм персонализации. Стратегия SEO должна смещаться от транзакционного подхода (получить клик по запросу) к подходу, основанному на взаимоотношениях (стать авторитетным источником для пользователя в определенной теме). Понимание этого механизма подчеркивает, что SEO – это оптимизация пользовательского опыта и ценности контента для формирования устойчивого спроса.
Сценарий: Усиление видимости сайта по ремонту техники для лояльного пользователя
User Model пользователя наполняется фразами типа "замена матрицы ноутбука", "перегрев процессора", "ошибка обновления iOS". Счетчики (Cluster Counts) для кластера "Ремонт электроники" увеличиваются.Related Phrases запроса пересекаются с кластером "Ремонт электроники" в User Model пользователя.Как система определяет, какие документы использовать для построения модели пользователя (User Model)?
Система отслеживает документы, к которым пользователь обращается (accessed). В патенте уточняется, что это могут быть не только клики, но и действия, свидетельствующие о более высоком уровне интереса: печать документа, сохранение, добавление в избранное (favorite/link), отправка по email или длительное время просмотра (например, 10 минут). Активное потребление контента важнее простого клика.
Что такое связанные фразы (Related Phrases) и как они определяются?
Related Phrases — это фразы, которые статистически часто встречаются вместе в корпусе документов. Связь определяется через метрику Information Gain: если фактическая частота совместной встречаемости двух фраз значительно превышает ожидаемую (случайную), они считаются связанными. Это позволяет системе группировать фразы в концепции или темы.
Как именно происходит переранжирование результатов?
Описано два основных механизма. Первый использует Mask Bit Vector, который создается из фраз, общих для запроса и User Model. Эта маска применяется к оценке документа, эффективно фильтруя результаты. Второй использует Cluster Counts (счетчики интереса к темам) из User Model как веса для повышения (бустинга) документов из интересующих пользователя тематик.
Влияет ли этот патент на ранжирование для новых пользователей или в режиме инкогнито?
Нет. Этот механизм персонализации требует наличия истории взаимодействия пользователя с контентом (User Model). Для новых пользователей или сессий без истории (инкогнито) будет применяться стандартное ранжирование без персонализации, описанной в этом патенте.
Как SEO-специалист может оптимизировать сайт под этот алгоритм персонализации?
Ключевая стратегия – стать основным источником информации для вашей целевой аудитории в выбранной нише. Это достигается через создание глубокого, семантически богатого контента (использующего множество Related Phrases) и стимулирование повторных визитов и вовлеченности. Цель – насытить User Model ваших пользователей фразами с вашего сайта.
Что такое кластеры (Clusters) и почему они важны?
Кластеры — это группы тесно связанных фраз, представляющие собой темы. Они важны, потому что User Model может отслеживать интерес пользователя к целым темам (через Cluster Counts), а не только к отдельным фразам. Это позволяет системе учитывать широкие тематические интересы пользователя при ранжировании.
Устарел ли этот патент в эпоху нейронных сетей и эмбеддингов?
Хотя конкретные технические реализации (такие как битовые векторы и расчет Information Gain) могли быть заменены более сложными моделями (например, эмбеддингами), базовая идея патента – использование истории потребления контента для тематической персонализации поиска – актуальна как никогда. Современные системы реализуют ту же логику, но более продвинутыми методами.
Как этот патент связан с Topical Authority?
Он тесно связан. Создавая контент, который формирует сильные тематические кластеры (Clusters), сайт развивает Topical Authority. Пользователи, потребляющие этот контент, формируют User Model, сфокусированную на этой теме. В результате сайт получает преимущество в персонализированной выдаче по этой теме, что усиливает его авторитетность.
Может ли этот механизм понизить мой сайт в выдаче?
Да, косвенно. Если User Model пользователя сильно насыщена фразами и кластерами с сайтов конкурентов, то при релевантном запросе система может предпочесть конкурентов вашему сайту, даже если ваш общий рейтинг высок. Это подчеркивает важность борьбы за лояльность аудитории.
Является ли этот патент доказательством использования поведенческих факторов в основном ранжировании Google?
Нет, этот патент доказывает использование поведенческих факторов (клики, вовлеченность) для слоя персонализации (Reranking), а не для основного ранжирования (Ranking). Он показывает, как Google использует эти данные для адаптации выдачи под конкретного пользователя, но не утверждает, что эти данные используются для определения глобальной релевантности документа.

Индексация
SERP
Семантика и интент

Персонализация
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Персонализация
Поведенческие сигналы
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

SERP
Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
SERP

Ссылки
EEAT и качество
SERP

Ссылки
Индексация
Поведенческие сигналы

Индексация
Краулинг
Ссылки

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Ссылки
Индексация
Техническое SEO

Персонализация
Поведенческие сигналы
SERP
