
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
Патент решает задачу идентификации документов, которые семантически или тематически связаны друг с другом, используя методы коллаборативной фильтрации, основанные на поведении пользователей, а не только на анализе контента или ссылок. Цель — улучшить качество поиска путем выявления документов, которые пользователи часто просматривают вместе или последовательно во время поисковых сессий. Это позволяет системе предоставлять более релевантные результаты, рекомендации и связанные запросы, учитывая контекст и намерение пользователя в рамках сессии.
Запатентована система и метод для генерации набора связанных документов на основе исходного набора. Ядром изобретения является расчет Strength of Relationship Score (Оценки силы связи) между документами. Эта оценка базируется на агрегированных данных о том, как часто пользователи просматривают второй документ в течение определенного окна времени после того, как первый документ был им показан (presented) на странице результатов поиска. Система агрегирует эти индивидуальные оценки для выявления наиболее связанных документов.
Система работает в два основных этапа: сбор данных и применение модели.
Aggregate Strength of Relationship Score путем суммирования индивидуальных оценок связи с каждым из исходных документов.Высокая. Анализ поведения пользователей, коллаборативная фильтрация и учет контекста сессии являются фундаментальными компонентами современных поисковых и рекомендательных систем (таких как Google Search и Discover). Понимание взаимосвязей между документами на основе реальных пользовательских путей остается критически важной задачей для улучшения релевантности и персонализации.
Патент имеет высокое стратегическое значение для SEO (8/10). Он демонстрирует, что релевантность определяется не только соответствием контента запросу, но и тем, насколько хорошо документ вписывается в более широкий контекст пользовательской сессии и поискового пути. Это подчеркивает важность оптимизации под интент и задачу пользователя в целом (Task Completion), а не только под отдельные ключевые слова. Стратегии, направленные на создание контента, который удовлетворяет несколько связанных потребностей в рамках одной темы (Topical Authority), получают подтверждение своей эффективности.
Strength of Relationship Scores между этим кандидатом и каждым документом из исходного набора.Strength of Relationship Scores для пар документов.Claim 1 (Независимый пункт): Описывает основной метод идентификации связанных документов.
Strength of Relationship Score между каждым документом-кандидатом и каждым исходным документом.User Selection Data от множества пользователей.Aggregate Strength of Relationship Score для каждого кандидата.Claim 3 (Зависимый от 1): Уточняет вес взаимодействий.
Агрегация данных может включать масштабирование (увеличение веса) данных пользователя, если он просмотрел кандидата после того, как *выбрал* (clicked) исходный документ из SERP, а не просто увидел его.
Claim 6 (Зависимый от 1): Описывает применение для улучшения выдачи (Augmentation).
Claim 8 (Зависимый от 1): Описывает применение для рекомендаций.
Claim 10 (Зависимый от 1): Описывает использование предпочтений пользователя.
Система может получать данные о предпочтениях пользователя (например, рейтинги или время просмотра) для исходных документов и использовать их как веса (document weight) при расчете агрегированной оценки. Это позволяет усилить влияние более важных для пользователя документов.
Claim 13 (Зависимый от 1): Описывает применение для предложения запросов.
Изобретение затрагивает несколько этапов поиска, связывая офлайн-анализ поведения с онлайн-персонализацией и ранжированием.
INDEXING – Индексирование и извлечение признаков
На этом этапе (или в рамках параллельных офлайн-процессов анализа логов) происходит построение Model Database. Система анализирует User Selection Data, вычисляет Strength of Relationship Scores (P(g|i)) между парами документов и сохраняет их.
QUNDERSTANDING – Понимание Запросов
Система анализирует контекст текущей сессии пользователя (просмотренные документы, предыдущие запросы), чтобы определить исходный набор документов для генерации связанных ресурсов (Claim 13).
RANKING / RERANKING – Ранжирование и Переранжирование
Механизм может применяться для модификации ранжирования:
METASEARCH – Метапоиск и Смешивание
Применяется для генерации блоков рекомендаций и связанных запросов (Claim 8, Claim 13). Система может предоставлять предложенные документы параллельно с основными результатами поиска.
Входные данные:
Model Database (предварительно рассчитанные P(g|i)).Выходные данные:
Алгоритм применяется в нескольких сценариях:
Процесс А: Построение Модели (Офлайн)
Strength of Relationship Score для каждой пары. Например, расчет условной вероятности P(G|I) = (Количество просмотров G после показа I) / (Общее количество показов I).Model Database.Процесс Б: Генерация Связанных Документов (Онлайн/Офлайн)
Model Database.Aggregate Strength of Relationship Score S(G). Например, путем суммирования: S(G)=∑iWi⋅P(G∣Ii).Патент сосредоточен исключительно на использовании поведенческих данных для определения связанности документов.
Контентные, ссылочные или технические факторы для расчета связанности в этом патенте не используются.
Strength of Relationship Scores между собой.Патент подтверждает стратегический приоритет Google на понимание и удовлетворение намерений пользователя в контексте всей его задачи (Task Completion), а не только отдельного запроса. Для SEO это означает необходимость смещения фокуса с анализа отдельных страниц на анализ пользовательских путей и сессий. Долгосрочная стратегия должна быть направлена на создание ресурсов, которые становятся предпочтительным источником для решения целого класса задач, что естественным образом приводит к сильным поведенческим сигналам связанности, описанным в патенте.
Сценарий: Оптимизация контент-кластера для сложной покупки (например, выбор ноутбука)
Model Database Google эти страницы получат высокие Strength of Relationship Scores между собой. Когда пользователь введет запрос "сравнение MacBook Air и Dell XPS", система, учитывая контекст сессии (если он ранее искал обзоры), может повысить в ранжировании именно те страницы сравнения, которые часто ведут к успешному завершению задачи (например, к отзывам или покупке).Как система рассчитывает «Силу связи» (Strength of Relationship Score) между двумя документами?
Оценка рассчитывается на основе агрегированных данных о поведении пользователей. Конкретно, она определяется как вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Это условная вероятность P(B|A), основанная на частоте совместных просмотров (co-visitation) в логах поиска.
Основан ли этот алгоритм на анализе контента или ссылок?
Нет. Этот патент описывает метод коллаборативной фильтрации, который полагается исключительно на поведенческие данные (показы и просмотры). Он не анализирует текст документов и не учитывает ссылки между ними для определения связанности. Связь устанавливается, если пользователи часто просматривают эти документы вместе.
Что такое нормализация по популярности P(g) и зачем она нужна?
Нормализация — это корректировка оценки связанности с учетом общей популярности документа-кандидата (P(g)). Она нужна, чтобы избежать смещения в сторону глобально популярных ресурсов (например, главной страницы Wikipedia), которые часто просматриваются пользователями независимо от контекста. Нормализация помогает выделить документы, которые специфически связаны с исходным набором, а не просто популярны сами по себе.
Имеет ли значение, кликнул ли пользователь на первый документ или просто увидел его в выдаче?
Да. Основной механизм (Claim 1) учитывает показ (presentation) исходного документа. Однако патент (Claim 3) также описывает возможность придавать больший вес (scaling factor) тем связям, где пользователь не просто увидел, а кликнул (selected) на исходный документ перед просмотром второго. Это позволяет считать связь более надежной.
Как этот патент связан с концепцией Тематического Авторитета (Topical Authority)?
Патент предоставляет поведенческое обоснование для Topical Authority. Если сайт качественно покрывает тему, пользователи с большей вероятностью будут изучать несколько его страниц в рамках одной сессии для решения своей задачи. Это приводит к формированию сильных связей (высоких Strength of Relationship Scores) между страницами этого сайта в модели Google, что система интерпретирует как признак авторитетности и полезности ресурса в данной теме.
Может ли этот механизм использоваться для персонализации выдачи?
Да, это одно из ключевых применений. Система может использовать историю просмотров пользователя или его действия в текущей сессии в качестве исходного набора документов (Claim 8). Затем она находит связанные документы и использует их для переранжирования текущей выдачи (Session-based Ranking) или для генерации персонализированных рекомендаций.
Как SEO-специалист может оптимизировать сайт с учетом этого патента?
Ключевая стратегия — оптимизация под полный путь пользователя (User Journey) и обеспечение завершения задачи (Task Completion). Необходимо создавать контент, который логически связан и облегчает пользователю переход от одного этапа решения задачи к другому. Качественная внутренняя перелинковка и структура сайта, соответствующие реальным потребностям пользователей, будут способствовать формированию сильных поведенческих сигналов связанности.
Что такое «Дополненный набор документов» (Augmented Set of Documents)?
Это результат применения механизма для улучшения стандартной выдачи (Claim 6). Система берет исходные результаты поиска по запросу, находит документы, которые тесно связаны с этими результатами (на основе поведения пользователей), и подмешивает эти связанные документы в финальную выдачу. Это позволяет улучшить релевантность и полноту SERP.
Влияет ли время просмотра (Dwell Time) на работу этого алгоритма?
Да, патент упоминает это как опциональный фактор. Система может учитывать просмотры, только если они длились дольше определенного порога (Claim 2). Также время просмотра исходных документов может использоваться как вес при расчете агрегированной оценки (Claim 10), позволяя более важным (дольше изучаемым) документам сильнее влиять на результат.
Может ли этот механизм предлагать связанные запросы?
Да (Claim 13). Система сначала находит документы, связанные с текущей сессией пользователя, а затем определяет, какие запросы чаще всего приводят к этим связанным документам. Эти запросы предлагаются пользователю как рекомендации для дальнейшего поиска, помогая ему глубже изучить тему.

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Персонализация
SERP

Поведенческие сигналы
Персонализация

Ссылки
SERP
Поведенческие сигналы

Поведенческие сигналы
Персонализация

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Knowledge Graph
Свежесть контента
Семантика и интент

Поведенческие сигналы
Семантика и интент
Антиспам

Персонализация
Семантика и интент
Поведенческие сигналы

Ссылки
Поведенческие сигналы
Мультимедиа

Поведенческие сигналы
Индексация
Семантика и интент

Поведенческие сигналы
Семантика и интент
Структура сайта

EEAT и качество
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы
