
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
Патент решает задачу повышения релевантности поисковой выдачи путем ее персонализации на основе интересов пользователя или контекста текущего сайта. Он направлен на улучшение стандартных результатов поиска за счет продвижения контента, который тематически связан с известными интересами пользователя, даже если эта связь не очевидна из анализа контента или ссылок. Система использует поведенческие паттерны сообщества пользователей для выявления таких скрытых связей.
Запатентована система генерации Search Boost Vector (Вектора повышения поисковой выдачи). Этот вектор представляет собой список URL и соответствующих им весов. Он создается путем анализа данных о совместном посещении (co-visitation) веб-ресурсов сообществом пользователей. Система определяет, какие сайты пользователи посещают в течение одного временного интервала, и использует эту информацию для вычисления силы тематической связи между ресурсами. Полученный вектор затем применяется для переранжирования стандартных результатов поиска.
Система работает следующим образом:
Uniqueness Factor (Уникальность) и Consistency Factor (Постоянство). Уникальность помогает отсеять общепопулярные сайты, а Постоянство обеспечивает статистическую значимость.Information Retrieval values или query score) результатов, тем самым повышая их позицию в выдаче.Высокая. Персонализация поиска и использование поведенческих данных для понимания связей между сущностями и ресурсами являются ключевыми направлениями развития Google. Методы, основанные на анализе поведения пользователей (User Behavior Analysis), активно применяются для улучшения качества выдачи, особенно в условиях, когда традиционных сигналов (контент, ссылки) недостаточно. Этот патент описывает фундаментальный механизм использования коллективного поведения для влияния на ранжирование.
Патент имеет высокое значение для SEO (8/10). Он демонстрирует, что Google может определять тематическую релевантность и связь между сайтами не только через контент и ссылки, но и через реальное поведение пользователей. Это подчеркивает важность построения пользовательских путей (User Journey), удержания аудитории и понимания того, какие еще ресурсы посещает целевая аудитория. Сайты, которые являются частью естественного потока информации для пользователей в определенной нише, получают преимущество.
weights). Используется для модификации стандартных оценок ранжирования с целью персонализации или контекстуализации выдачи.time interval или time window).Boost Vector. Может быть основан на истории пользователя, его профиле, избранном или профиле текущего сайта.Boost Vector, чтобы снизить влияние URL, которые посещаются очень большим количеством пользователей.Boost Vector, определенного на основе профиля или предпочтений пользователя.Boost Vector, определенного на основе профиля контентного сайта (например, сайта, с которого пользователь отправляет запрос).Claim 1 (Независимый пункт): Описывает основной метод генерации Search Boost Vector.
co-visits) отдельными пользователями в сообществе пользователей в течение определенного временного интервала.Search Boost Vector с весами для URL из второго набора. Веса основаны, по крайней мере частично, на частоте посещений пользователями соответствующих URL во втором наборе.boost) результатов при обслуживании поисковой выдачи.Claim 3 (Зависимый от 1): Уточняет механизм взвешивания, связанный с популярностью.
URL во втором наборе, посещаемые большим количеством пользователей (первый диапазон), в среднем имеют более низкие веса в Boost Vector, чем URL, посещаемые меньшим количеством пользователей (второй диапазон). Это механизм, схожий с IDF или Uniqueness Factor, который направлен на понижение веса общепопулярных ресурсов и выделение нишевых, но сильно связанных ресурсов.
Claim 7 (Зависимый от 1): Введение временного фактора.
При генерации вектора применяется Temporal Window Function. Весовые коэффициенты этой функции зависят от временного интервала между совместными посещениями. Это означает, что близость посещений по времени влияет на итоговый вес в векторе.
Claim 9 и 10 (Зависимые от 1): Введение фактора постоянства.
Генерация вектора включает определение Consistency Factor. Он определяется как абсолютное количество совместных посещений URL из первого и второго наборов. Это обеспечивает статистическую надежность связи.
Claim 11 (Зависимый от 1): Определение фактора уникальности.
Генерация вектора включает определение Uniqueness Factor. Для конкретного URL из второго набора (URL2) и URL из первого набора (URL1) он рассчитывается путем деления частоты совместных посещений URL1 и URL2 на частоту посещений URL2.
Формула Фактора Уникальности:
Claim 37 (Независимый пункт): Описывает метод применения Search Boost Vector.
boosting) подмножества результатов с использованием Search Boost Vector. Вес из вектора используется для повышения соответствующего URL в результатах. Вес основан на совместных посещениях и частоте посещений.Изобретение затрагивает несколько этапов поиска, используя данные, собираемые системой непрерывно, и влияя на финальные этапы ранжирования.
CRAWLING & Data Acquisition (Сбор данных)
Система должна непрерывно собирать и хранить данные о поведении пользователей (User URL Log), включая идентификаторы пользователей (например, через cookies), посещенные URL и временные метки (Time Stamp). Эти данные являются основой для анализа совместных посещений.
INDEXING & Feature Extraction (Индексирование и извлечение признаков)
На этом этапе (или в рамках отдельного офлайн-процесса) происходит обработка логов для вычисления связей между URL. Система анализирует данные сообщества, вычисляет Consistency Factor и Uniqueness Factor для пар URL и генерирует Boost Vectors для различных профилей пользователей или сайтов.
RANKING (Ранжирование)
Основная система ранжирования генерирует первоначальный набор результатов поиска с базовыми оценками релевантности (query scores).
RERANKING (Переранжирование)
Основное применение патента. На этом этапе система выбирает соответствующий Boost Vector (на основе профиля пользователя или сайта) и применяет его к результатам этапа RANKING. Оценки релевантности документов, присутствующих в Boost Vector, умножаются на соответствующие веса, что приводит к их повышению в финальной выдаче.
Входные данные:
Выходные данные:
Search Boost Vector (список URL и весов).Boost Vector.Consistency Factor и Uniqueness Factor (если используются) превышают установленные пороги. Например, порог уникальности может быть 0.90, а порог постоянства – 10,000 совместных посещений.Процесс А: Генерация Boost Vector (Офлайн или по требованию)
Consistency Factor: Общее количество совместных посещений.Uniqueness Factor: Отношение совместных посещений к общему числу посещений S.Uniqueness Factor (например, 1 + Uniqueness Factor) и/или нормализован с помощью IDF.Процесс Б: Применение Boost Vector (Во время поиска)
query scores).Boost Vector, связанный с профилем пользователя или текущим сайтом.Boost Vector. Если да, базовая оценка релевантности умножается на соответствующий вес из вектора.Патент фокусируется на использовании поведенческих данных, собранных от сообщества пользователей.
session data), включающие: Source Identification / User Identification: Идентификаторы пользователей (например, через cookies или логины).URL: Посещенные ресурсы.Time Stamp: Временные метки посещений.User Profile), предпочтения, история посещений (history log), избранное (favorites) – используются для формирования исходного набора (First Set).content site profile), с которого выполняется поиск, также может использоваться для формирования исходного набора.Co-Visit Frequency. Используется с пороговым значением для обеспечения статистической значимости (например, минимум 10,000 совместных посещений).Uniqueness Factor (например, 1 + Uniqueness Factor). Может быть дополнительно нормализован с помощью IDF (например, умножен на IDF для снижения веса общепопулярных сайтов).co-visitation) для установления тематических связей между ресурсами, аналогично тому, как используются гиперссылки. Это альтернативный граф веба, построенный на поведении.Community of Users) для выявления общих паттернов интересов, которые затем применяются для персонализации выдачи отдельного пользователя. Это позволяет рекомендовать пользователю контент, который он никогда не посещал, но который популярен среди людей с похожими интересами.Uniqueness Factor. Система специально разработана для фильтрации общепопулярных сайтов. Связь считается сильной, только если значительная часть посетителей второго сайта также посещает первый сайт. Просто высокая частота совместных посещений недостаточна, если она обусловлена огромной популярностью второго сайта.Consistency Factor гарантирует, что выводы делаются на основе достаточного объема данных, отсекая случайные совпадения или индивидуальные аномалии.time window). Посещения, разделенные большим интервалом времени, не считаются связанными. Temporal Window Function может дополнительно усиливать вес близких по времени посещений.Personalized Search (на основе истории пользователя), так и для Content Site Flavored Search (на основе характеристик сайта, на котором находится пользователь).co-visitation.Uniqueness Factor дает преимущество сайтам, которые имеют сильную и уникальную связь с определенной темой, а не общепопулярным порталам. Концентрация на своей нише и становление ключевым ресурсом в ней усиливает эти сигналы.Consistency Factor для обеспечения статистической значимости и анализирует поведение реального сообщества пользователей, что сложно и дорого подделать в нужном масштабе.Boost Vector.Патент подчеркивает стратегическую важность поведенческих факторов в ранжировании. Он демонстрирует переход от анализа статических сигналов (ссылки, текст) к анализу динамических паттернов взаимодействия пользователей с контентом в масштабах всего веба. Для SEO это означает, что релевантность определяется не только тем, что написано на странице, но и тем, как эта страница вписывается в информационное потребление реальных пользователей. Долгосрочная стратегия должна учитывать не только оптимизацию под запросы, но и оптимизацию под интересы и поведение аудитории.
Сценарий: Усиление позиций нишевого блога о кофе
Consistency выше порога).Uniqueness Factor = 15,000 / 20,000 = 0.75 (Высокая уникальность).Boost Vector, в котором Сайт Б имеет высокий вес (например, 1.75).Как Google собирает данные о совместных посещениях сайтов?
Патент упоминает анализ логов сессий (session data) и User URL Log. На практике это может включать данные, собранные через браузер Chrome, Google Analytics, Android, а также данные от интернет-провайдеров или через панель инструментов (Toolbar), если она используется. Идентификация пользователя для связывания посещений разных сайтов обычно происходит с помощью файлов cookie или учетных записей Google.
Что такое Uniqueness Factor и почему он так важен?
Uniqueness Factor измеряет, насколько уникальна связь между двумя сайтами. Он рассчитывается как доля совместных посещений Сайта А и Б от общего числа посещений Сайта Б. Это критически важно для фильтрации шума. Например, многие пользователи посещают Facebook после посещения вашего сайта, но это не значит, что Facebook тематически связан с вашим сайтом – он просто очень популярен. Низкий Uniqueness Factor отсеет такие общепопулярные ресурсы.
Что такое Consistency Factor и как он влияет на работу алгоритма?
Consistency Factor – это абсолютное количество совместных посещений двух сайтов. Он используется для обеспечения статистической значимости. Если два сайта были посещены вместе всего 5 раз, это может быть случайностью. Если же их посетили вместе 10,000 раз, система может быть уверена, что связь существует. Алгоритм учитывает связь, только если Consistency Factor превышает определенный порог.
Может ли этот механизм повысить мой сайт в выдаче, даже если у меня мало обратных ссылок?
Да, теоретически это возможно. Если ваш сайт демонстрирует очень сильные сигналы совместного посещения с другими авторитетными ресурсами в вашей нише (высокий Uniqueness Factor и Consistency Factor), он может быть включен в Boost Vector. Это позволит ему ранжироваться выше в персонализированной выдаче для релевантной аудитории, компенсируя недостаток других факторов, таких как ссылочный вес.
Насколько важен временной интервал между посещениями?
Временной интервал критичен. Патент явно указывает, что совместные посещения учитываются только в рамках определенного временного окна (например, 30-60 минут). Кроме того, может применяться Temporal Window Function, которая придает больший вес посещениям, произошедшим ближе друг к другу по времени. Это помогает установить контекстуальную связь в рамках одной сессии пользователя.
Как SEO-специалист может повлиять на сигналы совместного посещения?
Напрямую повлиять сложно, но можно создать условия для их возникновения. Это включает глубокое понимание интересов вашей аудитории и того, какие еще ресурсы они используют. Создавайте контент, который естественно вписывается в процесс исследования темы пользователем. Улучшение пользовательского опыта и ценности контента также способствует тому, что ваш сайт становится регулярной точкой маршрута для нишевой аудитории.
Используется ли этот механизм только для персонализации по истории пользователя?
Нет. Патент описывает два варианта применения. Первый – это Personalized Search, где исходный набор URL берется из истории или профиля пользователя. Второй – это Content Site Flavored Search, где исходный набор формируется на основе профиля сайта, на котором сейчас находится пользователь (например, если пользователь выполняет поиск, находясь на сайте о спорте, система может повысить другие спортивные ресурсы).
Поможет ли размещение исходящих ссылок на авторитетные сайты улучшить мои показатели co-visitation?
Размещение полезных исходящих ссылок может улучшить пользовательский опыт и потенциально стимулировать совместные посещения, если пользователи действительно переходят по этим ссылкам в рамках той же сессии. Если пользователи часто переходят с вашего сайта на Сайт Б, это усиливает направленную связь от вас к Сайту Б. Однако для алгоритма также важно, чтобы пользователи приходили к вам с других релевантных ресурсов.
Что произойдет, если мой сайт часто посещают вместе с низкокачественными или спамными ресурсами?
Патент не описывает механизм пессимизации на основе совместных посещений, он фокусируется на повышении (boosting). Однако, если ваш сайт ассоциируется с низкокачественными ресурсами через поведение пользователей, это может негативно повлиять на общую оценку качества и авторитетности вашего сайта в других алгоритмах Google. Важно следить за качеством трафика и тем, с какими ресурсами вы ассоциируетесь.
Как связаны метрики этого патента с концепцией Topical Authority?
Этот патент предоставляет механизм для измерения и применения Topical Authority, основанный на поведении пользователей. Если ваш сайт регулярно посещается пользователями, интересующимися определенной темой, и демонстрирует сильные уникальные связи (Uniqueness Factor) с другими авторитетными сайтами в этой теме, система идентифицирует ваш сайт как авторитетный в данной области и повышает его в выдаче через Boost Vector.

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Персонализация

Поведенческие сигналы
SERP
Семантика и интент

Ссылки
SERP
Поведенческие сигналы

Ссылки
SERP

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
Антиспам

Поведенческие сигналы
Персонализация
SERP

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы

SERP
Семантика и интент
Ссылки
