SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи

SEARCH BOOST VECTOR BASED ON CO-VISITATION INFORMATION (Вектор повышения поисковой выдачи на основе информации о совместных посещениях)
  • US8874570B1
  • Google LLC
  • 2004-11-30
  • 2014-10-28
  • Поведенческие сигналы
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.

Описание

Какую проблему решает

Патент решает задачу повышения релевантности поисковой выдачи путем ее персонализации на основе интересов пользователя или контекста текущего сайта. Он направлен на улучшение стандартных результатов поиска за счет продвижения контента, который тематически связан с известными интересами пользователя, даже если эта связь не очевидна из анализа контента или ссылок. Система использует поведенческие паттерны сообщества пользователей для выявления таких скрытых связей.

Что запатентовано

Запатентована система генерации Search Boost Vector (Вектора повышения поисковой выдачи). Этот вектор представляет собой список URL и соответствующих им весов. Он создается путем анализа данных о совместном посещении (co-visitation) веб-ресурсов сообществом пользователей. Система определяет, какие сайты пользователи посещают в течение одного временного интервала, и использует эту информацию для вычисления силы тематической связи между ресурсами. Полученный вектор затем применяется для переранжирования стандартных результатов поиска.

Как это работает

Система работает следующим образом:

  • Идентификация исходного набора (Seed Set): Определяется первый набор URL, отражающий контекст (например, история посещений пользователя, его "избранное" или профиль текущего сайта).
  • Анализ совместных посещений: Система анализирует логи посещений сообщества пользователей, чтобы найти, какие другие URL (второй набор) часто посещаются в течение определенного временного окна вместе с URL из первого набора.
  • Фильтрация и взвешивание: Для фильтрации шума и определения значимости связи используются метрики Uniqueness Factor (Уникальность) и Consistency Factor (Постоянство). Уникальность помогает отсеять общепопулярные сайты, а Постоянство обеспечивает статистическую значимость.
  • Генерация Boost Vector: Создается вектор, содержащий URL из второго (и, возможно, первого) набора с рассчитанными весами.
  • Применение: При выполнении поиска этот вектор используется для умножения стандартных оценок релевантности (Information Retrieval values или query score) результатов, тем самым повышая их позицию в выдаче.

Актуальность для SEO

Высокая. Персонализация поиска и использование поведенческих данных для понимания связей между сущностями и ресурсами являются ключевыми направлениями развития Google. Методы, основанные на анализе поведения пользователей (User Behavior Analysis), активно применяются для улучшения качества выдачи, особенно в условиях, когда традиционных сигналов (контент, ссылки) недостаточно. Этот патент описывает фундаментальный механизм использования коллективного поведения для влияния на ранжирование.

Важность для SEO

Патент имеет высокое значение для SEO (8/10). Он демонстрирует, что Google может определять тематическую релевантность и связь между сайтами не только через контент и ссылки, но и через реальное поведение пользователей. Это подчеркивает важность построения пользовательских путей (User Journey), удержания аудитории и понимания того, какие еще ресурсы посещает целевая аудитория. Сайты, которые являются частью естественного потока информации для пользователей в определенной нише, получают преимущество.

Детальный разбор

Термины и определения

Search Boost Vector (Вектор повышения поисковой выдачи)
Структура данных, содержащая набор идентификаторов контента (например, URL) и соответствующие им веса (weights). Используется для модификации стандартных оценок ранжирования с целью персонализации или контекстуализации выдачи.
Co-Visitation (Совместное посещение)
Событие, когда пользователь посещает два разных URL в течение определенного временного интервала (time interval или time window).
First Set / Seed Set (Первый/Исходный набор)
Начальный набор URL, который служит основой для генерации Boost Vector. Может быть основан на истории пользователя, его профиле, избранном или профиле текущего сайта.
Second Set (Второй набор)
Набор URL, идентифицированных как связанные с первым набором на основе данных о совместных посещениях сообществом пользователей.
Community of Users (Сообщество пользователей)
Группа пользователей, чьи данные о посещениях (логи сессий) анализируются для выявления паттернов совместных посещений.
Consistency Factor (Фактор постоянства)
Метрика, используемая для обеспечения статистической значимости данных о совместных посещениях. Часто определяется как абсолютное количество совместных посещений двух URL. Должен превышать определенный порог.
Uniqueness Factor (Фактор уникальности)
Метрика, используемая для измерения силы связи между двумя URL и фильтрации шума (например, общепопулярных сайтов). Часто определяется как условная вероятность посещения одного URL при условии посещения другого. Например, отношение частоты совместных посещений URL A и URL B к общей частоте посещений URL B.
Inverse Document Frequency (Обратная частота документа, IDF)
Метрика, которая может использоваться для нормализации весов в Boost Vector, чтобы снизить влияние URL, которые посещаются очень большим количеством пользователей.
Temporal Window Function (Временная оконная функция)
Функция, применяемая для взвешивания совместных посещений в зависимости от разницы во времени между ними. Чем меньше времени прошло между посещениями, тем выше может быть вес.
Personalized Search (Персонализированный поиск)
Повышение результатов поиска с использованием Boost Vector, определенного на основе профиля или предпочтений пользователя.
Content Site Flavored Search (Поиск с учетом характеристик сайта)
Повышение результатов поиска с использованием Boost Vector, определенного на основе профиля контентного сайта (например, сайта, с которого пользователь отправляет запрос).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации Search Boost Vector.

  1. Предоставляется первый набор идентификаторов контента (URL).
  2. Используя первый набор, идентифицируется второй набор URL. Связь основана на совместных посещениях (co-visits) отдельными пользователями в сообществе пользователей в течение определенного временного интервала.
  3. Генерируется Search Boost Vector с весами для URL из второго набора. Веса основаны, по крайней мере частично, на частоте посещений пользователями соответствующих URL во втором наборе.
  4. Вектор предоставляется поисковому серверу для повышения (boost) результатов при обслуживании поисковой выдачи.

Claim 3 (Зависимый от 1): Уточняет механизм взвешивания, связанный с популярностью.

URL во втором наборе, посещаемые большим количеством пользователей (первый диапазон), в среднем имеют более низкие веса в Boost Vector, чем URL, посещаемые меньшим количеством пользователей (второй диапазон). Это механизм, схожий с IDF или Uniqueness Factor, который направлен на понижение веса общепопулярных ресурсов и выделение нишевых, но сильно связанных ресурсов.

Claim 7 (Зависимый от 1): Введение временного фактора.

При генерации вектора применяется Temporal Window Function. Весовые коэффициенты этой функции зависят от временного интервала между совместными посещениями. Это означает, что близость посещений по времени влияет на итоговый вес в векторе.

Claim 9 и 10 (Зависимые от 1): Введение фактора постоянства.

Генерация вектора включает определение Consistency Factor. Он определяется как абсолютное количество совместных посещений URL из первого и второго наборов. Это обеспечивает статистическую надежность связи.

Claim 11 (Зависимый от 1): Определение фактора уникальности.

Генерация вектора включает определение Uniqueness Factor. Для конкретного URL из второго набора (URL2) и URL из первого набора (URL1) он рассчитывается путем деления частоты совместных посещений URL1 и URL2 на частоту посещений URL2.

Формула Фактора Уникальности: Freq(Co−visit(URL1,URL2))Freq(Visit(URL2))\frac{Freq(Co-visit(URL1, URL2))}{Freq(Visit(URL2))}

Claim 37 (Независимый пункт): Описывает метод применения Search Boost Vector.

  1. Получение запроса от пользователя.
  2. Идентификация результатов поиска, включающих часть второго набора URL (который был ранее определен на основе первого набора).
  3. Повышение (boosting) подмножества результатов с использованием Search Boost Vector. Вес из вектора используется для повышения соответствующего URL в результатах. Вес основан на совместных посещениях и частоте посещений.
  4. Предоставление повышенных результатов пользователю.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, собираемые системой непрерывно, и влияя на финальные этапы ранжирования.

CRAWLING & Data Acquisition (Сбор данных)
Система должна непрерывно собирать и хранить данные о поведении пользователей (User URL Log), включая идентификаторы пользователей (например, через cookies), посещенные URL и временные метки (Time Stamp). Эти данные являются основой для анализа совместных посещений.

INDEXING & Feature Extraction (Индексирование и извлечение признаков)
На этом этапе (или в рамках отдельного офлайн-процесса) происходит обработка логов для вычисления связей между URL. Система анализирует данные сообщества, вычисляет Consistency Factor и Uniqueness Factor для пар URL и генерирует Boost Vectors для различных профилей пользователей или сайтов.

RANKING (Ранжирование)
Основная система ранжирования генерирует первоначальный набор результатов поиска с базовыми оценками релевантности (query scores).

RERANKING (Переранжирование)
Основное применение патента. На этом этапе система выбирает соответствующий Boost Vector (на основе профиля пользователя или сайта) и применяет его к результатам этапа RANKING. Оценки релевантности документов, присутствующих в Boost Vector, умножаются на соответствующие веса, что приводит к их повышению в финальной выдаче.

Входные данные:

  • Логи посещений пользователей (User ID, URL, Timestamp).
  • Исходный набор URL (Seed Set), основанный на профиле пользователя или сайта.
  • Стандартные результаты поиска с оценками релевантности.

Выходные данные:

  • Search Boost Vector (список URL и весов).
  • Переранжированный список результатов поиска с модифицированными оценками.

На что влияет

  • Персонализация выдачи: Основное влияние. Выдача адаптируется под интересы пользователя, выявленные через его историю посещений и поведение схожих пользователей.
  • Тематическая релевантность: Позволяет системе выявлять тематически связанные ресурсы, даже если между ними нет прямых ссылок или текстового сходства, основываясь исключительно на поведении пользователей.
  • Нишевые запросы: Может значительно улучшить выдачу в нишах, где пользователи часто изучают несколько источников перед принятием решения (например, путешествия, сложные покупки, исследования).

Когда применяется

  • Триггеры активации: Механизм активируется, когда для текущего пользователя или сайта доступен релевантный Boost Vector.
  • Условия для включения URL в вектор: URL включается в вектор, только если его Consistency Factor и Uniqueness Factor (если используются) превышают установленные пороги. Например, порог уникальности может быть 0.90, а порог постоянства – 10,000 совместных посещений.
  • Временные рамки: Совместное посещение засчитывается, только если оно произошло в рамках заданного временного окна (например, 30 или 60 минут).

Пошаговый алгоритм

Процесс А: Генерация Boost Vector (Офлайн или по требованию)

  1. Идентификация исходного набора URL (First Set). Источником могут быть: история браузера пользователя, избранное, явно указанные предпочтения или профиль контентного сайта.
  2. Сбор данных о совместных посещениях. Анализ логов сообщества пользователей. Для каждого URL W из исходного набора определяются пользователи, посетившие W. Затем находятся другие URL (набор S), которые эти же пользователи посетили в рамках заданного временного интервала до или после посещения W.
  3. (Опционально) Применение временной оконной функции. Вес совместного посещения может быть скорректирован в зависимости от разницы во времени между посещением W и S. Функция может быть асимметричной (посещение после W важнее, чем до W).
  4. (Опционально) Расчет Постоянства и Уникальности. Для каждой пары (W, S) рассчитываются:
    • Consistency Factor: Общее количество совместных посещений.
    • Uniqueness Factor: Отношение совместных посещений к общему числу посещений S.
  5. Фильтрация и идентификация второго набора (Second Set). URL из набора S, которые удовлетворяют порогам Постоянства и Уникальности, формируют второй набор связанных URL.
  6. Генерация Boost Vector. Формируется вектор, где каждому URL из второго (и, возможно, первого) набора присваивается вес. Вес может быть основан на Uniqueness Factor (например, 1 + Uniqueness Factor) и/или нормализован с помощью IDF.
  7. (Опционально) Усечение вектора. Вектор может быть сокращен до Топ-N результатов или по пороговому значению веса.

Процесс Б: Применение Boost Vector (Во время поиска)

  1. Получение запроса. Пользователь вводит поисковый запрос.
  2. Генерация стандартных результатов. Поисковая система генерирует результаты и их базовые оценки релевантности (query scores).
  3. Выбор Boost Vector. Система выбирает подходящий Boost Vector, связанный с профилем пользователя или текущим сайтом.
  4. Повышение/Переранжирование. Система проверяет, присутствуют ли URL из результатов поиска в Boost Vector. Если да, базовая оценка релевантности умножается на соответствующий вес из вектора.
  5. Предоставление результатов. Результаты сортируются по новым оценкам и предоставляются пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных, собранных от сообщества пользователей.

  • Поведенческие факторы: Критически важные данные. Используются логи сессий (session data), включающие:
    • Source Identification / User Identification: Идентификаторы пользователей (например, через cookies или логины).
    • URL: Посещенные ресурсы.
    • Time Stamp: Временные метки посещений.
  • Пользовательские факторы: Данные из профиля пользователя (User Profile), предпочтения, история посещений (history log), избранное (favorites) – используются для формирования исходного набора (First Set).
  • Контекстные факторы: Профиль текущего сайта (content site profile), с которого выполняется поиск, также может использоваться для формирования исходного набора.

Какие метрики используются и как они считаются

  • Co-Visit Frequency (Частота совместных посещений): Количество раз, когда два URL были посещены одним и тем же пользователем в рамках заданного временного окна.
  • Visit Frequency (Частота посещений): Общее количество посещений определенного URL за период анализа логов.
  • Consistency Factor (Фактор постоянства): Обычно равен Co-Visit Frequency. Используется с пороговым значением для обеспечения статистической значимости (например, минимум 10,000 совместных посещений).
  • Uniqueness Factor (Фактор уникальности): Рассчитывается для измерения направленной связи. Например, Уникальность URL B по отношению к URL A: Co-VisitFrequency(A,B)VisitFrequency(B)\frac{\text{Co-Visit Frequency}(A, B)}{\text{Visit Frequency}(B)}. Используется с пороговым значением (например, > 0.50 или > 0.90).
  • Weight (Вес в Boost Vector): Итоговое значение, используемое для повышения оценки ранжирования. Может быть функцией от Uniqueness Factor (например, 1 + Uniqueness Factor). Может быть дополнительно нормализован с помощью IDF (например, умножен на IDF для снижения веса общепопулярных сайтов).

Выводы

  1. Поведение пользователей как сигнал связи: Патент подтверждает, что Google использует паттерны навигации пользователей (co-visitation) для установления тематических связей между ресурсами, аналогично тому, как используются гиперссылки. Это альтернативный граф веба, построенный на поведении.
  2. Коллективные данные для индивидуальной персонализации: Система использует данные сообщества (Community of Users) для выявления общих паттернов интересов, которые затем применяются для персонализации выдачи отдельного пользователя. Это позволяет рекомендовать пользователю контент, который он никогда не посещал, но который популярен среди людей с похожими интересами.
  3. Важность Уникальности (Uniqueness) над Популярностью: Ключевым элементом является Uniqueness Factor. Система специально разработана для фильтрации общепопулярных сайтов. Связь считается сильной, только если значительная часть посетителей второго сайта также посещает первый сайт. Просто высокая частота совместных посещений недостаточна, если она обусловлена огромной популярностью второго сайта.
  4. Статистическая значимость (Consistency): Consistency Factor гарантирует, что выводы делаются на основе достаточного объема данных, отсекая случайные совпадения или индивидуальные аномалии.
  5. Временной контекст критичен: Совместное посещение имеет значение только в рамках ограниченного временного окна (time window). Посещения, разделенные большим интервалом времени, не считаются связанными. Temporal Window Function может дополнительно усиливать вес близких по времени посещений.
  6. Два типа применения: Механизм может использоваться как для Personalized Search (на основе истории пользователя), так и для Content Site Flavored Search (на основе характеристик сайта, на котором находится пользователь).

Практика

Best practices (это мы делаем)

  • Анализ смежных интересов аудитории: Необходимо понимать, какие еще сайты и темы интересуют вашу целевую аудиторию. Используйте аналитику, опросы и анализ конкурентов, чтобы определить ресурсы, которые пользователи часто посещают вместе с вашим. Цель – стать частью естественного информационного потока пользователя.
  • Стимулирование совместных посещений (User Journey Optimization): Оптимизируйте контент и навигацию так, чтобы ваш сайт становился хабом или важной точкой в исследовании темы пользователем. Если пользователи регулярно приходят к вам после посещения авторитетного ресурса А или уходят от вас на авторитетный ресурс Б, это может усилить вашу связь с этими ресурсами в глазах Google.
  • Создание контента, отвечающего на следующие шаги пользователя: Предлагайте контент, который логически продолжает изучение темы. Если пользователь ищет "симптомы Х", а следующим шагом логично ищет "методы лечения Х", наличие обоих типов контента или сильная связь с сайтами, покрывающими следующий шаг, будет преимуществом.
  • Фокус на вовлеченности и удержании сессии: Поскольку временное окно критично, важно вовлекать пользователя и предоставлять ценность быстро. Сайты, которые пользователи быстро покидают в поисках лучшей информации, могут терять в силе связей, основанных на co-visitation.
  • Построение нишевой авторитетности: Механизм Uniqueness Factor дает преимущество сайтам, которые имеют сильную и уникальную связь с определенной темой, а не общепопулярным порталам. Концентрация на своей нише и становление ключевым ресурсом в ней усиливает эти сигналы.

Worst practices (это делать не надо)

  • Искусственная накрутка совместных посещений: Попытки манипулировать логами посещений с помощью ботов или заданий на буксах, вероятно, будут неэффективны. Система использует Consistency Factor для обеспечения статистической значимости и анализирует поведение реального сообщества пользователей, что сложно и дорого подделать в нужном масштабе.
  • Использование кликбейта для привлечения нецелевого трафика: Привлечение пользователей, которые не заинтересованы в вашей основной тематике, размывает паттерны совместных посещений и может привести к нерелевантным или слабым связям в Boost Vector.
  • Игнорирование пути пользователя за пределами сайта: Фокусироваться только на внутренних метриках (время на сайте, глубина просмотра) без понимания того, откуда пришел пользователь и куда он пойдет дальше, является упущением стратегической возможности усилить тематические связи.

Стратегическое значение

Патент подчеркивает стратегическую важность поведенческих факторов в ранжировании. Он демонстрирует переход от анализа статических сигналов (ссылки, текст) к анализу динамических паттернов взаимодействия пользователей с контентом в масштабах всего веба. Для SEO это означает, что релевантность определяется не только тем, что написано на странице, но и тем, как эта страница вписывается в информационное потребление реальных пользователей. Долгосрочная стратегия должна учитывать не только оптимизацию под запросы, но и оптимизацию под интересы и поведение аудитории.

Практические примеры

Сценарий: Усиление позиций нишевого блога о кофе

  1. Анализ (Имитация Google): Google анализирует логи и видит, что пользователи, которые посещают авторитетный сайт обжарщика (Сайт А), часто в течение следующих 30 минут посещают нишевый блог с обзорами кофемолок (Сайт Б).
  2. Расчет метрик:
    • Сайт А и Сайт Б совместно посетили 15,000 раз (Consistency выше порога).
    • Сайт Б всего посетили 20,000 раз.
    • Uniqueness Factor = 15,000 / 20,000 = 0.75 (Высокая уникальность).
  3. Генерация Boost Vector: Для пользователей, интересующихся Сайтом А (или для профиля "любители кофе"), создается Boost Vector, в котором Сайт Б имеет высокий вес (например, 1.75).
  4. Применение: Пользователь с таким профилем ищет "лучшая кофемолка". Сайт Б присутствует в стандартной выдаче на 8 позиции.
  5. Результат: Система применяет вес 1.75 к оценке Сайта Б, что поднимает его с 8 на 2 позицию в персонализированной выдаче этого пользователя.

Вопросы и ответы

Как Google собирает данные о совместных посещениях сайтов?

Патент упоминает анализ логов сессий (session data) и User URL Log. На практике это может включать данные, собранные через браузер Chrome, Google Analytics, Android, а также данные от интернет-провайдеров или через панель инструментов (Toolbar), если она используется. Идентификация пользователя для связывания посещений разных сайтов обычно происходит с помощью файлов cookie или учетных записей Google.

Что такое Uniqueness Factor и почему он так важен?

Uniqueness Factor измеряет, насколько уникальна связь между двумя сайтами. Он рассчитывается как доля совместных посещений Сайта А и Б от общего числа посещений Сайта Б. Это критически важно для фильтрации шума. Например, многие пользователи посещают Facebook после посещения вашего сайта, но это не значит, что Facebook тематически связан с вашим сайтом – он просто очень популярен. Низкий Uniqueness Factor отсеет такие общепопулярные ресурсы.

Что такое Consistency Factor и как он влияет на работу алгоритма?

Consistency Factor – это абсолютное количество совместных посещений двух сайтов. Он используется для обеспечения статистической значимости. Если два сайта были посещены вместе всего 5 раз, это может быть случайностью. Если же их посетили вместе 10,000 раз, система может быть уверена, что связь существует. Алгоритм учитывает связь, только если Consistency Factor превышает определенный порог.

Может ли этот механизм повысить мой сайт в выдаче, даже если у меня мало обратных ссылок?

Да, теоретически это возможно. Если ваш сайт демонстрирует очень сильные сигналы совместного посещения с другими авторитетными ресурсами в вашей нише (высокий Uniqueness Factor и Consistency Factor), он может быть включен в Boost Vector. Это позволит ему ранжироваться выше в персонализированной выдаче для релевантной аудитории, компенсируя недостаток других факторов, таких как ссылочный вес.

Насколько важен временной интервал между посещениями?

Временной интервал критичен. Патент явно указывает, что совместные посещения учитываются только в рамках определенного временного окна (например, 30-60 минут). Кроме того, может применяться Temporal Window Function, которая придает больший вес посещениям, произошедшим ближе друг к другу по времени. Это помогает установить контекстуальную связь в рамках одной сессии пользователя.

Как SEO-специалист может повлиять на сигналы совместного посещения?

Напрямую повлиять сложно, но можно создать условия для их возникновения. Это включает глубокое понимание интересов вашей аудитории и того, какие еще ресурсы они используют. Создавайте контент, который естественно вписывается в процесс исследования темы пользователем. Улучшение пользовательского опыта и ценности контента также способствует тому, что ваш сайт становится регулярной точкой маршрута для нишевой аудитории.

Используется ли этот механизм только для персонализации по истории пользователя?

Нет. Патент описывает два варианта применения. Первый – это Personalized Search, где исходный набор URL берется из истории или профиля пользователя. Второй – это Content Site Flavored Search, где исходный набор формируется на основе профиля сайта, на котором сейчас находится пользователь (например, если пользователь выполняет поиск, находясь на сайте о спорте, система может повысить другие спортивные ресурсы).

Поможет ли размещение исходящих ссылок на авторитетные сайты улучшить мои показатели co-visitation?

Размещение полезных исходящих ссылок может улучшить пользовательский опыт и потенциально стимулировать совместные посещения, если пользователи действительно переходят по этим ссылкам в рамках той же сессии. Если пользователи часто переходят с вашего сайта на Сайт Б, это усиливает направленную связь от вас к Сайту Б. Однако для алгоритма также важно, чтобы пользователи приходили к вам с других релевантных ресурсов.

Что произойдет, если мой сайт часто посещают вместе с низкокачественными или спамными ресурсами?

Патент не описывает механизм пессимизации на основе совместных посещений, он фокусируется на повышении (boosting). Однако, если ваш сайт ассоциируется с низкокачественными ресурсами через поведение пользователей, это может негативно повлиять на общую оценку качества и авторитетности вашего сайта в других алгоритмах Google. Важно следить за качеством трафика и тем, с какими ресурсами вы ассоциируетесь.

Как связаны метрики этого патента с концепцией Topical Authority?

Этот патент предоставляет механизм для измерения и применения Topical Authority, основанный на поведении пользователей. Если ваш сайт регулярно посещается пользователями, интересующимися определенной темой, и демонстрирует сильные уникальные связи (Uniqueness Factor) с другими авторитетными сайтами в этой теме, система идентифицирует ваш сайт как авторитетный в данной области и повышает его в выдаче через Boost Vector.

Похожие патенты

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует совместное посещение сайтов в рамках одной сессии (Co-visitation) для классификации ресурсов по темам
Google анализирует, какие ресурсы пользователи посещают в рамках одной сессии (поисковой или браузерной). Если пользователь посещает известный ресурс по теме А, а затем в той же сессии посещает новый ресурс Б (даже в ответ на другой запрос), система предполагает, что ресурс Б также связан с темой А. Этот механизм позволяет автоматически классифицировать контент на основе реального поведения пользователей.
  • US20140108376A1
  • 2014-04-17
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует поведенческие сигналы и совместные просмотры для генерации рекомендаций контента (например, "Похожие видео" на YouTube)
Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.
  • US8055655B1
  • 2011-11-08
  • Поведенческие сигналы

  • Персонализация

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

seohardcore