SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)

CLUSTERING DOCUMENTS BASED ON COMMON DOCUMENT SELECTIONS (Кластеризация документов на основе общих выборок документов)
  • US8650196B1
  • Google LLC
  • 2011-09-30
  • 2014-02-11
  • Поведенческие сигналы
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.

Описание

Какую проблему решает

Патент решает задачу определения тематической схожести между документами путем анализа поведения пользователей, а не только контента или ссылок. Это помогает улучшить кластеризацию результатов поиска, особенно для неоднозначных запросов (например, «Lotus» — автомобиль или цветок), позволяя группировать документы на основе того, как пользователи взаимодействуют с ними в контексте своих поисковых сессий. Система использует навигационные паттерны (co-visitation) как сильный сигнал релевантности и взаимосвязи.

Что запатентовано

Запатентована система кластеризации документов, основанная на общности последующих пользовательских выборов (Common Document Selections). Система анализирует навигационные логи (Navigation Information), чтобы определить, куда пользователи переходят после посещения определенного документа. Если два разных документа постоянно приводят пользователей к одному и тому же набору последующих документов, эти два исходных документа считаются похожими.

Как это работает

Механизм работает следующим образом:

  • Сбор данных: Система собирает Navigation Information, отслеживая переходы пользователей между документами в рамках сессий (Sessions).
  • Генерация векторов: Для каждого документа (например, Документ А) создается вектор (Document Vector), который содержит список документов, выбранных пользователями после Документа А, и частоту (вес) этих выборов.
  • Расчет схожести: Система сравнивает вектор Документа А с вектором Документа Б, используя метрику схожести (например, cosine similarity).
  • Кластеризация: Если рассчитанный Similarity Score превышает определенный порог, Документ А и Документ Б помечаются как схожие и объединяются в кластер (Cluster).

Актуальность для SEO

Высокая. Анализ поведения пользователей (clickstream data, анализ сессий) является критически важным компонентом современных поисковых систем для понимания интента и релевантности за пределами ключевых слов. Этот патент описывает конкретный метод использования данных о совместном посещении (co-visitation) для построения тематических моделей и кластеризации контента, что остается актуальной задачей.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегии. Он подчеркивает, что Google оценивает не только сам контент страницы, но и то, как она вписывается в общее путешествие пользователя (user journey). Это напрямую влияет на то, как Google понимает тематическую структуру веба и релевантность конкретных страниц. Оптимизация под этот механизм требует фокуса на удовлетворении интента и эффективном направлении пользователя к его следующему шагу.

Детальный разбор

Термины и определения

Candidate Document (Кандидатный документ)
Исходный документ, для которого анализируются последующие пользовательские переходы.
Cluster (Кластер)
Группа документов, идентифицированных системой как тематически схожие на основе анализа навигационных данных.
Correlation Information (Корреляционная информация)
Данные, генерируемые системой, которые указывают на схожесть между двумя кандидатными документами.
Direct Navigation (Прямая навигация)
Переход от первого документа ко второму без промежуточных документов.
Document Vector (Вектор документа)
Структура данных (например, связанный список, массив), представляющая документ. Она содержит список других документов, которые были выбраны после просмотра исходного документа, а также веса (частоту) этих выборов.
Indirect Navigation (Непрямая навигация)
Переход от первого документа к последующему документу с одним или несколькими промежуточными документами в рамках одной сессии.
Navigation Information (Навигационная информация)
Зарегистрированные данные (логи), описывающие прошлое поведение пользователей. Идентифицируют документы, которые были выбраны после того, как были представлены другие документы, а также количество таких выборов.
Session (Сессия)
Определенный период взаимодействия пользователя. Может определяться временными рамками, количеством кликов или контекстом (например, от ввода запроса до ввода следующего запроса).
Similarity Score (Оценка схожести)
Числовая метрика, определяющая степень схожести между двумя векторами документов. Может рассчитываться с использованием cosine similarity или других методов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод кластеризации.

  1. Система получает первую навигационную информацию (first navigation information) для первого документа. Эта информация идентифицирует первый набор документов, выбранных после первого документа, и количество (quantity) этих выборов.
  2. Система получает вторую навигационную информацию для второго документа.
  3. Генерируются первая и вторая структуры данных (data structures), ассоциирующие документы с их навигационной информацией.
  4. Система сравнивает первый набор документов со вторым, используя эти структуры данных.
  5. Генерируется similarity score, основанный на сравнении и на информации о количестве выборов (весах).
  6. На основе similarity score определяется, что первый документ похож на второй.
  7. Генерируется кластер (cluster), включающий идентификационную информацию первого и второго документов.

Claim 7 (Зависимый от 1): Уточняет, что структуры данных являются векторами (first vector и second vector), и сравнение включает определение схожести этих векторов.

Claim 8 (Зависимый от 7): Уточняет, что определение схожести векторов включает определение косинусного сходства (cosine similarity) между первым и вторым векторами.

Claim 14 (Независимый пункт): Описывает систему, реализующую метод, схожий с Claim 1, но с акцентом на то, что similarity score базируется на количестве раз, когда каждый документ в наборах был выбран (т.е. на весах в векторах).

Где и как применяется

Изобретение в основном применяется в офлайн-процессах обработки данных для генерации кластеров, которые затем используются онлайн-системами ранжирования.

CRAWLING & Data Acquisition / INDEXING & Feature Extraction (Офлайн-процессы)
На этих этапах происходит сбор и обработка Navigation Information. Система анализирует логи пользовательского поведения (clickstream data), обрабатывает их, генерирует Document Vectors для большого количества документов и вычисляет Similarity Scores между парами документов. Результаты (Correlation Information и Clusters) сохраняются в репозитории (Cluster Repository). Это масштабный процесс анализа данных.

RANKING / METASEARCH & Blending (Онлайн-процессы)
Сгенерированные кластеры используются поисковой системой (Search Engine Server) во время обработки запросов. Это может применяться для:

  • Группировки результатов поиска по темам (например, разделение результатов по запросу «Lotus» на кластеры «автомобили» и «цветы»).
  • Улучшения релевантности, используя принадлежность документа к определенному кластеру как сигнал.
  • Диверсификации выдачи, обеспечивая представление результатов из разных кластеров.

Входные данные:

  • Логи пользовательской навигации (Navigation Information).
  • Идентификаторы документов (Document IDs).

Выходные данные:

  • Correlation Information, указывающая на схожесть пар документов.
  • Clusters — группы схожих документов.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на широкие или неоднозначные запросы, где требуется кластеризация результатов для уточнения интента пользователя.
  • Конкретные типы контента: В патенте упоминается, что концепции могут применяться к наборам документов, в частности к изображениям (например, индексируемым поисковой системой изображений). Метод эффективен для контента, где визуальная или тематическая схожесть не всегда очевидна из текста (например, товары, мультимедиа).

Когда применяется

  • Триггеры активации: Процесс анализа активируется для пар документов, по которым накоплено достаточное количество Navigation Information.
  • Условия и пороги: Кластеризация происходит только тогда, когда Similarity Score между векторами двух документов превышает заданный порог.
  • Временные рамки: Сбор данных происходит непрерывно, а обработка и генерация кластеров выполняются периодически в офлайн-режиме.

Пошаговый алгоритм

Процесс анализа и кластеризации документов:

  1. Получение навигационной информации: Система получает Navigation Information из репозитория логов. Эти данные включают информацию о том, какие документы были выбраны после просмотра других документов, и частоту этих выборов.
  2. Идентификация сессий: Система анализирует данные в контексте пользовательских сессий (Sessions). Учитываются только те переходы, которые произошли в рамках одной сессии (например, в течение определенного времени после просмотра исходного документа или до ввода нового запроса).
  3. Генерация вектора для первого документа: Для первого кандидатного документа (Документ 1) идентифицируются все документы, выбранные после него. Создается Document Vector, где каждый элемент — это последующий документ и его вес (количество выборов).
  4. Генерация вектора для второго документа: Аналогичный процесс выполняется для второго кандидатного документа (Документ 2).
  5. Расчет оценки схожести (Similarity Score): Система сравнивает два сгенерированных вектора. Это может включать расчет cosine similarity, анализ пропорции общих документов в векторах или комбинацию методов. Веса (частота выборов) играют ключевую роль в расчете.
  6. Корректировка оценки схожести (Опционально): Similarity Score может быть скорректирован (увеличен), если зафиксирована прямая корреляция — то есть, если Документ 1 присутствует в векторе Документа 2 и/или наоборот. Это указывает на то, что пользователи напрямую переходили между этими двумя документами.
  7. Сравнение с порогом: Итоговый Similarity Score сравнивается с предустановленным порогом.
  8. Генерация кластера: Если оценка превышает порог, система генерирует Correlation Information, указывающую на схожесть Документа 1 и Документа 2, и они добавляются в общий кластер (Cluster). Эта информация сохраняется в Cluster Repository.

Какие данные и как использует

Данные на входе

Патент полностью сосредоточен на использовании поведенческих данных.

  • Поведенческие факторы:
    • Navigation Information: Данные о последовательности выбора документов пользователями (clickstream data).
    • Sessions: Данные о границах пользовательских взаимодействий, используемые для фильтрации навигационной информации.
    • Количество выборов (Quantity of selections): Частота, с которой пользователи переходили от одного документа к другому.

Другие типы факторов (контентные, ссылочные, технические) в этом патенте не упоминаются как входные данные для этого конкретного механизма кластеризации.

Какие метрики используются и как они считаются

  • Веса в векторе (Weights): Используется количество выборов (quantity of times) последующего документа. Это определяет важность конкретного перехода в общем навигационном паттерне документа.
  • Vector Similarity Score: Основная вычисляемая метрика. Патент предлагает несколько методов расчета:
    • Cosine Similarity: Стандартный метод для определения схожести между двумя векторами в многомерном пространстве, учитывающий веса элементов.
    • Пропорция общих документов: Соотношение документов, которые являются общими для обоих векторов, к общему количеству документов в векторах.
    • Пропорция общих выборов: Соотношение суммы весов общих документов к общей сумме весов всех документов в векторах.
  • Комбинированная оценка: Система может генерировать несколько оценок схожести (например, одну по косинусному сходству, другую по пропорции) и комбинировать их, возможно, с применением взвешивания.
  • Пороговые значения (Thresholds): Предустановленное значение, с которым сравнивается Similarity Score для принятия решения о кластеризации. Пороги могут отличаться в зависимости от того, используются ли кластеры для создания подкластеров внутри уже существующих кластеров.

Выводы

  1. Схожесть определяется общими результатами (Shared Outcomes): Ключевая идея патента в том, что два документа считаются похожими, если они приводят пользователей к одинаковым последующим действиям или ресурсам. Если пользователи после прочтения Страницы А и Страницы Б часто переходят на Страницу В, то А и Б тематически связаны.
  2. Поведение пользователей как основа кластеризации: Этот механизм позволяет Google строить тематические кластеры, полагаясь исключительно на Navigation Information, независимо от анализа ключевых слов, контента или ссылочного профиля документов.
  3. Важность сессий (Context Matters): Анализ переходов часто ограничивается рамками одной Session. Это гарантирует, что учитываются только контекстуально связанные переходы, а не случайные навигационные действия пользователя.
  4. Взвешенная важность переходов: Система учитывает не только факт перехода на последующий документ, но и его частоту (вес). Переходы, которые совершаются чаще, оказывают большее влияние на расчет Similarity Score.
  5. Co-visitation как сигнал релевантности: Патент демонстрирует, как данные о совместном посещении (co-visitation) используются для понимания структуры информации и взаимосвязей между документами в вебе.

Практика

Best practices (это мы делаем)

  • Оптимизация пути пользователя (User Journey Optimization): Проектируйте контент и внутреннюю перелинковку так, чтобы они логично направляли пользователя к следующему шагу в решении его задачи. Ваша страница должна удовлетворять первичный интент и эффективно фасилитировать следующий.
  • Анализ навигационных паттернов авторитетов: Изучайте, куда пользователи переходят после посещения топовых страниц конкурентов или авторитетных ресурсов в вашей нише. Если они постоянно переходят к определенному типу ресурса (например, к странице сравнения цен или руководству по установке), ваша страница должна также вести к аналогичным ресурсам (внутренним или внешним), чтобы соответствовать установленному навигационному паттерну темы.
  • Создание сильных тематических хабов: Развивайте хабовые страницы, которые служат отправной точкой для изучения темы. Если ваш хаб и хаб конкурента успешно направляют пользователей на один и тот же набор качественных вспомогательных страниц (spokes), это усилит восприятие обоих хабов как релевантных данной теме.
  • Улучшение вовлеченности и глубины сессии: Работайте над снижением показателя отказов и увеличением глубины просмотра. Страницы, которые вовлекают пользователя и мотивируют его к дальнейшим переходам на релевантный контент, генерируют сильные Document Vectors.

Worst practices (это делать не надо)

  • Создание тупиковых страниц (Dead-end Pages): Страницы, которые не предлагают пользователю релевантных следующих шагов (и, как следствие, имеют высокий показатель отказов), не смогут генерировать значимые навигационные данные и будут слабее кластеризоваться.
  • Вводящая в заблуждение перелинковка и исходящие ссылки: Направление пользователей на нерелевантные последующие страницы (например, для монетизации или искусственного увеличения глубины просмотра) приведет к созданию Document Vectors, которые не коррелируют с векторами других качественных страниц по теме.
  • Игнорирование следующего шага пользователя: Фокус исключительно на привлечении трафика по ключевому слову без учета того, что пользователь хочет делать дальше. Например, информационная статья, которая не ведет к практическому руководству или связанным продуктам, когда это логично ожидать.

Стратегическое значение

Патент подтверждает, что Google активно использует данные о поведении пользователей (co-visitation data) для понимания тематической релевантности и взаимосвязей между документами. Для SEO-специалистов это означает, что стратегия должна фокусироваться не только на том, как пользователь попадает на страницу (ключевые слова, ссылки), но и на том, что он делает после этого. Успешность страницы зависит от ее способности быть полезным шагом в общем путешествии пользователя по теме.

Практические примеры

Сценарий: Кластеризация страниц обзоров разных форматов

  1. Ситуация: Есть две страницы, обозревающие одну и ту же модель кофемашины. Страница А — это подробный текстовый обзор. Страница Б — это видео-обзор на другой площадке. Текстовое содержание страниц сильно различается.
  2. Поведение пользователей: Система анализирует Navigation Information.
    • Пользователи после Страницы А часто переходят на: Страницу покупки этой модели на Amazon (Вес 50), Руководство по очистке этой модели (Вес 20).
    • Пользователи после Страницы Б часто переходят на: Ту же страницу покупки на Amazon (Вес 45), То же руководство по очистке (Вес 15).
  3. Анализ: Система генерирует векторы для Страницы А и Страницы Б. При сравнении векторов рассчитывается высокий Similarity Score (например, из-за высокого cosine similarity), так как последующие переходы и их относительные веса очень похожи.
  4. Результат: Несмотря на разный формат контента и различие в тексте, Google кластеризует Страницу А и Страницу Б как очень похожие документы, посвященные обзору этой конкретной модели кофемашины.

Вопросы и ответы

Зависит ли этот механизм кластеризации от наличия внутренних или внешних ссылок на странице?

Нет, он зависит от фактических выборов (кликов) пользователей. Пользователь может кликнуть на внутреннюю ссылку, внешнюю ссылку, или даже вернуться на страницу результатов поиска (SERP) и выбрать другой результат. Все эти действия, если они происходят в рамках одной Session, могут быть записаны как Navigation Information и использованы для генерации Document Vector.

Что такое «Сессия» (Session) в контексте этого патента?

Session определяется как период взаимодействия пользователя. Патент предлагает несколько вариантов определения границ сессии: она может начинаться при показе документа или вводе запроса и заканчиваться по истечении определенного времени, после определенного количества кликов, при закрытии браузера или при вводе следующего поискового запроса. Это необходимо для учета только контекстуально связанных переходов.

Как именно рассчитывается схожесть между двумя документами?

Схожесть рассчитывается путем сравнения их Document Vectors. Вектор содержит список последующих кликов и их частоту (вес). Основным методом, упомянутым в патенте, является косинусное сходство (cosine similarity), которое учитывает как набор общих последующих документов, так и их относительные веса. Также могут использоваться метрики пропорции общих документов или общих выборов.

Какое значение имеет показатель отказов (Bounce Rate) для этого алгоритма?

Показатель отказов имеет критическое значение. Страницы с высоким показателем отказов (тупиковые страницы) не генерируют данных о последующих переходах. Следовательно, для них невозможно создать надежный Document Vector и эффективно кластеризовать их с помощью этого метода. Страницы, которые удовлетворяют интент и ведут к релевантным следующим шагам, будут иметь преимущество.

Может ли система повысить оценку схожести, если пользователи часто переходят напрямую между двумя анализируемыми документами?

Да, патент предусматривает возможность корректировки (увеличения) Similarity Score, если один кандидатный документ присутствует в векторе другого. Например, если пользователи часто переходят от А к Б или от Б к А. Это считается сильным сигналом прямой корреляции и может усилить общую оценку схожести, рассчитанную на основе других общих переходов.

Как SEO-специалист может повлиять на этот механизм кластеризации?

Основной способ влияния — это оптимизация пути пользователя (User Journey). Необходимо убедиться, что страница предоставляет логичные и полезные следующие шаги (через внутреннюю перелинковку или исходящие ссылки), которые соответствуют навигационным паттернам, наблюдаемым у авторитетных сайтов по этой теме. Это поможет сформировать Document Vector, схожий с векторами других релевантных страниц.

Используется ли этот механизм для всех типов контента?

Патент указывает, что метод применим к любым документам, но особо выделяет его полезность для изображений. Для мультимедийного контента, где текстовый анализ может быть ограничен, поведенческие сигналы, такие как co-visitation, становятся особенно важными для определения тематической схожести и кластеризации.

Является ли этот процесс вычислением в реальном времени?

Нет. Сбор Navigation Information, генерация Document Vectors и расчет Similarity Scores — это ресурсоемкие процессы, которые выполняются офлайн. Результаты (Clusters) сохраняются в репозитории и затем используются поисковой системой в реальном времени для улучшения ранжирования и группировки результатов.

Что произойдет, если я попытаюсь манипулировать этим алгоритмом, используя ботов для симуляции переходов?

Манипуляции, скорее всего, будут неэффективны. Google обладает сложными механизмами для фильтрации бот-трафика и неестественного поведения. Кроме того, для успешной кластеризации ваши навигационные паттерны должны соответствовать паттернам, генерируемым реальными пользователями на других авторитетных сайтах по той же теме. Случайные или искусственные переходы не создадут нужной корреляции.

Как этот патент связан с Topical Authority?

Он напрямую связан с тем, как Google может оценивать Topical Authority. Если страницы сайта постоянно кластеризуются вместе со страницами других авторитетных ресурсов по определенной теме на основе общих навигационных паттернов, это сигнализирует о том, что сайт является релевантным и полезным источником информации в рамках этой темы, что способствует повышению его тематического авторитета.

Похожие патенты

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
  • US8065316B1
  • 2011-11-22
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Популярные патенты

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи
Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.
  • US8825639B2
  • 2014-09-02
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента
Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.
  • US9268880B2
  • 2016-02-23
  • Персонализация

  • Семантика и интент

  • Мультимедиа

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации
Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).
  • US8645393B1
  • 2014-02-04
  • Персонализация

  • Семантика и интент

  • SERP

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента
Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.
  • US8595619B1
  • 2013-11-26
  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore