SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google кластеризует контент на основе общих интересов аудитории, используя анализ ближайших соседей

METHOD AND SYSTEM FOR EVALUATING CONTENT VIA A COMPUTER NETWORK (Метод и система для оценки контента через компьютерную сеть)
  • US8745074B1
  • Google LLC
  • 2012-09-14
  • 2014-06-03
  • Персонализация
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для кластеризации контента (например, рекламы или рекомендаций), основанный на профилях интересов пользователей, которые с ним взаимодействуют. Система создает векторы интересов аудитории для каждого элемента контента, затем формирует Списки Ближайших Соседей (Nearest Neighbor Lists). Контент объединяется в кластеры, если их списки соседей схожи. Это позволяет группировать контент по аудитории, а не только по тематике, улучшая таргетинг.

Описание

Какую проблему решает

Патент решает задачу улучшения таргетинга и эффективности систем размещения контента (content placement systems). В тексте в качестве примеров контента часто упоминаются рекламные объявления (ads). Система позволяет отойти от группировки, основанной только на содержании контента, и перейти к кластеризации, основанной на фактических интересах пользователей, взаимодействующих с этим контентом. Это позволяет выявлять неочевидные связи между элементами контента, которые привлекают схожие аудитории.

Что запатентовано

Запатентована система и метод иерархической кластеризации контента, использующая многоступенчатый анализ схожести аудиторий. Система генерирует Interest Category Vectors (векторы категорий интересов) на основе поведения пользователей. Затем она создает Nearest Neighbor Lists (NNL, списки ближайших соседей). Ключевая особенность — кластеризация основана не на прямой схожести векторов, а на схожести самих списков NNL.

Как это работает

Система работает в несколько этапов:

  • Генерация векторов: Анализируется активность пользователей (например, поисковые запросы, посещенные сайты), которые взаимодействовали с элементом контента. Формируется Interest Category Vector, отражающий распределение и вес интересов этой аудитории.
  • Генерация NNL: Вектор интересов одной группы контента сравнивается с векторами всех других групп (используя First Distance Metric, например, косинусное расстояние). Создается упорядоченный Nearest Neighbor List (NNL).
  • Сравнение NNL и Кластеризация: Система сравнивает NNL разных групп контента между собой (используя Second Distance Metric, например, edit distance). Группы контента с наиболее похожими NNL итеративно объединяются в кластеры (Hierarchical Agglomerative Clustering).

Актуальность для SEO

Средняя. Концепция использования данных об аудитории и ее интересах для улучшения таргетинга является фундаментальной для Google (особенно в AdTech и системах рекомендаций, таких как YouTube и Discover). Хотя конкретная реализация метода иерархической кластеризации через сравнение NNL может быть частично устаревшей по сравнению с современными векторными методами (embeddings), базовый принцип анализа профилей интересов аудитории остается высокоактуальным.

Важность для SEO

Влияние на органический поиск (SEO) низкое (3/10). Патент описывает инфраструктуру, которая, согласно тексту, предназначена в первую очередь для систем размещения контента (content placement systems), таких как реклама или рекомендации. В патенте нет упоминаний о ранжировании органических результатов поиска. Однако он предоставляет стратегически важное понимание того, как Google технически анализирует интересы пользователей и идентифицирует совпадение аудиторий.

Детальный разбор

Термины и определения

Cluster (Кластер)
Группа элементов контента, объединенных на основе высокой степени схожести их Nearest Neighbor Lists.
Content Group (Группа контента)
Набор из одного или нескольких элементов контента (например, рекламных объявлений), которые система обрабатывает как единое целое для анализа и кластеризации.
Distance Metric (Метрика расстояния)
Числовое значение, представляющее степень различия между двумя объектами. В патенте используются два уровня: First Distance Metric и Second Distance Metric.
Edit Distance (Расстояние редактирования)
Одна из возможных метрик для Second Distance Metric. Определяется как минимальное количество операций (вставок, удалений), необходимых для преобразования одного Nearest Neighbor List в другой.
First Distance Metric (Первая метрика расстояния)
Метрика для расчета схожести между двумя Interest Category Vectors. Используется для генерации NNL. Примеры: cosine distance.
Hierarchical Agglomerative Clustering (Иерархическая агломеративная кластеризация)
Алгоритм кластеризации "снизу вверх", который начинает с отдельных элементов и последовательно объединяет наиболее похожие пары в более крупные кластеры.
Interest Category Vector (Вектор категорий интересов)
Структура данных (например, гистограмма), ассоциированная с элементом контента. Она описывает распределение и относительную частоту (вес) различных категорий интересов пользователей, которые взаимодействовали с этим контентом.
Nearest Neighbor List (NNL) (Список ближайших соседей)
Упорядоченный список других групп контента, отсортированный по степени их схожести с базовой группой контента на основе сравнения Interest Category Vectors.
Second Distance Metric (Вторая метрика расстояния)
Метрика для расчета схожести между двумя Nearest Neighbor Lists. Используется для принятия решения о кластеризации.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной многоступенчатый процесс оценки и кластеризации контента.

  1. Система идентифицирует первую группу контента. Элементы этой группы имеют Interest Category Vectors, указывающие на интересы пользователей, контактировавших с элементом.
  2. Система оценивает вектор элемента первой группы в сравнении с векторами элементов других групп для вычисления First Distance Metrics (первичные метрики расстояния, показывающие схожесть между группами).
  3. Генерируется First Nearest Neighbor List (NNL) для первой группы. Это ранжированный список других групп, основанный на первичных метриках.
  4. Система сравнивает первый NNL со вторым NNL (принадлежащим второй группе контента) для вычисления Second Distance Metric (вторичная метрика расстояния, показывающая схожесть между списками NNL).
  5. На основе вторичной метрики первая и вторая группы объединяются в Cluster, который заменяет исходные группы.

Ядром изобретения является двухэтапное сравнение: сначала схожесть векторов интересов (для создания NNL), затем схожесть самих списков NNL (для кластеризации).

Claim 3 (Зависимый): Детализирует процесс генерации векторов интересов.

  1. Идентификация пользователей, которые получили доступ к элементу контента.
  2. Определение категорий интересов этих пользователей.
  3. Генерация Interest Category Vector для элемента на основе анализа этих категорий интересов.

Это подтверждает, что векторы основаны на фактическом поведении и профилях аудитории.

Claim 4 (Зависимый): Уточняет метод сравнения списков NNL (Second Distance Metric).

  1. Система определяет Edit Distance между первым и вторым NNL.
  2. Объединение в кластер происходит на основе этого Edit Distance.

Где и как применяется

Патент не описывает применение этого метода в основном конвейере органического поиска в реальном времени. Он фокусируется на офлайн-анализе данных для систем размещения контента.

CRAWLING / Сбор данных
Система должна собирать и обрабатывать данные о поведении пользователей (user activity), такие как поисковые запросы, посещенные сайты и взаимодействие с контентом (клики, просмотры). Эти данные являются исходным материалом для анализа.

INDEXING / Обработка данных (Offline Processing)
Основные процессы, описанные в патенте (генерация векторов, вычисление NNL и кластеризация), вероятно, выполняются в офлайн-режиме или в виде пакетной обработки. Это аналитический процесс, который обрабатывает большие объемы данных для создания структуры кластеров.

Системы размещения контента (AdTech / Рекомендации)
Результаты работы системы — кластеры контента — используются на этапе доставки контента пользователю. Content placement system (например, рекламная сеть или система рекомендаций) использует эти кластеры для выбора наиболее подходящего контента для показа.

Входные данные:

  • Набор элементов контента (например, рекламные объявления).
  • Данные о поведении пользователей (анонимизированные), связанные с взаимодействием с этим контентом.
  • Классификатор интересов (например, Bayesian classifier network).

Выходные данные:

  • Иерархическая структура кластеров, объединяющая исходные группы контента на основе схожести аудитории.

На что влияет

  • Конкретные типы контента: В патенте явно указано влияние на рекламу (ads). Метод также может применяться к любому контенту в рекомендательных системах (например, Google Discover, YouTube).
  • Конкретные ниши или тематики: Метод универсален. Он особенно полезен для выявления неочевидных связей между контентом из разных тематик, если они привлекают одну и ту же аудиторию.

Когда применяется

  • Временные рамки и частота применения: Процесс кластеризации является итеративным и ресурсоемким. Это предполагает периодическую пакетную обработку для обновления кластеров по мере поступления новых данных о поведении пользователей, а не выполнение в реальном времени.
  • Условия и пороги: Кластеризация происходит, когда схожесть между списками ближайших соседей (Second Distance Metric) является наивысшей среди всех пар или превышает определенный порог.

Пошаговый алгоритм

Процесс можно разделить на три основных этапа: генерация векторов, генерация списков ближайших соседей и кластеризация.

Этап А: Генерация векторов интересов (Interest Category Vector Generation)

  1. Сбор данных о поведении: Для каждого элемента контента идентифицируется группа пользователей, которые с ним взаимодействовали. Собирается их активность (например, поисковые запросы, посещенные сайты).
  2. Определение интересов: Активность пользователей обрабатывается (например, с помощью Байесовского классификатора) для определения категорий интересов.
  3. Агрегация и взвешивание: Интересы агрегируются по всей группе пользователей. Определяется относительная частота (вес) каждого интереса.
  4. Формирование вектора: Создается Interest Category Vector для элемента контента, отражающий профиль интересов его аудитории.

Этап Б: Генерация списков ближайших соседей (NNL Generation)

  1. Вычисление схожести векторов (First Distance Metric): Система сравнивает вектор интересов каждой группы контента с векторами всех остальных групп. Используются методы, такие как косинусное расстояние (cosine distance function) или скалярное произведение нормализованных векторов (dot product of the unit-normalized vectors).
  2. Ранжирование и сортировка: Для каждой группы контента остальные группы сортируются по возрастанию расстояния (убыванию схожести).
  3. Формирование списка: Создается Nearest Neighbor List (NNL) — упорядоченный список соседей.

Этап В: Кластеризация контента (Content Clustering)

  1. Вычисление схожести списков (Second Distance Metric): Система сравнивает NNL всех пар групп контента. Используются метрики, такие как Edit Distance или сумма абсолютных разностей рангов.
  2. Идентификация наиболее похожей пары: Определяется пара групп контента, чьи NNL имеют наименьшее расстояние (наибольшую схожесть).
  3. Объединение в кластер: Эти две группы объединяются в новый кластер, который заменяет исходные группы в наборе данных.
  4. Итерация: Процесс повторяется (Hierarchical Agglomerative Clustering), пока не будет достигнуто желаемое состояние.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на данных, связанных с поведением пользователей и их интересами. Традиционные SEO-факторы (контентные, ссылочные, технические) не упоминаются.

  • Поведенческие факторы: Это основные данные для системы. Используется активность пользователей (user activity), которые взаимодействовали с контентом. Сюда входят:
    • Поисковые запросы (search query, keywords), введенные пользователем.
    • Посещенные веб-сайты (website visited by the user).
    • Взаимодействие с контентом (клики, просмотры).

В патенте подчеркивается, что данные собираются анонимно (например, с помощью cookies) и с согласия пользователя (opt-in/opt-out).

Какие метрики используются и как они считаются

  • Interest Category Vector: Вектор или гистограмма, представляющая профиль интересов аудитории. Для классификации интересов может использоваться Байесовская сеть (Bayesian classifier network).
  • First Distance Metric (Схожесть векторов): Метрика для определения схожести между двумя Interest Category Vectors. Упоминаются методы:
    • Скалярное произведение нормализованных векторов (dot product of the unit-normalized vectors).
    • Косинусное расстояние (cosine distance function).
  • Nearest Neighbor List (NNL): Ранжированный список, созданный путем сортировки групп контента на основе First Distance Metric.
  • Second Distance Metric (Схожесть списков): Метрика для определения схожести между двумя NNL. Упоминаются методы:
    • Edit Distance (расстояние редактирования).
    • Сумма абсолютной разницы в ранге каждой записи, деленная на минимальный ранг для этой записи в двух списках.
  • Алгоритмы машинного обучения: Для кластеризации используется Hierarchical Agglomerative Clustering.

Выводы

  1. Кластеризация на основе аудитории, а не содержания: Ключевой вывод — Google использует механизмы для группировки контента на основе того, КТО его потребляет (их интересы), а не только того, О ЧЕМ этот контент. Два тематически разных элемента могут попасть в один кластер, если их аудитории имеют схожие профили интересов.
  2. Глубокий анализ поведения пользователей: Система основана на способности Google собирать данные о поведении (поисковые запросы, посещения сайтов) и преобразовывать их в структурированные профили интересов (Interest Category Vectors).
  3. Сложный механизм выявления связей (NNL Comparison): Используется двухэтапный анализ схожести. Кластеризация основана на сравнении списков соседей (NNL), что является более сложным методом, чем прямое сравнение векторов. Это позволяет выявить более глубокие структурные сходства между аудиториями.
  4. Применение в AdTech и рекомендациях: Согласно тексту патента, этот механизм предназначен для улучшения систем размещения контента (content placement systems), в первую очередь рекламы и рекомендаций. Прямого применения в алгоритмах ранжирования органического поиска не описано.

Практика

Патент описывает внутренние процессы Google (преимущественно AdTech и системы рекомендаций) без прямых рекомендаций для SEO. Патент является инфраструктурным и не дает прямых практических выводов для SEO-ранжирования в органическом поиске, но позволяет лучше понять, как Google анализирует аудиторию.

Best practices (это мы делаем)

  • Глубокое изучение интересов целевой аудитории: Необходимо понимать не только основной интент, связанный с ключевым словом, но и смежные интересы аудитории. Патент подтверждает, что Google способен профилировать эти интересы. Создание контента, охватывающего смежные темы (Topical Authority), укрепляет связь с аудиторией.
  • Фокус на привлечении целевой аудитории: Необходимо сосредоточиться на привлечении пользователей с четко выраженными интересами, соответствующими тематике сайта. Наличие целевой аудитории помогает сформировать релевантный Interest Category Vector в системах Google.
  • Анализ профиля аудитории: Используйте доступные инструменты аналитики для понимания реальных интересов посетителей вашего сайта. Это поможет синхронизировать SEO и контент-стратегию с тем, как Google может кластеризовать вашу аудиторию.

Worst practices (это делать не надо)

  • Привлечение нецелевого или смешанного трафика: Покупка трафика низкого качества, использование кликбейта или накрутка посещаемости может негативно сказаться на восприятии сайта системами, использующими подобные методы анализа. Нецелевой трафик "размывает" Interest Category Vector сайта, что может привести к некорректной кластеризации.
  • Игнорирование смежных интентов: Фокусировка исключительно на узком наборе ключевых слов без учета более широкого круга интересов пользователей в вашей нише.

Стратегическое значение

Патент подтверждает стратегический приоритет Google на понимание пользователя и его интересов. Он демонстрирует техническую реализацию того, как поведение пользователей преобразуется в данные для машинного обучения. Для Senior SEO-специалистов это подчеркивает важность перехода от чисто семантического анализа контента к анализу аудитории и ее поведения. Хотя этот конкретный патент относится к AdTech, технологии профилирования аудитории лежат в основе многих систем Google.

Практические примеры

Патент не предоставляет конкретных сценариев применения для SEO. Приведенный ниже пример иллюстрирует работу патента в контексте рекомендательных систем или AdTech.

Сценарий: Кластеризация контента на основе общих интересов аудитории

  1. Элемент контента 1: Статья "Лучшие карбоновые шоссейные велосипеды".
  2. Элемент контента 2: Статья "Как подготовиться к марафону".
  3. Анализ аудитории: Google анализирует пользователей, читающих обе статьи. Выясняется, что аудитория обеих статей имеет схожие Interest Category Vectors с высокими весами для интересов: "Спортивное питание", "Мониторы сердечного ритма", "Восстановление после тренировок".
  4. Кластеризация: Система определяет высокую степень схожести между Nearest Neighbor Lists этих статей. Обе статьи попадают в один кластер (например, "Спорт на выносливость").
  5. Результат: Пользователю, который прочитал статью о велосипедах, система рекомендаций (например, Google Discover) или рекламная система с большей вероятностью покажет статью о марафоне или рекламу спортивного питания, так как они находятся в одном кластере интересов аудитории.

Вопросы и ответы

Влияет ли описанный в патенте механизм на ранжирование в органическом поиске?

Нет, согласно тексту патента, прямого влияния на органическое ранжирование нет. Патент описывает метод кластеризации контента для использования в системах размещения контента (content placement systems), таких как рекламные сети или системы рекомендаций. В нем не упоминаются факторы ранжирования органической выдачи.

Что такое "Вектор категорий интересов" (Interest Category Vector) и как он формируется?

Это профиль интересов аудитории, которая взаимодействовала с определенным элементом контента. Он формируется путем анализа поведения этих пользователей (их поисковых запросов, посещенных сайтов). Вектор показывает, какие темы интересуют эту аудиторию и насколько сильно (вес интереса), например: 50% – путешествия, 30% – дайвинг, 20% – фотография.

Как Google определяет интересы пользователей?

Google анализирует активность пользователей, такую как введенные поисковые запросы и посещенные веб-сайты. В патенте упоминается использование классификаторов (например, Bayesian classifier network) для преобразования этой активности в конкретные категории интересов. Подчеркивается, что данные собираются анонимно и с согласия пользователя.

В чем ключевая особенность этого метода кластеризации?

Ключевая особенность в том, что кластеризация происходит не просто путем сравнения векторов интересов, а путем сравнения Списков Ближайших Соседей (NNL). Это означает, что два элемента объединяются в кластер, если они похожи друг на друга с точки зрения того, кто является их соседями в пространстве интересов, что позволяет выявить более глубокие связи.

В чем отличие этого метода от обычной кластеризации по тексту?

Обычная кластеризация анализирует содержание контента (ключевые слова, сущности) для группировки похожих документов. Описанный метод игнорирует содержание и фокусируется на интересах аудитории. Два совершенно разных по тексту документа будут объединены в кластер, если их читают пользователи с одинаковыми профилями интересов.

Как SEO-специалист может использовать информацию из этого патента?

Хотя прямой пользы для ранжирования мало, патент подчеркивает важность понимания реальных интересов вашей аудитории за пределами ключевых слов. Понимание того, как Google моделирует интересы, помогает строить более эффективные контент-стратегии, ориентированные на привлечение и удержание целевой аудитории с четким профилем интересов.

Может ли привлечение нецелевого трафика навредить сайту с точки зрения этого патента?

Косвенно да. Если на сайт привлекается много пользователей с разрозненными интересами (например, через кликбейт или покупку трафика), это может "размыть" Interest Category Vector, связанный с вашим контентом. Это затрудняет системе четкую классификацию вашей аудитории, что может негативно сказаться на эффективности систем, использующих эти данные.

Что такое "Расстояние редактирования" (Edit Distance) в контексте патента?

Это одна из метрик, используемых для сравнения двух списков ближайших соседей (NNL). Она показывает, сколько операций (вставок или удалений) нужно сделать, чтобы превратить один упорядоченный список в другой. Чем меньше расстояние, тем более похожи списки и тем выше вероятность кластеризации.

Связан ли этот механизм с Google Topics API?

Концептуально они связаны. И этот патент (подача 2012 г.), и современный Topics API направлены на профилирование интересов пользователей на основе их поведения для улучшения таргетинга контента и рекламы. Этот патент описывает конкретный механизм кластеризации, который использует такие профили интересов.

Происходит ли этот процесс в реальном времени во время поискового запроса?

Нет. Описанный процесс генерации векторов и иерархической кластеризации является ресурсоемким и предназначен для выполнения в офлайн-режиме или в виде пакетной обработки. Результаты этой обработки (кластеры) затем используются системами размещения контента.

Похожие патенты

Как Google кластеризует новостные результаты для генерации блоков "Связанные темы" и "Категории"
Google анализирует результаты поиска по новостям и группирует статьи, освещающие одно и то же событие, в кластеры. Затем система извлекает общие ключевые слова из этих кластеров для формирования блока "Связанные темы" (Related Topics), помогая уточнить запрос. Одновременно определяется широкая категория новостей (например, "Спорт"), из которой предлагается дополнительный контент для расширения контекста.
  • US11194868B1
  • 2021-12-07
  • Семантика и интент

  • Свежесть контента

  • SERP

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
  • US8065316B1
  • 2011-11-22
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google оценивает качество новостных источников, кластеризует статьи и ранжирует новости на основе свежести, оригинальности и авторитетности
Детальный разбор основополагающего патента Google News. Система оценивает источники по скорости реакции на события, оригинальности контента и авторитетности (ссылки, просмотры). Новостные сюжеты (кластеры) ранжируются по свежести и качеству источников. Статьи внутри сюжета сортируются с использованием «Модифицированной оценки свежести», которая дает значительное преимущество авторитетным изданиям.
  • US7568148B1
  • 2009-07-28
  • Свежесть контента

  • EEAT и качество

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google группирует результаты поиска из одного источника («Канала») в поисковой выдаче
Google использует механизм для изменения порядка результатов поиска на медиа-платформах. Если в выдаче присутствует несколько элементов контента (например, видео) из одного источника («Канала»), система может сгруппировать их в визуальный кластер, даже если это нарушает исходный порядок релевантности. Это улучшает восприятие выдачи и повышает видимость авторитетных источников.
  • US10216842B2
  • 2019-02-26
  • SERP

Популярные патенты

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки
Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).
  • US20180357238A1
  • 2018-12-13
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore