SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует иерархическую популярность связанных сущностей и данные веб-поиска для ранжирования в вертикальном поиске

USING HIERARCHICAL SCORING FOR DISAMBIGUATION IN AN INFORMATION RETRIEVAL SYSTEM (Использование иерархического скоринга для устранения неоднозначности в системе поиска информации)
  • US9626435B2
  • Google LLC
  • 2012-11-16
  • 2017-04-18
  • Google Shopping
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм иерархического скоринга для ранжирования сущностей (например, брендов или исполнителей) в вертикальных поисках (non-WWW corpus). Популярность родительской сущности рассчитывается на основе агрегированной популярности дочерних (например, товаров или треков). Система использует данные о запросах и CTR из основного веб-поиска (WWW corpus) для определения популярности и применяет геолокацию и язык для устранения неоднозначности.

Описание

Какую проблему решает

Патент решает проблему неоднозначности (disambiguation) и плохого ранжирования в «разреженных системах поиска информации» (sparse information retrieval systems). Это относится к специализированным вертикальным поисковым системам (например, Google Shopping, Books, Music), где данных по каждой отдельной сущности недостаточно для их различения (например, два исполнителя или товара с одинаковым названием).

Что запатентовано

Запатентована система иерархического скоринга (Hierarchical Scoring) для ранжирования сущностей в специализированном поиске (non-WWW corpus). Суть изобретения — оценка сущности определяется путем агрегации оценок популярности связанных с ней подчиненных сущностей. Популярность «течет» вверх по иерархии (например, от Трека к Альбому и к Исполнителю). Также запатентован механизм использования геолокации и языка для разрешения неоднозначности.

Как это работает

Система работает по иерархическому принципу:

  • Определение базовой популярности: Популярность базовых элементов (например, треков/товаров) рассчитывается на основе объема поисковых запросов и CTR. Критически важно, что эти данные могут браться из основного веб-поиска (WWW corpus).
  • Иерархическая агрегация: Оценки популярности агрегируются вверх. Популярность Альбома — это взвешенное среднее (weighted average) популярности его Треков. Популярность Исполнителя — взвешенное среднее популярности его Альбомов.
  • Ранжирование: Итоговая иерархическая оценка используется для ранжирования в вертикальном поиске.
  • Устранение неоднозначности: Используются независимые от запроса оценки (Query Independent Scores), такие как данные о продажах, а также геолокация и язык пользователя, чтобы различить идентичные названия.

Актуальность для SEO

Высокая. Концепции патента фундаментальны для поиска, ориентированного на сущности (Entity-Oriented Search), и оптимизации в вертикальных поисках. Идея иерархической передачи авторитета или популярности между связанными сущностями является ключевой для понимания оценки релевантности и E-E-A-T в 2025 году.

Важность для SEO

Патент имеет значительное влияние (7.5/10), особенно для Entity SEO и оптимизации в вертикалях (E-commerce, медиа). Он демонстрирует, как сигналы популярности (спрос и CTR) для конкретных элементов (товаров, треков) в основном веб-поиске способствуют общему авторитету и ранжированию родительской сущности (бренда, исполнителя) в вертикальном поиске. Также патент явно подтверждает использование геолокации и языка для разрешения неоднозначности.

Детальный разбор

Термины и определения

Combined media popularity score (Комбинированная оценка популярности медиа)
Агрегированная оценка популярности для родительской сущности (например, исполнителя), основанная на оценках популярности ее дочерних элементов (например, альбомов).
Hierarchical Scoring (Иерархический скоринг)
Метод оценки, при котором оценка элемента на одном уровне иерархии зависит от оценок элементов на смежных уровнях (например, Трек -> Альбом -> Исполнитель).
Non-WWW corpus (Корпус, не относящийся к WWW)
Специализированная база данных или индекс, документы в котором не являются стандартными веб-страницами (например, база данных Google Shopping, Google Books).
Popularity Score (Оценка популярности)
Метрика, отражающая популярность сущности. На базовом уровне (например, трек) рассчитывается на основе объема поисковых запросов и CTR.
Query Independent Scores (Оценки, не зависящие от запроса)
Факторы ранжирования, не зависящие от текста текущего запроса. В патенте упоминаются геолокация, язык, дата выпуска (Release Date), количество продаж (Sell Count) и количество прослушиваний (Play Count).
Sparse information retrieval systems (Разреженные системы поиска информации)
Поисковые системы, где доступно ограниченное количество данных по каждому документу или сущности, что затрудняет их различение.
Weighted Average (Взвешенное среднее)
Метод агрегации оценок, используемый для расчета популярности на более высоких уровнях иерархии.
WWW corpus (WWW-корпус)
Основной индекс веб-поиска.

Ключевые утверждения (Анализ Claims)

Claims 1 и 2 (Независимые пункты): Описывают основной механизм ранжирования в non-WWW corpus.

  1. Система получает запрос о медиа авторе/исполнителе в non-WWW corpus.
  2. Генерируется оценка для каждого автора, основанная на ДВУХ компонентах: (i) Combined media/album popularity score (иерархическая оценка) и (ii) Дополнительная оценка, не зависящая от запроса (Query Independent Score).
  3. Эта дополнительная оценка (ii) явно основана на geographic location (геолокации) получения запроса и language (языке), используемом в этой локации.
  4. Механизм устранения неоднозначности: Если идентифицированы два элемента (например, альбома) с идентичным названием (identical title), то элемент, который более тесно связан с геолокацией и языком пользователя, получает более высокую оценку.
  5. Результаты ранжируются на основе итоговой оценки.

Claims 5 и 6 (Зависимые): Определяют расчет базовой популярности (например, трека).

  1. Popularity score основывается на: (i) Общем количестве поисковых запросов об этом элементе и/или (ii) Clickthrough ratios (CTRs) веб-результатов по этим запросам.
  2. Критически важно (Claim 6): По крайней мере часть этих поисковых запросов выполняется в WWW-based search corpus (основном веб-поиске). Это связывает поведение пользователей в веб-поиске с ранжированием в вертикальном поиске.

Claims 7 и 8 (Зависимые): Определяют механизм иерархической агрегации.

  1. Популярность альбома рассчитывается как weighted average (взвешенное среднее) оценок популярности треков внутри этого альбома (Claim 7).
  2. Комбинированная оценка популярности (для исполнителя) рассчитывается как weighted average оценок популярности его альбомов (Claim 8).

Claim 18 (Независимый): Применяет ту же логику к поиску альбома.

  1. Оценка альбома основывается на (i) Популярности его треков И/ИЛИ (ii) Популярности связанного с ним исполнителя.
  2. Также применяется фактор устранения неоднозначности на основе геолокации и языка.

Где и как применяется

Изобретение применяется в специализированных вертикальных поисковых системах (non-WWW corpus) и затрагивает этапы индексирования и ранжирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительный расчет иерархических оценок популярности. Система анализирует логи поисковых запросов и CTR из WWW corpus для определения популярности базовых сущностей (треков, товаров). Затем эти оценки агрегируются по иерархии (альбомы, исполнители) и сохраняются как признаки (features) этих сущностей в индексе вертикального поиска.

RANKING – Ранжирование / RERANKING – Переранжирование
Во время обработки запроса в вертикальном поиске система извлекает предварительно рассчитанные Popularity Scores. Эти оценки комбинируются с другими Query Independent Scores (например, данные о продажах). На финальном этапе применяется корректировка на основе контекста пользователя (геолокация и язык) для устранения неоднозначности.

Входные данные:

  • Запрос пользователя в вертикальном поиске (non-WWW corpus).
  • Контекст пользователя (геолокация, язык).
  • Предварительно рассчитанные иерархические Popularity Scores.
  • Данные Query Independent Scores (Sell Count, Play Count, Release Date).
  • (Офлайн) Логи запросов и CTR из WWW corpus.

Выходные данные:

  • Отранжированный список сущностей в вертикальном поиске.

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние на вертикали с четкими иерархическими связями: Музыка (Трек/Альбом/Исполнитель), Книги (Книга/Автор), E-commerce (Товар/Бренд), Кино/ТВ.
  • Сущности (Entities): Влияет на ранжирование и видимость Авторов, Исполнителей, Брендов, а также их продуктов.
  • Языковые и географические ограничения: Патент явно описывает механизм использования геолокации и языка для предпочтения региональных версий контента при наличии неоднозначности.

Когда применяется

  • Условия работы алгоритма: Применяется при поиске в специализированных, «разреженных» корпусах (non-WWW corpus).
  • Триггеры активации: Активируется, когда необходимо ранжировать сущности, особенно при наличии неоднозначности. Механизм гео-дисамбигуации активируется, когда обнаруживаются два элемента с идентичным названием (identical title).

Пошаговый алгоритм

Алгоритм состоит из офлайн-процесса расчета оценок и онлайн-процесса ранжирования.

Процесс А: Офлайн-расчет иерархических оценок (Индексирование)

  1. Сбор данных из WWW: Анализ логов основного веб-поиска (WWW corpus) для сбора данных об объеме запросов и CTR для базовых сущностей (например, треков).
  2. Расчет базовой популярности: Вычисление Popularity Score для каждого трека на основе собранных поведенческих данных.
  3. Иерархическая агрегация (Уровень 1): Расчет Popularity Score для каждого альбома как weighted average оценок популярности входящих в него треков.
  4. Иерархическая агрегация (Уровень 2): Расчет Combined Popularity Score для каждого исполнителя как weighted average оценок популярности его альбомов.
  5. Сохранение оценок: Сохранение рассчитанных оценок в индексе вертикального поиска как признаков соответствующих сущностей.

Процесс Б: Онлайн-обработка запроса (Ранжирование)

  1. Получение запроса и контекста: Система получает запрос (например, имя исполнителя) в вертикальном поиске, а также геолокацию и язык пользователя.
  2. Идентификация кандидатов: Определение списка релевантных исполнителей.
  3. Получение оценок: Извлечение предварительно рассчитанных Combined Popularity Score и других Query Independent Scores (например, Sell Count).
  4. Расчет предварительной оценки: Комбинирование иерархической оценки популярности и других независимых оценок.
  5. Устранение неоднозначности (Disambiguation): Проверка наличия сущностей с идентичными названиями. Применение корректировки на основе геолокации и языка: повышение оценки для сущности, более релевантной контексту пользователя.
  6. Финальное ранжирование: Сортировка кандидатов на основе итоговой оценки и отображение результатов.

Какие данные и как использует

Данные на входе

Патент явно указывает на использование следующих типов данных:

  • Поведенческие факторы: Являются основой для расчета популярности. Используются Total number of search queries (общее количество поисковых запросов) и Clickthrough ratios (CTRs) (показатели кликабельности) веб-результатов. Эти данные собираются из WWW corpus.
  • Географические факторы: Geographic location (геолокация), откуда получен запрос. Используется для устранения неоднозначности.
  • Пользовательские факторы: Язык (language), используемый в географической локации пользователя.
  • Временные факторы: Дата выпуска (Release Date) упоминается как один из Query Independent Scores.
  • Внешние/Коммерческие данные: Количество продаж (Sell Count) и количество прослушиваний/воспроизведений (Play Count) используются как Query Independent Scores.

Какие метрики используются и как они считаются

Система использует иерархическую модель расчета метрик:

  1. Popularity Score (Базовый уровень, например, Трек): Рассчитывается на основе объема запросов и CTR из WWW corpus.
  2. Popularity Score (Иерархический уровень, например, Альбом): Рассчитывается как weighted average (взвешенное среднее) оценок популярности подчиненных элементов (треков).
  3. Combined Popularity Score (Верхний уровень, например, Исполнитель): Рассчитывается как weighted average оценок популярности подчиненных элементов (альбомов).
  4. Geo/Language Disambiguation Score: Оценка, повышающая результат, если он соответствует геолокации и языку пользователя, особенно при наличии одинаковых названий.

Выводы

  1. Иерархическая природа авторитетности сущностей: Патент демонстрирует, что авторитет или популярность "родительской" сущности (Бренд, Исполнитель) напрямую зависит от агрегированной популярности ее "дочерних" сущностей (Товары, Треки). Это подтверждает концепцию Topical Authority в SEO, где авторитет домена в теме зависит от качества и популярности отдельных кластеров контента.
  2. Кросс-корпусные сигналы ранжирования (WWW влияет на Вертикали): Критически важный вывод — Google использует данные из основного веб-поиска (WWW corpus) для ранжирования результатов в специализированных вертикальных поисках (non-WWW corpus). Популярность сущности в вебе напрямую влияет на ее видимость в вертикалях.
  3. Популярность = Спрос + Вовлеченность: Система четко определяет популярность через измеримые поведенческие сигналы: объем поискового спроса (количество запросов) и вовлеченность (CTR).
  4. Геолокация и язык как факторы ранжирования (Disambiguation): Патент явно подтверждает использование контекста пользователя (геолокация и язык) в качестве решающих факторов при наличии неоднозначных результатов с идентичными названиями.
  5. Интеграция внешних сигналов популярности: Реальные показатели, такие как продажи (Sell Count) и прослушивания (Play Count), интегрируются в систему ранжирования как Query Independent Scores.

Практика

Best practices (это мы делаем)

  • Комплексная оптимизация сущностей (Entity SEO) и иерархии: Работайте над тем, чтобы Google четко понимал иерархию ваших сущностей. Используйте структурированные данные (Schema.org) для связи родительских сущностей (Бренд, Автор) с дочерними (Товар, Книга). Авторитет должен "течь" снизу вверх.
  • Стимулирование поискового спроса и улучшение CTR в Веб-поиске: Поскольку популярность (спрос и CTR) в WWW corpus используется как сигнал ранжирования в вертикалях (например, Google Shopping), необходимо активно работать над повышением этих показателей для ваших продуктов в основном поиске Google. Высокая вовлеченность с дочерними сущностями улучшит ранжирование родительской сущности.
  • Точный международный таргетинг (Glocalization): Патент явно указывает, что геолокация и язык используются для устранения неоднозначности. Критически важно реализовать точный геотаргетинг (например, через Hreflang или локализованные фиды), чтобы система могла выбрать правильную версию продукта для пользователя и применить механизм Disambiguation в вашу пользу.
  • Оптимизация всех компонентов сущности: Убедитесь, что все компоненты сущности (например, все продукты линейки) хорошо оптимизированы и популярны. Популярность одного элемента может поддержать видимость связанных элементов (как вверх, так и вниз по иерархии).

Worst practices (это делать не надо)

  • Изолированная оптимизация вертикального поиска: Рассматривать оптимизацию под Google Shopping исключительно как задачу по настройке фида, игнорируя популярность бренда и товаров в основном веб-поиске.
  • Игнорирование CTR и поведенческих факторов: Фокусироваться только на позициях без анализа реального спроса и кликабельности (CTR) для конкретных продуктов. Низкий CTR в веб-поиске может снизить Popularity Score сущности.
  • Неоднозначное международное позиционирование: Запуск продуктов с одинаковыми названиями для разных рынков без четкого технического разделения (например, без hreflang). Это затруднит работу механизма Disambiguation и может привести к показу нерелевантного контента.

Стратегическое значение

Патент подтверждает стратегический сдвиг в сторону поиска, ориентированного на сущности (Entity-Oriented Search). Он демонстрирует, что популярность и авторитет являются передаваемыми и иерархическими свойствами. SEO-стратегии должны быть направлены на создание реального спроса и вовлеченности в основном поиске, так как эти поведенческие сигналы квантифицируются и используются для ранжирования на различных поверхностях Google.

Практические примеры

Сценарий: Ранжирование Бренда в E-commerce (Google Shopping)

  1. Задача: Улучшить видимость Бренда А в результатах Google Shopping (non-WWW corpus) по категории «Кроссовки».
  2. Механизм патента: Google рассчитывает иерархическую Popularity Score для Бренда А.
  3. Анализ данных: Система анализирует объем поисковых запросов и CTR в основном веб-поиске (WWW corpus) для отдельных моделей кроссовок Бренда А (дочерние сущности).
  4. Агрегация: Если Модель X и Модель Y Бренда А имеют высокий спрос и CTR в веб-поиске, их оценки популярности агрегируются (weighted average) и повышают общую оценку Бренда А.
  5. Результат: Благодаря высокой иерархической популярности, Бренд А получает преимущество в ранжировании в Google Shopping по сравнению с Брендом Б, чьи модели менее популярны в веб-поиске.
  6. Дисамбигуация: Если Бренд А имеет разные линейки для США и Европы с одинаковыми названиями моделей, система использует геолокацию пользователя, чтобы показать ему релевантную версию.

Вопросы и ответы

Означает ли этот патент, что сигналы из Google Поиска влияют на ранжирование в Google Shopping, Google Books или Google Play?

Да, патент прямо указывает (Claim 6), что для расчета Popularity Score сущности могут использоваться данные о количестве поисковых запросов и CTR из основного веб-поиска (WWW-based search corpus). Это подтверждает наличие кросс-корпусных сигналов ранжирования: популярность в вебе влияет на видимость в вертикальных сервисах.

Как Google определяет популярность согласно этому патенту?

Популярность определяется двумя основными факторами: поисковым спросом (общее количество запросов о сущности) и вовлеченностью пользователей (CTR веб-результатов по этим запросам). Также учитываются дополнительные независимые сигналы, такие как количество продаж (Sell Count) и количество прослушиваний/просмотров (Play Count).

Что такое иерархический скоринг и как он связан с Topical Authority в SEO?

Иерархический скоринг — это агрегация оценок снизу вверх: популярность Треков определяет популярность Альбома, которая определяет популярность Исполнителя. В SEO это аналогично концепции Topical Authority: качество и популярность отдельных статей (Треки) определяют авторитет кластера (Альбом), что в итоге определяет общий авторитет сайта в теме (Исполнитель).

Как работает механизм устранения неоднозначности (Disambiguation)?

Если система обнаруживает несколько сущностей с идентичным названием (например, товар выпущен для разных рынков), она использует контекст пользователя для выбора лучшего варианта. Патент делает упор на географическое положение пользователя и язык, используемый в этой локации, чтобы повысить в ранжировании наиболее релевантную версию.

Как этот патент влияет на международное SEO?

Он подчеркивает критическую важность правильной локализации. Если ваш контент или продукт предназначен для разных рынков, необходимо предоставлять четкие сигналы (например, через hreflang, структуру сайта, локальный контент), чтобы помочь Google понять, какая версия релевантна для конкретной геолокации и языка пользователя.

Что означает «взвешенное среднее» (weighted average) в контексте агрегации оценок?

Это означает, что не все дочерние элементы вносят одинаковый вклад в оценку родителя. Например, при расчете популярности Альбома, один супер-хит может иметь больший вес, чем остальные менее популярные треки. Система использует веса для учета этой разницы при расчете среднего значения.

Применяется ли этот механизм только к Музыке?

Хотя большинство примеров в патенте касаются музыки (Исполнители, Альбомы, Треки), Claim 1 сформулирован более широко и охватывает "Авторов медиа" (Media Author) и "Медиа-элементы" (Media Item). Это подразумевает применимость к книгам, фильмам, товарам (E-commerce) и другим структурированным данным.

Как обеспечить правильную связь между сущностями (например, Товар и Бренд)?

Для SEO-специалистов ключевым инструментом является использование микроразметки Schema.org (например, свойство brand для Product) и предоставление точных данных в фидах (например, GTIN, MPN в Google Merchant Center). Это помогает поисковой системе установить иерархические связи, необходимые для работы этого алгоритма.

Влияет ли популярность Исполнителя на ранжирование его Трека?

Да. Патент описывает иерархический скоринг как двунаправленный процесс. При поиске трека или альбома (Claim 18) его оценка может основываться как на его собственной популярности (и популярности его компонентов), так и на популярности связанного Исполнителя. Авторитет родительской сущности помогает ранжированию дочерней.

Что делать, если мой бренд или продукт имеет общеупотребимое название (неоднозначность)?

Необходимо максимально усилить сигналы, которые помогут Google вас идентифицировать. Это включает построение сильной иерархической популярности (чтобы выделиться среди других сущностей с тем же именем) и четкое таргетирование на вашу целевую аудиторию по географии и языку, чтобы механизм Disambiguation работал в вашу пользу.

Похожие патенты

Как Google использует популярность сущностей в Веб-поиске для ранжирования результатов в Вертикальном поиске (Музыка, Книги, Товары)
Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы определить авторитетность и популярность сущностей (песен, книг, товаров) и скорректировать их позиции в вертикальной выдаче.
  • US9779140B2
  • 2017-10-03
  • Поведенческие сигналы

  • SERP

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует структурированные данные для борьбы с дублированием страниц с одинаковыми сущностями (например, фасеты и сортировки)
Google анализирует структурированные данные (например, Schema.org) на веб-страницах, чтобы определить, какие сущности (товары, объекты) на них представлены. Если несколько страниц, особенно с одного сайта, содержат одинаковый набор сущностей (например, листинги с разной сортировкой), Google идентифицирует их как дубликаты. Система понижает или удаляет эти дубликаты из выдачи для повышения разнообразия результатов.
  • US20140280084A1
  • 2014-09-18
  • Семантика и интент

  • SERP

  • Индексация

Как Google наследует сигналы качества и пессимизации между иерархически связанным контентом (например, Видео, Плейлисты, Каналы)
Google использует механизм для оценки качества контента (например, видео), учитывая не только его собственные характеристики, но и качество связанных с ним родительских сущностей (например, плейлиста или канала). Система комбинирует оценки качества (Classifier Scores) и оценки защиты (Protection Scores) всех уровней иерархии для расчета агрегированной оценки (Aggregate Score). Это позволяет точнее выявлять и понижать в поиске нежелательный контент, даже если он размещен на в целом качественном ресурсе, и наоборот.
  • US20200159769A1
  • 2020-05-21
  • SERP

  • EEAT и качество

  • Антиспам

Популярные патенты

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

seohardcore