Как Google обеспечивает разнообразие выдачи (Diversity), принудительно понижая результаты с повторяющимися признаками (домен, автор, тема)

FEATURE BASED RANKING ADJUSTMENT (Корректировка ранжирования на основе признаков)

US10055463B1
Google LLC
2015-11-19
2018-08-21

SERP

Google использует механизм переранжирования для обеспечения разнообразия (Diversity) в поисковой выдаче или ленте рекомендаций. Система определяет ключевые признаки (Features) для каждого результата (например, домен, автор, тип контента) и назначает им "штрафные значения" (Demotion Values). Если признак повторяется в топе, следующий результат с этим же признаком принудительно смещается вниз на заданное количество позиций от предыдущего, предотвращая доминирование одного источника или темы.

Какую проблему решает

Патент решает проблему "скученности" (crowding) однотипного контента в ранжированном списке результатов. Стандартные алгоритмы ранжирования могут привести к ситуации, когда верхние позиции заняты ресурсами с одинаковыми признаками (Features) – например, с одного сайта, от одного автора или посвященные одной узкой подтеме. Изобретение призвано обеспечить разнообразие (Diversity) выдачи по заданным признакам.

Что запатентовано

Запатентована система корректировки ранжирования, которая итеративно обрабатывает предварительно отсортированный список результатов. Система не изменяет базовые оценки релевантности, а переупорядочивает результаты на основе их Ordinal Positions (порядковых позиций) и определенных признаков. Цель – гарантировать минимальное расстояние между результатами, обладающими одинаковыми признаками.

Как это работает

Механизм работает как система переранжирования (Re-Ranking Engine):

Инициализация: Результат на первой позиции фиксируется (Finalized Ranking). Система отслеживает его признаки (например, Домен А).
Итерация: Система проверяет следующий результат.
Проверка признаков: Если следующий результат имеет тот же признак (Домен А), система вычисляет позицию понижения (Demoted Ordinal Position).
Расчет понижения: Используется Demotion Value (значение понижения), заданное для этого признака. Если для Домена А значение равно 5, то следующий результат от Домена А не может появиться выше позиции 1+5=6.
Действие: Результат либо смещается на позицию понижения (если она ниже текущей), либо фиксируется на текущей позиции (если он уже удовлетворяет условию).
Обновление: При фиксации результата система обновляет позицию последнего появления его признаков. Процесс повторяется до конца списка.

Актуальность для SEO

Высокая. Обеспечение разнообразия выдачи (Diversity) является постоянной задачей поисковых систем для улучшения пользовательского опыта. Этот патент описывает конкретный алгоритмический подход к предотвращению доминирования одних и тех же источников (Site Diversity) или авторов, что особенно актуально в контексте органического поиска, Google News и рекомендательных систем (Google Discover).

Важность для SEO

Патент имеет высокое значение (8/10) для понимания формирования ТОП-10. Он описывает механизм, который напрямую влияет на Site Diversity. Если сайт занимает позицию №1, этот алгоритм может принудительно понизить другие страницы этого же сайта (или страницы с похожими признаками) на несколько позиций вниз, освобождая место для другого контента, даже если его базовая релевантность ниже. Это критически важно при стратегиях кластеризации контента и попытках занять несколько позиций в топе.

Термины и определения

Demoted Ordinal Position (DOP) (Пониженная порядковая позиция): Новая позиция в ранжировании, на которую перемещается ресурс, если он подвергается понижению из-за наличия общего признака с ранее зафиксированным ресурсом.
Demotion Value (DV) / Feature Demotion Value (FDV) (Значение понижения): Числовое значение, присваиваемое конкретному признаку (Feature). Определяет минимальное количество позиций, на которое должен быть смещен вниз следующий ресурс с этим же признаком.
Feature (Признак): Идентифицируемый атрибут ресурса. Примеры, упомянутые в патенте: Author feature (автор), Source feature (источник/домен), Topic features (тема/категория), Video features (тип контента).
Finalized Ranking (Фиксированное ранжирование): Статус ресурса, чья позиция в итоговом списке определена и больше не будет изменена в рамках данного алгоритма.
First Rank Value (FRV) (Первоначальная оценка ранжирования): Оценка (например, релевантности), полученная от основного поискового движка (Search Engine). Определяет первоначальный порядок ресурсов и используется для разрешения конфликтов (tie-breaking).
Ordinal Position (Порядковая позиция): Позиция ресурса в ранжированном списке (1-й, 2-й, 3-й и т.д.). Используется как основа для корректировок вместо First Rank Value.
Re-Ranking Engine (Механизм переранжирования): Компонент поисковой системы, отвечающий за корректировку первоначального порядка результатов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной итеративный метод корректировки ранжирования на основе признаков.

Система получает набор ресурсов, упорядоченных по Ordinal Positions (на основе First Rank Value), и список признаков (Feature list) для каждого.
Определяется, что один ресурс (обычно первый) имеет Finalized Ranking, а остальные – нет.
Система отслеживает particular ordinal position (например, самую последнюю/ближайшую к топу) для каждого признака, который уже встречался в ресурсах с Finalized Ranking.
Система итеративно выбирает ресурсы без Finalized Ranking в порядке их текущих позиций.
Для каждого выбранного ресурса принимается решение: фиксировать ранг или понизить (demote).
Если понизить: Ресурс перемещается на Demoted Ordinal Position. Эта позиция рассчитывается относительно позиции другого ресурса, который уже имеет Finalized Ranking и обладает тем же признаком.
Если фиксировать: Ранжирование ресурса фиксируется на позиции, следующей за последним зафиксированным ресурсом. После этого обновляются отслеживаемые позиции для признаков этого ресурса.

Claim 6 (Зависимый): Детализирует механизм принятия решения о понижении.

Определяется текущая Ordinal Position ресурса.
Вычисляются значения корректировки ранга (rank adjustment values, т.е. Demotion Values) для признаков ресурса, которые совпадают с признаками уже зафиксированных ресурсов.
Для каждого такого признака вычисляется потенциальная Demoted Ordinal Position (DOP) на основе Demotion Value и позиции зафиксированного ресурса.
Ранг фиксируется, если текущая Ordinal Position ресурса ниже (т.е. дальше от начала списка), чем все вычисленные DOP.
Ресурс понижается до самой низкой (наиболее удаленной от топа) из вычисленных DOP, если его текущая позиция выше хотя бы одной из них.

Claim 7 (Зависимый): Описывает разрешение конфликтов (tie-breaking).

Если несколько ресурсов понижены до одной и той же Demoted Ordinal Position, их порядок относительно друг друга сохраняется на основе их первоначальных First Rank Values. Более релевантный ресурс будет выше.

Claim 8 (Зависимый): Утверждает, что Demotion Value для разных признаков может отличаться (персонализированный контроль разнообразия).

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса для обеспечения разнообразия выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна идентифицировать и сохранить признаки (Features) для каждого ресурса (автор, домен, основная сущность, формат). Эти данные сохраняются в хранилище Feature Information.

RANKING – Ранжирование
Основной поисковый движок (Search Engine) генерирует первоначальный набор результатов, отсортированный по First Rank Value (релевантности).

RERANKING – Переранжирование (Twiddlers)
Основное место применения патента. Механизм переранжирования (Re-Ranking Engine) выступает как "Твидлер разнообразия" (Diversity Twiddler).

Входные данные: Первоначальный список ресурсов с их First Rank Values и Feature lists; набор Demotion Values для признаков.
Процесс: Алгоритм итеративно фиксирует позиции одних ресурсов и понижает другие на основе совпадения признаков и заданных Demotion Values.
Выходные данные: Финальный список ресурсов (SERP), переупорядоченный для обеспечения разнообразия.

На что влияет

Конкретные типы контента и источники: Влияет на любой контент, где важно разнообразие. В веб-поиске это напрямую влияет на Site Diversity (разнообразие доменов) и Author Diversity (разнообразие авторов). Патент также упоминает контекст социальных сетей (предотвращение показа множества постов от одного пользователя подряд).
Специфические запросы: Наибольшее влияние оказывается на запросы, где один источник или автор обладает множеством высокорелевантных страниц (например, брендовые или широкие информационные запросы).

Когда применяется

Алгоритм применяется, когда поисковая система стремится обеспечить разнообразие выдачи по определенным критериям (признакам).

Условия работы: Наличие предварительно ранжированного списка и определенных признаков с заданными Demotion Values.
Триггеры активации: Алгоритм обрабатывает список итеративно; понижение происходит только при совпадении признаков у близко расположенных результатов, если расстояние между ними меньше заданного Demotion Value.

Пошаговый алгоритм

Процесс переранжирования списка ресурсов для обеспечения разнообразия признаков.

Получение данных: Система получает набор ресурсов, упорядоченный по First Rank Value (FRV), и список признаков (Features) для каждого. Также известны Demotion Values (DV) для каждого признака.
Инициализация: Ресурс на первой позиции автоматически получает статус Finalized Ranking (Позиция 1).
Инициализация трекинга признаков: Для каждого признака первого ресурса система запоминает его последнюю фиксированную позицию (изначально 1).
Начало итерации: Система выбирает следующий ресурс в текущем списке, который еще не имеет Finalized Ranking.
Расчет Пониженной Порядковой Позиции (DOP): Система вычисляет потенциальную позицию понижения для выбранного ресурса.
- Для каждого признака (F) выбранного ресурса проверяется, был ли этот признак уже зафиксирован ранее.
- Если да, вычисляется целевая позиция: $\text{Последняя Фиксированная Позиция}(F) + \text{Demotion Value}(F)$ .
- DOP определяется как Максимум из всех вычисленных целевых позиций и текущей порядковой позиции ресурса.
Принятие решения (Понизить или Фиксировать):
- Если DOP > Текущая Порядковая Позиция: Ресурс понижается (перемещается) на позицию DOP. Алгоритм возвращается к шагу 4 (выбирается следующий ресурс в новом порядке).
- Если DOP <= Текущая Порядковая Позиция: Ресурс получает Finalized Ranking на текущей позиции (которая является следующей доступной фиксированной позицией).
Обновление трекинга признаков: Если ранг ресурса был фиксирован на шаге 6, система обновляет последнюю фиксированную позицию для всех его признаков.
Разрешение конфликтов: Если несколько ресурсов были понижены до одной и той же DOP, их относительный порядок определяется их изначальными First Rank Values (FRV).
Завершение: Процесс повторяется (шаги 4-8), пока все ресурсы не получат Finalized Ranking.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме переранжирования и использует следующие входные данные:

Системные данные (Результаты Ранжирования): Предварительно отсортированный список ресурсов. Используется First Rank Value (FRV) для определения начального порядка и разрешения конфликтов.
Контентные/Структурные/Технические факторы (Признаки): Feature list для каждого ресурса. Это могут быть любые идентифицируемые атрибуты. Патент явно упоминает:
- Author feature (Автор ресурса).
- Topic features (Темы, к которым отнесен ресурс).
- Video features (Наличие видео / Тип контента).
- Source feature (Источник, веб-сайт/домен).

Какие метрики используются и как они считаются

Ordinal Position (Порядковая позиция): Позиция ресурса в списке (1, 2, 3...). Основная переменная алгоритма.
Demotion Value (DV) / FDV: Предопределенное значение для каждого признака. Задается извне (например: DV(Домен)=5, DV(Автор)=3).
Demoted Ordinal Position (DOP): Вычисляемая метрика для определения новой позиции ресурса.

Основная формула расчета DOP: Рассчитывается как максимум из текущей позиции и всех потенциальных позиций понижения. Формула для ресурса R:

$DOP(R) = Max(\text{ТекущаяПозиция}(R), (\text{Позиция}(F_i) + DV(F_i)) \text{ для всех } F_i)$ )

Где Позиция(Fi) - это последняя фиксированная позиция, на которой встречался признак Fi.

Альтернативная формула DOP: Патент также описывает вариант, где DOP может зависеть от всех предыдущих позиций признака, а не только последней. Например, формула, учитывающая частоту появления признака (Cardinality):

$DOP = Max(\{R\}) + Card(\{R\}) + FDV$

Где {R} - набор всех позиций, где признак уже встречался. Это означает, что чем чаще признак появляется, тем агрессивнее он будет понижаться в дальнейшем.

Обеспечение разнообразия через позиционное понижение: Патент описывает конкретный алгоритм для обеспечения разнообразия (Diversity). Он предотвращает доминирование результатов с одинаковыми признаками (Features) в топе выдачи.
Корректировка позиций, а не оценок релевантности: Ключевой особенностью является то, что алгоритм работает с порядковыми позициями (Ordinal Positions), а не с оценками релевантности (First Rank Values). Он не понижает "качество" ресурса, а физически перемещает его вниз по списку.
Настраиваемое разнообразие: Система позволяет явно контролировать степень разнообразия для каждого признака с помощью Demotion Value. Можно установить строгое разнообразие для доменов (большое DV) и более мягкое для тем (маленькое DV).
Итеративный и зависимый процесс: Понижение ресурса зависит от того, где в последний раз был зафиксирован совпадающий признак. Решения, принятые для верхних результатов, напрямую влияют на ранжирование нижних.
Механизм Site и Author Diversity: Этот алгоритм является технической реализацией того, как Google обеспечивает разнообразие сайтов и авторов в SERP, гарантируя, что один источник не займет слишком много позиций подряд.

Best practices (это мы делаем)

Стратегия одного главного документа (Pillar Page): Поскольку механизм Site Diversity (реализованный этим алгоритмом) активно препятствует занятию нескольких позиций подряд одним доменом, стратегически выгоднее фокусировать усилия на продвижении одной, максимально сильной страницы по кластеру запросов, вместо создания множества конкурирующих страниц.
Диверсификация авторства (Author Diversity): Если авторство является значимым признаком (Feature) в вашей нише (особенно YMYL или новостной контент), обеспечьте разнообразие авторов для разных статей. Это снижает риск того, что статьи одного автора будут принудительно понижены из-за "скученности".
Анализ признаков SERP: При анализе выдачи обращайте внимание на разнообразие доменов, типов контента и основных сущностей. Если выдача уже насыщена одним типом признака, шансы попасть туда с тем же признаком снижаются, если только ваша базовая релевантность не является исключительно высокой (позиция 1).
Оптимизация под Google Discover и Ленты: Патент упоминает применение в лентах (feeds/social network page). Для успеха в Discover критически важно разнообразие контента и тематик на сайте, так как система рекомендаций будет стремиться избежать показа пользователю подряд нескольких статей с одного сайта или на одну и ту же узкую тему.

Worst practices (это делать не надо)

Попытки занять ТОП-5 одним доменом по одному запросу: Создание нескольких страниц, оптимизированных под один и тот же интент. Алгоритм Diversity активно борется с этим. Если одна страница займет позицию 1, следующая будет принудительно смещена вниз на Demotion Value (например, на позицию 4-6).
Использование одного автора для всего контента: Если весь экспертный контент публикуется от имени одного человека (или "редакции"), это увеличивает риск активации Author Diversity фильтра, ограничивая общую видимость сайта.
Каннибализация контента без дифференциации признаков: Наличие нескольких страниц с высоким First Rank Value по одному запросу не гарантирует занятия нескольких мест в топе; вместо этого они создают ситуацию, в которой система применит понижение ко всем страницам, кроме лучшей, если они имеют одинаковые признаки.

Стратегическое значение

Патент подтверждает, что разнообразие выдачи (Diversity) является отдельной целью, для достижения которой используются специализированные алгоритмы переранжирования (Twiddlers) на этапе RERANKING. Он демонстрирует, что финальный вид SERP определяется не только релевантностью, но и структурными правилами компоновки выдачи. Для SEO-специалистов это подчеркивает важность построения стратегии вокруг уникального ценностного предложения и диверсификации контента (по авторам, форматам и подтемам), а также снижает эффективность тактик, направленных на монополизацию выдачи.

Практические примеры

Сценарий: Применение Site Diversity в SERP

Анализируется запрос "купить страхование путешественников". Google определяет, что "Домен" (Source) является ключевым признаком для разнообразия, и устанавливает Demotion Value (DV) = 3.

Исходное ранжирование (по First Rank Value):
#1 Сайт А (Страница 1)
#2 Сайт А (Страница 2)
#3 Сайт Б
#4 Сайт В
#5 Сайт А (Страница 3)
Итерация 1: #1 Сайт А (Стр. 1) фиксируется. Трекинг: Домен А был на позиции 1.
Итерация 2: Анализ #2 Сайт А (Стр. 2). Признак совпадает (Домен А). Расчет DOP: Позиция(А) + DV = 1 + 3 = 4. DOP (4) > Текущая позиция (2). Понижение до позиции 4.
Итерация 3: Анализ следующего нефиксированного ресурса (Сайт Б). Признак (Домен Б) не совпадал. Фиксируется на позиции 2. Трекинг: Домен Б был на позиции 2.
Итерация 4: Анализ следующего нефиксированного ресурса (Сайт В). Признак (Домен В) не совпадал. Фиксируется на позиции 3. Трекинг: Домен В был на позиции 3.
Итерация 5: Анализ Сайт А (Стр. 2) (который был понижен до 4). Фиксируется на позиции 4. Трекинг обновлен: Домен А был на позиции 4.
Итерация 6: Анализ Сайт А (Стр. 3). Признак совпадает (Домен А). Расчет DOP: Позиция(А) + DV = 4 + 3 = 7. Понижение до позиции 7.
Итоговое ранжирование:
#1 Сайт А (Страница 1)
#2 Сайт Б
#3 Сайт В
#4 Сайт А (Страница 2)
...
#7 Сайт А (Страница 3)

Что такое "Признак" (Feature) в контексте этого патента?

Признак — это любой идентифицируемый атрибут контента, который система хочет использовать для обеспечения разнообразия. Наиболее очевидные примеры для SEO – это домен (Source feature), автор контента (Author feature), основная тема или сущность (Topic feature), а также формат контента (например, Video feature). Система может определять разные наборы признаков для разных типов выдачи.

Изменяет ли этот алгоритм оценку релевантности или качества сайта?

Нет. Этот алгоритм работает на этапе RERANKING и оперирует порядковыми позициями (Ordinal Positions), а не базовыми оценками релевантности (First Rank Values). Он не понижает оценку сайта или страницы, а принудительно перемещает результат ниже в списке, чтобы обеспечить разнообразие. Исходные оценки используются только для первоначальной сортировки и разрешения конфликтов.

Что такое "Значение понижения" (Demotion Value) и как оно определяется?

Demotion Value (DV) – это количество позиций, которое должно разделять два результата с одинаковым признаком. Патент не описывает, как устанавливаются эти значения, но указывает, что они могут быть разными для разных признаков. Например, DV для домена может быть 5 (строгое разнообразие), а DV для автора – 2 (более мягкое разнообразие). Эти значения устанавливаются поисковой системой глобально или для конкретных контекстов.

Как этот патент связан с обновлениями Google Site Diversity?

Этот патент предоставляет конкретный алгоритмический механизм для реализации Site Diversity. Обновления Site Diversity направлены на то, чтобы в ТОП-10 не показывалось слишком много результатов с одного домена. Описанный итеративный процесс с использованием Demotion Value для признака "Источник" (домен) является эффективным способом достижения этой цели.

Мой сайт занимает #1 и #2 по запросу. Может ли этот алгоритм понизить мою вторую страницу?

Да, это основная цель алгоритма. Если система применяет правило разнообразия доменов с Demotion Value, например, 4, то ваша первая страница останется на #1, а вторая страница будет принудительно смещена на позицию 1+4=5 или ниже. Позиции 2, 3 и 4 будут заняты другими доменами, даже если их базовая релевантность ниже, чем у вашей второй страницы.

Как бороться с этим алгоритмом, если я хочу занять несколько позиций в топе?

Напрямую бороться с механизмом Diversity сложно. Необходимо адаптировать стратегию: во-первых, фокусироваться на занятии позиции №1 самой сильной страницей. Во-вторых, если необходимо занять несколько позиций, убедитесь, что ваши страницы имеют разные признаки: разные авторы, разные форматы контента или нацелены на разные подтемы (если эти признаки используются системой для диверсификации).

Применяется ли этот механизм в Google Discover или Новостях?

Патент явно упоминает контекст социальных сетей и лент, где нежелательно видеть много постов подряд от одного пользователя или источника. Это делает механизм идеально подходящим для Google Discover и Google News, где разнообразие источников и тем критически важно для удержания внимания пользователя. Вероятно, в этих сервисах применяются агрессивные Demotion Values.

Что происходит, если два результата понижены на одну и ту же позицию?

Патент предусматривает механизм разрешения конфликтов (Claim 7). Если несколько ресурсов претендуют на одну и ту же Demoted Ordinal Position, их порядок относительно друг друга будет определяться их первоначальными оценками ранжирования (First Rank Values). Тот, у кого базовая релевантность выше, будет показан первым.

Может ли ресурс быть понижен несколько раз в ходе обработки списка?

Да. В ходе итеративного процесса ресурс может быть понижен (Шаг 6 алгоритма), после чего система возвращается к выбору следующего ресурса (Шаг 4). Если после этого фиксируются новые результаты выше него, его текущая порядковая позиция смещается. При повторном анализе он может быть понижен еще раз, если он все еще нарушает правила разнообразия относительно недавно зафиксированных результатов.

Существует ли вариант алгоритма, который наказывает за слишком частое появление признака?

Да, патент описывает альтернативный вариант расчета DOP, который учитывает кардинальность (Cardinality) – сколько раз признак уже появлялся в фиксированной выдаче. Формула $Max(\{R\}) + Card(\{R\}) + FDV$ . Это означает, что каждое последующее появление признака будет приводить к всё более сильному понижению.

Как Google визуально выделяет популярные профили в поиске и использует частоту запросов для борьбы с фейковыми аккаунтами

Google использует данные о популярности (количество связей) и качестве (вовлеченность) профилей пользователей, чтобы визуально выделить наиболее авторитетные результаты при поиске людей или брендов. Если один профиль значительно популярнее других, он отображается крупнее. Система также динамически регулирует порог качества в зависимости от частоты запроса: чем популярнее имя, тем выше требования к профилю для его отображения, что помогает бороться со спамом.

US8935245B1
2015-01-13

SERP
Антиспам
EEAT и качество

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче

Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.

US9424360B2
2016-08-23

Local SEO
Поведенческие сигналы

Как Google тестирует, сравнивает и выбирает лучшие алгоритмы ранжирования

Патент описывает инфраструктуру Google для сравнения и оценки различных алгоритмов ранжирования (Scoring Functions). Система выбирает два алгоритма, которые дают максимально разные результаты (Diversity Score), показывает обе выдачи для сравнения (Side-by-Side) и собирает данные для определения лучшего алгоритма, фильтруя при этом ненадежную обратную связь.

US8060497B1
2011-11-15

SERP

Как Google управляет разнообразием и персонализацией в лентах контента (например, Discover), балансируя категории контента

Google использует систему для управления лентами контента (например, Google Discover). Различные серверы агрегируют контент в тематические блоки (Aggregated Content Data Structures) и оценивают их. Затем сервер смешивания выбирает эти блоки, активно балансируя их категории: он повышает оценки блоков из недопредставленных категорий и понижает из слишком частых, чтобы обеспечить заданное разнообразие и соответствие интересам пользователя.

US10129309B2
2018-11-13

Персонализация
Поведенческие сигналы

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи

Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.

US9623119B1
2017-04-18

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования

Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.

US8195654B1
2012-06-05

Поведенческие сигналы
SERP

Как Google динамически фильтрует выдачу, уточняя интент пользователя после клика по результату

Google использует механизм для обработки неоднозначных запросов. Если выдача содержит результаты, относящиеся к разным сущностям (например, «Ягуар» как животное и как автомобиль), клик пользователя по одному из результатов сигнализирует о его интересе к конкретной сущности. При возврате на страницу выдачи система модифицирует SERP, скрывая или понижая результаты, связанные с нерелевантными сущностями, и фокусируя выдачу на выбранном интенте.

US9355158B2
2016-05-31

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)

Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.

US9128993B2
2015-09-08

Ссылки
SERP
Индексация

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

US8060405B1
2011-11-15

Антиспам
Ссылки
SERP

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей

Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.

US11379527B2
2022-07-05

Семантика и интент
Поведенческие сигналы

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта

Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.

US7962462B1
2011-06-14

Поведенческие сигналы
Ссылки
SERP

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации

Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.

US7565358B2
2009-07-21

EEAT и качество
Ссылки

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

US8868592B1
2014-10-21

Персонализация
Поведенческие сигналы
Local SEO

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов

Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).

US8090736B1
2012-01-03

Ссылки
SERP
Структура сайта

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

US10922326B2
2021-02-16

Knowledge Graph
SERP
Семантика и интент