SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей

SUBSTITUTE TERM SCORING (Оценка замещающих терминов)
  • US9116957B1
  • Google LLC
  • 2013-03-05
  • 2015-08-25
  • Поведенческие сигналы
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.

Описание

Какую проблему решает

Патент решает проблему контекстно-независимой оценки синонимов (substitute terms) в поиске. Традиционные системы часто присваивают синонимам фиксированный вес, игнорируя контекст документа. Это может привести к неточному ранжированию, когда документ получает незаслуженное повышение из-за наличия синонима, который используется в ином значении (например, повышение страницы о мюзикле "Cats" по запросу "Felines" (кошачьи)). Изобретение улучшает точность поиска (precision), гарантируя, что синонимы увеличивают релевантность только тогда, когда контекст документа, подтвержденный поведением пользователей, соответствует исходному запросу.

Что запатентовано

Запатентована система контекстно-зависимой оценки замещающих терминов (синонимов). Система использует сигнал релевантности (Relevance Signal), основанный на поведении пользователей, который связывает исходный термин запроса (Original Query Term) с конкретным документом. Этот сигнал определяет, какой вес (Increment Value) присвоить синониму, найденному в этом документе. Если исходный термин высоко релевантен документу, синоним получает больший вес; если низко релевантен — меньший.

Как это работает

Ключевой механизм заключается в динамическом выборе модели оценки (Scoring Model) для каждого документа:

  • Идентификация терминов: Система определяет исходный термин и его синоним (например, "Felines" и "Cats").
  • Доступ к сигналу релевантности: Для каждого документа извлекается Relevance Signal, показывающий, насколько исходный термин релевантен этому документу (на основе кликов, времени просмотра и т.д.).
  • Проверка порога: Сигнал сравнивается с предопределенным порогом (Predetermined Threshold).
  • Выбор модели оценки:
    • Если сигнал высокий: Применяется Первая модель оценки (First Scoring Model), где синоним получает высокий вес (First Increment Value).
    • Если сигнал низкий: Применяется Вторая модель оценки (Second Scoring Model), где синоним получает низкий вес (Second Increment Value).
  • Ранжирование: Документы ранжируются на основе рассчитанных оценок.

Актуальность для SEO

Высокая. Понимание контекста запроса и использование сигналов пользовательского взаимодействия (User Engagement Signals) являются центральными элементами современного поиска. Этот патент описывает конкретный механизм интеграции поведенческих данных (таких как CTR и Dwell Time) непосредственно в расчет релевантности контента, что соответствует принципам работы систем машинного обучения в поиске.

Важность для SEO

Патент имеет значительное влияние на SEO (7/10). Он демонстрирует, что простое наличие синонимов на странице недостаточно для повышения релевантности. Ключевое значение приобретают поведенческие факторы по основным ключевым словам. Если пользователи не взаимодействуют с документом по основному запросу (низкий CTR, короткое время просмотра), система считает исходный термин низкорелевантным этому документу, и вес любых синонимов на странице будет минимальным.

Детальный разбор

Термины и определения

Click Count (Количество кликов)
Поведенческая метрика, указывающая на частоту, с которой пользователи кликают на документ в результатах поиска после ввода определенного термина запроса. Используется для расчета Relevance Signal.
Impression Duration (Продолжительность просмотра)
Поведенческая метрика (аналог Dwell Time), которая количественно определяет, как долго пользователи просматривают документ после выбора его из результатов поиска по определенному запросу. Может быть агрегированной или средней. Используется для расчета Relevance Signal.
Increment Value (Значение приращения / Вес термина)
Числовое значение (вес), присваиваемое экземпляру термина (исходного или замещающего) в документе при расчете оценки релевантности в рамках Scoring Model.
Original Query Term (Исходный термин запроса)
Термин, введенный пользователем или полученный системой изначально.
Query Reviser Engine (Механизм пересмотра запросов)
Компонент системы, который генерирует пересмотренные запросы, например, путем добавления или замены терминов синонимами.
Relevance Signal / Value (Сигнал релевантности / Значение релевантности)
Значение, соответствующее релевантности исходного термина запроса конкретному документу. Рассчитывается на основе поведенческих данных (Click Count, Skip Count, Impression Duration).
Scoring Engine (Механизм оценки)
Компонент, который присваивает оценки документам, используя различные Scoring Models.
Scoring Model (Модель оценки)
Набор правил и весов (Increment Values) для расчета оценки документа. Патент описывает как минимум две модели: для высокой и низкой релевантности исходного термина.
Skip Count (Количество пропусков)
Поведенческая метрика, указывающая на частоту, с которой пользователи пропускают документ в результатах поиска после ввода определенного термина запроса. Используется для расчета Relevance Signal.
Substitute Term (Замещающий термин / Синоним)
Термин, идентифицированный как синоним исходного термина запроса и используемый для генерации пересмотренных запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод динамической оценки синонимов.

  1. Система получает запрос, включающий исходный термин и замещающий термин (синоним).
  2. Получается набор документов.
  3. Для выбранного документа извлекается значение (Value), соответствующее релевантности запроса этому документу.
  4. Система определяет, удовлетворяет ли это значение предопределенному порогу (Predetermined Threshold).
  5. Если ДА (релевантность высокая): Генерируется оценка для документа с использованием Первой модели оценки (First Scoring Model). Эта модель включает Первое значение приращения (First Increment Value) для синонима.
  6. Первая модель отличается от Второй модели оценки (Second Scoring Model), которая используется для документов, чьи значения релевантности НЕ удовлетворяют порогу. Вторая модель имеет Второе значение приращения (Second Increment Value) для синонима, отличное от Первого.

Claims 2, 3, 4 (Зависимые): Детализируют природу Значения релевантности (Value).

Значение релевантности может быть основано на:

  • (Claim 2) Агрегированном количестве кликов (aggregate number of clicks) пользователей, выбравших документ при использовании исходного термина.
  • (Claim 3) Агрегированной продолжительности просмотров (aggregate duration of users' views) документа пользователями при использовании исходного термина.
  • (Claim 4) Средней продолжительности просмотров (average duration of users' views) документа пользователями при использовании исходного термина.

Claim 6 (Зависимый от 1): Уточняет соотношение весов.

Первое значение приращения (высокая релевантность) больше, чем Второе значение приращения (низкая релевантность). Это означает, что синонимы получают больший вес в документах, которые сильно связаны с исходным запросом.

Claim 7 (Зависимый от 6): Уточняет вес синонима относительно исходного термина.

В Первой модели оценки (высокая релевантность) Первое значение приращения для синонима меньше или равно значению приращения для исходного термина запроса. Синоним обычно не может быть важнее исходного термина.

Где и как применяется

Изобретение применяется на нескольких этапах поиска, интегрируя данные о поведении пользователей в процесс оценки релевантности.

INDEXING – Индексирование и извлечение признаков (Обработка данных)
На этом этапе (или в рамках отдельного офлайн/nearline процесса) система должна собирать, обрабатывать и индексировать данные о поведении пользователей. Click Counts, Skip Counts и Impression Durations, связывающие запросы с документами, используются для расчета Relevance Signals. Эти сигналы сохраняются (например, в Index Database или отдельном хранилище) для последующего доступа Search Engine и Scoring Engine.

QUNDERSTANDING – Понимание Запросов
Synonym Engine идентифицирует синонимы (Substitute Terms) для исходных терминов запроса. Query Reviser Engine использует их для создания пересмотренных запросов (Revised Queries).

RANKING – Ранжирование
Это основной этап применения патента. Search Engine идентифицирует документы, содержащие исходные термины или синонимы. Затем Scoring Engine выполняет оценку:

  1. Извлекает предварительно рассчитанный Relevance Signal для пары (Исходный термин, Документ).
  2. Использует этот сигнал для динамического выбора Scoring Model и определения веса (Increment Value) для синонимов, присутствующих в документе.

Входные данные:

  • Пересмотренный запрос (содержащий исходные термины и синонимы).
  • Набор документов-кандидатов.
  • Relevance Signals для каждого документа, связанные с исходными терминами запроса.

Выходные данные:

  • Оценки (Scores) для каждого документа, рассчитанные с учетом динамических весов синонимов.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, где Google активно использует синонимы для расширения охвата, особенно если термины имеют несколько значений или сильно зависят от контекста (например, "Ягуар" (животное) vs "Jaguar" (автомобиль)).
  • Типы контента: Влияет на все типы контента, где может быть измерено пользовательское взаимодействие (клики, время просмотра).

Когда применяется

  • Условия применения: Алгоритм применяется, когда поисковая система использует пересмотренный запрос (содержащий синонимы) для оценки документа.
  • Требования к данным: Для работы механизма необходимо наличие достаточного объема поведенческих данных для расчета Relevance Signal между исходным термином и конкретным документом.

Пошаговый алгоритм

Процесс оценки документа с динамическим весом синонимов.

  1. Получение данных: Scoring Engine получает пересмотренный запрос (включая Исходный термин и Синоним) и набор документов.
  2. Доступ к сигналу релевантности: Для выбранного документа система извлекает Relevance Signal, который количественно определяет релевантность Исходного термина этому документу (на основе исторических поведенческих данных).
  3. Нормализация (если требуется): Relevance Signal может быть нормализован (например, от 0.0 до 1.0).
  4. Сравнение с порогом: Система сравнивает Relevance Signal с предопределенным порогом (Predetermined Threshold, например, 0.5).
  5. Выбор модели оценки и определение веса:
    • Сценарий А (Высокая релевантность): Если сигнал превышает порог. Выбирается Первая модель оценки (First Scoring Model). Синониму присваивается Высокий вес (First Increment Value, например, 0.9).
    • Сценарий Б (Низкая релевантность): Если сигнал не превышает порог. Выбирается Вторая модель оценки (Second Scoring Model). Синониму присваивается Низкий вес (Second Increment Value, например, 0.1).
  6. Расчет оценки документа: Scoring Engine подсчитывает количество вхождений Исходного термина и Синонима в документе. Оценка рассчитывается путем суммирования вхождений, умноженных на соответствующие веса. (Например, в Сценарии А: (Кол-во Исходных терминов * Вес Исходного термина) + (Кол-во Синонимов * 0.9)).
  7. Финальное ранжирование: Процесс повторяется для всех документов. Полученные оценки используются для ранжирования результатов поиска.

Какие данные и как использует

Данные на входе

Патент явно указывает на использование следующих типов данных:

  • Контентные факторы: Наличие и количество вхождений исходного термина запроса (Original Query Term) и замещающего термина (Substitute Term/Синоним) в тексте документа.
  • Поведенческие факторы (Ключевые): Эти данные используются для формирования Relevance Signal:
    • Click Count: Агрегированное количество кликов на документ по исходному запросу.
    • Skip Count: Агрегированное количество пропусков документа по исходному запросу.
    • Impression Duration: Агрегированная или средняя продолжительность просмотра документа после клика по исходному запросу (Dwell Time).

Какие метрики используются и как они считаются

  • Relevance Signal (Value): Метрика, определяющая связь между исходным термином и документом. Рассчитывается на основе поведенческих факторов. В патенте упоминается, что сигнал может быть нормализован (например, от 0.0 до 1.0). Конкретная формула расчета не приводится, но указаны входные данные (клики, время просмотра).
  • Predetermined Threshold (Предопределенный порог): Пороговое значение для Relevance Signal, используемое для разделения высокой и низкой релевантности. Может определяться эмпирически или с помощью статистического моделирования (например, 0.5, 0.8).
  • Increment Value (Вес термина): Веса, используемые в моделях оценки.
    • Вес Исходного термина: Базовый вес (например, 1.0).
    • First Increment Value: Высокий вес для синонима при высокой релевантности (например, 0.9). Всегда больше, чем Second Increment Value. Меньше или равен весу исходного термина.
    • Second Increment Value: Низкий вес для синонима при низкой релевантности (например, 0.1).
  • Альтернативный расчет веса: Патент также упоминает возможность использования линейной или нелинейной функции от Relevance Signal для определения веса синонима, вместо использования жесткого порога и двух фиксированных моделей. Например, вес синонима может быть прямо пропорционален сигналу релевантности.

Выводы

  1. Поведение пользователей напрямую влияет на оценку релевантности синонимов. Это ключевой вывод. Relevance Signal, основанный на кликах и времени просмотра (Dwell Time), определяет, будет ли синоним учитываться при ранжировании документа.
  2. Контекст определяется пользовательским взаимодействием. В рамках этого патента контекст документа определяется не только его содержанием, но и тем, как пользователи реагируют на этот документ при поиске по исходному термину.
  3. Динамическое взвешивание синонимов. Не существует статического веса для синонима. Один и тот же синоним будет иметь разный вес (Increment Value) в разных документах для одного и того же запроса, в зависимости от Relevance Signal каждого документа.
  4. Защита от семантических неточностей. Механизм предотвращает неправомерное повышение документов, где синоним используется в неподходящем контексте (например, мюзикл "Cats" по запросу о животных "Felines"), так как поведенческие сигналы для такой пары (Запрос, Документ) будут низкими.
  5. Приоритет исходного термина. Система гарантирует, что вес синонима обычно не превышает вес исходного термина запроса (Claim 7).

Практика

Best practices (это мы делаем)

  • Оптимизация под пользовательское взаимодействие (Engagement) для основных ключевых слов. Необходимо максимизировать CTR и Dwell Time (Impression Duration) для целевых запросов. Сильное взаимодействие подтверждает релевантность исходного термина (высокий Relevance Signal), что позволяет синонимам, используемым на странице, получить максимальный вес (First Increment Value).
  • Обеспечение четкой тематической направленности страницы. Контент должен быть сфокусирован, чтобы пользовательские сигналы однозначно подтверждали основную тему. Если страница оптимизирована под "Felines" (кошачьи), контент и метаданные должны гарантировать, что пользователи, ищущие информацию о животных, будут удовлетворены, тем самым валидируя использование синонима "Cats" в этом контексте.
  • Естественное использование синонимов и LSI-слов. Используйте синонимы для улучшения читабельности и полноты раскрытия темы. Помните, что их вклад в ранжирование зависит от общей релевантности страницы основному запросу, подтвержденной пользователями.

Worst practices (это делать не надо)

  • Насыщение текста синонимами (Synonym Stuffing). Простое добавление множества синонимов на страницу не улучшит ранжирование, если поведенческие сигналы для основного термина слабые. В этом случае система применит Вторую модель оценки, и синонимы получат минимальный вес (Second Increment Value).
  • Использование вводящих в заблуждение Title/Description для получения кликов. Даже если удастся получить клик (Click Count), короткое время просмотра (низкий Impression Duration) или возврат в выдачу приведет к снижению Relevance Signal, что в итоге понизит вес синонимов.
  • Игнорирование оптимизации под основной запрос. Нельзя полагаться на синонимы для установления релевантности, если страница плохо оптимизирована или не удовлетворяет интент основного запроса.

Стратегическое значение

Патент подтверждает стратегическую важность интеграции поведенческих данных в ядро алгоритмов расчета релевантности. Он демонстрирует переход Google от статического анализа текста к более сложным моделям, где пользователи выступают валидаторами семантического значения терминов на странице. Для SEO это означает, что стратегии, направленные на удовлетворение интента пользователя и улучшение взаимодействия с контентом, напрямую влияют на то, как поисковая система интерпретирует и оценивает текст страницы.

Практические примеры

Сценарий: Оценка релевантности для запроса "Felines" (Кошачьи)

Исходный термин: "Felines". Синоним: "Cats".
Порог релевантности (Threshold): 0.5.
Модель 1 (Высокая релевантность): Вес "Felines"=1.0, Вес "Cats"=0.9.
Модель 2 (Низкая релевантность): Вес "Felines"=1.0, Вес "Cats"=0.1.

  1. Документ А: "Информация о кошачьих" (Feline Information)
    • Содержание: 1 вхождение "Felines", 1 вхождение "Cats".
    • Поведение пользователей: Высокий CTR и долгое время просмотра по запросу "Felines".
    • Relevance Signal: 0.9 (Выше порога).
    • Применяемая модель: Модель 1.
    • Расчет оценки: (1 * 1.0) + (1 * 0.9) = 1.9.
  2. Документ Б: "Мюзикл Кошки" (Cats Musical)
    • Содержание: 0 вхождений "Felines", 2 вхождения "Cats".
    • Поведение пользователей: Низкий CTR и быстрые отказы по запросу "Felines".
    • Relevance Signal: 0.1 (Ниже порога).
    • Применяемая модель: Модель 2.
    • Расчет оценки: (0 * 1.0) + (2 * 0.1) = 0.2.

Результат: Документ А ранжируется значительно выше Документа Б по запросу "Felines", несмотря на то, что в Документе Б больше вхождений синонима "Cats". Поведение пользователей позволило системе корректно интерпретировать контекст и снизить вес синонима для нерелевантного документа.

Вопросы и ответы

Что такое "Relevance Signal" и как он рассчитывается?

Relevance Signal (или Value) — это метрика, которая количественно определяет релевантность исходного термина запроса конкретному документу. Патент явно указывает, что он рассчитывается на основе поведенческих данных: количества кликов (Click Count), количества пропусков (Skip Count) и продолжительности просмотра (Impression Duration, аналог Dwell Time) этого документа пользователями, которые ввели исходный запрос.

Означает ли этот патент, что синонимы стали менее важны для SEO?

Не обязательно. Важность синонимов стала контекстно-зависимой и валидируемой пользователями. Если исходный термин высоко релевантен документу (высокий Relevance Signal), синонимы получают значительный вес (например, 0.9 от веса исходного термина). Однако если релевантность низкая, их вес минимален (например, 0.1). Важно использовать их в правильном контексте.

Как этот механизм влияет на страницы с низким трафиком или новые страницы?

Для новых страниц или страниц с низким трафиком может не хватать поведенческих данных для надежного расчета Relevance Signal. В патенте не уточняется, как система действует в этом случае. Вероятно, Google может использовать стандартную модель оценки синонимов или опираться на другие сигналы релевантности (контентные, ссылочные), пока не накопится достаточно данных о поведении пользователей.

Как я могу улучшить "Relevance Signal" для моих страниц?

Необходимо сосредоточиться на улучшении показателей вовлеченности пользователей для ваших основных ключевых запросов. Это включает оптимизацию сниппетов для повышения CTR (Click Count) и, что более важно, создание качественного контента, который удерживает пользователя на странице и удовлетворяет его интент (высокий Impression Duration, низкий Bounce Rate).

Использует ли Google фиксированный порог для определения высокой и низкой релевантности?

Патент описывает использование предопределенного порога (Predetermined Threshold) для выбора между двумя моделями оценки. Однако также упоминается возможность использования более гибкого подхода, где вес синонима определяется линейной или нелинейной функцией от Relevance Signal, что позволяет более плавно регулировать вес.

Влияет ли этот механизм на вес исходного термина запроса?

В основном описанном варианте реализации механизм изменяет только вес синонима (Substitute Term). Вес исходного термина (Original Query Term) остается неизменным в обеих моделях (например, 1.0). Однако в патенте кратко упоминается возможность того, что исходный термин также может получать более низкий балл во второй модели (низкая релевантность).

Что произойдет, если я попытаюсь манипулировать кликами или временем просмотра?

Попытки искусственно завысить Click Count или Impression Duration рискованны. Google имеет сложные системы для обнаружения недействительного трафика и манипуляций поведенческими факторами. Если манипуляции будут обнаружены, это может привести к пессимизации сайта, а не к улучшению Relevance Signal.

Как этот патент связан с RankBrain или другими ML-алгоритмами?

Этот патент хорошо согласуется с общей философией использования машинного обучения и анализа поведения пользователей для интерпретации запросов и оценки контента, которую продвигает RankBrain. Описанный механизм предоставляет конкретный способ использования данных о взаимодействии для уточнения семантической релевантности на уровне отдельных терминов и их синонимов.

Влияет ли этот механизм на ранжирование по длиннохвостым (long-tail) запросам?

Влияние на long-tail запросы может быть ограничено из-за нехватки данных. Поскольку Relevance Signal требует накопления статистики по конкретной паре (Запрос, Документ), для редких или уникальных запросов система, скорее всего, не сможет применить этот механизм и будет использовать стандартные методы оценки синонимов.

Стоит ли удалять синонимы со страницы, если основной запрос имеет низкую релевантность?

Нет, удалять синонимы не стоит, если они используются естественно и улучшают качество текста. Даже при низкой релевантности основного запроса синонимы получают небольшой вес (Second Increment Value, например, 0.1). Основной фокус должен быть на улучшении контента и поведенческих сигналов, чтобы повысить Relevance Signal и тем самым увеличить вес этих синонимов.

Похожие патенты

Как Google встраивает синонимы и контекст непосредственно в поисковый индекс на этапе индексирования
Google использует механизм для повышения релевантности поиска путем определения синонимов на основе контекста документа во время индексирования. Система встраивает эти синонимы, включая сложные многословные замены (N-to-M), непосредственно в инвертированный индекс. Это позволяет поисковой системе находить релевантные документы, даже если они не содержат точных ключевых слов из запроса, без необходимости переписывать запрос на лету.
  • US9037591B1
  • 2015-05-19
  • Индексация

  • Семантика и интент

Как Google динамически корректирует веса факторов ранжирования для каждого запроса на основе анализа выдачи
Google использует этот механизм для динамической адаптации алгоритма ранжирования к специфике конкретного запроса. Система анализирует, какие факторы оказали наибольшее влияние на формирование первичной выдачи по сравнению с историческими данными. Если влияние факторов отличается от нормы, система корректирует их веса и проводит повторное ранжирование (Re-scoring) для обеспечения оптимального результата.
  • US10339144B1
  • 2019-07-02
  • SERP

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска
Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.
  • US20140358904A1
  • 2014-12-04
  • Семантика и интент

  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует «Решающие Клики» и «Решающие Пропуски» для валидации и очистки правил синонимов
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
  • US8965882B1
  • 2015-02-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
  • US20250005303A1
  • 2025-01-02
  • SERP

  • EEAT и качество

  • Персонализация

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
  • US20130144836A1
  • 2013-06-06
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

seohardcore