SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует CTR и разницу в оценках релевантности для визуального выделения доминирующего результата в выдаче

DOCUMENT SEARCH ENGINE INCLUDING HIGHLIGHTING OF CONFIDENT RESULTS (Поисковая система документов с выделением уверенных результатов)
  • US7836391B2
  • Google LLC
  • 2003-06-10
  • 2010-11-16
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может визуально выделять результат поиска (например, с помощью миниатюры страницы), если система уверена, что это именно то, что ищет пользователь. Эта уверенность основана на значительном превосходстве результата над всеми остальными по показателям CTR (Click-Through Rate) и/или оценке релевантности (Relevance Score).

Описание

Какую проблему решает

Патент направлен на улучшение пользовательского опыта при взаимодействии с поисковой выдачей. Он решает проблему необходимости тратить время на чтение текстовых сниппетов для оценки релевантности каждого результата. Цель изобретения — сократить "time to satisfaction" (время до удовлетворения пользователя) путем визуального выделения тех результатов, в релевантности которых поисковая система наиболее уверена.

Что запатентовано

Запатентована система и метод для выборочного выделения результатов поиска с помощью "visual cues" (визуальных подсказок), таких как миниатюрные изображения (thumbnails) веб-страниц. Выделение применяется к результатам, которые система классифицирует как "very relevant" (очень релевантные) или "confident results" (уверенные результаты). Эта уверенность рассчитывается на основе значительного превосходства результата над остальными по таким показателям, как исторический Click Through Rate (CTR) и Relevance Scores.

Как это работает

Система работает на этапе формирования поисковой выдачи:

  • Ранжирование: Система генерирует и ранжирует список результатов, присваивая им Relevance Scores.
  • Анализ уверенности: Decision Component (компонент принятия решений) анализирует топовые результаты, учитывая их позицию, исторический CTR и разницу в Relevance Scores.
  • Определение доминирования: Если один результат значительно превосходит все остальные (превышая установленные пороги для разницы в CTR и/или Score), он классифицируется как very relevant.
  • Применение выделения: К этому результату применяется Visual Cue (например, миниатюра страницы, логотип, контрастный шрифт).
  • Фильтрация: Система может подавлять выделение для нежелательного контента (например, порнографических документов).

Актуальность для SEO

Средняя/Высокая. Патент подан в 2003 году. Хотя конкретная реализация в виде миниатюр веб-страниц рядом со стандартными результатами сегодня изменилась, базовые принципы остаются актуальными. Идентификация "уверенных результатов" с использованием разницы в CTR и оценках релевантности является фундаментальным механизмом для управления форматом отображения результатов в поиске, включая генерацию современных функций SERP (Rich Results, Sitelinks) для запросов с ясным интентом.

Важность для SEO

Патент имеет важное значение (7/10) для понимания взаимодействия между алгоритмической релевантностью и поведением пользователей. Он демонстрирует, что для достижения максимальной видимости и получения специальных функций в SERP необходимо не только занять высокую позицию, но и добиться значительного отрыва от конкурентов как по Relevance Score, так и по CTR. Это усиливает видимость лидера и подчеркивает важность стратегий, направленных на оптимизацию сниппетов и достижение явного тематического лидерства.

Детальный разбор

Термины и определения

Click Through Rate (CTR) (Показатель кликабельности)
Историческая метрика, основанная на том, как часто пользователи кликали на данный документ в ответ на конкретный запрос. Может рассчитываться относительно других документов или относительно общего числа запросов.
Confident Result / Very Relevant (Уверенный / Очень релевантный результат)
Классификация, присваиваемая документу, когда система уверена, что он точно соответствует намерению пользователя. Определяется на основе доминирования в CTR и Relevance Score.
Decision Component (Компонент принятия решений)
Часть поисковой системы, которая анализирует различные параметры (позиция, CTR, Relevance Score, классификация контента) для определения того, является ли документ "Very Relevant" и следует ли его выделять.
Relevance Score (Оценка релевантности)
Числовое значение, присваиваемое документу компонентом ранжирования (Ranking Component), указывающее на степень его релевантности запросу.
Thumbnail (Миниатюра)
Уменьшенное графическое представление (рендеринг) веб-страницы, используемое в качестве Visual Cue.
Time to Satisfaction (Время до удовлетворения)
Метрика пользовательского опыта, измеряющая время, необходимое пользователю для нахождения нужной информации. Цель патента — сократить это время.
Visual Cue (Визуальная подсказка)
Элемент интерфейса, используемый для выделения Confident Results. Примеры включают миниатюры, логотипы, контрастные шрифты или фон.

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов, описывающих различные условия для активации визуального выделения. Ключевым элементом во всех пунктах является требование доминирования над всеми остальными результатами.

Claim 1 (Независимый пункт): Фокус исключительно на разнице в CTR.

  1. Система получает запрос, идентифицирует и ранжирует документы, рассчитывает CTR для каждого.
  2. Миниатюрное изображение (thumbnail representation) ассоциируется со ссылкой на конкретный документ, если его CTR выше, чем CTR всех остальных идентифицированных документов на пороговую величину.

Этот пункт защищает механизм выделения результата, основанный исключительно на его доминирующем показателе кликабельности по сравнению со всеми другими результатами по данному запросу.

Claim 10 (Независимый пункт): Фокус на комбинации разницы в Relevance Score И разницы в CTR.

  1. Система получает запрос, идентифицирует ссылки на документы с Relevance Scores и создает ранжированный список.
  2. Графическое изображение (graphic rendering) ассоциируется со ссылкой на конкретный документ, если обнаружено, что:
    • Relevance Score этого документа больше, чем оценки всех других документов в списке на пороговую величину, И
    • CTR этого документа больше, чем CTR всех других документов в списке на пороговую величину.

Это ядро изобретения, требующее одновременного доминирования как в алгоритмической релевантности, так и в поведении пользователей (CTR) для активации визуального выделения.

Claim 24 (Независимый пункт): Фокус на комбинации Relevance Score, CTR и фильтрации контента.

  1. Система идентифицирует ссылки, создает ранжированный список и вычисляет CTR.
  2. Решение об ассоциации графического изображения принимается на основе:
    • Является ли Relevance Score ссылки выше, чем у всех остальных на пороговую величину.
    • Является ли CTR ссылки выше, чем у всех остальных на пороговую величину.
    • Связана ли ссылка с порнографическим документом.

Этот пункт добавляет фильтр контента (аспект SafeSearch) к механизму, предполагая, что даже доминирующие результаты могут не выделяться, если они содержат взрослый контент.

Claim 30 (Независимый пункт): Описывает гибкие критерии выбора (компромиссы/tradeoffs).

  1. Система получает запрос, идентифицирует и ранжирует ссылки.
  2. Выбирается ссылка для графической индикации (graphic indication), если:
    • Ее CTR выше, чем у всех остальных ссылок на пороговую величину, И
    • Выполняется хотя бы одно из следующих условий: (a) ранг ссылки (позиция), (b) Relevance Score выше, чем у всех остальных на пороговую величину, ИЛИ (c) классификация как порнографический документ.

Этот пункт описывает возможность компромиссов. Доминирующий CTR является обязательным, но вторичное требование может быть удовлетворено позицией ИЛИ разницей в релевантности ИЛИ типом контента.

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса, используя данные о поведении пользователей для корректировки отображения результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит классификация контента для идентификации порнографических документов. Также патент упоминает возможность предварительного рендеринга (pre-rendering) миниатюр для документов с высоким CTR, чтобы ускорить их отображение.

RANKING – Ранжирование
На этом этапе рассчитываются основные Relevance Scores для документов по отношению к запросу. Результаты сортируются.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента. Decision Component функционирует здесь, после того как финальный набор результатов определен и отсортирован:

  1. Анализ результатов ранжирования: Система анализирует выходные данные этапа RANKING.
  2. Интеграция данных: Извлекаются исторические данные CTR и данные классификации контента для топовых документов.
  3. Оценка уверенности: Сравниваются Relevance Scores и CTR между результатами, проверяется их соответствие порогам разницы.
  4. Принятие решения и модификация SERP: Система решает, активировать ли Visual Cue для конкретного результата и модифицирует финальную выдачу перед отправкой пользователю.

Входные данные:

  • Ранжированный список документов.
  • Relevance Score для каждого документа.
  • Исторические данные Click Through Rate для этих документов по данному запросу.
  • Данные классификации контента (например, порнография).
  • (Опционально) Данные о ссылках (анкоры).

Выходные данные:

  • Финальная страница результатов поиска (SERP), в которой доминирующий результат может быть дополнен Visual Cues.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы с ясным и сконцентрированным интентом, где подавляющее большинство пользователей ищут один и тот же результат. Это характерно для навигационных запросов или информационных запросов с однозначным ответом.
  • Типы контента: Применяется к стандартным веб-документам. Патент явно оговаривает возможность исключения или особой обработки порнографических документов.
  • Представление выдачи (SERP Layout): Патент напрямую влияет на внешний вид SERP, добавляя визуальные элементы к определенным сниппетам, но не описывает изменение порядка ранжирования.

Когда применяется

Алгоритм применяется при выполнении строгих условий, связанных с доминированием результата.

  • Триггеры активации: Когда Decision Component определяет, что результат является "very relevant" (высокая степень уверенности).
  • Пороговые значения: Активация требует достижения специфических порогов. В зависимости от реализации (Claims), это может быть:
    1. Доминирующий CTR: CTR результата должен превышать CTR всех остальных результатов на пороговую величину.
    2. Значительная разница в Relevance Score: Relevance Score результата должен превышать оценки всех остальных результатов на пороговую величину.
    3. Позиция в рейтинге: Часто требуется, чтобы документ находился на первой позиции.
  • Компромиссы (Tradeoffs): Патент описывает возможность компромиссов: если Relevance Score очень высок и позиция равна 1, система может принять умеренный CTR. Если Relevance Score низок, система может потребовать очень высокий CTR и позицию 1.

Пошаговый алгоритм

  1. Получение запроса и Ранжирование: Система получает запрос, идентифицирует релевантные документы, рассчитывает Relevance Scores и сортирует результаты.
  2. Сбор данных для анализа: Для топовых результатов извлекаются:
    • Позиция в ранжированном списке.
    • Relevance Score.
    • Исторический Click Through Rate (CTR).
    • Классификация контента (например, порнография).
  3. Оценка уверенности (Decision Component): Система определяет, является ли какой-либо документ "very relevant". Для этого производится сравнение метрик с порогами:
    • Проверяется, превышает ли CTR результата CTR всех других результатов на пороговое значение (Threshold 1).
    • Проверяется, превышает ли Relevance Score результата оценки всех других результатов на пороговое значение (Threshold 2).
  4. Принятие решения: Если результат удовлетворяет комбинации установленных критериев и порогов (например, Threshold 1 И Threshold 2, согласно Claim 10, или с учетом компромиссов), он помечается для выделения.
  5. Фильтрация контента: Если результат помечен, но классифицирован как нежелательный (например, порнография), выделение может быть подавлено.
  6. Ассоциация визуальной подсказки: Система связывает Visual Cue (например, извлекает предварительно сгенерированную миниатюру страницы) с помеченным результатом.
  7. Возврат результатов: Финальная выдача (SERP) с интегрированными визуальными подсказками предоставляется пользователю.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Критические): Исторический Click Through Rate (CTR). Это данные о том, как часто пользователи выбирали конкретный документ в ответ на конкретный запрос. Это ключевой компонент для измерения уверенности системы.
  • Системные факторы (Критические): Relevance Score, рассчитанный поисковой системой. Позиция (ранг) документа в отсортированном списке результатов.
  • Ссылочные факторы (Упомянуты): В патенте (включая Claim 9) упоминается возможность использования дополнительного параметра: количества ссылок, указывающих на документ, в которых текст ссылки (anchor text) соответствует поисковому запросу.
  • Контентные/Классификационные факторы: Данные, используемые для классификации контента, в частности, для идентификации порнографических документов с целью фильтрации.

Какие метрики используются и как они считаются

  • Relevance Score: Оценка релевантности, полученная от основного алгоритма ранжирования.
  • Click Through Rate (CTR): Рассчитывается на основе исторических данных. Патент предлагает несколько вариантов расчета:
    • Относительный CTR (сравнение популярности документа D относительно документа E):

Выводы

  1. Синергия релевантности и поведения пользователей: Для классификации результата как "уверенного" ("very relevant") часто требуется комбинация сильных сигналов. Документ должен доминировать как по алгоритмической оценке релевантности (Relevance Score), так и по предпочтениям пользователей (CTR).
  2. Критическая важность разрыва (Delta): Патент многократно подчеркивает (Claims 1, 10, 24, 30), что для активации механизма необходима значительная разница в метриках между лидером и всеми остальными результатами. Недостаточно быть просто лучше; необходимо быть значительно лучше остальных.
  3. CTR как валидатор уверенности: Исторический CTR используется как прямой сигнал для валидации результатов ранжирования и оценки уверенности системы. В некоторых реализациях (Claim 1) это может быть единственным триггером.
  4. Гибкость и компромиссы (Tradeoffs): Система предусматривает возможность компромиссов между факторами (подтверждено в Claim 30 и описании). Например, исключительно высокий Relevance Score может компенсировать умеренный (но все еще доминирующий) CTR, и наоборот.
  5. Встроенная фильтрация контента: Механизм включает проверку типа контента (например, идентификацию порнографии) и может подавлять визуальное выделение для нежелательного контента, даже если он удовлетворяет критериям доминирования.
  6. Влияние анкорного текста: Соответствие анкорного текста входящих ссылок поисковому запросу также может учитываться как дополнительный сигнал уверенности.

Практика

Best practices (это мы делаем)

  • Достижение явного тематического лидерства: Необходимо стремиться к созданию контента, который значительно превосходит конкурентов по качеству и соответствию интенту пользователя. Это направлено на создание необходимого разрыва в Relevance Score по сравнению с другими сайтами в выдаче.
  • Максимизация CTR сниппета: Критически важно оптимизировать Title и Description для достижения CTR, значительно превышающего показатели конкурентов по данному запросу. Согласно патенту, доминирующий CTR является обязательным условием для классификации результата как "уверенного".
  • Фокус на запросах с ясным интентом: Сосредоточьте усилия на оптимизации под запросы, где намерение пользователя четко определено (навигационные, брендовые, точные информационные). По таким запросам система чаще формирует "confident results".
  • Построение релевантного анкор-листа: Патент упоминает возможность учета количества входящих ссылок, где анкорный текст (anchor text) соответствует запросу. Это подтверждает важность стратегии линкбилдинга с использованием релевантных анкоров.

Worst practices (это делать не надо)

  • Искусственные манипуляции с CTR: Попытки накрутки CTR без реального доминирования в релевантности вряд ли активируют этот механизм, так как большинство реализаций требуют комбинации высокого Relevance Score И высокого CTR.
  • Игнорирование оптимизации сниппетов: Если ваш сайт занимает ТОП-1, но имеет средний CTR по сравнению с другими результатами, он не будет классифицирован как "confident result" и не получит визуального выделения (или расширенных функций SERP).
  • Создание контента "на грани" допустимого: Контент, который может быть классифицирован как взрослый или нежелательный, рискует попасть под фильтрацию, которая подавляет визуальное выделение, даже при высоких показателях релевантности и CTR.

Стратегическое значение

Патент подтверждает стратегию Google по активному использованию поведенческих данных (CTR) для валидации качества поиска и управления отображением SERP. Для SEO это означает, что долгосрочная стратегия должна быть направлена не только на соответствие алгоритмам ранжирования, но и на оптимизацию взаимодействия с пользователем, стремясь к статусу доминирующего ответа в своей нише. Это усиливает эффект «Победитель получает больше» (Winner Takes All) в поисковой выдаче.

Практические примеры

Сценарий: Оптимизация страницы под навигационный запрос

  1. Запрос: "личный кабинет банка X".
  2. Анализ ситуации: Google определяет, что официальная страница авторизации банка X имеет Relevance Score 95/100. Следующий результат (например, статья о том, как войти в кабинет) имеет оценку 60/100. Исторический CTR страницы авторизации составляет 85%, а статьи — 5%.
  3. Срабатывание механизма: Decision Component видит, что разница в Relevance Score (35) и разница в CTR (80%) значительно превышают установленные пороги.
  4. Результат: Система классифицирует страницу авторизации как "confident result" и добавляет Visual Cue. (В современной выдаче это может проявляться не как миниатюра, описанная в патенте, а как блок Sitelinks или увеличенный сниппет).
  5. Действия SEO-специалиста: Убедиться, что страница авторизации имеет максимально кликабельный сниппет, чтобы гарантировать поддержание доминирующего CTR и активацию визуальных улучшений SERP.

Вопросы и ответы

Что такое "Visual Cue" (Визуальная подсказка) в контексте этого патента?

Основной пример, приведенный в патенте, — это Thumbnail, то есть уменьшенное изображение (миниатюра) самой веб-страницы. Однако патент также упоминает другие формы выделения: логотипы, контрастные шрифты (по размеру, цвету или весу), контрастный фон или текстовые метки.

Какие основные факторы определяют, будет ли результат выделен?

Согласно наиболее полному описанию (Claim 10), требуется комбинация факторов: (1) Relevance Score, который значительно выше, чем у всех остальных результатов (превышает порог разницы); и (2) Исторический CTR, который значительно выше, чем у всех остальных результатов (превышает порог разницы). Также часто учитывается позиция в ранге (ТОП-1).

Насколько важна разница в CTR между первым и вторым результатом?

Она критически важна. Патент фокусируется не на абсолютном значении CTR, а именно на разнице (Delta) между доминирующим результатом и всеми остальными. Если ТОП-1 имеет CTR 40%, а ТОП-2 — 38%, выделение, вероятно, не произойдет. Если же ТОП-1 имеет 40%, а ТОП-2 — 15%, система может классифицировать ТОП-1 как "confident result".

Может ли результат на второй позиции быть выделен?

Теоретически да, так как некоторые пункты формулы (например, Claim 1) не требуют первую позицию. Однако, учитывая требование доминирования в Relevance Score и CTR над всеми остальными, на практике это почти всегда будет результат на ТОП-1, особенно по запросам с ясным интентом.

Как этот патент связан с современными функциями SERP (например, Sitelinks или Featured Snippets)?

Патент описывает фундаментальный механизм определения "уверенности" в результате. Этот же механизм оценки (доминирование в Relevance Score и CTR) может использоваться Google для принятия решения о показе расширенных функций SERP. Sitelinks, например, обычно показываются для результатов, которые явно доминируют по навигационным запросам.

Означает ли этот патент, что CTR является фактором ранжирования?

Нет, этот патент не описывает использование CTR для изменения порядка результатов (ранжирования). Он описывает использование CTR для изменения отображения (выделения) уже отранжированных результатов. CTR здесь используется как мера уверенности в качестве существующего ранжирования.

Что такое компромиссы (tradeoffs) между Relevance Score и CTR?

Патент упоминает (и Claim 30 это формализует), что Decision Component может использовать гибкую логику. Например, если документ имеет очень высокий Relevance Score и находится на первой позиции, система может потребовать лишь умеренно высокий (но все еще доминирующий) CTR для его выделения. И наоборот.

Упоминается ли в патенте использование анкорного текста?

Да, в описании и в Claim 9 упоминается дополнительный параметр, который может использовать Decision Component. Это количество входящих ссылок на документ, в которых текст ссылки (anchor text) соответствует поисковому запросу. Это может служить дополнительным сигналом уверенности.

Почему система может подавлять выделение для порнографического контента?

Патент явно включает проверку на порнографический контент (например, в Claim 24) как часть процесса принятия решения. Это механизм фильтрации (аналогичный SafeSearch), который предотвращает визуальное выделение (особенно с помощью миниатюр страниц) потенциально нежелательного контента в общей выдаче.

Генерируются ли миниатюры страниц в реальном времени?

Патент предлагает оптимизацию производительности. Вместо рендеринга в реальном времени, миниатюры могут быть предварительно сгенерированы (pre-rendered) для документов, которые имеют высокий click through rate. Это позволяет быстро возвращать результаты, которые с высокой вероятностью потребуют визуального выделения.

Похожие патенты

Как Google определяет и показывает похожие сайты с помощью визуальных превью и функции "related:"
Google патентует интерфейс для показа связанных сайтов во время просмотра пользователем веб-страницы. Система определяет похожие сайты на основе текстового и визуального сходства. Результаты отображаются в виде миниатюр (превью), которые при наведении увеличивают ключевые области (например, логотип или навигацию), чтобы помочь пользователю быстро оценить релевантность сайта.
  • US8812500B2
  • 2014-08-19
Как Google автоматически A/B тестирует и выбирает лучшие миниатюры (thumbnails) для максимизации CTR
Google использует систему для автоматической оптимизации миниатюр (thumbnails), сопровождающих ссылки на контент (например, видео или статьи). Система проводит A/B тестирование, показывая разные миниатюры для одного и того же контента разным пользователям. Она отслеживает показатели вовлеченности (клики, просмотры), вычисляет метрику качества (например, CTR) для каждой миниатюры и автоматически выбирает наиболее эффективный вариант для последующих показов.
  • US10037310B1
  • 2018-07-31
  • Поведенческие сигналы

  • Персонализация

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google генерирует визуальные превью страниц в выдаче, используя "разрывы страницы" и масштабирование релевантного контента
Google использует систему для создания визуальных превью страниц (Page Previews) в результатах поиска. Система оценивает релевантность контента, учитывая близость ключевых слов и тип контента (например, пессимизируя сноски). Для показа наиболее важных, но разрозненных участков используются "разрывы страницы" (Page Tears). Ключевой контент также может отображаться в увеличенном масштабе для читаемости, помогая пользователю оценить формат страницы до клика.
  • US8954427B2
  • 2015-02-10
  • SERP

  • Семантика и интент

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Популярные патенты

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок
Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.
  • US7509344B1
  • 2009-03-24
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore