Google использует метрику Reachability Score (Оценка Достижимости) для ранжирования страниц. Эта метрика оценивает, сколько времени пользователь, вероятно, проведет на сайте и сколько связанных ресурсов он посетит, переходя по ссылкам с исходной страницы. Оценка рассчитывается рекурсивно на основе агрегированных поведенческих данных (CTR, время просмотра) страниц, доступных в нескольких «хопах» (кликах) от исходной.
Описание
Какую задачу решает
Патент решает задачу более точной оценки ценности ресурса для пользователя, выходя за рамки его собственного содержания. Он фокусируется на измерении потенциала вовлеченности (engagement potential). Система стремится определить, является ли ресурс «шлюзом» к другому ценному контенту и сколько времени пользователь, вероятно, потратит, исследуя связанные ресурсы, начиная с исходного. Это позволяет повышать в выдаче ресурсы, которые способствуют более длительным и глубоким сессиям взаимодействия.
Что запатентовано
Запатентована система расчета и применения Reachability Score (RS, Оценки Достижимости) ресурса для корректировки его ранжирования в поиске. Reachability Score — это агрегированная оценка, которая рассчитывается на основе исторических данных о взаимодействии пользователей (historical user feedback data) с вторичными ресурсами (secondary resources). Эти вторичные ресурсы должны быть доступны по ссылкам с первичного ресурса (primary resource) в пределах определенного количества «хопов» (кликов).
Как это работает
Ключевой механизм — это рекурсивный обход графа ссылок и агрегация поведенческих метрик:
- Идентификация связанных ресурсов: Система определяет вторичные ресурсы, доступные с первичного ресурса в пределах K хопов (например, K=3).
- Сбор поведенческих данных: Для каждого вторичного ресурса извлекаются исторические данные о взаимодействии пользователей (например, click-through-rate (CTR), median access time (время просмотра)).
- Расчет Reachability Score (RS): Система рекурсивно вычисляет RS первичного ресурса, суммируя оценки вторичных ресурсов, взвешенные по вероятности перехода к ним (например, по CTR ссылки).
- Применение в ранжировании: Полученный RS используется как сигнал для корректировки оценки ранжирования первичного ресурса. Он может изменять оценку качества (Quality Score) или применяться как коэффициент повышения (Promotion Factor) к итоговому рейтингу.
Актуальность для SEO
Высокая. Оценка вовлеченности пользователей и качества сессий остается ключевой задачей для поисковых систем. Метрики, основанные на поведении пользователей и глубине взаимодействия с контентом (включая внутренние переходы), играют важную роль в современных алгоритмах ранжирования. Этот патент описывает конкретный механизм для количественной оценки этого аспекта.
Важность для SEO
Влияние на SEO — значительное (85/100). Патент подчеркивает критическую важность продуманной внутренней перелинковки и оптимизации пути пользователя (User Journey). Он демонстрирует, что ранжирование страницы зависит не только от ее собственных метрик, но и от качества, релевантности и поведенческих метрик (CTR, Dwell Time) страниц, на которые она ссылается. Это делает стратегию создания контент-хабов и кластеров с высокой вовлеченностью особенно эффективной.
Детальный разбор
Термины и определения
- Reachability Score (RS) (Оценка Достижимости)
- Агрегированная оценка (aggregate score) для первичного ресурса. Представляет собой прогнозируемое количество ресурсов, которые пользователь, вероятно, посетит, переходя по ссылкам с исходного ресурса, и/или общее время, которое пользователь, вероятно, потратит на взаимодействие с первичным и связанными с ним вторичными ресурсами.
- Primary Resource (Первичный ресурс)
- Исходный ресурс (например, веб-страница), для которого рассчитывается Reachability Score и который ранжируется в ответ на запрос.
- Secondary Resource (Вторичный ресурс)
- Ресурс, доступный через одну или несколько ссылок с первичного ресурса. Включает ресурсы, находящиеся на расстоянии одного или нескольких хопов (дочерние, внучатые/третичные ресурсы и т.д.).
- Hop (Хоп)
- Действие пользователя (например, клик мышью, жестовое касание, голосовая команда), необходимое для перехода от одного ресурса к другому по ссылке. Определяет глубину обхода графа ссылок при расчете RS.
- User Interaction Data / Historical User Feedback Data (Данные о взаимодействии пользователей)
- Данные, полученные на основе предшествующих взаимодействий пользователей с ресурсом. Примеры, упомянутые в патенте: click-through-rate (CTR), user ratings (пользовательские рейтинги), median access time (медианное время доступа/просмотра), long clicks (длинные клики/Dwell Time).
- Promotion Factor (PF) (Коэффициент повышения)
- Коэффициент, определяемый на основе Reachability Score. Используется для корректировки (повышения) исходной оценки ранжирования первичного ресурса. PF>1 приводит к повышению позиции.
- Trustworthiness Score (T) (Оценка достоверности/надежности)
- Метрика, указывающая на надежность ресурса на основе предшествующих взаимодействий пользователей (например, long clicks) и, опционально, меры качества ресурса. Может использоваться для фильтрации вторичных ресурсов при расчете RS.
- Quality Score (Оценка качества)
- Мера качества ресурса, основанная на его внутренних характеристиках (intrinsic features). RS может использоваться для корректировки этой оценки.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод использования Reachability Score при обработке поискового запроса.
- Система получает запрос от пользователя.
- Выбираются результаты поиска (идентифицирующие первичные ресурсы), релевантные запросу, каждый с исходной оценкой (respective score).
- Для каждого результата поиска его исходная оценка корректируется на основе соответствующей агрегированной оценки (Reachability Score) первичного ресурса.
- Эта агрегированная оценка основана на исторических данных обратной связи (historical user feedback data), связанных с взаимодействием пользователей с одним или несколькими вторичными ресурсами.
- Вторичные ресурсы доступны по ссылкам с первичного ресурса и находятся в пределах заданного количества хопов (specified number of hops).
- Результаты поиска упорядочиваются на основе скорректированных оценок и предоставляются пользователю.
Ядро изобретения — использование поведенческих данных связанных (вторичных) ресурсов для корректировки ранжирования исходного (первичного) ресурса.
Claim 3 (Зависимый от 2): Уточняет природу данных о взаимодействии.
Взаимодействия предшествующих пользователей включают median access time (медианное время доступа) или click-through-rate (CTR), связанные с конкретным вторичным ресурсом.
Claim 5 и 6 (Зависимые): Подтверждают рекурсивный характер анализа.
Вторичные ресурсы могут включать третичные ресурсы (доступные по ссылкам с других вторичных ресурсов), и исторические данные о взаимодействии с этими третичными ресурсами также учитываются при расчете RS.
Claim 7 (Зависимый от 1): Детализирует механизм корректировки оценки ранжирования.
Корректировка включает определение Promotion Factor на основе агрегированной оценки (RS) и комбинирование исходной оценки с этим Promotion Factor.
Где и как применяется
Изобретение затрагивает этапы индексирования (для предварительного расчета) и ранжирования/переранжирования (для применения оценки).
INDEXING – Индексирование и извлечение признаков
На этом этапе система (Resource Reachability System) предварительно рассчитывает Reachability Scores для ресурсов. Это происходит путем анализа графа ссылок и агрегации Historical Data (поведенческие данные). Также рассчитываются оценки качества (Quality Score) и достоверности (Trustworthiness Score). Рассчитанные RS сохраняются в индексе (Resource Index).
RANKING – Ранжирование
После того как ресурсы идентифицированы как релевантные запросу, система определяет их исходные оценки ранжирования (на основе релевантности и качества).
RERANKING – Переранжирование
На этом этапе происходит корректировка оценок. Система извлекает предварительно рассчитанный Reachability Score для каждого кандидата. RS используется либо для корректировки Quality Score, либо (чаще) для расчета Promotion Factor (PF), который затем применяется к исходной оценке ранжирования для получения скорректированной оценки (adjusted ranking score).
Входные данные:
- Структура ссылок (граф) для первичного и вторичных ресурсов (из индекса).
- Исторические данные о взаимодействии пользователей (CTR, Median Access Time, User Ratings) для всех задействованных ресурсов (из Historical Data).
- Исходные оценки ранжирования (Relevance Score, Quality Score) кандидатов.
- Опционально: Trustworthiness Score для вторичных ресурсов.
Выходные данные:
- Скорректированная оценка ранжирования (Adjusted Ranking Score) для первичного ресурса.
На что влияет
- Типы контента: Наибольшее влияние оказывается на ресурсы, которые служат точками входа или навигационными узлами (Hub Pages, Pillar Pages). Патент в качестве основного примера использует страницы просмотра видео (video watch-page), где есть ссылки на похожие видео. Однако уточняется, что механизм применим к любым ресурсам, включая HTML-страницы, документы, изображения и т.д.
- Структурные факторы: Влияет на оценку качества внутренней перелинковки. Ресурсы с богатой, релевантной и вовлекающей структурой ссылок получают преимущество.
- Поведенческие факторы: Усиливает влияние поведенческих сигналов (CTR, время взаимодействия), перенося их с связанных страниц на исходную.
Когда применяется
- Условия применения: Алгоритм применяется при ранжировании ресурсов в ответ на поисковый запрос. Расчет RS происходит периодически офлайн.
- Параметры расчета:
- Глубина обхода (K Hops): Количество хопов (K) может быть задано статически (например, 3) или динамически (например, на основе среднего количества ресурсов, просмотренных пользователем за сессию).
- Фильтрация по достоверности: Система может исключать из расчета RS вторичные ресурсы, чья оценка достоверности (Trustworthiness Score T) ниже порогового значения (TT). Это предотвращает накрутку RS через ссылки на некачественные ресурсы с низким Dwell Time.
Пошаговый алгоритм
Процесс А: Расчет Reachability Score (RS) (Офлайн)
- Инициализация: Выбирается первичный ресурс и определяется максимальное количество хопов (K).
- Обход графа: Система рекурсивно обходит граф ссылок, начиная с первичного ресурса, до глубины K.
- Сбор данных для вторичных ресурсов: Для каждого обнаруженного вторичного ресурса извлекаются:
- Данные о взаимодействии (например, Median Access Time).
- Вес связи (W), например, нормализованный CTR ссылки, ведущей на этот ресурс.
- Опционально: Trustworthiness Score (T).
- Фильтрация (Опционально): Вторичные ресурсы с T < TT исключаются из расчета.
- Рекурсивный расчет: RS рассчитывается по формуле, агрегирующей данные снизу вверх. На уровне K, RS вторичного ресурса может быть константой. На промежуточных уровнях RS рассчитывается как сумма сигналов от дочерних ресурсов, взвешенных по вероятности перехода.
Пример формулы из патента (Equation 1): RS = Σ Si + Σ(Wi * RSi). - Сохранение: Рассчитанный RS сохраняется в индексе для первичного ресурса.
Процесс Б: Применение RS в ранжировании (В реальном времени)
- Получение запроса и кандидатов: Система получает запрос и идентифицирует релевантные первичные ресурсы с исходными оценками ранжирования (Initial Ranking Score).
- Извлечение RS: Для каждого первичного ресурса извлекается его Reachability Score.
- Расчет корректировки (Promotion Factor): Система определяет коэффициент повышения (PF) на основе RS.
- Если RS < T1 (мин. порог), PF = Min_Value (например, 1).
- Если RS > T2 (макс. порог), PF = Max_Value (например, 1.5).
- Если T1 ≤ RS ≤ T2, PF рассчитывается по функции (линейной, логарифмической и т.д.) между Min_Value и Max_Value.
- Корректировка ранжирования: Исходная оценка ранжирования комбинируется (например, умножается) с PF для получения скорректированной оценки (Adjusted Ranking Score).
- Сортировка и выдача: Результаты сортируются по скорректированным оценкам и предоставляются пользователю.
Какие данные и как использует
Данные на входе
Система использует комбинацию структурных и поведенческих данных.
- Ссылочные (Структурные) факторы:
- Наличие исходящих ссылок с первичного ресурса.
- Структура графа ссылок (взаимосвязи между первичным, вторичными и третичными ресурсами).
- Количество ресурсов, доступных в пределах K хопов.
- Поведенческие факторы (Ключевые данные): Исторические данные о взаимодействии пользователей с вторичными ресурсами.
- Click-through-rate (CTR) вторичных ресурсов (используется для расчета веса W).
- Median access time (Медианное время доступа/просмотра) вторичных ресурсов.
- User ratings (Пользовательские рейтинги) вторичных ресурсов.
- Данные о кликах (Click data), включая классификацию кликов как короткие или длинные (long clicks/Dwell Time). Используются для расчета Trustworthiness Score.
- Количество просмотров (view count).
- Факторы качества (Системные оценки):
- Базовый Quality Score ресурса (на основе внутренних характеристик).
Какие метрики используются и как они считаются
- Reachability Score (RS): Рассчитывается рекурсивно. В патенте приводится пример формулы (Equation 1):
RS = Σ Si + Σ(Wi * RSi)
Где:- RSi = Reachability Score i-го вторичного ресурса.
- Si = Значение сигнала, полученное от i-го вторичного ресурса (например, может быть равно 1, если ресурс существует).
- Wi = Вес, связанный с i-м вторичным ресурсом.
- Вес (Wi): Может быть рассчитан как нормализованный CTR. Например, Wi = CTRi / CTR_parent (CTR вторичного ресурса, деленный на CTR родительского ресурса). Патент также упоминает возможность корректировки Wi на основе количества доступных точек данных (для учета надежности статистики).
- Сигналы (S или используемые в расчете): Могут включать нормализованные значения Quality Score, access count, average user rating, median access time, video duration, importance graph ranking.
- Promotion Factor (PF): Рассчитывается на основе RS с использованием пороговых значений (T1, T2) и функции масштабирования (линейной, ступенчатой, логарифмической и т.д.).
- Long Click: Определяется как доступ к ресурсу в течение времени, превышающего пороговое (например, 30 секунд). Для коротких ресурсов — просмотр всего ресурса один или два раза за сессию.
Выводы
- Ранжирование страницы зависит от качества и вовлеченности связанных страниц: Ключевой вывод заключается в том, что Google может оценивать первичный ресурс на основе того, как пользователи взаимодействуют с вторичными ресурсами, на которые он ссылается. Если страница ссылается на контент с высоким CTR и длительным временем взаимодействия (long clicks), она получает более высокий Reachability Score.
- Поведенческие данные как основа оценки: Reachability Score напрямую зависит от агрегированных исторических данных о поведении пользователей (CTR, время просмотра). Это подтверждает важность оптимизации поведенческих факторов не только для целевых страниц, но и для всего кластера контента.
- Важность пути пользователя (User Journey) и глубины сессии: Алгоритм поощряет ресурсы, которые успешно вовлекают пользователя в дальнейшее исследование контента. Это смещает фокус с оптимизации отдельных страниц на оптимизацию целых сессий.
- Рекурсивная природа оценки вовлеченности: RS рассчитывается рекурсивно на глубину K хопов. Это означает, что страница A, ссылающаяся на B, которая ссылается на высококачественную страницу C, получит преимущество от качества C, хотя и с меньшим весом (зависит от CTR переходов A->B и B->C).
- Защита от манипуляций через Trustworthiness Score: Система предусматривает механизм фильтрации вторичных ресурсов по Trustworthiness Score (основан на long clicks). Это означает, что ссылки на кликбейтный, но некачественный контент (с низким Dwell Time) могут быть исключены из расчета RS.
Практика
Best practices (это мы делаем)
- Оптимизация внутренней перелинковки для вовлечения: Стратегически размещайте ссылки на релевантный и дополняющий контент. Цель — не просто связать страницы, а мотивировать пользователя перейти по ссылке и провести время на вторичном ресурсе. Используйте блоки «Читайте также», контекстные ссылки и четкую навигацию.
- Повышение CTR внутренних ссылок: Используйте понятные и привлекательные анкоры для внутренних ссылок. Убедитесь, что ссылка ведет именно на тот контент, который ожидает увидеть пользователь. Высокий CTR внутренних переходов (Wi в формуле) увеличивает вес, с которым поведенческие метрики вторичного ресурса влияют на первичный.
- Повышение качества и Dwell Time (Long Clicks) всех страниц сайта: Поскольку любая страница может выступать в роли вторичного ресурса, необходимо поддерживать высокое качество всего контента. Страницы с длительным временем взаимодействия (высоким Trustworthiness Score) позитивно влияют на ранжирование страниц, которые на них ссылаются.
- Создание контент-хабов и кластеров (Hub-and-Spoke): Разрабатывайте структуру сайта, которая поощряет глубокое погружение в тему. Хаб-страницы (Primary Resource), ссылающиеся на множество качественных статей кластера (Secondary Resources), получат высокий Reachability Score.
- Анализ пути пользователя: Используйте аналитику для выявления популярных маршрутов пользователей по сайту. Усиливайте эти маршруты и устраняйте тупики, чтобы максимизировать Reachability Score для ключевых точек входа.
Worst practices (это делать не надо)
- Изолированный контент (Страницы-сироты или тупики): Создание страниц без релевантных исходящих ссылок приведет к низкому Reachability Score.
- Ссылки на некачественный контент с низким Dwell Time: Ссылки на страницы, которые пользователи быстро покидают (низкий Trustworthiness Score), не дадут прироста RS или будут отфильтрованы системой.
- Использование кликбейта во внутренних ссылках: Если анкор ссылки вводит в заблуждение, пользователь быстро покинет вторичный ресурс. Даже при высоком CTR перехода, низкое время взаимодействия (Short Click) на вторичной странице нивелирует эффект и снизит Trustworthiness.
- Скрытие или затруднение доступа к связанному контенту: Дизайн или UX, который мешает пользователю находить и переходить к связанным материалам, снижает потенциал вовлеченности и RS.
Стратегическое значение
Патент подтверждает стратегию, ориентированную на пользователя и его вовлеченность на уровне сессии, а не отдельной страницы. Он показывает, что Google оценивает не только релевантность страницы запросу, но и ее способность удовлетворить более широкий интент пользователя через связанные ресурсы. Для долгосрочной SEO-стратегии это означает необходимость инвестиций в качественную архитектуру сайта, удобную навигацию и создание сети взаимосвязанного контента, который удерживает пользователя.
Практические примеры
Сценарий: Оптимизация статьи в блоге (Информационный сайт)
- Ситуация: Есть статья «Как выбрать кофемашину» (Primary Resource). Она хорошо ранжируется, но имеет средние поведенческие метрики.
- Анализ (по патенту): Необходимо увеличить Reachability Score, улучшив взаимодействие с вторичными ресурсами.
- Действия:
- Добавить контекстные ссылки на статьи «Сравнение рожковых и капсульных кофемашин», «Лучшие сорта кофе для эспрессо» (Secondary Resources).
- Убедиться, что эти вторичные статьи максимально качественные и имеют высокое время вовлечения (Long Clicks).
- В конце статьи добавить блок со ссылками на «Обзоры популярных моделей 2025 года».
- Оптимизировать анкоры ссылок для повышения их CTR.
- Ожидаемый результат: Пользователи чаще переходят по внутренним ссылкам (повышение Wi) и проводят больше времени на вторичных страницах. Это увеличивает Reachability Score исходной статьи, что приводит к повышению ее позиций в поиске через Promotion Factor.
Сценарий: Карточка товара (E-commerce)
- Ситуация: Карточка товара «Смартфон X» (Primary Resource).
- Действия: Оптимизировать блоки «С этим товаром покупают», «Похожие товары» (Secondary Resources), а также добавить ссылку на подробный «Обзор модели Смартфон X» (еще один Secondary Resource). Убедиться, что обзор качественный и пользователи его читают (высокий Dwell Time).
- Ожидаемый результат: Увеличение глубины просмотра (переходы на аксессуары или обзор) и времени сессии, начиная с карточки товара, повышает ее Reachability Score и конкурентоспособность в поиске.
Вопросы и ответы
Что такое Reachability Score простыми словами?
Это метрика, которая предсказывает, насколько вероятно, что пользователь, зайдя на страницу, продолжит исследовать другие связанные ресурсы и сколько времени он на это потратит. Чем выше эта вероятность и ожидаемое время вовлечения, тем выше Reachability Score. Эта оценка используется Google для повышения в ранжировании страниц, которые способствуют глубоким сессиям.
Какие поведенческие метрики самые важные для расчета Reachability Score?
Патент явно выделяет Click-Through-Rate (CTR) и Median Access Time (медианное время доступа или просмотра). CTR используется для определения веса (вероятности перехода, Wi) к вторичному ресурсу, а время доступа (связанное с Long Clicks и Dwell Time) используется для оценки качества и вовлеченности этого ресурса.
Как Google определяет, что вторичный ресурс качественный (Trustworthy)?
Система использует Trustworthiness Score, который, согласно патенту, основан на предшествующих взаимодействиях пользователей, в частности, на long clicks (длинных кликах). Если пользователи проводят много времени на вторичном ресурсе, его достоверность считается высокой. Ресурсы с низкой достоверностью могут быть исключены из расчета RS.
Что важнее: количество ссылок или их качество?
Качество ссылок и качество ресурсов, на которые они ведут, критически важны. Формула RS взвешивает вклад каждого вторичного ресурса по его собственным метрикам вовлеченности и вероятности перехода на него (CTR). Большое количество ссылок на некачественные страницы с низким CTR и Dwell Time не даст значительного прироста Reachability Score.
Сколько кликов (хопов) вглубь учитывает система?
Патент не указывает точное число, говоря о «заданном количестве хопов» (K). Упоминается, что K может быть установлено статически (например, 3 хопа) или динамически, например, на основе среднего количества ресурсов, просматриваемых пользователем за сессию. На практике это означает, что наибольшее влияние оказывают ресурсы в 1-3 кликах от исходной страницы.
Как этот патент влияет на стратегию внутренней перелинковки?
Он делает внутреннюю перелинковку одним из ключевых факторов ранжирования, ориентированных на пользователя. Перелинковка должна быть стратегической, направленной на максимальное вовлечение. Необходимо оптимизировать CTR внутренних ссылок и гарантировать, что они ведут на контент, который удержит внимание пользователя (высокий Dwell Time).
Применим ли этот механизм только к видео, как в примерах патента?
Нет. Хотя патент часто использует страницы просмотра видео в качестве примеров (так как они естественно содержат блоки похожих видео), в тексте прямо указано, что механизм применим к любым ресурсам, включая HTML-страницы, текстовые документы, изображения и PDF.
Чем Reachability Score (RS) отличается от PageRank?
PageRank оценивает авторитетность страницы на основе входящих ссылок (кто ссылается на вас). Reachability Score оценивает страницу на основе исходящих ссылок (на кого ссылаетесь вы) и того, как пользователи взаимодействуют с контентом по этим ссылкам. Это два разных измерения качества ресурса, фокусирующиеся на авторитетности и вовлеченности соответственно.
Что такое Promotion Factor (PF) и насколько сильно он может повысить рейтинг?
Promotion Factor — это множитель, применяемый к начальной оценке ранжирования. Он определяется на основе RS. В патенте приводятся примеры значений: минимум 1 (нет повышения) и максимум, например, 1.5. Это означает, что при высоком RS страница может получить значительное повышение в рейтинге.
Как измерить Reachability Score для своего сайта?
Напрямую измерить Reachability Score нельзя, так как это внутренняя метрика Google. Однако можно использовать прокси-метрики в системах аналитики: анализировать CTR внутренних переходов, среднюю глубину просмотра сессии и время взаимодействия с отдельными страницами (Dwell Time). Улучшение этих показателей должно коррелировать с ростом RS.