Google использует Дополненный Граф Ресурсов для расчета независимых от запроса оценок качества страниц. Этот граф объединяет традиционные ссылки с поведенческими данными: запросами, кликами и пользовательскими сессиями. Алгоритм, подобный PageRank, запускается на этом объединенном графе, позволяя авторитетности передаваться не только через ссылки, но и через качественное взаимодействие пользователей с поиском (например, CTR и длительность клика).
Описание
Какую задачу решает
Патент решает проблему ограничений традиционных методов расчета авторитетности (таких как классический PageRank), которые полагаются исключительно на граф гиперссылок. Такие методы игнорируют то, как пользователи фактически находят контент и перемещаются по сети с помощью поисковых систем. Это может приводить к недооценке ресурсов, которые высоко ценятся пользователями (часто выбираются в поиске), но имеют мало входящих ссылок. Изобретение улучшает оценку качества ресурсов путем интеграции поведенческих данных непосредственно в структуру графа авторитетности.
Что запатентовано
Запатентована система и метод оценки ресурсов с использованием Augmented Resource Graph (Дополненного графа ресурсов). Этот граф расширяет традиционный веб-граф, добавляя новые типы узлов: Запросы (Query Nodes) и, опционально, Пользователей (User Nodes) или Сессии (User Session Nodes). Связи в графе отражают не только гиперссылки, но и клики пользователей по результатам поиска. На этом объединенном графе запускается итеративный алгоритм для расчета независимых от запроса (query-independent) оценок качества ресурсов.
Как это работает
Система функционирует следующим образом:
- Построение графа: Создается граф, включающий Ресурсы, Запросы и Сессии (или Пользователей).
- Определение связей: Устанавливаются связи: Ресурс->Ресурс (гиперссылки), Запрос->Ресурс (клики), Сессия->Запрос (ввод запроса).
- Взвешивание связей: Связям присваиваются веса. Ключевой момент: вес связи Запрос->Ресурс определяется Quality of Result Statistic (например, CTR, с потенциальным учетом длительности клика).
- Итеративный расчет: На графе запускается алгоритм типа PageRank. Авторитетность (Score) распространяется по всем узлам. Оценка ресурса зависит от оценок ссылающихся ресурсов И от оценок запросов, которые на него ведут.
Актуальность для SEO
Высокая. Интеграция пользовательских сигналов (поведенческих факторов) и структурных данных (ссылок) является фундаментальным аспектом современных поисковых систем. Этот патент описывает основополагающий механизм для объединения этих разнородных сигналов в единую метрику авторитетности. Понимание того, как удовлетворенность пользователей влияет на авторитетность наравне со ссылками, критически важно для SEO в 2025 году.
Важность для SEO
Патент имеет критическое значение для SEO (9/10). Он фундаментально меняет понимание расчета авторитетности (Authority). Если раньше авторитетность рассматривалась преимущественно как функция ссылок, то этот патент показывает механизм, где удовлетворенность пользователей (выраженная через качественные клики и активность в сессиях) напрямую конвертируется в независимую от запроса оценку качества ресурса. Оптимизация под пользовательский опыт и высокий CTR становится стратегией построения авторитетности.
Детальный разбор
Термины и определения
- Augmented Resource Graph (Дополненный граф ресурсов)
- Структура данных, которая расширяет традиционный веб-граф путем добавления узлов, представляющих запросы, пользователей или сессии, и связей, отражающих взаимодействие пользователей с поиском (клики).
- Click Through Rate (CTR)
- Показатель кликабельности. Основной пример Quality of Result Statistic, используемый для взвешивания связей между запросом и ресурсом.
- Dampening Factor (Фактор затухания)
- Коэффициент, используемый в итеративных алгоритмах типа PageRank. Моделирует вероятность того, что пользователь прекратит навигацию. Упоминается в описании алгоритма оценки.
- Quality of Result Statistic (Статистика качества результата)
- Метрика, оценивающая, насколько релевантным пользователи сочли ресурс в ответ на запрос. Включает CTR, но также может учитывать позицию результата и длительность клика (length of the clicks).
- Query Node (Узел запроса)
- Узел в графе, представляющий поисковый запрос.
- Resource Node (Узел ресурса)
- Узел в графе, представляющий веб-страницу или документ.
- Resource Score (Оценка ресурса)
- Итоговая, независимая от запроса (query-independent) оценка авторитетности ресурса, рассчитанная на основе дополненного графа.
- User Session Node / User Node (Узел сессии / Узел пользователя)
- Узлы в графе, представляющие поисковую сессию или анонимизированного пользователя. Они связаны с запросами, которые были отправлены в рамках сессии или пользователем.
Ключевые утверждения (Анализ Claims)
Патент US8812520B1 является патентом-продолжением (continuation). Хотя в общем описании (Description) рассматриваются разные варианты графа, Формула изобретения (Claims 1-18) сфокусирована конкретно на реализации с использованием User Sessions.
Claim 1 (Независимый пункт): Описывает метод использования оценок сессий для ранжирования.
- Система получает доступ к данным о ресурсах, выбранных (кликнутых) в ответ на запросы в рамках пользовательских сессий.
- Система получает доступ к User Session Scores (оценкам сессий).
- Система рассчитывает Search Query Scores (оценки запросов) на основе User Session Scores. Оценка запроса зависит от оценки связанной с ним сессии.
- Система ранжирует ресурсы в ответ на запрос, основываясь (частично) на рассчитанных Search Query Scores.
Ядро изобретения, защищенное этим пунктом, — это механизм передачи авторитетности: Важность сессии влияет на важность запросов в этой сессии, что затем используется в ранжировании.
Claim 3 (Зависимый): Детализирует структуру данных как граф.
Информация представлена в виде графа с узлами для Ресурсов, Запросов и Сессий. Определены связи:
- Ресурс-Ресурс (гиперссылка).
- Ресурс-Запрос (клик пользователя).
- Сессия-Запрос (запрос отправлен во время сессии).
Claim 4, 5 и 6 (Зависимые): Детализируют механизм взвешивания.
- Связи имеют веса. Расчет Search Query Scores также зависит от весов связей между Запросами и Ресурсами (Claim 4).
- Вес связи Запрос-Ресурс определяется на основе Quality of Result Statistic (Claim 5).
- Quality of Result Statistic может быть Click Through Rate (CTR) (Claim 6).
Система использует взвешенный граф, где поведенческие метрики (CTR) определяют силу связей между запросами и ресурсами, влияя на распространение авторитетности по цепочке Session -> Query -> Resource.
Где и как применяется
Изобретение затрагивает преимущественно этапы индексирования (для расчета метрик) и ранжирования (для их использования).
CRAWLING – Сканирование и Сбор данных
Сбор сырья для графа: Resource Data (контент и гиперссылки) и Query Data (логи поисковых запросов, включающие сессии, запросы и клики). Данные о запросах анонимизируются.
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Происходит офлайн или в пакетном режиме.
- Построение графа: Resource Scoring Engine обрабатывает собранные данные для генерации Augmented Resource Graph.
- Расчет оценок: Выполняется итеративный алгоритм (подобный PageRank) на всем графе для расчета Resource Scores, Query Scores и Session Scores.
- Хранение: Рассчитанные оценки сохраняются в Score Repository и ассоциируются с ресурсами в индексе.
RANKING – Ранжирование
Использование предварительно рассчитанных оценок в реальном времени. Search Engine использует Resource Scores как независимый от запроса (query-independent) сигнал авторитетности ресурса.
Входные данные:
- Данные о ресурсах и гиперссылках (Resource Data).
- Логи запросов: запросы, клики, CTR, идентификаторы сессий/пользователей (Query Data).
Выходные данные:
- Набор независимых от запроса оценок для ресурсов (Resource Scores).
На что влияет
- Все типы контента и запросов: Механизм универсален и применяется для расчета глобальной авторитетности индексируемых ресурсов.
- Ресурсы с малым количеством ссылок: Наибольшее влияние оказывается на ресурсы, которые редко получают прямые гиперссылки, но часто являются полезной конечной точкой поисковой навигации (например, форумы, специфические товары, узкоспециализированный контент). Они могут получить высокую оценку за счет поведенческих факторов.
Когда применяется
- Расчет оценок: Выполняется периодически в офлайн-режиме (Batch processing) для обновления глобальных метрик авторитетности, так как требует значительных вычислительных ресурсов.
- Использование оценок: Происходит в реальном времени на этапе ранжирования при обработке каждого запроса.
- Фильтрация: Система может фильтровать данные при построении графа, например, исключать ресурсы или запросы с недостаточной активностью или ребра с весом ниже порога.
Пошаговый алгоритм
Процесс расчета оценок ресурсов на основе Дополненного Графа.
- Сбор и подготовка данных:
- Сбор Resource Data (ссылки) и Query Data (запросы, клики, сессии).
- Расчет Quality of Result Statistic (например, CTR с возможной поправкой на длительность клика и позицию) для пар Запрос-Ресурс.
- Генерация Дополненного Графа:
- Создание узлов для Ресурсов (R), Запросов (Q) и Сессий (S) (или Пользователей).
- Создание связей R->R (гиперссылки), Q<->R (клики), S<->Q (принадлежность к сессии).
- Взвешивание связей:
- Присвоение весов R->R (например, 1/N исходящих ссылок).
- Присвоение весов Q<->R на основе Quality of Result Statistic.
- Присвоение весов S<->Q (например, на основе количества запросов в сессии).
- Опциональная нормализация весов исходящих связей.
- Инициализация оценок: Присвоение начальных оценок всем узлам графа.
- Итеративное обновление оценок: Выполнение алгоритма распространения оценок (например, PageRank):
- Оценка узла обновляется на основе взвешенной суммы оценок связанных с ним узлов.
- Применяется Dampening Factor (коэффициент затухания).
- Процесс повторяется до сходимости (стабилизации оценок) или достижения порогового числа итераций.
- Хранение и применение: Итоговые Resource Scores сохраняются и используются поисковой системой как сигнал авторитетности при ранжировании.
Какие данные и как использует
Данные на входе
- Ссылочные факторы: Данные о входящих и исходящих гиперссылках. Используются для построения базового веб-графа (связи R->R).
- Поведенческие факторы: Данные из логов поисковой системы:
- Клики (Selections): Факт выбора результата поиска. Используется для создания связей Q->R.
- CTR (Click Through Rate): Используется как основная метрика для Quality of Result Statistic.
- Длительность клика (Length of the clicks): В патенте явно упоминается, что коротким кликам может придаваться меньший вес, чем длинным. Используется для корректировки Quality of Result Statistic.
- Позиция результата (Position): Упоминается возможность учета позиции (клик по низкой позиции может получить больший вес).
- Пользовательские факторы (Анонимизированные):
- Сессии (User Sessions): Группы последовательных запросов. Используются для построения Session Nodes и связей S->Q.
- Идентификаторы пользователей (User Identifiers): Могут использоваться в альтернативной реализации для построения User Nodes.
Какие метрики используются и как они считаются
- Resource Score, Query Score, Session Score: Рассчитываются итеративно с использованием алгоритма типа PageRank. Оценка узла определяется взвешенной суммой оценок узлов, ссылающихся на него.
- Веса связей (Edge Weights): Определяют силу передачи оценки между узлами.
- Q->R: Основано на Quality of Result Statistic (CTR, скорректированный по длительности клика и позиции).
- R->R: Обычно 1 / (Количество исходящих ссылок).
- S->Q: Может быть основано на 1 / (Количество запросов в сессии) или 1 / (Количество сессий, содержащих запрос).
- Коэффициент затухания (Dampening Factor): Используется в итеративном расчете для моделирования поведения пользователя и обеспечения сходимости алгоритма.
- Нормализация: Веса исходящих связей от узла могут нормализоваться (например, чтобы их сумма равнялась 1).
Выводы
- Единая модель авторитетности (Ссылки + Поведение): Патент описывает фундаментальный механизм объединения ссылочных и поведенческих сигналов в единую метрику авторитетности (Resource Score). Этот score функционирует аналогично PageRank, но учитывает взаимодействие пользователей.
- Клики как «Поведенческие ссылки»: Клики из поиска действуют как передатчики авторитетности наравне с гиперссылками. Связь Query->Resource является каналом передачи авторитетности от запроса к документу.
- Критичность Качества Взаимодействия (Satisfaction): Не все клики одинаковы. Вес связи зависит от Quality of Result Statistic. Патент явно упоминает CTR и возможность учета длительности клика (длинные клики лучше коротких) и позиции. Удовлетворенность пользователя напрямую влияет на передачу авторитетности.
- Важность Контекста (Сессии и Пользователи): Включение User Session Nodes или User Nodes означает, что контекст поиска влияет на оценку запросов и, следовательно, ресурсов. Авторитетность передается по цепочке: Session -> Query -> Resource.
- Преимущество для Полезных Ресурсов без Ссылок: Ресурсы, которые полезны и часто кликабельны, но имеют мало входящих гиперссылок, могут получить высокий Resource Score благодаря этому механизму.
Практика
Best practices (это мы делаем)
- Оптимизация под Удовлетворенность Пользователя (Long Clicks): Фокусируйтесь на создании контента, который полностью отвечает на интент и удерживает пользователя на странице. Поскольку длительность клика может учитываться в Quality of Result Statistic, длинные клики увеличивают вес связи Q->R и напрямую способствуют росту авторитетности сайта.
- Максимизация Релевантного CTR: Работа над сниппетами (Title, Description, микроразметка) критически важна. Высокий CTR увеличивает вес связи от запроса к ресурсу, что ведет к передаче большей авторитетности от Query Node к Resource Node.
- Построение Тематической Авторитетности (Topical Authority): Стремитесь к тому, чтобы сайт был качественным ответом на множество связанных запросов. Чем больше Query Nodes связано с вашими Resource Nodes через качественные клики, тем выше будет итоговый Resource Score.
- Анализ Поискового Пути (Search Journey): Понимайте контекст сессии пользователя. Создавайте контент, который удовлетворяет последовательные интенты. Если ваш сайт становится частью авторитетных сессий (High-scoring Session Nodes), это положительно скажется на оценке ваших страниц.
Worst practices (это делать не надо)
- Кликбейт и Обман Ожиданий: Использование завлекающих сниппетов, не соответствующих контенту. Это приведет к коротким кликам (низкое качество результата), что минимизирует передачу авторитетности, даже при высоком номинальном CTR, согласно механизму учета длительности клика.
- Игнорирование Поведенческих Факторов: Стратегии, сфокусированные исключительно на получении гиперссылок при игнорировании того, как пользователи взаимодействуют с сайтом через поиск. Авторитетность является функцией обоих факторов.
- Накрутка Поведенческих Факторов: Попытки манипулировать Quality of Result Statistic через искусственные клики. Использование метрик качества (длительность клика, паттерны сессий) делает такие манипуляции неэффективными для передачи авторитетности в графе.
Стратегическое значение
Этот патент подтверждает стратегический сдвиг от чисто ссылочной модели авторитетности к гибридной модели, где пользовательский опыт и удовлетворенность являются прямыми входами в расчет фундаментального качества ресурса. Для SEO это означает, что работа над качеством контента, UX и представлением в SERP не просто улучшает ранжирование по конкретным запросам, но и строит долгосрочную, независимую от запроса авторитетность домена.
Практические примеры
Сценарий: Повышение авторитетности страницы Лонгрида с малым количеством ссылок.
- Ситуация: Имеется детальный лонгрид (Resource A), на который ссылается мало внешних сайтов, но он хорошо ранжируется по множеству НЧ запросов (Queries X, Y, Z).
- Цель: Повысить глобальную авторитетность (Resource Score) страницы A.
- Действия:
- Оптимизировать сниппеты для запросов X, Y, Z, чтобы максимизировать CTR.
- Улучшить контент страницы A, чтобы максимизировать удовлетворенность (стимулировать длинные клики, минимизировать возвраты в поиск).
- Механизм работы:
- Улучшение CTR и длительности кликов увеличивает Quality of Result Statistic.
- Это увеличивает вес связей Query X->Resource A, Query Y->Resource A и т.д. в Augmented Resource Graph.
- При следующем пересчете графа, узлы запросов X, Y, Z передадут больше авторитетности узлу ресурса A.
- Результат: Resource Score страницы A увеличивается, что улучшает ее ранжирование по всем релевантным запросам, включая более конкурентные.
Вопросы и ответы
Заменяет ли этот механизм классический PageRank?
Он не заменяет его, а дополняет и интегрирует. Алгоритм, описанный в патенте, похож на PageRank (итеративное распространение оценок по графу), но он запускается на более сложном графе (Augmented Resource Graph). Ссылки остаются важной частью этого графа, но добавляются новые пути передачи авторитетности через запросы, клики и сессии.
Что важнее для авторитетности согласно этому патенту: ссылки или клики?
Оба фактора вносят вклад в итоговый Resource Score. Авторитетность становится гибридной метрикой. В нишах или для документов, где ссылок мало, поведенческие факторы (клики) могут играть доминирующую роль в определении авторитетности, предоставляя альтернативный путь ее накопления.
Как система определяет «важность» пользовательской сессии (User Session Score)?
Поскольку алгоритм работает итеративно на всем графе, Session Score определяется рекурсивно. Сессия считается важной, если она содержит важные запросы (High Query Scores). Запросы считаются важными, если они ведут к важным ресурсам и получают качественные клики. Это самоподдерживающаяся система оценки.
Как влияют короткие клики (Short Clicks) и возвраты в поиск (Pogo-sticking)?
Патент явно упоминает, что Quality of Result Statistic может учитывать длительность кликов (length of the clicks), при этом коротким кликам может придаваться меньший вес, чем длинным. Это означает, что короткие клики (признак неудовлетворенности пользователя) будут передавать минимальную авторитетность от запроса к ресурсу.
Означает ли это, что высокий CTR гарантирует высокую авторитетность?
Не обязательно. Во-первых, важен не только номинальный CTR, но и качество клика (длительность). Во-вторых, CTR является весом связи. Чтобы ресурс получил высокую оценку, он должен иметь высокий CTR по «важным» запросам (High-scoring Query Nodes) или получать качественные клики по очень большому количеству менее важных запросов.
Как этот патент влияет на стратегию построения ссылок (Link Building)?
Стратегия построения ссылок остается важной, так как гиперссылки являются частью дополненного графа. Однако этот патент подчеркивает необходимость диверсификации стратегии построения авторитетности. Необходимо инвестировать ресурсы не только в получение ссылок, но и в создание контента, который генерирует качественный поисковый трафик и удовлетворяет пользователей.
Может ли страница с нулевым количеством входящих ссылок иметь высокую авторитетность?
Да, теоретически это возможно. Если страница является частым и качественным ответом (высокий CTR, длинные клики) на множество запросов, она может накопить значительный Resource Score исключительно за счет поведенческих связей в дополненном графе.
Влияет ли позиция в выдаче на вес клика?
Да, патент упоминает такую возможность. При расчете Quality of Result Statistic система может придавать больший вес кликам по результатам, находящимся на более низких позициях, по сравнению с кликами по результатам на высоких позициях. Это позволяет лучше оценить ресурсы, которые привлекают внимание, несмотря на изначально более низкий рейтинг.
Рассчитываются ли эти оценки в реальном времени?
Нет. Построение Augmented Resource Graph и итеративный расчет Resource Scores – это ресурсоемкие процессы, которые выполняются периодически в офлайн-режиме (пакетная обработка). Однако полученные оценки затем используются в реальном времени на этапе ранжирования как независимый от запроса сигнал.
Как использовать концепцию сессий в SEO-стратегии?
Необходимо думать о пути пользователя (User Journey), а не об изолированных ключевых словах. Создавайте контент, который отвечает на последовательные запросы пользователя в рамках одной задачи. Если ваш сайт становится надежным источником в рамках сессий, это повышает вероятность того, что эти сессии получат высокую оценку, что, в свою очередь, повысит оценку ваших страниц.