
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
Патент решает проблему предоставления универсальных результатов поиска, которые не учитывают индивидуальный контекст, интересы или "точку зрения" (Point-of-View, POV) пользователя. Цель изобретения — повысить релевантность выдачи путем её смещения (biasing) в сторону предпочтений пользователя (персонализация) или заданной тематики. Это позволяет избежать недостатков существовавших методов (например, HITS), которые были уязвимы для спама и дрейфа темы.
Запатентована система выполнения поиска с учетом "точки зрения" (POV Searching), которая реализуется через модификацию алгоритма PageRank (часто называемую Personalized PageRank). Суть изобретения заключается в изменении способа расчета авторитетности: вместо глобальной оценки рассчитывается оценка относительно набора данных POV Data (например, истории посещений пользователя или заданного набора тематических сайтов).
Ключевым механизмом является модификация "вероятности сброса" (Reset Probability или вектора телепортации) в алгоритме PageRank. В стандартном PageRank случайный переход возможен на любую страницу в вебе. В этой системе случайные переходы ограничиваются только набором URL, входящих в POV Data (On-topic URLs). Это приводит к тому, что весь поток авторитетности исходит из этого набора. Документы, тесно связанные ссылками с POV Data, получают более высокую персонализированную оценку и повышаются в выдаче.
Высокая. Патент описывает фундаментальную концепцию Personalized PageRank. Хотя методы персонализации Google значительно эволюционировали (используя машинное обучение и векторные представления), базовая идея использования персонального контекста или тематического фокуса для влияния на оценку авторитетности остается критически важной в современных поисковых и рекомендательных системах.
Патент имеет высокое стратегическое значение (85/100). Он демонстрирует, что авторитетность не является статичной глобальной метрикой, а может быть динамической и персонализированной. Это подчеркивает важность не только построения общего ссылочного профиля, но и необходимость становиться часто посещаемым, сохраняемым ресурсом для целевой аудитории, чтобы попасть в их POV Data и получить преимущество в персонализированной выдаче.
POV. Включает историю просмотров пользователя (browsing history), закладки (bookmarks/favorites), ключевые слова, категории, On-topic URLs и Off-topic URLs.POV. Являются основой для смещения ранжирования.Personalized PageRank).PageRank — вероятность того, что пользователь совершит случайный переход ("телепортацию") на страницу. Модификация этого вектора является ядром изобретения.POV Data.Claim 1 (Независимый пункт): Описывает основной метод персонализированного поиска.
POV data до получения запроса. POV data включает набор URL, связанных с документами, ранее посещенными пользователем.POV data.Ключевой аспект — использование истории посещений пользователя как основы для фильтрации текущего поиска (персонализация).
Claim 13 и 14 (Зависимые от 1): Детализируют технический механизм фильтрации (Personalized PageRank).
Reset Probability для URL в наборе POV data (On-topic URLs) в значение 1/k (где k — количество URL в наборе). (Claim 13)Reset Probability для всех остальных URL (не входящих в POV data) в ноль (0). (Claim 14)PageRank), основанного на этих установленных вероятностях.Это описывает ключевую инновацию: вектор телепортации полностью концентрируется на наборе POV. Авторитет (Rank) в этой модели распространяется исключительно из этого набора, меняя PageRank с глобальной оценки на персонализированную или тематическую.
Claims 4-8 (Зависимые): Описывают методы расширения исходного набора POV data. Включают поиск по ключевым словам, извлеченным из POV data (Claim 5), и добавление URL, которые совместно цитируются (co-cited) с URL из исходного набора (Claim 8).
Claim 34 (Независимый пункт): Расширяет определение источников POV Data, включая адреса, связанные с документом, текущим или недавно просмотренным пользователем, или находящимся в списке избранного (favorites list).
Изобретение затрагивает несколько этапов поиска, интегрируя контекст и данные пользователя в процесс ранжирования.
CRAWLING & INDEXING – Сканирование, Индексирование
На этом этапе строится глобальный граф ссылок, необходимый для расчетов PageRank. Также должна существовать инфраструктура для сбора и хранения персональных данных пользователя (POV Data).
QUNDERSTANDING – Понимание Запросов (и Контекста)
Система извлекает POV Data пользователя для определения контекста. В некоторых вариантах (Claim 27) POV Data может использоваться для дополнения (augmentation) исходного запроса (например, добавление уточняющих слов на основе истории пользователя).
RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. После генерации базового набора релевантных документов система применяет фильтрацию. Рассчитывается Personalized PageRank для документов-кандидатов с использованием POV Data пользователя в качестве вектора Reset Probability. Результаты переупорядочиваются на основе этих персонализированных оценок.
Входные данные:
POV Data пользователя (история, закладки, категории, указанные URL).Выходные данные:
POV и отсортированный с учетом модифицированного PageRank.POV Data.Алгоритм применяется при выполнении одного из условий:
POV Data для пользователя (история просмотров, закладки) для осмысленного смещения результатов.Процесс реализации Personalized PageRank на основе POV Data.
POV Data пользователя (например, из истории посещений).POV Data устанавливается Reset Probability равная 1/K (или взвешенное значение w(A)).Reset Probability устанавливается равной 0.PageRank, используя модифицированный вектор Reset Probability. Расчет производится по формуле:Personalized PageRank), доказывающий, что PageRank может быть не глобальной статичной метрикой, а динамической оценкой, зависящей от контекста пользователя (POV).Reset Probability). Концентрация случайных переходов на POV Data делает эти документы эксклюзивными источниками авторитетности в данной модели расчета.Personalized PageRank получают не только сайты из POV Data, но и те сайты, которые находятся близко к ним в графе ссылок (т.е. на которые часто ссылаются из "любимых" сайтов пользователя).POV Data и получает прямое преимущество в персонализированном ранжировании.POV Data).POV Data пользователей и повышает Personalized PageRank.POV Data пользователя, хороший Personalized PageRank будет эффективно распространяться на связанные страницы внутри кластера.POV Data вашими URL.POV Data и не дают долгосрочных преимуществ в рамках описанного механизма персонализации.Personalized PageRank, даже если эти ресурсы имеют высокий глобальный авторитет.Этот патент является одним из основополагающих документов в области персонализированного поиска. Он демонстрирует, как классические алгоритмы (PageRank) могут быть адаптированы для учета индивидуальных предпочтений. Для SEO это означает переход от борьбы за абстрактный глобальный авторитет к борьбе за внимание, лояльность и тематическую релевантность для конкретных пользователей. Долгосрочная стратегия должна фокусироваться на построении ресурса, который становится неотъемлемой частью информационного потребления целевой аудитории.
Сценарий 1: Персонализированный поиск по запросу "Jaguar"
Reset Probability устанавливается в 1/3 для каждого из этих трех сайтов и 0 для всех остальных (включая сайты о животном ягуар).Personalized PageRank. Сайты о животном получают близкий к нулю балл.Сценарий 2: Тематический поиск (Поиск в категории)
On-topic URLs (k=50).Reset Probability распределяется между этими 50 сайтами.Что такое Personalized PageRank (PPR) простыми словами?
В стандартном PageRank авторитет распределяется по всему интернету равномерно. В Personalized PageRank авторитет распределяется преимущественно от тех сайтов, которые пользователь предпочитает (его история, закладки). Если вы часто читаете New York Times, то для вас NYT и сайты, на которые он ссылается, будут считаться более авторитетными.
Что такое "Reset Probability" и как оно используется в этом патенте?
Reset Probability — это вероятность того, что пользователь совершит случайный переход ("телепортацию") на страницу вместо следования по ссылкам. В этом патенте это ключевой механизм персонализации: вероятность перехода устанавливается только для сайтов из персонального набора пользователя (POV Data), а для всех остальных сайтов она равна нулю. Это заставляет алгоритм PageRank вращаться вокруг интересов пользователя.
Что входит в состав "Point-of-View (POV) Data"?
Патент перечисляет несколько источников: история посещений (ранее, недавно или текущие просматриваемые страницы), список закладок (Favorites), явно указанные пользователем предпочтительные (On-topic) или нежелательные (Off-topic) URL, выбранные категории интересов, а также данные из предыдущих поисковых сессий.
Как SEO-специалист может повлиять на Personalized PageRank своего сайта?
Есть два основных пути. Первый — добиться того, чтобы ваш сайт попал в POV Data пользователя, стимулируя повторные визиты и добавление в закладки. Второй — обеспечить ссылочную близость к сайтам, которые уже находятся в POV Data вашей целевой аудитории, получая ссылки с релевантных авторитетных ресурсов.
Означает ли это, что глобальный PageRank больше не важен?
Нет, глобальный PageRank по-прежнему важен как общий сигнал авторитетности и для ранжирования при отсутствии данных для персонализации. Однако этот патент показывает, что Personalized PageRank может переопределять глобальные оценки, если у пользователя есть четко выраженные предпочтения в данной теме.
Как система расширяет набор POV Data?
Патент предлагает автоматическое расширение. Один метод — анализ со-цитирования (если сайт А и сайт Б часто упоминаются вместе, и сайт А уже в POV Data, то сайт Б может быть добавлен). Второй — извлечение ключевых слов из POV Data, выполнение поиска по ним и добавление топовых результатов в набор.
Насколько актуален этот механизм сегодня?
Концепция Personalized PageRank остается фундаментальной. Хотя современные системы Google используют более сложные методы персонализации (например, основанные на машинном обучении и векторах), идея использования истории пользователя для корректировки авторитетности по-прежнему актуальна и применяется в системах поиска.
Как этот патент влияет на стратегию линкбилдинга?
Он смещает фокус с получения любых авторитетных ссылок на получение ссылок с сайтов, которые любит ваша целевая аудитория. Ссылка с нишевого ресурса, который часто посещают ваши потенциальные клиенты, может дать больший прирост Personalized PageRank для этих пользователей, чем ссылка с общего новостного портала.
Может ли этот механизм понизить мой сайт в выдаче?
Да, косвенно. Если конкуренты лучше соответствуют POV Data пользователя (чаще посещаются им или имеют лучшие связи с его любимыми сайтами), они получат буст за счет Personalized PageRank и вытеснят ваш сайт с топовых позиций в персонализированной выдаче этого пользователя.
Влияет ли этот механизм на пользователей в режиме Инкогнито?
В режиме Инкогнито или при отсутствии истории поиска у системы нет доступа к основным источникам POV Data (истории посещений, закладкам). В таких случаях механизм Personalized PageRank, описанный в патенте, не может быть эффективно применен, и система будет полагаться на стандартное ранжирование и неперсонализированные сигналы.

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Ссылки

Персонализация
Поведенческие сигналы
SERP

Техническое SEO
SERP
Ссылки

Мультиязычность
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Персонализация
SERP

Knowledge Graph
Семантика и интент
EEAT и качество

Поведенческие сигналы
Мультимедиа
Семантика и интент

Структура сайта
Техническое SEO
Ссылки

Поведенческие сигналы
Семантика и интент
Мультимедиа

Индексация
Ссылки
SERP
