Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет «точку зрения» пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
Описание
Какую задачу решает
Патент решает проблему предоставления универсальных результатов поиска, которые не учитывают индивидуальный контекст, интересы или «точку зрения» (Point-of-View, POV) пользователя. Цель изобретения — повысить релевантность выдачи путем ее смещения (biasing) в сторону предпочтений пользователя (персонализация) или заданной тематики. Это позволяет избежать недостатков существовавших методов (например, HITS), которые были уязвимы для спама и дрейфа темы.
Что запатентовано
Запатентована система выполнения поиска с учетом «точки зрения» (POV Searching), которая реализуется через модификацию алгоритма PageRank (часто называемую Personalized PageRank). Суть изобретения заключается в изменении способа расчета авторитетности: вместо глобальной оценки рассчитывается оценка относительно набора данных POV Data (например, истории посещений пользователя или заданного набора тематических сайтов).
Как это работает
Ключевым механизмом является модификация «вероятности сброса» (Reset Probability или вектора телепортации) в алгоритме PageRank. В стандартном PageRank случайный переход возможен на любую страницу в вебе. В этой системе случайные переходы ограничиваются только набором URL, входящих в POV Data (On-topic URLs). Это приводит к тому, что весь поток авторитетности исходит из этого набора. Документы, тесно связанные ссылками с POV Data, получают более высокую персонализированную оценку и повышаются в выдаче.
Актуальность для SEO
Высокая. Патент описывает фундаментальную концепцию Personalized PageRank. Хотя методы персонализации Google значительно эволюционировали (используя машинное обучение и векторные представления), базовая идея использования персонального контекста или тематического фокуса для влияния на оценку авторитетности остается критически важной в современных поисковых и рекомендательных системах.
Важность для SEO
Патент имеет высокое стратегическое значение (85/100). Он демонстрирует, что авторитетность не является статичной глобальной метрикой, а может быть динамической и персонализированной. Это подчеркивает важность не только построения общего ссылочного профиля, но и необходимость становиться часто посещаемым, сохраняемым ресурсом для целевой аудитории, чтобы попасть в их POV Data и получить преимущество в персонализированной выдаче.
Детальный разбор
Термины и определения
- Point-of-View (POV) (Точка зрения)
- Контекст, в рамках которого выполняется поиск. Определяет предпочтения пользователя или тематические ограничения.
- POV Data (Данные точки зрения)
- Информация, определяющая POV. Включает историю просмотров пользователя (browsing history), закладки (bookmarks/favorites), ключевые слова, категории, On-topic URLs и Off-topic URLs.
- On-topic URLs (Тематические URL)
- Набор URL, служащих положительными примерами для POV. Являются основой для смещения ранжирования.
- PageRank™
- Алгоритм ранжирования, основанный на анализе ссылок. В патенте используется его модифицированная версия (Personalized PageRank).
- Reset Probability (Вероятность сброса / Вектор телепортации)
- В алгоритме PageRank — вероятность того, что пользователь совершит случайный переход («телепортацию») на страницу. Модификация этого вектора является ядром изобретения.
- Co-citation (Совместное цитирование)
- Ситуация, когда один документ ссылается на два других. Используется как метод расширения набора POV Data.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод персонализированного поиска.
- Получение поискового запроса.
- Хранение POV data до получения запроса. POV data включает набор URL, связанных с документами, ранее посещенными пользователем.
- Генерация списка документов на основе запроса.
- Фильтрация списка документов на основе POV data.
- Представление отфильтрованного списка.
Ключевой аспект — использование истории посещений пользователя как основы для фильтрации текущего поиска (персонализация).
Claim 13 и 14 (Зависимые от 1): Детализируют технический механизм фильтрации (Personalized PageRank).
- Установка Reset Probability для URL в наборе POV data (On-topic URLs) в значение (где k — количество URL в наборе). (Claim 13)
- Установка Reset Probability для всех остальных URL (не входящих в POV data) в ноль (0). (Claim 14)
- Присвоение оценок документам с использованием метода ранжирования (PageRank), основанного на этих установленных вероятностях.
Это описывает ключевую инновацию: вектор телепортации полностью концентрируется на наборе POV. Авторитет (Rank) в этой модели распространяется исключительно из этого набора, меняя PageRank с глобальной оценки на персонализированную или тематическую.
Claims 4-8 (Зависимые): Описывают методы расширения исходного набора POV data. Включают поиск по ключевым словам, извлеченным из POV data (Claim 5), и добавление URL, которые совместно цитируются (co-cited) с URL из исходного набора (Claim 8).
Claim 34 (Независимый пункт): Расширяет определение источников POV Data, включая адреса, связанные с документом, текущим или недавно просмотренным пользователем, или находящимся в списке избранного (favorites list).
Где и как применяется
Изобретение затрагивает несколько этапов поиска, интегрируя контекст и данные пользователя в процесс ранжирования.
CRAWLING & INDEXING – Сканирование, Индексирование
На этом этапе строится глобальный граф ссылок, необходимый для расчетов PageRank. Также должна существовать инфраструктура для сбора и хранения персональных данных пользователя (POV Data).
QUNDERSTANDING – Понимание Запросов (и Контекста)
Система извлекает POV Data пользователя для определения контекста. В некоторых вариантах (Claim 27) POV Data может использоваться для дополнения (augmentation) исходного запроса (например, добавление уточняющих слов на основе истории пользователя).
RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. После генерации базового набора релевантных документов система применяет фильтрацию. Рассчитывается Personalized PageRank для документов-кандидатов с использованием POV Data пользователя в качестве вектора Reset Probability. Результаты переупорядочиваются на основе этих персонализированных оценок.
Входные данные:
- Поисковый запрос пользователя.
- POV Data пользователя (история, закладки, категории, указанные URL).
- Глобальный граф ссылок.
Выходные данные:
- Список результатов поиска, смещенный в сторону POV и отсортированный с учетом модифицированного PageRank.
На что влияет
- Персонализация поиска: Результаты адаптируются под интересы пользователя на основе его предыдущего поведения. Особенно сильно влияет на неоднозначные запросы (например, «Ягуар»).
- Тематический поиск: Позволяет ограничить поиск определенной областью (например, поиском внутри категории каталога или среди набора доверенных сайтов), используя тематические URL как POV Data.
Когда применяется
Алгоритм применяется при выполнении одного из условий:
- Автоматически (Персонализация): Когда у системы есть достаточный объем POV Data для пользователя (история просмотров, закладки) для осмысленного смещения результатов.
- Явный запрос пользователя: Пользователь предоставляет примеры URL или выбирает категорию для ограничения поиска (как показано в патенте на примере интерфейса Advanced Search).
Пошаговый алгоритм
Процесс реализации Personalized PageRank на основе POV Data.
- Получение запроса и POV Data: Система получает запрос и извлекает набор URL-адресов (K штук), составляющих POV Data пользователя (например, из истории посещений).
- Генерация первичных результатов: Система выполняет стандартный поиск и формирует список релевантных документов.
- Инициализация вектора персонализации (Reset Probability):
- Для каждого URL в наборе POV Data устанавливается Reset Probability равная (или взвешенное значение w(A)).
- Для всех остальных URL в вебе Reset Probability устанавливается равной 0.
- Расчет Personalized PageRank: Система рассчитывает оценки PageRank, используя модифицированный вектор Reset Probability. Расчет производится по формуле:
Выводы
- Авторитетность является контекстной и персонализированной: Патент демонстрирует конкретный механизм (Personalized PageRank), доказывающий, что PageRank может быть не глобальной статичной метрикой, а динамической оценкой, зависящей от контекста пользователя (POV).
- Механизм смещения PageRank через Reset Vector: Ключевой технический прием — модификация вектора телепортации (Reset Probability). Концентрация случайных переходов на POV Data делает эти документы эксклюзивными источниками авторитетности в данной модели расчета.
- Важность истории пользователя: История посещений, закладки и прошлые поиски явно указаны как первичные входные данные. Поведение пользователя напрямую формирует его будущую выдачу.
- Ссылочная близость к предпочтениям пользователя: Высокий Personalized PageRank получают не только сайты из POV Data, но и те сайты, которые находятся близко к ним в графе ссылок (т.е. на которые часто ссылаются из «любимых» сайтов пользователя).
- Лояльность пользователя как фактор ранжирования: Патент подчеркивает важность формирования лояльной аудитории. Если сайт часто посещается или добавляется в закладки, он становится частью POV Data и получает прямое преимущество в персонализированном ранжировании.
Практика
Best practices (это мы делаем)
- Стимулирование лояльности и повторных визитов: Разрабатывайте стратегии для поощрения пользователей возвращаться на сайт и добавлять его в закладки (например, через email-рассылки, обновления контента, полезные инструменты). Цель — стать частью регулярной истории посещений пользователя (POV Data).
- Целевой линкбилдинг на основе аудитории (Link Neighborhoods): Анализируйте, какие сайты уже являются авторитетными и часто посещаемыми для вашей целевой аудитории. Получение ссылок с этих ресурсов критически важно, так как это увеличивает ссылочную близость к вероятному набору POV Data пользователей и повышает Personalized PageRank.
- Сильная внутренняя перелинковка и тематические кластеры: Создавайте плотно связанные кластеры контента. Если одна страница попадает в POV Data пользователя, хороший Personalized PageRank будет эффективно распространяться на связанные страницы внутри кластера.
- Развитие бренда и узнаваемости: Укрепляйте бренд, чтобы пользователи чаще выбирали ваш сайт в выдаче и взаимодействовали с ним, тем самым пополняя свои POV Data вашими URL.
Worst practices (это делать не надо)
- Игнорирование персонализации: Разработка SEO-стратегии исключительно на основе глобальных метрик авторитетности без учета того, как персонализация влияет на реальную видимость сайта для целевой аудитории.
- Фокус на разовом трафике (Кликбейт): Стратегии, направленные на привлечение разовых посетителей, не способствуют попаданию в POV Data и не дают долгосрочных преимуществ в рамках описанного механизма персонализации.
- Нецелевой линкбилдинг: Построение ссылок с ресурсов, которые не посещаются вашей целевой аудиторией, неэффективно для повышения Personalized PageRank, даже если эти ресурсы имеют высокий глобальный авторитет.
Стратегическое значение
Этот патент является одним из основополагающих документов в области персонализированного поиска. Он демонстрирует, как классические алгоритмы (PageRank) могут быть адаптированы для учета индивидуальных предпочтений. Для SEO это означает переход от борьбы за абстрактный глобальный авторитет к борьбе за внимание, лояльность и тематическую релевантность для конкретных пользователей. Долгосрочная стратегия должна фокусироваться на построении ресурса, который становится неотъемлемой частью информационного потребления целевой аудитории.
Практические примеры
Сценарий 1: Персонализированный поиск по запросу «Jaguar»
- Пользователь: Автомобильный энтузиаст.
- POV Data (История просмотров): Включает сайты motor-trend.com, caranddriver.com, jaguarusa.com (k=3).
- Запрос: «Jaguar».
- Модификация PageRank: Reset Probability устанавливается в 1/3 для каждого из этих трех сайтов и 0 для всех остальных (включая сайты о животном ягуар).
- Расчет: Авторитетность распространяется только от этих трех автомобильных сайтов. Сайты, тесно связанные с ними (например, обзоры моделей, дилеры), получают высокий Personalized PageRank. Сайты о животном получают близкий к нулю балл.
- Результат: Выдача сильно смещена в сторону автомобилей Jaguar.
Сценарий 2: Тематический поиск (Поиск в категории)
- Пользователь: SEO-специалист.
- Действие: Пользователь выбирает поиск внутри категории «SEO» в гипотетическом каталоге.
- Запрос: «Link building strategies».
- POV Data: Система использует все URL, перечисленные в категории «SEO» (например, 50 сайтов), как On-topic URLs (k=50).
- Модификация PageRank: Reset Probability распределяется между этими 50 сайтами.
- Результат: В выдаче будут преобладать документы, которые наиболее авторитетны именно в контексте SEO-сообщества (тесно связаны ссылками с сайтами из категории), а не общие маркетинговые статьи.
Вопросы и ответы
Что такое Personalized PageRank (PPR) простыми словами?
В стандартном PageRank авторитет распределяется по всему интернету равномерно. В Personalized PageRank авторитет распределяется преимущественно от тех сайтов, которые пользователь предпочитает (его история, закладки). Если вы часто читаете New York Times, то для вас NYT и сайты, на которые он ссылается, будут считаться более авторитетными.
Что такое «Reset Probability» и как оно используется в этом патенте?
Reset Probability — это вероятность того, что пользователь совершит случайный переход («телепортацию») на страницу вместо следования по ссылкам. В этом патенте это ключевой механизм персонализации: вероятность перехода устанавливается только для сайтов из персонального набора пользователя (POV Data), а для всех остальных сайтов она равна нулю. Это заставляет алгоритм PageRank вращаться вокруг интересов пользователя.
Что входит в состав «Point-of-View (POV) Data»?
Патент перечисляет несколько источников: история посещений (ранее, недавно или текущие просматриваемые страницы), список закладок (Favorites), явно указанные пользователем предпочтительные (On-topic) или нежелательные (Off-topic) URL, выбранные категории интересов, а также данные из предыдущих поисковых сессий.
Как SEO-специалист может повлиять на Personalized PageRank своего сайта?
Есть два основных пути. Первый — добиться того, чтобы ваш сайт попал в POV Data пользователя, стимулируя повторные визиты и добавление в закладки. Второй — обеспечить ссылочную близость к сайтам, которые уже находятся в POV Data вашей целевой аудитории, получая ссылки с релевантных авторитетных ресурсов.
Означает ли это, что глобальный PageRank больше не важен?
Нет, глобальный PageRank по-прежнему важен как общий сигнал авторитетности и для ранжирования при отсутствии данных для персонализации. Однако этот патент показывает, что Personalized PageRank может переопределять глобальные оценки, если у пользователя есть четко выраженные предпочтения в данной теме.
Как система расширяет набор POV Data?
Патент предлагает автоматическое расширение. Один метод — анализ со-цитирования (если сайт А и сайт Б часто упоминаются вместе, и сайт А уже в POV Data, то сайт Б может быть добавлен). Второй — извлечение ключевых слов из POV Data, выполнение поиска по ним и добавление топовых результатов в набор.
Насколько актуален этот механизм сегодня?
Концепция Personalized PageRank остается фундаментальной. Хотя современные системы Google используют более сложные методы персонализации (например, основанные на машинном обучении и векторах), идея использования истории пользователя для корректировки авторитетности по-прежнему актуальна и применяется в системах поиска.
Как этот патент влияет на стратегию линкбилдинга?
Он смещает фокус с получения любых авторитетных ссылок на получение ссылок с сайтов, которые любит ваша целевая аудитория. Ссылка с нишевого ресурса, который часто посещают ваши потенциальные клиенты, может дать больший прирост Personalized PageRank для этих пользователей, чем ссылка с общего новостного портала.
Может ли этот механизм понизить мой сайт в выдаче?
Да, косвенно. Если конкуренты лучше соответствуют POV Data пользователя (чаще посещаются им или имеют лучшие связи с его любимыми сайтами), они получат буст за счет Personalized PageRank и вытеснят ваш сайт с топовых позиций в персонализированной выдаче этого пользователя.
Влияет ли этот механизм на пользователей в режиме Инкогнито?
В режиме Инкогнито или при отсутствии истории поиска у системы нет доступа к основным источникам POV Data (истории посещений, закладкам). В таких случаях механизм Personalized PageRank, описанный в патенте, не может быть эффективно применен, и система будет полагаться на стандартное ранжирование и неперсонализированные сигналы.