Патент Google, описывающий механизм переменной персонализации. Система рассчитывает «значения повышения» (Boost Values) для авторитетных сайтов, анализируя граф сайтов (Site Graph) и распространение авторитета от доверенных источников (Seed Sites). Пользователь может динамически контролировать (например, ползунком), насколько сильно его профиль интересов влияет на ранжирование.
Описание
Какую задачу решает
Патент решает две ключевые проблемы. Во-первых, стандартные результаты поиска могут точно соответствовать запросу, но не отражать глубинные интересы пользователя (например, запрос «Stanford» для музыканта и программиста). Во-вторых, он устраняет недостаток «всегда включенной» персонализации, предоставляя пользователю возможность контролировать, когда и в какой степени его интересы должны влиять на ранжирование выдачи.
Что запатентовано
Запатентована система для переменной персонализации результатов поиска. Ядром системы является использование профиля интересов пользователя (Interest Profile), который связывает определенные темы с Boost Values (значениями повышения) для конкретных сайтов. Ключевым элементом является интерфейсный контроллер (например, ползунок), позволяющий пользователю динамически регулировать степень влияния этих Boost Values на итоговое ранжирование результатов.
Как это работает
Система работает следующим образом:
- Определение интересов: Пользователь явно выбирает интересующие его темы из каталога (например, Open Directory Project), формируя свой Interest Profile.
- Расчет авторитетности (Офлайн): Система заранее рассчитывает Boost Values для сайтов, которые являются авторитетными в этих темах. Это делается путем анализа ссылок в Site Graph, начиная с доверенных источников (Seed Sites).
- Обработка запроса (Онлайн): Пользователь вводит запрос. Система генерирует два набора результатов: базовый (R_base) и полностью персонализированный (R_in).
- Переменное применение бустинга: Пользователь использует контроллер (ползунок) для установки желаемого уровня персонализации (от 0% до 100%).
- Динамическое переранжирование: Система интерполирует результаты и генерирует предварительно рассчитанные Ranking Vectors для всех позиций ползунка. Переранжирование происходит мгновенно на стороне клиента без перезагрузки страницы.
Актуальность для SEO
Средне-Высокая. Конкретная реализация интерфейса (явный выбор интересов и ползунок) устарела, так как Google перешел к неявной автоматической персонализации. Однако базовые концепции патента критически важны. Механизмы расчета авторитетности в рамках конкретных тем (Site Graph, Seed Sites) и использования тематических Boost Values лежат в основе современных систем персонализированного поиска и концепций E-E-A-T и Topical Authority.
Важность для SEO
Патент имеет значительное стратегическое значение для SEO (7.5/10). Он детализирует конкретный алгоритм (S0/S1/S2 и Claims 11-12), как Google может идентифицировать авторитетные сайты для конкретных тем путем расчета Boost Values через анализ Site Graph. Понимание этих механизмов критически важно для построения тематического авторитета и разработки эффективных стратегий линкбилдинга.
Детальный разбор
Термины и определения
- Boost Value (Значение повышения, Буст)
- Множитель, связанный с конкретным сайтом и конкретной темой. Отражает тематическую авторитетность сайта. Используется для увеличения IR Score документа, если он соответствует интересам пользователя.
- Information Retrieval (IR) Score (Оценка информационного поиска)
- Базовая числовая оценка релевантности документа запросу, предоставляемая поисковой системой.
- Interest Profile (Профиль интересов пользователя)
- Набор данных, представляющий темы (категории), которые интересуют пользователя. В контексте патента формируется пользователем явно.
- Personalization Controller (Контроллер персонализации)
- Элемент пользовательского интерфейса (например, ползунок, шкала, радиокнопки), позволяющий пользователю выбирать степень влияния его Interest Profile на ранжирование результатов.
- Ranking Vector / Arrangement Vector (Вектор ранжирования/упорядочивания)
- Предварительно рассчитанный вектор, определяющий порядок сортировки результатов поиска для конкретного положения контроллера. Используется для быстрого переранжирования на стороне клиента.
- S0, S1, S2 (Начальные и производные наборы сайтов)
- Этапы расчета авторитетности. S0 (Seed Sites) — начальные доверенные сайты из каталога по теме. S1 — сайты, на которые активно ссылаются из S0. S2 — сайты, на которые активно ссылаются из S1. Сайты в S2 получают итоговые Boost Values.
- Site Graph (Граф сайтов)
- Структура данных, используемая для расчета Boost Values. Узлы представляют сайты, а взвешенные ребра основаны на количестве ссылок между страницами этих сайтов.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод персонализации результатов поиска с переменным контролем.
- Получение Interest Profile пользователя (включает темы и связанные с ними Boost Values для сайтов).
- Получение от пользователя поискового запроса И ввода персонализации (personalization input), который представляет степень влияния профиля интересов.
- Ранжирование набора документов на основе базовых IR Scores.
- Корректировка IR Scores документов с использованием соответствующих Boost Values.
- Переранжирование набора документов на основе скорректированных IR Scores.
- Представление переранжированного набора.
Claims 11-12 (Зависимые): Критически важны для SEO. Описывают метод определения Boost Values на основе ссылочного графа.
- Система определяет, содержится ли документ на первом сайте, на который ссылается второй сайт.
- Второй сайт должен быть связан с темой из Interest Profile пользователя.
- Boost Value для первого сайта основан на количестве ссылок со второго сайта на первый (Claim 12).
Этот механизм описывает расчет тематической авторитетности (Topical Authority) через ссылочный граф. Если авторитетный в теме сайт (Сайт 2) ссылается на другой сайт (Сайт 1), Сайт 1 получает тематический буст.
Claim 14 (Зависимый): Уточняет эффективность процесса. Переранжирование происходит динамически, без повторного выполнения поиска (without re-executing the search).
Claim 16 (Зависимый): Описывает механизм для быстрого переключения.
Определяются множественные Ranking Vectors, связанные с разными позициями контроллера. Выбор одного из векторов на основе текущей позиции контроллера позволяет мгновенно обновить выдачу.
Анализ Описания (Description): В описании детализируется офлайн-метод расчета Boost Values (алгоритм S0/S1/S2), который интерпретирует Claims 11-12.
- Генерируется Site Graph.
- Для темы выбираются начальные сайты (S0) из каталога (например, Open Directory).
- Идентифицируется набор S1 (на кого ссылаются S0) с присвоением весов.
- Идентифицируется набор S2 (на кого ссылаются S1) с присвоением весов.
- Сайты в S2 получают итоговые Boost Values.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, а также взаимодействие с клиентом.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-обработка. Система строит Site Graph. Используя Seed Sites (S0) из каталога (например, ODP), система рассчитывает тематические Boost Values с помощью алгоритма S0/S1/S2.
RANKING – Ранжирование
Система генерирует два набора результатов: базовый (R_base, без персонализации) и полностью персонализированный (R_in, с применением 100% Boost Values на основе Interest Profile пользователя).
RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основной этап применения логики патента. Система объединяет R_base и R_in в общий список (R_all). Затем она рассчитывает промежуточные ранжирования (интерполяция) и генерирует Ranking Vectors для каждой позиции контроллера.
Client-Side (Браузер пользователя)
Все данные (R_all и Ranking Vectors) отправляются клиенту. Взаимодействие пользователя с контроллером обрабатывается локально (например, с помощью Javascript) для мгновенной пересортировки результатов без обращения к серверу.
Входные данные:
- Поисковый запрос (Q) и Interest Profile (IN).
- Ввод персонализации (позиция ползунка).
- Предварительно рассчитанные Boost Values и Site Graph.
Выходные данные:
- R_all (список всех уникальных результатов).
- Набор Ranking Vectors (по одному для каждой позиции контроллера).
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на многозначные или широкие запросы, где базовые интересы пользователя значительно меняют релевантность результатов (например, запрос «Stanford» для пользователя с интересом «Computers» против «Music»).
- Конкретные ниши или тематики: Влияет на видимость сайтов, которые система идентифицировала как авторитетные (высокий Boost Value) в конкретных тематиках.
Когда применяется
- Условия применения: Алгоритм активен, только если пользователь предварительно определил свой Interest Profile (выбрал темы).
- Триггеры активации: Динамическое переранжирование активируется, когда пользователь взаимодействует с контроллером персонализации.
Пошаговый алгоритм
Процесс А: Офлайн-расчет авторитетности (Индексирование)
- Построение Site Graph: Создается граф, где узлы — это сайты, а ребра взвешены по количеству ссылок между ними.
- Идентификация Seed Sites (S0): Для каждой темы в каталоге (например, Open Directory Project) выбираются начальные авторитетные сайты (S0).
- Распространение авторитетности (Итерация 1): Идентифицируются сайты (S1), на которые активно ссылаются сайты из S0. Сайтам S1 присваиваются веса.
- Распространение авторитетности (Итерация 2): Идентифицируются сайты (S2), на которые активно ссылаются сайты из S1. Сайтам S2 присваиваются веса.
- Определение Boost Values: Веса сайтов S2 используются как Boost Values для соответствующей темы. Создаются маппинги {Сайт -> Буст} для каждой темы.
Процесс Б: Обработка запроса (Онлайн)
- Получение данных: Система получает запрос (Q) и Interest Profile (IN) пользователя.
- Генерация результатов: Поисковая система генерирует два набора результатов:
- R_base: Обычные результаты без персонализации.
- R_in: Персонализированные результаты, где IR Scores документов умножаются на соответствующие Boost Values, если документ принадлежит авторитетному сайту в теме из IN.
- Объединение результатов: R_base и R_in объединяются в список всех уникальных результатов R_all. Каждому результату присваивается идентификатор.
- Расчет интерполяции и векторов: Система рассчитывает промежуточные ранжирования для всех позиций контроллера (например, 11 позиций от 0 до 10). Генерируются 11 Ranking Vectors.
- Отправка данных клиенту: R_all и все Ranking Vectors отправляются в браузер пользователя.
Процесс В: Взаимодействие с пользователем (Client-Side)
- Отображение: Результаты отображаются в соответствии с начальной позицией контроллера.
- Взаимодействие: Пользователь перемещает ползунок в позицию X.
- Динамическое переранжирование: Скрипт в браузере использует Ranking Vector X для мгновенной пересортировки списка R_all.
Какие данные и как использует
Данные на входе
- Ссылочные факторы: Играют ключевую роль в офлайн-процессе. Ссылки между сайтами (Site Graph) используются для расчета Boost Values. Анализируется, какие тематически авторитетные сайты ссылаются на другие ресурсы (Claims 11, 12, алгоритм S0/S1/S2).
- Пользовательские факторы: Interest Profile пользователя — явно указанные им темы интересов.
- Внешние данные: Тематические каталоги (например, Open Directory Project) используются для определения начальных авторитетных сайтов (Seed Sites / S0).
- Системные данные: Базовые IR Scores, рассчитанные стандартными алгоритмами ранжирования.
Какие метрики используются и как они считаются
- Boost Value: Метрика тематической авторитетности сайта. Рассчитывается офлайн на основе анализа Site Graph. Метод расчета включает итеративное распространение веса от Seed Sites (S0) через два уровня ссылок (до S2). Чем больше ссылок с авторитетных в теме сайтов, тем выше Boost Value.
- IR Score (Adjusted): Скорректированная оценка ранжирования. Рассчитывается путем применения Boost Value к базовому IR Score. Степень применения буста зависит от положения контроллера персонализации (от 0% до 100%).
- Ranking Vector: Вектор, определяющий порядок результатов для конкретного уровня персонализации. Рассчитывается путем интерполяции между базовым и полностью персонализированным ранжированием.
Выводы
- Алгоритм расчета тематической авторитетности (Boost Values): Патент описывает конкретный метод оценки авторитетности сайтов в рамках определенных тем (Topical Authority). Он использует анализ Site Graph и распространение веса через ссылки от уже известных авторитетных источников (Seed Sites) по схеме S0/S1/S2.
- Значение ссылок от тематических авторитетов (Claims 11-12): Патент явно утверждает, что Boost Value сайта увеличивается, если на него ссылаются другие сайты, связанные с этой темой, и зависит от количества этих ссылок. Это подтверждает критическую важность релевантного линкбилдинга.
- Авторитетность на уровне сайта: Boost Values рассчитываются на уровне сайта (хоста) и применяются ко всем страницам этого сайта, что подчеркивает важность общей авторитетности ресурса в теме.
- Переменная и контролируемая персонализация: Запатентован механизм, позволяющий пользователям явно контролировать интенсивность персонализации результатов поиска в реальном времени.
- Эффективность через предварительные вычисления: Динамическое переранжирование достигается без задержек за счет предварительного расчета Ranking Vectors и выполнения сортировки на стороне клиента.
- Стратегический контекст: Хотя интерфейс (ползунок) устарел, базовая инфраструктура для персонализированного бустинга на основе тематического авторитета является фундаментальной частью современного поиска (E-E-A-T).
Практика
Best practices (это мы делаем)
- Построение тематической авторитетности (Topical Authority): Необходимо сосредоточиться на том, чтобы сайт был признан системой как авторитетный источник в конкретной теме (получил высокий Boost Value). Это требует комплексного охвата темы контентом.
- Получение тематически релевантных ссылок: Механизм расчета Boost Values напрямую зависит от ссылок с сайтов, которые уже признаны релевантными данной теме (Claims 11, 12). Стратегия линкбилдинга должна фокусироваться на получении редакционных ссылок от установленных авторитетов в вашей нише.
- Анализ ссылочного графа ниши (Применение логики S0/S1/S2): Изучайте, кто на кого ссылается в вашей тематике. Определите ключевые авторитетные узлы (S0) и сайты, на которые они ссылаются (S1). Стремитесь получить ссылки с сайтов S1, чтобы ваш сайт был идентифицирован как S2 и получил тематический вес.
- Понимание интересов аудитории: Даже если сегодня персонализация происходит автоматически, этот патент подтверждает, что Google профилирует интересы пользователей и повышает контент, соответствующий этим профилям. Создавайте контент, который четко служит определенным Interest Profiles.
Worst practices (это делать не надо)
- Нерелевантный линкбилдинг: Получение общих или нетематических ссылок не поможет увеличить специфические Boost Values. Ссылки с сайтов вне вашего тематического Site Graph малоэффективны в этом контексте.
- Поверхностный контент: Создание разрозненного контента, который не позволяет установить авторитетность на уровне сайта, не позволит воспользоваться преимуществами персонализированного бустинга.
- Игнорирование E-E-A-T: Факторы, способствующие идентификации сайта как авторитетного источника (экспертиза, опыт), напрямую влияют на вероятность получения высокого Boost Value в соответствующей теме.
Стратегическое значение
Этот патент является фундаментальным для понимания персонализированного поиска и подтверждает переход от общей релевантности к тематической. Он подчеркивает, что авторитетность (E-E-A-T) рассчитывается не только глобально, но и в контексте конкретных тем (Topical Authority). Долгосрочная SEO-стратегия должна быть направлена на доминирование в конкретных тематических нишах и построение сильного тематического ссылочного профиля.
Практические примеры
Сценарий: Повышение авторитетности медицинского сайта (Применение логики S0/S1/S2)
Цель: Увеличить Boost Value нового медицинского сайта в теме «Health».
- Идентификация S0 (Seed Sites): Определить установленные авторитетные сайты. В описании патента упоминаются nih.gov, cdc.gov, med.stanford.edu.
- Идентификация S1: Проанализировать, на кого ссылаются сайты S0. Это могут быть специализированные медицинские журналы или исследовательские группы.
- Стратегия линкбилдинга (S1 -> S2): Добиваться получения редакционных ссылок с сайтов S1. Например, опубликовать исследование, которое процитирует журнал (S1).
- Механизм (согласно патенту): Анализ Site Graph (Claims 11, 12) обнаружит эти ссылки. Система идентифицирует ваш сайт как S2 и увеличит его Boost Value в теме «Health».
- Ожидаемый результат: Когда пользователь, интересующийся темой «Health» (явно или неявно), выполняет соответствующий запрос, ваш сайт получит более высокое персонализированное ранжирование благодаря примененному Boost Value.
Вопросы и ответы
Что такое «Boost Value» и как он рассчитывается?
Boost Value — это множитель, который увеличивает базовую оценку ранжирования (IR Score) документа, если он признан авторитетным в теме, интересующей пользователя. Он рассчитывается офлайн путем анализа Site Graph. Система определяет авторитетные сайты в теме (начиная с Seed Sites из каталогов типа ODP) и затем распространяет этот авторитет через ссылки по схеме S0/S1/S2. Если на ваш сайт ссылаются авторитетные в теме ресурсы, ваш Boost Value увеличивается (Claims 11, 12).
Что такое «Site Graph» и почему он важен для SEO?
Site Graph — это структура данных, где узлы представляют сайты, а ребра — ссылки между ними, взвешенные по их количеству. Он критически важен для SEO, так как используется для расчета Boost Values (тематической авторитетности). Это подчеркивает важность не просто получения ссылок, а получения ссылок от сайтов, которые находятся в вашем тематическом кластере и признаны авторитетными.
Что такое алгоритм S0/S1/S2 и как его использовать в линкбилдинге?
Это метод расчета тематической авторитетности через два уровня ссылок от доверенных источников (S0). В линкбилдинге это означает, что нужно идентифицировать ключевые авторитеты (S0) и сайты, на которые они ссылаются (S1). Ваша стратегическая цель — получить ссылки с сайтов S1. Это сигнализирует системе, что ваш сайт (S2) является частью доверенного тематического сообщества.
Использует ли Google этот ползунок персонализации сейчас?
Маловероятно, что этот конкретный UI используется в основном поиске Google в 2025 году, так как Google перешел к неявной (автоматической) персонализации. Однако базовые технологии — профилирование интересов, расчет тематических Boost Values и корректировка ранжирования на их основе — по-прежнему актуальны и лежат в основе современных алгоритмов.
Как этот патент связан с Topical Authority и E-E-A-T?
Патент напрямую связан с Topical Authority. Механизм расчета Boost Values — это, по сути, алгоритм определения тематической авторитетности сайта. Он показывает, что Google оценивает авторитетность (Authority в рамках E-E-A-T) не только глобально, но и в контексте конкретных тем, основываясь на связях в Site Graph.
Как я могу повысить «Boost Value» моего сайта в моей нише?
Ключевая стратегия, вытекающая из патента (Claims 11 и 12), — это получение ссылок от сайтов, которые уже признаны авторитетными в вашей нише. Используйте логику S0/S1/S2: определите ключевые авторитетные узлы (S0) и связанные с ними сайты (S1) в вашем тематическом Site Graph и сосредоточьте усилия на получении ссылок с них.
Влияет ли этот механизм на все страницы моего сайта?
Да. В патенте указано, что Boost Values рассчитываются для сайтов (например, nih.gov). Если сайт идентифицирован как авторитетный в теме, все страницы на этом сайте могут получить соответствующий буст при персонализированном поиске. Это подчеркивает важность общей авторитетности домена.
Что такое «Ranking Vector» (Вектор ранжирования)?
Ranking Vector — это техническое решение для обеспечения мгновенного переранжирования на стороне клиента. Вместо того чтобы пересчитывать ранжирование каждый раз, когда пользователь двигает ползунок, система заранее рассчитывает порядок результатов для каждой позиции ползунка и отправляет их все клиенту. Браузер просто переключается между этими векторами.
Как система определяет начальные авторитетные сайты (Seed Sites / S0) для темы?
Патент упоминает использование каталогов, таких как Open Directory Project (ODP), для выбора начального набора авторитетных сайтов (S0) для конкретной темы. От этих сайтов затем начинается расчет распространения авторитетности через Site Graph.
На каких этапах поиска работает этот алгоритм?
Он затрагивает несколько этапов. На этапе индексирования (офлайн) рассчитываются Site Graph и Boost Values (S0/S1/S2). На этапе ранжирования генерируются базовые и персонализированные результаты. На этапе переранжирования/смешивания рассчитываются Ranking Vectors. Финальная пересортировка происходит на стороне клиента (в браузере).