Google использует механизм для уточнения ранжирования, анализируя ссылочные связи исключительно между документами, уже попавшими в топ выдачи по конкретному запросу. Система рассчитывает оценку локальной авторитетности (LocalScore), повышая документы, на которые ссылаются другие релевантные результаты. При этом применяются строгие фильтры для учета разнообразия хостов и нейтрализации манипуляций.
Описание
Какую задачу решает
Патент решает задачу повышения качества ранжирования путем выявления наиболее авторитетных документов в контексте конкретного запроса. Он направлен на идентификацию «локальных авторитетов», чья значимость может отличаться от глобальных метрик (таких как PageRank). Система ищет документы, имеющие сильную «поддержку» (support) в виде ссылок от других документов, которые также признаны релевантными данному запросу.
Что запатентовано
Запатентован метод переранжирования (re-ranking) начального набора результатов поиска. Суть изобретения — в расчете оценки локальной взаимосвязанности (LocalScore) для каждого документа. Эта оценка базируется исключительно на анализе гиперссылок между документами внутри этого начального набора. Документы, на которые часто ссылаются другие высокорелевантные документы из набора, получают более высокий LocalScore и повышаются в итоговой выдаче.
Как это работает
Механизм активируется на этапе пост-ранжирования:
- Получение начального набора: Генерируется исходный набор релевантных документов с начальными оценками ранжирования (OldScore).
- Анализ локальных связей: Система анализирует ссылочный граф исключительно внутри этого набора.
- Фильтрация связей (Pruning): Применяются строгие фильтры для исключения манипуляций. Удаляются ссылки с того же хоста или аффилированных хостов (определяемых по IP-адресу). Если с одного хоста ссылается несколько страниц, учитывается только та, у которой наивысший OldScore.
- Расчет LocalScore: LocalScore вычисляется как взвешенная сумма OldScores ссылающихся на него документов (прошедших фильтрацию).
- Переранжирование: Вычисляется новая оценка (NewScore) путем комбинации OldScore и LocalScore. Результаты пересортировываются.
Актуальность для SEO
Высокая. Патент описывает механизм, тесно связанный с концепцией тематической авторитетности (Topical Authority) и алгоритмом Hilltop (изобретатель тот же — Krishna Bharat). Хотя конкретная реализация (анализ графа в реальном времени) могла эволюционировать, идея анализа локального ссылочного графа для определения авторитетности в контексте запроса остается фундаментальной и крайне актуальной для поисковых систем.
Важность для SEO
Влияние на SEO — высокое (8.5/10). Патент демонстрирует, что локальные, зависящие от запроса сигналы авторитетности могут корректировать глобальные сигналы. Это подчеркивает критическую важность получения ссылок не просто с авторитетных сайтов, а именно с тех страниц, которые сами высоко релевантны целевому запросу (имеют высокий OldScore). Также патент явно указывает на важность разнообразия хостов (Host Diversity) и механизмы нейтрализации ссылочных сетей (PBN).
Детальный разбор
Термины и определения
- OldScore(x)
- Начальная оценка релевантности документа X, полученная от основного компонента ранжирования до этапа переранжирования.
- LocalScore(x)
- Оценка локальной авторитетности документа X. Квантифицирует степень «поддержки» (support) документа X другими документами из того же начального набора результатов. Зависит от запроса.
- NewScore(x)
- Финальная, уточненная оценка ранжирования документа X, рассчитанная как функция от LocalScore(x) и OldScore(x).
- Local Inter-connectivity (Локальная взаимосвязанность)
- Структура гиперссылок между документами, ограниченная рамками начального набора результатов поиска по конкретному запросу.
- B(y)
- Множество документов внутри начального набора, которые имеют гиперссылку на документ X (до фильтрации).
- BackSet(y)
- Отфильтрованное и отсортированное подмножество B(y). Включает только топ-k документов из B(y) с наивысшими OldScores, прошедших фильтрацию по хостам.
- IP3(x)
- Первые три октета IP-адреса хоста документа X (IP-подсеть). Используется для идентификации документов с одного или близких/аффилированных хостов.
- Affiliated hosts (Аффилированные хосты)
- Хосты, которые считаются связанными или исходящими от одного владельца. Определяются по совпадению IP3(x), как зеркала сайта или другими методами.
- MaxLS и MaxOS
- Максимальные значения LocalScore и OldScore среди всех документов в начальном наборе. Используются для нормализации.
- MaxLSMin
- Минимальное пороговое значение для MaxLS. Используется для снижения влияния LocalScore, если в наборе результатов очень мало перекрестных ссылок.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает базовый метод генерации документов по запросу.
- Получение начального набора документов, релевантных запросу.
- Присвоение оценок релевантности (relevance scores) этим документам на основе перекрестных ссылок (cross references, т.е. гиперссылок) между документами внутри этого начального набора.
- Сортировка документов на основе присвоенных оценок.
Ядро изобретения — оценка релевантности базируется на анализе ссылок строго внутри топового набора результатов.
Claim 2 (Зависимый от 1): Уточняет механизм присвоения оценок, вводя концепцию начальных и уточненных оценок.
- Начальный набор имеет начальные оценки релевантности (initial relevance scores, т.е. OldScore).
- Вычисляется локальная оценка (local score value, т.е. LocalScore), которая квантифицирует степень поддержки (supported) документа другими документами из набора.
- Генерируются уточненные оценки релевантности (refined relevance scores, т.е. NewScore) на основе LocalScore и OldScore.
Claim 4 и 5 (Зависимые от 2): Описывают критически важные механизмы фильтрации (Pruning) для анти-манипуляции.
- Claim 4: Из набора ссылающихся документов (B(y)) удаляются те, которые аффилированы (affiliated) с целевым документом (например, тот же хост/IP3).
- Claim 5: Если в наборе ссылающихся документов есть пара аффилированных между собой документов (например, с одного IP3), удаляется тот, у которого ниже OldScore. Это гарантирует, что один источник (хост/сеть) дает только один, самый сильный «голос».
Claim 7 (Зависимый от 4): Определяет формулу расчета LocalScore.
LocalScore(x) = Σ (OldScore(BackSet(i))^m). Сумма берется по первым k документам в BackSet. Где m — константа чувствительности. Это означает, что «голоса» (ссылки) взвешиваются по релевантности (OldScore) голосующего документа.
Claim 9 (Зависимый от 2): Определяет формулу расчета NewScore.
NewScore(x) = (a + LocalScore(x)/MaxLS) * (b + OldScore(x)/MaxOS). Где a и b — константы (например, 1). Это мультипликативная комбинация нормализованных исходной и локальной оценок.
Где и как применяется
Изобретение применяется на финальных стадиях обработки поискового запроса для уточнения порядка результатов.
INDEXING – Индексирование и извлечение признаков
На этом этапе система собирает данные, необходимые для работы алгоритма: ссылочный граф (кто на кого ссылается) и техническую информацию о хостах (IP-адреса), которая используется для определения аффилированности (IP3(x)).
RANKING – Ранжирование
Основной компонент ранжирования генерирует начальный набор релевантных документов (например, топ-1000) и присваивает им исходные оценки (OldScore). Это является входными данными для алгоритма.
RERANKING – Переранжирование
Основное место применения патента. Компонент переранжирования анализирует структуру связей (Local Inter-connectivity) внутри полученного набора.
- Анализ графа: Система определяет, какие документы ссылаются на какие внутри набора.
- Расчет локальной авторитетности: Применяются фильтры аффилированности и рассчитывается LocalScore.
- Финальное ранжирование: Рассчитывается NewScore путем комбинации OldScore и LocalScore. Происходит пересортировка набора.
Входные данные:
- Начальный набор релевантных документов (Топ-N).
- Начальные оценки релевантности (OldScores).
- Данные о гиперссылках между документами в наборе.
- Данные о хостах и IP-адресах (IP3) для фильтрации.
Выходные данные:
- Переранжированный набор документов с финальными оценками (NewScores).
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на широкие информационные запросы, где существует развитая экосистема ресурсов, ссылающихся друг на друга. Алгоритм помогает выявить центральные, наиболее цитируемые источники по теме.
- Конкретные типы контента: Влияет на контент, который часто цитируется или используется как справочный материал (исследования, гайды, официальная документация).
- Ниши и тематики: Сильное влияние в нишах, где цитирование авторитетных источников является нормой (академические, технические, некоторые YMYL-темы).
Когда применяется
- Временные рамки: Алгоритм применяется в реальном времени (at query time) после завершения основного этапа ранжирования.
- Условия работы: Для эффективной работы необходимо наличие достаточной взаимосвязанности (inter-connectivity) внутри начального набора результатов.
- Ограничения: Если документы почти не ссылаются друг на друга (низкий MaxLS), влияние LocalScore будет минимальным. Система использует порог MaxLSMin, чтобы уменьшить влияние LocalScore в таких случаях.
Пошаговый алгоритм
Этап 1: Инициализация
- Генерация начального набора и OldScores: Создается начальный набор релевантных документов (например, Топ-1000), и каждому документу X присваивается OldScore(x).
Этап 2: Расчет LocalScore (повторяется для каждого документа X в наборе)
- Идентификация входящих локальных ссылок (B(y)): Формируется множество B(y) — документы из начального набора, которые ссылаются на X.
- Фильтрация по аффилированности с X (Анти-спам 1): Из B(y) удаляются документы, расположенные на том же хосте или в той же подсети (IP3(x)), что и документ X, или на аффилированных хостах (например, зеркалах).
- Фильтрация дубликатов хостов (Host Diversity Enforcement / Анти-спам 2):
- Проверяется, есть ли в B(y) пары документов с одинаковыми IP3 (т.е. с одного хоста/подсети).
- Если да, сравниваются их OldScores. Документ с более низким OldScore удаляется из B(y).
- Процесс повторяется, пока в B(y) не останется не более одного документа от каждого хоста/подсети.
- Выбор лучших ссылок (BackSet(y)):
- Документы в отфильтрованном множестве B(y) сортируются по убыванию OldScore.
- Выбираются первые k (например, k=20) документов, формируя BackSet(y).
- Вычисление LocalScore(x): Рассчитывается как сумма (OldScore)^m для всех документов в BackSet(y). (m — коэффициент чувствительности, например, 1-3).
Этап 3: Расчет NewScore и Переранжирование
- Нормализация и применение порога: Определяются максимальные значения MaxLS и MaxOS. Если MaxLS ниже минимального порога (MaxLSMin) — что указывает на низкую связанность выдачи — MaxLS устанавливается равным MaxLSMin.
- Вычисление NewScore: Для каждого документа X рассчитывается финальная оценка по формуле: NewScore(x) = (a + LocalScore(x)/MaxLS) * (b + OldScore(x)/MaxOS), где a и b – константы (например, 1).
- Переранжирование: Начальный набор документов сортируется на основе NewScore для предоставления пользователю.
Какие данные и как использует
Данные на входе
- Ссылочные факторы: Критически важные данные. Анализируются гиперссылки между документами, попавшими в начальный набор результатов. Анкорный текст не упоминается.
- Технические факторы: IP-адреса хостов (IP3(x)). Используются для идентификации аффилированных сайтов и предотвращения манипуляций ссылочным весом. Также используется информация о хостах для выявления зеркал (affiliated hosts).
- Системные данные: Исходные оценки релевантности (OldScore), сгенерированные основной поисковой системой.
Какие метрики используются и как они считаются
- OldScore(x): Исходная оценка релевантности (входная метрика).
- LocalScore(x): Оценка локальной авторитетности. Рассчитывается по формуле: Сумма (OldScore(BackSet(i))^m) по k документам.
- k: Предопределенное количество лучших ссылающихся документов (например, 20).
- m: Константа чувствительности (степень), влияющая на вес ссылок с высоким OldScore.
- NewScore(x): Финальная оценка ранжирования. Рассчитывается по формуле: (a + LocalScore(x)/MaxLS) * (b + OldScore(x)/MaxOS).
- a, b: Константы для сглаживания (например, 1).
- MaxLS, MaxOS: Метрики нормализации (максимальные значения в наборе).
- MaxLSMin: Пороговое значение для MaxLS. Используется для снижения влияния LocalScore, если общая взаимосвязанность в выдаче низкая.
- IP3 Matching: Метод сравнения первых трех октетов IP для выявления аффилированности.
Выводы
- Авторитетность зависит от запроса (Query-Dependent Authority): Патент описывает механизм расчета авторитетности «на лету», основываясь исключительно на локальном графе результатов поиска. В отличие от PageRank (глобального и независимого от запроса), LocalScore определяет авторитетность документа в контексте конкретного запроса.
- Релевантность ссылающегося документа критична: Ценность ссылки напрямую зависит от OldScore ссылающегося документа. «Голос» от высокорелевантной страницы весит значительно больше. Ссылки с низкорелевантных страниц вносят минимальный вклад.
- Критичность разнообразия хостов и агрессивный антиспам: Система активно борется с манипуляциями (PBN, ссылочные фермы), используя технические данные (IP-адреса IP3) для идентификации аффилированных хостов. Исключаются ссылки с того же хоста, а также учитывается только одна (наиболее релевантная) ссылка от любого другого хоста/подсети.
- Выявление «Локальных Авторитетов» (Topical Authority): Цель алгоритма — найти документы, которые признаны «экспертами» внутри тематического сообщества, сформированного результатами поиска. Это закладывает основу для концепции Тематического Авторитета.
- Мультипликативный эффект ранжирования: Финальная оценка NewScore является произведением нормализованных OldScore и LocalScore. Это означает, что для высокого ранжирования документ должен обладать как хорошей исходной релевантностью, так и сильной локальной ссылочной поддержкой.
Практика
Best practices (это мы делаем)
- Стратегический линкбилдинг (Topical Link Building): Необходимо сфокусироваться на получении ссылок от «тематических хабов» — страниц, которые уже высоко ранжируются по вашим целевым или близким запросам. Согласно патенту, именно OldScore (релевантность) ссылающейся страницы определяет вес, передаваемый через ссылку в рамках LocalScore.
- Становиться цитируемым источником (Linkable Assets): Создавать контент, который естественным образом стимулирует других авторов в вашей нише (включая конкурентов в топе) ссылаться на вас. Чем чаще на вас ссылаются другие топовые результаты, тем выше будет ваш LocalScore.
- Обеспечение максимального разнообразия доноров (Host Diversity): Критически важно получать ссылки с максимально разнообразных, неаффилированных хостов. Патент явно описывает механизм, который учитывает только одну (лучшую) ссылку с каждого хоста/IP-подсети.
- Обеспечение технической независимости ресурсов: Если вы управляете несколькими сайтами (например, PBN), критически важно обеспечить их техническую независимость (разные хостинги, непересекающиеся диапазоны IP-адресов), чтобы избежать фильтрации по IP3(x) при перекрестном цитировании.
Worst practices (это делать не надо)
- Использование PBN на общем хостинге или в одной подсети: Размещение сети сателлитов (PBN) в одной подсети IP-адресов крайне неэффективно. Механизм фильтрации IP3(x) предназначен для нейтрализации таких ссылок. Система учтет только одну ссылку из всей сети для расчета LocalScore.
- Массовое создание ссылок с одного домена: Размещение множества ссылок с разных страниц одного сайта неэффективно. Будет учтена только ссылка с той страницы донора, которая имеет наивысший OldScore.
- Получение ссылок с высокоавторитетных, но нерелевантных страниц: Ссылки с сайтов с высоким глобальным авторитетом, но низкой релевантностью по конкретному запросу (низкий OldScore), не помогут в контексте этого алгоритма.
Стратегическое значение
Патент подтверждает, что Google использует многоуровневый подход к анализу ссылок, выходящий за рамки глобального PageRank, и валидирует SEO-стратегии, направленные на построение тематического авторитета (Topical Authority). Он показывает, что Google стремится идентифицировать экспертные источники, анализируя паттерны цитирования внутри конкретной ниши. Стратегически важно не просто наращивать ссылочную массу, а работать над качеством, релевантностью и разнообразием источников ссылок.
Практические примеры
Сценарий 1: Повышение авторитетного исследования
- Запрос: «влияние сна на продуктивность».
- Исходная выдача: В топ-10 много статей из блогов и новостных сайтов с примерно одинаковым OldScore.
- Анализ: Система обнаруживает, что 5 из этих 10 статей ссылаются на одно конкретное академическое исследование (Документ X).
- Фильтрация: Система проверяет, что ссылки исходят с разных IP и не аффилированы с Документом X.
- Расчет LocalScore: Документ X получает высокий LocalScore, так как на него ссылаются релевантные источники (с высоким OldScore).
- Результат: NewScore Документа X значительно увеличивается, и он поднимается на первую позицию как наиболее авторитетный источник по теме.
Сценарий 2: Нейтрализация PBN
- Запрос: «купить спиннинг для морской рыбалки».
- Ситуация: SEO-специалист создал 5 сайтов-сателлитов (PBN) для продвижения магазина. Все они размещены на одном хостинге в одной подсети (одинаковый IP3). Все 5 сайтов попали в топ-100 и ссылаются на магазин.
- Анализ: При расчете LocalScore для магазина система идентифицирует эти 5 ссылок (попадают в B(y)).
- Фильтрация (Host Diversity Enforcement): Система обнаруживает, что все 5 сайтов имеют одинаковый IP3. Она выбирает из них только один сайт с наивысшим OldScore, а остальные 4 ссылки игнорирует.
- Результат: Вклад PBN в LocalScore минимален (учитывается только 1 ссылка вместо 5). Манипуляция нейтрализована.
Вопросы и ответы
Чем описанный алгоритм отличается от PageRank?
PageRank — это глобальная метрика авторитетности, рассчитываемая на основе всего графа веба и не зависящая от запроса. Описанный алгоритм (LocalScore) является локальным и зависимым от запроса. Он рассчитывается «на лету» и учитывает только ссылки между документами, уже отобранными как релевантные данному запросу, выявляя авторитетность в контексте темы.
Что важнее для LocalScore: количество ссылок или их качество?
Качество имеет приоритет, но и количество важно. Качество определяется релевантностью ссылающегося документа запросу (его OldScore) и уникальностью хоста донора. Количество учитываемых ссылок ограничено порогом k (например, 20 лучших ссылок), и все они должны быть с разных, неаффилированных хостов.
Как система борется с попытками накрутки LocalScore через сетки сайтов (PBN)?
Система использует агрессивную фильтрацию на основе IP-адресов (IP3) и аффилированности. Ссылки с того же хоста или подсети игнорируются. Если несколько аффилированных сайтов ссылаются на целевую страницу, будет учтена только одна, самая сильная ссылка (от страницы с наивысшим OldScore). Это делает неэффективными PBN на общих хостингах.
Имеет ли смысл ставить несколько ссылок с разных страниц одного сильного сайта?
В контексте этого патента — нет. Механизм фильтрации (Host Diversity Enforcement) гарантирует, что при расчете LocalScore будет учтена только одна ссылка с каждого хоста — та, которая размещена на странице с наивысшим OldScore. Для других алгоритмов это может иметь смысл, но не для этого механизма.
Как этот патент связан с концепцией Topical Authority?
Он напрямую реализует эту концепцию. LocalScore измеряет тематическую авторитетность, анализируя, насколько часто на документ ссылаются другие тематически релевантные страницы (те, что попали в топ выдачи). Если сайт является центром тематического графа и на него ссылаются другие эксперты ниши, он получит высокий LocalScore.
Что произойдет, если в топе выдачи вообще нет ссылок друг на друга?
Патент предусматривает такую ситуацию. Если общая взаимосвязанность низкая (MaxLS ниже порога MaxLSMin), система искусственно снижает вклад LocalScore в финальную оценку NewScore. В этом случае ранжирование будет определяться в основном начальными оценками OldScore.
Как определить, какие сайты Google считает аффилированными (affiliated hosts)?
Основной метод в патенте — сравнение первых трех октетов IP-адреса (IP3). Также упоминается возможность ручного или автоматического определения (например, путем сравнения контента для выявления зеркал). На практике это может включать анализ IP, WHOIS, структуры сайтов и других футпринтов.
Стоит ли пытаться получить ссылку с конкурента, который находится в топе по моему запросу?
Да, это идеальная стратегия в контексте этого патента. Конкурент в топе имеет высокий OldScore. Получение ссылки с его страницы даст максимальный прирост к вашему LocalScore, при условии, что ваши сайты не признаны аффилированными. Это сигнализирует Google о признании вашего контента другими релевантными игроками.
Что означает константа ‘m’ в формуле LocalScore?
Константа ‘m’ (степень) контролирует чувствительность LocalScore к OldScore ссылающихся документов. Если m > 1 (патент предлагает значения 1-3), система придает экспоненциально больший вес ссылкам с очень высоких позиций по сравнению с несколькими ссылками от менее авторитетных (но все еще релевантных) документов.
Является ли этот алгоритм тем же самым, что и алгоритм Hilltop?
Они связаны (изобретатель Krishna Bharat работал над обоими) и имеют общую философию, но механизм отличается. Hilltop фокусируется на поиске «экспертных документов» (списков ресурсов) и использует их для идентификации авторитетов. Данный патент не требует предварительной идентификации экспертов; он использует все документы в топе выдачи как потенциальных «голосующих», взвешивая их голоса по их собственной релевантности (OldScore).