
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
Патент решает проблему манипулирования оценками качества документов (например, PageRank), основанными на ссылочной структуре. Он направлен против линк-ферм, PBN и других схем, где группа аффилированных (связанных) сайтов или страниц искусственно завышает рейтинг целевого документа путем множественных перекрестных ссылок. Изобретение улучшает объективность оценки качества, делая ее устойчивой к подобным манипуляциям.
Запатентована система для расчета Ranking Score (оценки качества) связанных документов, которая учитывает аффилированность (affiliation) между источниками ссылок. Ключевым изобретением является метод расчета вклада ссылок (SETCONTRIB), который изменяется в зависимости от степени аффилированности. Для независимых ссылок вклад суммируется (оператор SUM), а для полностью аффилированных – учитывается только максимальный вклад от группы (оператор MAX). Система может использовать как бинарную, так и непрерывную модель аффилированности.
Система работает в несколько этапов:
affiliated sets).Ranking Score и количестве исходящих ссылок.CONTRIB внутри аффилированного набора, система применяет функцию, которая стремится к MAX (учитывается только самая сильная ссылка из набора), если аффилированность сильная, и к SUM, если аффилированность слабая.Ranking Score документа вычисляется путем суммирования SETCONTRIB от всех наборов, которые на него ссылаются. Процесс повторяется итеративно до сходимости.Критически высокая. Борьба с линк-схемами, PBN и искусственным наращиванием ссылочного веса является одной из главных задач Google. Этот патент описывает фундаментальный механизм, позволяющий алгоритмически снижать ценность неестественных ссылок. Учитывая авторов (ключевые инженеры поиска Google, включая Amit Singhal и Paul Haahr), эти принципы лежат в основе современных систем оценки качества ссылок.
Патент имеет критическое значение (95/100) для SEO, особенно в области линкбилдинга. Он объясняет механизм, с помощью которого Google может идентифицировать и нейтрализовать линк-фермы и PBN. Если система классифицирует группу сайтов как аффилированную, ссылочный вес, передаваемый между ними или от них к целевому сайту, будет радикально снижен. Это подчеркивает стратегическую важность получения ссылок из разнообразных, независимых и авторитетных источников.
Ranking Score документа, деленный на количество исходящих ссылок (OutD(D)).PageRank.Claim 1 (Независимый пункт): Описывает основной метод расчета Ranking Score с учетом аффилированности.
CONTRIB) для каждого документа в наборе на основе его Ranking Score и количества исходящих ссылок.SETCONTRIB) как максимум из первых значений для документов в наборе.Ranking Score Документа 1 присваивается на основе второго значения.Ranking Score включает: Ranking Score Документа 1 с помощью функции, которая действует как оператор Суммирования (SUM), если набор слабо аффилирован, и как оператор Максимума (MAX), если набор сильно аффилирован.SETCONTRIB) определена как (Обобщенное среднее): Ключевой защищенный механизм — это использование интерполяции между SUM и MAX для расчета ссылочного веса в зависимости от степени аффилированности источников.
Claim 6 (Зависимый от 1): Детализирует методы идентификации аффилированности.
Аффилированность определяется на основе по крайней мере одного из следующих факторов: структура ссылочного графа документов, паттерны трафика к документам, схожесть имен хостов (hostnames) документов или схожесть IP-адресов документов.
Claim 8 (Зависимый от 1): Уточняет процесс расчета.
Присвоение Ranking Score происходит итеративно до достижения сходимости (convergence).
Изобретение применяется на этапе индексирования и является частью глобального анализа ссылочной структуры веба.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Система функционирует как часть модуля анализа ссылок (Link Analysis), который рассчитывает глобальные оценки качества документов (например, PageRank).
Set Location Component анализирует эти данные для группировки документов в affiliated sets и определения степени их связи (γ).Rank Computation Component выполняет итеративный расчет Ranking Scores. На каждой итерации система использует модифицированный алгоритм передачи веса, который учитывает аффилированность источников.RANKING – Ранжирование
На этапе ранжирования система использует предварительно рассчитанные Ranking Scores (полученные на этапе INDEXING) как один из сигналов для сортировки документов, релевантных запросу пользователя.
Входные данные:
Ranking Score (для первой итерации).Выходные данные:
Ranking Score для каждого документа в корпусе, устойчивый к манипуляциям со стороны аффилированных групп.PageRank). Это ресурсоемкий офлайн-процесс, а не расчет в реальном времени при обработке запроса.Описание процесса расчета Ranking Score (например, с использованием Непрерывной модели).
Set Location Component анализирует корпус документов.Affiliated Sets S).Ranking Score.CONTRIB(D) по формуле: .SETCONTRIB(S, γ). SETCONTRIB с помощью функции интерполяции MAX/SUM (Обобщенное среднее): .Ranking Score путем суммирования SETCONTRIB от всех наборов (Si), которые ссылаются на X: .Ranking Scores по сравнению с предыдущей итерацией. Если изменения минимальны (достигнута сходимость), процесс останавливается. В патенте упоминается, что обычно достаточно около 50 итераций.Ranking Scores могут быть нормализованы.Система использует несколько типов данных для определения аффилированности и расчета оценок:
OutD(D)). Сила связи между сайтами на основе ссылок.Патент определяет конкретные метрики и формулы для их расчета:
Ranking Score.Этот патент является одним из фундаментальных документов, определяющих подход Google к оценке ссылок. Он подтверждает, что Google давно разрабатывает и внедряет сложные механизмы для борьбы с ссылочным спамом, выходящие далеко за рамки простого подсчета ссылок. Стратегическое значение заключается в понимании того, что качество и независимость источника ссылки гораздо важнее их количества. Долгосрочная SEO-стратегия должна фокусироваться на построении реального авторитета и получении естественных упоминаний, так как любые искусственные схемы имеют встроенный механизм обесценивания.
Сценарий: Нейтрализация PBN (Private Blog Network)
Set Location Component анализирует IP-адреса. Совпадение первых трех октетов (192.168.1.*) является сильным сигналом аффилированности. Система группирует эти 10 сайтов в Affiliated Set и присваивает высокую степень аффилированности (Gamma γ близка к 0).Ranking Score для Money Site система применяет функцию интерполяции. Так как γ близка к 0, функция действует как оператор MAX.Сценарий: Диверсифицированный линкбилдинг
Ranking Score.Как именно Google определяет аффилированность сайтов?
Патент перечисляет несколько конкретных методов. Во-первых, это технические признаки: схожесть имен хостов и IP-адресов (особенно совпадение первых 2-3 октетов IP). Во-вторых, это анализ структуры ссылочного графа: сильная перекрестная связанность между сайтами. В-третьих, упоминается анализ паттернов трафика: если множество пользователей посещают одни и те же сайты в рамках одной сессии, это может указывать на их аффилированность.
Заменяет ли этот алгоритм PageRank?
Нет, он не заменяет его, а модифицирует и дополняет. Алгоритм использует ту же базовую итеративную логику расчета качества на основе ссылок, что и PageRank. Однако он вносит критическое изменение в способ агрегации ссылочного веса: вместо простого суммирования вклада от всех входящих ссылок, он сначала группирует ссылки по аффилированным наборам и применяет к ним функцию MAX/SUM. Это делает итоговый Ranking Score более устойчивым к спаму.
Что это значит для использования PBN?
Это означает, что PBN (Private Blog Networks) сталкиваются с алгоритмическим противодействием. Если Google сможет идентифицировать вашу сеть (обнаружить футпринты), эффективность всей сети резко упадет. Вместо суммы веса всех сайтов вы получите вес только самого сильного сайта в сети. Это делает построение эффективных PBN значительно дороже и сложнее, так как требует безупречного сокрытия всех признаков аффилированности, упомянутых в патенте.
В чем разница между бинарной и непрерывной моделями аффилированности?
В бинарной модели система просто определяет, связаны сайты или нет. Если связаны, применяется оператор MAX. В непрерывной модели система оценивает степень связи (Gamma γ). Если связь очень сильная (γ близка к 0), применяется MAX. Если связь слабая или отсутствует (γ близка к 1), применяется SUM. Если связь средней силы, применяется промежуточное значение. Это позволяет Google более точно регулировать передачу веса и не пессимизировать сайты, которые могут иметь легитимные, но слабые связи.
Влияет ли этот патент на внутреннюю перелинковку?
Да, влияет. В патенте (FIG. 1) приведен пример, где документы одного автора ссылаются друг на друга. Система признает, что дополнительные ссылки от того же автора не должны чрезмерно повышать Ranking Score. Страницы на одном сайте по определению являются сильно аффилированными. Это означает, что попытки агрессивного "скульптинга" PageRank с помощью тысяч внутренних ссылок могут быть нейтрализованы этим механизмом, так как система будет стремиться применить оператор MAX к их вкладу.
Что такое оператор MAX в контексте ссылок?
Оператор MAX означает, что из всей группы аффилированных ссылок учитывается только одна – та, которая передает максимальный индивидуальный вклад (CONTRIB). Например, если у вас есть 5 связанных сайтов, ссылающихся на целевую страницу, система выберет самый авторитетный из них и учтет только его вес, игнорируя остальные 4 ссылки при расчете SETCONTRIB.
Как избежать идентификации моих сайтов как аффилированных?
Необходимо избегать любых футпринтов, описанных в патенте. Используйте разные хостинги и регистраторов, убедитесь, что сайты находятся в разных подсетях IP-адресов (избегайте совпадения первых трех октетов). Не создавайте сильных перекрестных ссылок между сайтами. Также следует избегать неестественно схожих паттернов трафика между сайтами. Полная изоляция – ключ к тому, чтобы система рассматривала сайты как независимые (Gamma=1).
Что такое модифицированный расчет CONTRIB (Eq. 7)?
Патент предлагает вариант расчета CONTRIB, где вес делится не на общее количество исходящих ссылок, а на MAX(1, OutD(D) - THRESHOLD). Если установить порог (THRESHOLD), например, 10, то первые 10 ссылок фактически не учитываются при делении веса. Это меняет модель с классического PageRank на модель голосования, где для страниц с небольшим или средним количеством ссылок каждая ссылка передает почти полный вес источника.
Является ли размещение нескольких сайтов на Cloudflare (с общими IP) риском аффилиации?
Хотя патент упоминает общие IP как фактор, системы Google достаточно сложны, чтобы различать общие IP крупных сервисов (CDN, хостинги) и выделенные IP или небольшие хостинги. Однако использование общих IP в сочетании с другими факторами (например, сильной перелинковкой или схожими паттернами трафика) может усилить сигнал аффилированности. Для максимальной безопасности PBN лучше избегать любых пересечений.
Насколько важен этот патент сегодня, учитывая его возраст?
Несмотря на то, что патент подан в 2004 году, он описывает фундаментальные принципы обработки ссылочных графов и борьбы с манипуляциями. Эти принципы не устаревают. Современные системы Google, вероятно, используют гораздо более сложные методы обнаружения аффилированности (например, с помощью машинного обучения), но базовая логика снижения веса аффилированных ссылок (интерполяция MAX/SUM) остается крайне актуальной для понимания работы поиска.

Антиспам
Ссылки
Техническое SEO

Антиспам
Ссылки
Техническое SEO

Local SEO
SERP
Ссылки

Антиспам
Ссылки
SERP

EEAT и качество
Knowledge Graph
SERP

Семантика и интент
Индексация
Мультимедиа

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
EEAT и качество
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Антиспам
Ссылки
Техническое SEO

Персонализация
Поведенческие сигналы
Антиспам

Поведенческие сигналы
Семантика и интент
SERP
