
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
Патент решает проблему уязвимости стандартного алгоритма PageRank перед манипуляциями, такими как создание ссылочных ферм (link farms) или искусственное зацикливание ссылок (loops), которые приводят к завышению рейтинга спам-страниц. Альтернативный подход, основанный на расчете PageRank от набора доверенных страниц (Seed Pages, концепция, схожая с TrustRank), сталкивается с проблемой вычислительной сложности: расчет необходимо проводить отдельно для каждого источника, что ограничивает количество используемых Seed Pages. Изобретение предлагает эффективный метод расчета рейтинга авторитетности, который устойчив к спаму и позволяет использовать большое количество разнообразных Seed Pages без критического увеличения сложности вычислений.
Запатентована система ранжирования страниц в гиперссылочной структуре, которая определяет рейтинг страницы на основе её близости к набору предопределенных доверенных страниц (Seed Pages). Система трансформирует задачу итеративного вычисления весов (как в PageRank) в задачу нахождения кратчайшего пути в ссылочном графе. Ссылкам присваивается «длина» (Length) на основе их свойств и свойств ссылающейся страницы (в частности, её исходящей степени Out-degree). Итоговый рейтинг определяется кратчайшим расстоянием от Seed Pages до целевой страницы.
Система функционирует следующим образом:
Shortest Distances) от набора Seed Pages до всех остальных страниц путем суммирования длин ссылок вдоль пути.Ranking Score страницы определяется на основе этих расстояний. Чем короче расстояние, тем выше рейтинг. Для надежности используется расстояние до k-го ближайшего источника (k-th shortest distance).Высокая. Принципы, заложенные в этом патенте, тесно связаны с концепциями TrustRank и оценки авторитетности на основе близости к доверенным источникам. Борьба со ссылочным спамом и определение надежных источников (как часть E-E-A-T) остаются ключевыми задачами поиска. Описанный механизм предоставляет математическую основу для эффективного расчета метрик доверия в масштабе веба.
Патент имеет высокое стратегическое значение для SEO (8/10), особенно в области построения ссылочного профиля. Он математически обосновывает, почему качество ссылочного окружения и близость к авторитетным ресурсам критически важны. Механизм объясняет, почему ссылки с заспамленных страниц или страниц с огромным количеством исходящих ссылок имеют низкую ценность (большую «длину»), и подчеркивает важность получения ссылок из надежных источников, которые сами находятся близко к Seed Sites.
Seed Page до целевой страницы.PageRank. В данном патенте он используется для определения базовой длины ссылки через параметр α=−log(d).Seed Pages до всех остальных страниц.Claim 1 (Независимый пункт): Описывает базовый метод ранжирования.
Seed Pages.lengths) ссылкам на основе свойств ссылок и страниц, которые они соединяют.shortest distances) от набора Seed Pages до каждой страницы на основе длин ссылок.Ranking Score для каждой страницы на основе вычисленных кратчайших расстояний.Ranking Scores.Claim 2 и 3 (Зависимые): Уточняют механизм определения длины ссылки.
Длина ссылки определяется как функция от количества исходящих ссылок (Out-degree) со страницы-источника. Эта функция является монотонно невозрастающей, то есть длина ссылки увеличивается (или остается прежней) при увеличении количества исходящих ссылок.
Claim 5 (Зависимый): Детализирует формулу длины ссылки.
Длина ссылки q→p включает член (α+log(∣q∣out)), где α — неотрицательное значение. Это подтверждает, что ценность ссылки логарифмически уменьшается с ростом исходящей степени источника.
Claim 6 (Зависимый от 5): Уточняет значение α.
α определяется как −log(d), где d — коэффициент затухания (damping factor). Это устанавливает прямую математическую связь между моделью PageRank и моделью кратчайших расстояний.
Claim 9, 10 и 11 (Зависимые): Определяют метод расчета итогового рейтинга.
Ranking Score определяется с использованием k кратчайших расстояний от k ближайших Seed Pages. В частности, он базируется именно на k-м кратчайшем расстоянии (D(p)). Рейтинг может быть пропорционален e−D(p).
Изобретение описывает метод вычисления глобальной метрики качества или авторитетности страниц, аналогичной PageRank, но с акцентом на доверие, исходящее от Seed Pages.
CRAWLING – Сканирование и Сбор данных
Метрики, рассчитанные этим методом, могут использоваться для приоритизации сканирования (Crawl Scheduling). Страницы с более коротким расстоянием до Seed Pages (более высоким рейтингом) могут сканироваться чаще.
INDEXING – Индексирование и извлечение признаков
Основное применение патента. На этом этапе происходит анализ ссылочного графа:
Seed Pages до всех достижимых страниц.RANKING – Ранжирование
На этапах L2 и L3 ранжирования вычисленный Ranking Score используется как один из сигналов для определения итоговой позиции документа в выдаче по конкретному запросу.
Входные данные:
Seed Pages (и их опциональные веса).Out-degree) для каждой страницы.Выходные данные:
Ranking Score для каждой достижимой страницы, основанный на кратчайшем расстоянии до Seed Pages.Reduced link-graph, показывающий пути распространения авторитета.PageRank. Ссылочные фермы и сети сателлитов оказываются «далеко» от доверенных источников, так как связи внутри них часто имеют большую длину (высокий Out-degree) и не имеют коротких путей к Seed Pages.PageRank). Это офлайн-процесс, а не расчет в реальном времени.Процесс расчета рейтинга авторитетности на основе расстояний:
Seed Pages (S).Seed Page si присваивается начальное расстояние di0. Если используются веса wi, то d0i=−log(wi). По умолчанию di0 = 0.Seed Pages до всех остальных страниц. Для каждой страницы p и каждого источника si вычисляется Di(p) как minq→p(Di(q)+L(q→p)).Ranking Score R(p) вычисляется на основе итогового расстояния. Например, R(p)=e−D(p).Патент фокусируется исключительно на использовании структуры ссылочного графа и предварительно отобранных эталонных страницах.
Out-degree) каждой страницы, которая напрямую используется для расчета длины ссылки. Также могут учитываться веса ссылок (w(q→p)), основанные на их свойствах (например, позиция, шрифт), если они используются.Seed Pages. Эти страницы должны быть предварительно идентифицированы как высококачественные и доверенные.Другие типы факторов (контентные, технические, поведенческие и т.д.) в этом конкретном алгоритме расчета авторитетности не используются.
PageRank в аддитивную модель расстояний. Основная формула (Equation 10): L(q→p)=−log(d)+log(w(q→p)∣q∣out).Seed Pages.TrustRank. Авторитетность определяется не общим количеством ссылок, а краткостью пути от доверенных источников (Seed Pages).Out-degree). Зависимость логарифмическая. Это снижает эффективность ссылок с каталогов, форумов и заспамленных ресурсов.PageRank в задачу поиска кратчайшего пути. Это позволяет эффективно использовать тысячи Seed Pages одновременно.Out-degree доноров), даст лучший результат, чем множество длинных путей через ссылочные хабы низкого качества.Seed Sites, таких как крупные СМИ, правительственные ресурсы, ведущие университеты).Out-degree являются более ценными (имеют меньшую «длину»), согласно патенту.Out-degree. Размещение большого количества исходящих ссылок на ключевых страницах увеличивает «длину» этих ссылок и уменьшает авторитет, передаваемый целевым страницам (как внутренним, так и внешним).Out-degree (каталоги, футеры, заспамленные блоги) имеют большую «длину» и практически не сокращают расстояние до Seed Sites.PageRank.Патент подтверждает стратегическую важность построения репутации и получения качественных редакционных ссылок. Он предоставляет модель для понимания того, как Google может измерять «Доверие» (Trust). Стратегия линкбилдинга должна смещаться от накопления ссылочной массы к построению кратчайших и наиболее качественных путей от эталонных авторитетных ресурсов к продвигаемому сайту. Это требует глубокого понимания ссылочного графа в своей нише и идентификации ключевых авторитетов.
Сценарий: Оценка ценности двух разных ссылок
Мы хотим получить ссылку для сайта (Сайт P). Есть два варианта:
Применение механизма патента (расчет длины ссылок):
Используем упрощенную формулу длины L=α+log(Out−degree). (Предположим α=0.1 и используем натуральный логарифм).
Результат:
Ссылка А значительно «короче» ссылки Б. Если предположить, что оба сайта Q1 и Q2 находятся на одинаковом расстоянии от Seed Sites, то получение ссылки А даст Сайту P более высокий Ranking Score (меньшее итоговое расстояние), чем получение ссылки Б.
Что такое «Seed Pages» (Страницы-источники) и как их определить для своей ниши?
Seed Pages — это набор высококачественных, доверенных сайтов, используемых как эталон для оценки авторитетности других ресурсов. В патенте предполагается, что они отбираются и обладают высокой надежностью, разнообразием и хорошей связностью. Для своей ниши это могут быть ведущие отраслевые СМИ, правительственные сайты, сайты университетов, энциклопедии (например, Wikipedia) и крупнейшие авторитетные бренды.
Как патент предлагает рассчитывать «длину» ссылки?
Длина ссылки (Link Length) — это мера её ценности. Чем длина больше, тем ценность ниже. Патент предлагает рассчитывать её как функцию от количества исходящих ссылок (Out-degree) страницы-донора. Ключевая формула включает log(∣q∣out). Это означает, что ссылка со страницы, где всего 5 ссылок, будет значительно «короче» (ценнее), чем ссылка со страницы, где их 500.
Что означает использование «k-го кратчайшего расстояния» (k-th shortest distance)?
Это механизм защиты от спама и повышения надежности оценки. Вместо того чтобы присваивать рейтинг на основе самого короткого пути от одного Seed Site (k=1), система может требовать наличия коротких путей от нескольких (k) разных источников. Если k=5, то ваш сайт должен быть близок как минимум к пяти Seed Sites, чтобы получить максимальный рейтинг. Это усложняет манипуляции через одну сильную ссылку.
Как этот патент связан с PageRank?
Этот метод является аппроксимацией (приближением) расчета PageRank, сфокусированного на доверенных источниках (Seed-based PageRank или TrustRank). Патент описывает математическую трансформацию (используя логарифмы), которая позволяет заменить сложный итеративный процесс расчета PageRank на более эффективный алгоритм поиска кратчайших путей в графе.
Означает ли это, что ссылки с Википедии или крупных СМИ всегда очень ценны?
Не всегда. Хотя Википедия и СМИ часто являются Seed Sites или находятся очень близко к ним, ценность конкретной ссылки зависит от её «длины». Если на странице СМИ очень много исходящих ссылок (высокий Out-degree), длина этой ссылки увеличится. Однако, близость к источнику обычно перевешивает фактор Out-degree, делая такие ссылки в большинстве случаев очень ценными.
Как использовать этот патент при построении PBN (Private Blog Network)?
Патент показывает уязвимость PBN, изолированных от внешнего мира. Чтобы PBN была эффективной, она должна получать «короткие» ссылки от сайтов, которые сами близки к Seed Sites. Изолированная сеть, даже с высокой внутренней перелинковкой, будет иметь большое расстояние до доверенных источников и, следовательно, низкий рейтинг авторитетности по этому алгоритму.
Влияет ли Nofollow на расчет этих расстояний?
Патент не упоминает атрибут Nofollow. Однако, исходя из того, что модель основана на аппроксимации PageRank и направлена на измерение передачи авторитета, логично предположить, что ссылки Nofollow (или Sponsored/UGC) исключаются из этого графа и не участвуют в построении кратчайших путей для передачи рейтинга.
Почему используется логарифмическая зависимость длины от количества исходящих ссылок?
Логарифмическая зависимость используется для сглаживания влияния Out-degree и соответствует математической трансформации из модели PageRank. Она сильно штрафует переход от малого количества ссылок к среднему (например, от 10 к 100), но слабо реагирует на изменения при очень больших значениях (например, от 10000 к 10100).
Можно ли как-то измерить «расстояние» своего сайта до Seed Sites?
Точно измерить это невозможно, так как мы не знаем полный список Seed Sites Google и точные формулы расчета длин ссылок. Однако можно использовать сторонние метрики (например, Trust Flow или аналогичные показатели авторитетности в SEO-инструментах), которые часто базируются на схожих принципах расчета близости к доверенным источникам.
Влияют ли свойства самой ссылки (например, анкор, позиция на странице) на её длину?
Да, патент упоминает возможность использования веса ссылки w(q→p), основанного на её свойствах (например, позиция, шрифт), при расчете длины (Equation 10). Это подразумевает, что система может уменьшать длину (повышать ценность) для ссылок с определенными характеристиками (например, редакционные ссылки в основном контенте) и увеличивать длину для других (например, ссылки в футере).

EEAT и качество
Ссылки

Ссылки

EEAT и качество
Knowledge Graph
SERP

Ссылки
Поведенческие сигналы
Антиспам

Антиспам
Ссылки
Техническое SEO

Local SEO
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Ссылки
EEAT и качество
Свежесть контента

Ссылки
Семантика и интент
SERP

SERP
Семантика и интент
EEAT и качество

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
SERP

Персонализация
Поведенческие сигналы
SERP

Knowledge Graph
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
SERP
