
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
Патент решает проблему искусственного завышения рангов документов с помощью манипулятивных ссылочных техник. Он направлен на противодействие:
Цель — улучшить качество поиска путем снижения влияния неестественных или повторяющихся ссылочных паттернов.
Запатентована система ранжирования документов, основанная на анализе контекста ссылок (reference context), указывающих на документ. Вместо того чтобы полагаться только на анкорный текст или авторитетность ссылающегося сайта, система анализирует текст, непосредственно окружающий ссылку. Контекст определяется путем идентификации редких слов (rare words) слева и справа от ссылки и создания уникального идентификатора (context identifier) для этой комбинации. Документы ранжируются на основе разнообразия этих контекстов и анализа распределения их частотности.
Ключевой механизм заключается в определении контекста ссылки и использовании этой информации для ранжирования:
rare words) на основе их частотности во всем корпусе документов (например, используя IDF).context identifier (фингерпринта).context count).Высокая. Анализ ссылочного профиля и борьба с манипулятивными ссылочными техниками остаются критически важными для Google. Хотя методы анализа текста эволюционировали с 2004 года, фундаментальные принципы, изложенные в этом патенте — анализ околоссылочного текста, оценка разнообразия контекстов и выявление неестественных паттернов для дисконтирования спама и шаблонных ссылок — по-прежнему актуальны.
Патент имеет высокое значение для SEO-стратегий, особенно в области линкбилдинга. Он демонстрирует, что Google оценивает не только наличие ссылки и её анкор, но и то, как именно ссылка интегрирована в контент. Это делает рискованными стратегии, создающие ссылки с однотипным окружением (PBN с одинаковыми шаблонами, массовый спам, сквозные ссылки). Если контекст ссылки идентичен у множества ссылок, их вес дисконтируется.
Context Identifier встречается среди всех ссылок, указывающих на документ.rare words), найденных слева и справа от ссылки. Представляет собой уникальный контекст конкретной ссылки.Context Counts во времени. Используется для выявления внезапных всплесков ссылочной активности (например, Google Bombing).IDF и тем более "редким" оно считается.Context Identifiers для документа и соответствующих им Context Counts.Claim 1 (Независимый пункт): Описывает базовый механизм определения контекста ссылки.
first rare word) в левой порции на основе частоты его встречаемости в наборе документов (корпусе).second rare word) в правой порции на основе частоты его встречаемости в корпусе.context identifier), основанный только на первом и втором редких словах.Ядром изобретения является метод определения контекста ссылки путем изоляции и комбинирования наиболее редких слов из её непосредственного окружения слева и справа.
Claim 3 (Зависимый от 1): Уточняет, что создание context identifier происходит путем хеширования (hashing) первого и второго редких слов.
Claim 5 (Зависимый от 4): Уточняет, что ранжирование основано на общем количестве (т.е. разнообразии) идентификаторов контекста.
Claim 7 и 8 (Зависимые): Описывают механизм противодействия спаму/шаблонам через анализ распределения (distribution).
context counts.reducing an impact) этого идентификатора контекста.Это ключевой механизм для дисконтирования шаблонных ссылок или результатов Google-бомбинга.
Claim 9 (Зависимый от 6): Уточняет, что ранжирование основано на истории распределения (history of distribution) счетчиков контекста. Это позволяет выявлять внезапные всплески активности.
Изобретение применяется на этапах индексирования и ранжирования.
CRAWLING – Сканирование и Сбор данных
Система собирает контент ссылающихся страниц, необходимый для последующего анализа контекста ссылок.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Во время индексирования система выполняет следующие действия:
Left/Right Windows).IDF или хэш-таблицы частот) для определения rare words.Context Identifiers путем хеширования.List of Contexts и Context Counts для каждого целевого URL.RANKING – Ранжирование
На этапе ранжирования система использует предварительно рассчитанные данные из List of Contexts в качестве одного из сигналов:
Distribution Analysis) для выявления и дисконтирования спама или шаблонных ссылок.Distribution History Analysis) для выявления манипуляций.Входные данные:
Выходные данные:
List of Contexts для целевого URL (набор Context Identifiers и Context Counts).Ranking Score), основанный на анализе этого списка.distribution analysis) Context Counts выявляет статистические аномалии. Например, если один контекст имеет счетчик 30 000, а остальные контексты — 15, 8 и 3. Также триггером является резкое изменение в истории распределения (distribution history) — например, внезапный рост счетчика одного контекста с 20 до 18 000.Процесс ранжирования документа на основе контекстов ссылок:
Left Window) и справа (Right Window) от ссылки (например, по 5 слов).rare word). Редкость определяется на основе глобальной статистики корпуса (например, IDF).Context Identifier.Context Identifier добавляется в List of Contexts для целевого URL. Если такой идентификатор уже существует, его счетчик (Context Count) увеличивается. Этот шаг повторяется для всех ссылок в корпусе.distribution of context counts) для выявления аномалий.distribution history).Left/Right Window). Патент также упоминает, что анкорный текст может быть использован для определения контекста, но основное внимание уделяется именно окружающему тексту.Inverse Document Frequency или аналогичные метрики) необходима для определения "редкости" слов.Context Counts используется для анализа истории распределения (distribution history).IDF или путем анализа хэш-таблицы с частотностью слов в корпусе. Система может устанавливать порог минимальной частотности, чтобы отсеять не-слова (например, слово должно встретиться минимум 50 раз в корпусе).Context Identifier.Context Identifiers, связанных с документом.Context Counts для выявления выбросов (outliers). Например, выявление контекста с частотой 10 000 при медиане 10.Context Identifiers (высокое разнообразие) является положительным сигналом ранжирования. Это указывает на естественность ссылочного профиля. Разнообразие важнее простого количества ссылок.rare words) в непосредственной близости. Фокус на редких словах позволяет создать точный «отпечаток» контекста и эффективно различать уникальное окружение от шаблонного.Distribution History) позволяет системе обнаруживать и реагировать на внезапные манипулятивные кампании.Context Identifier.Context Identifiers и последующему дисконтированию.Context Counts или Distribution History.Context Count, что приведет к их дисконтированию согласно патенту.Этот патент является одним из фундаментальных документов, описывающих, как Google перешел от простого подсчета ссылок к сложному анализу их качества и естественности. Он подтверждает, что качество интеграции ссылки в контент имеет решающее значение. Стратегически, это означает, что SEO-специалисты должны фокусироваться на получении естественных редакционных ссылок, которые по своей природе обладают высоким разнообразием контекстов. Любые масштабируемые методы линкбилдинга, приводящие к однородности контекстов, несут высокие риски.
Сценарий 1: Дисконтирование шаблонной ссылки (Сквозная ссылка в футере)
Context Count = 100 000, в то время как другие контексты имеют счетчики 5-10.Сценарий 2: Оценка качественной редакционной ссылки
Context Count = 1).Как этот патент влияет на ценность сквозных ссылок (из футера или сайдбара)?
Патент напрямую объясняет, почему сквозные (boilerplate) ссылки часто имеют низкую ценность. Так как они расположены в шаблонных блоках, текст слева и справа от них идентичен на всех страницах. Это приводит к генерации одного и того же Context Identifier с очень высоким Context Count. Система идентифицирует это как аномальное распределение и дисконтирует (снижает влияние) этих ссылок.
Означает ли это, что анкорный текст больше не важен?
Нет, анкорный текст по-прежнему важен как сигнал релевантности. Однако этот патент показывает, что Google не полагается исключительно на него. Система валидирует ссылку через анализ окружающего её текста (Left/Right Window), чтобы подтвердить контекст и оценить естественность. Если контекст ссылки признан спамным или шаблонным, даже оптимизированный анкор не поможет.
Как именно определяется "редкое слово" (Rare Word)?
Редкость определяется на основе частоты встречаемости слова во всем корпусе документов (индексе Google). Часто используется метрика Inverse Document Frequency (IDF). Чем реже слово встречается в интернете, тем оно "редче". Патент также упоминает фильтрацию: чтобы считаться "настоящим" словом, оно должно встретиться хотя бы минимальное количество раз (например, 50), чтобы отсеять опечатки или случайные символы.
Что такое Context Identifier и зачем он нужен?
Context Identifier — это, по сути, цифровой отпечаток (фингерпринт) или хеш, созданный из комбинации самых редких слов слева и справа от ссылки. Он позволяет системе быстро и эффективно сравнивать контексты миллионов ссылок. Вместо того чтобы хранить и сравнивать целые предложения, система хранит и сравнивает эти компактные идентификаторы для оценки разнообразия и выявления повторов.
Как этот патент помогает бороться с Google Bombing?
Google Bombing — это скоординированная акция по размещению большого количества ссылок за короткое время. Патент описывает механизм анализа истории распределения контекстов (Distribution History). Внезапное появление тысяч ссылок с одинаковым или похожим контекстом будет обнаружено как временная аномалия, и эти ссылки будут помечены как подозрительные и дисконтированы.
Влияет ли этот механизм на внутреннюю перелинковку?
Да, принципы применимы и к внутренним ссылкам. Если внутренние ссылки размещены в шаблонных блоках навигации или в повторяющихся фрагментах контента, они также могут быть дисконтированы из-за идентичного контекста. Для эффективной внутренней перелинковки рекомендуется размещать контекстные ссылки в уникальном теле документа.
Как SEO-специалист может увеличить разнообразие контекстов входящих ссылок?
Необходимо фокусироваться на получении естественных редакционных ссылок. Когда разные авторы на разных сайтах ссылаются на ваш контент по собственному желанию, они естественным образом используют разный язык и размещают ссылки в разных контекстах. Избегайте методов линкбилдинга, где вы полностью контролируете размещение и окружение ссылки, так как это часто приводит к однообразию.
Может ли этот механизм помочь Google обнаружить PBN или сети сайтов?
Да. Если PBN использует одинаковые шаблоны или структуру контента, ссылки, размещенные в этой сети, могут иметь очень похожие или идентичные Context Identifiers, даже если текст немного отличается. Если система обнаруживает, что множество сайтов генерируют ссылки с одинаковыми контекстами, это может сигнализировать о неестественной связи между ними или об использовании автоматизированных методов размещения.
Как система определяет, что распределение Context Counts является подозрительным?
Система ищет статистические аномалии или выбросы в данных. Например, если документ имеет 5 разных контекстов со следующими счетчиками: 30 000, 15, 8, 5, 3. Контекст со счетчиком 30 000 явно выбивается из общего распределения. Патент предполагает, что такие аномалии часто являются результатом спама или использования шаблонных ссылок, и предлагает снижать их влияние.
Всегда ли размер окна (Window Size) составляет 5 слов?
Патент приводит 5 слов в качестве примера, но также упоминает возможность использования большего или меньшего количества слов (например, 15 слов). Точный размер окна, используемый Google в продакшене, не указан, но принцип остается тем же: анализируется непосредственное окружение ссылки.

Ссылки
Семантика и интент
Индексация

Структура сайта
SERP
Ссылки

Ссылки
Индексация
Техническое SEO

Ссылки
Мультиязычность
Семантика и интент

Антиспам
SERP
Техническое SEO

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
SERP
Семантика и интент

EEAT и качество
Поведенческие сигналы
SERP

Структура сайта
SERP
Ссылки

Поведенческие сигналы
Персонализация
Семантика и интент

Local SEO
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Индексация
Поведенческие сигналы

Knowledge Graph
Ссылки
EEAT и качество

Knowledge Graph
Поведенческие сигналы
Персонализация
