
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
Патент решает проблему ограниченности индексирования страницы только по ее собственному контенту. Он предлагает механизм использования экстринсивной (внешней) информации — текста, контекста и атрибутов входящих ссылок — для определения релевантности целевой страницы. Это критически важно для индексации ресурсов с малым количеством текста (изображения, мультимедиа) и позволяет проиндексировать страницу еще до того, как она будет сканирована. Также решается задача масштабируемой обработки огромного объема ссылочных данных.
Запатентована система и метод для эффективной обработки информации из анкорных тегов (anchor tags). Ядром изобретения является создание Sorted Anchor Map. Эта структура данных инвертирует информацию о ссылках: вместо хранения списка исходящих ссылок со страницы-источника (Link Log), она хранит список входящих ссылок и связанных с ними аннотаций (Annotations) для каждой целевой страницы, сортируя данные по целевому URL для быстрого доступа.
Система работает как часть конвейера индексирования:
Content filters извлекают исходящие ссылки и их Annotations (анкорный текст, контекст, атрибуты) и записывают их в Link Log.Global State Manager (GSM) обрабатывает Link Log и инвертирует данные.Sorted Anchor Map (организованную по целевым URL, для индексации текста) и Sorted Link Map (организованную по исходным URL, для расчета PageRank).Layered Sets) карт и периодически объединяет их (Merging) для консолидации данных и обработки удаленных ссылок.Sorted Anchor Map, чтобы ассоциировать анкорный текст с целевой страницей в индексе.Критически высокая. Это описание фундаментальной части инфраструктуры Google, отвечающей за обработку ссылочного графа и анкорного текста. Базовые принципы сбора, инверсии и индексации анкоров остаются центральными для работы поиска. Изобретатели (Jeffrey Dean, Sanjay Ghemawat) являются ключевыми архитекторами инфраструктуры Google.
Фундаментальное влияние (95/100). Патент описывает точный механизм, благодаря которому анкорный текст и контекст входящих ссылок становятся ключевыми факторами релевантности. Он подтверждает, что Google систематически извлекает и индексирует эту информацию, рассматривая ее как часть контента целевой страницы. Это критически важно для стратегий линкбилдинга и внутренней перелинковки.
Anchor Records), отсортированные по идентификатору целевого документа (Target Document Identifier). Агрегирует список исходных документов, ссылающихся на цель, и соответствующие аннотации. Представляет собой инвертированный граф ссылок.Text Passage (текстовый фрагмент) и Attributes (атрибуты текста).<STRONG>, <EM>, <CITE>), позицию текста, количество слов/символов.Delete Link) или документа (Delete Node). Используется при слиянии карт для актуализации данных.Link Logs, генерацию и слияние Sorted Anchor Maps и Sorted Link Maps.Sorted Maps, сгенерированных в разное время. Используется для эффективной обработки потока обновлений.Link Records) о найденных ссылках, организованные по исходным документам.PageRank.predetermined distance) от анкорного тега.Claim 1 (Независимый пункт): Описывает основной метод инверсии ссылочных данных.
Link Log (данные сканирования, организованные по источникам).Sorted Anchor Map.Sorted Anchor Map содержит записи, идентифицирующие целевой документ и список входящих ссылок (исходных документов).Ядром изобретения является масштабируемый процесс инвертирования журнала ссылок в карту анкоров, отсортированную по цели, что обеспечивает эффективный доступ к данным во время индексации.
Claim 2, 4 и 5 (Зависимые): Детализируют состав данных.
Sorted Anchor Map также содержит список Annotations (Claim 2).text passage) и список его атрибутов (list of attributes) (Claim 4).predetermined distance) от анкорного тега в исходном документе (Claim 5).Это критически важно для SEO, так как подтверждает, что система фиксирует не только точный анкорный текст, но и окружающий его текст (околоссылочный контекст) и его HTML-атрибуты.
Claim 6 и 7 (Зависимые): Описывают механизм масштабирования и обновления.
Layered Set of Sorted Anchor Maps.merge condition), подмножество карт объединяется в Merged Anchor Map.Это описывает инфраструктуру для непрерывной обработки потока новых данных о ссылках без полной перестройки всей структуры.
Claim 19 (Независимый пункт): Описывает полный процесс индексирования аннотаций.
Link Log и затем Anchor Map (с аннотациями).Этот пункт защищает конечную цель системы: использование текста внешних ссылок для индексации и поиска целевой страницы.
Изобретение является ключевой частью инфраструктуры обработки данных и затрагивает несколько этапов поиска.
CRAWLING – Сканирование и Сбор данных
На этом этапе Robots (краулеры) и Content Filters собирают сырые данные. Они извлекают исходящие ссылки и связанные с ними Annotations. Эти данные записываются в Link Log.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Global State Manager (GSM) читает Link Log и выполняет трансформацию данных:
Link Log), в формат, ориентированный на цель (Sorted Anchor Map).Sorted Link Map (ориентированный на источник).Indexers) читают Sorted Anchor Map и добавляют аннотации в основной индекс, связывая их с целевыми документами.Page Rankers используют Sorted Link Maps для расчета метрик авторитетности (например, PageRank).RANKING – Ранжирование
Проиндексированный анкорный текст (полученный на этапе INDEXING) используется алгоритмами ранжирования как сигнал релевантности целевой страницы запросу.
Процесс применяется непрерывно, но в несколько этапов с разными триггерами:
Global State Manager активируется для обработки Link Log и создания новых Sorted Maps, когда выполняется условие сброса (например, по времени, объему данных в логе или доступности памяти).Layered Set или во время простоя системы).Процесс А: Сбор данных (Выполняется Краулером и Фильтрами)
Attributes).Процесс Б: Обработка Логов и Генерация Карт (Выполняется Global State Manager)
Link Log.Link Log в память.Anchor Log. При обнаружении противоречий или исчезновении ссылок/документов генерируются записи об удалении (Delete Link Entry или Delete Node Entry).Anchor Sorter читает Anchor Log, консолидирует информацию для каждого целевого документа и сортирует записи по идентификатору цели. Новые карты добавляются в Layered Set.Процесс В: Слияние Карт (Выполняется Global State Manager)
Layered Set (предпочтительно схожего размера для эффективности).Delete Entry для ссылки, которая есть в более старой карте, эта ссылка исключается из результата.Система использует данные, извлеченные краулером и записанные в Link Log:
URL Fingerprints для эффективности).Annotation): <a>...</a>).predetermined distance) от анкорного тега на странице-источнике.<EM>), Strongly Emphasized (<STRONG>).<CITE>), Variable name (<VAR>), Source Code (<CODE>).text position), количество символов, количество слов.Патент фокусируется на инфраструктуре обработки данных, а не на вычислении метрик ранжирования. Он оперирует следующими методами:
Delete Entry.Хотя патент не описывает детали расчета PageRank, он указывает, что Sorted Link Maps создаются для его вычисления, и приводит базовую формулу PageRank: PR(A)=(1−d)+d∗∑(PR(Ti)/C(Ti)).
Annotations, которые включают не только текст ссылки, но и текст в пределах «заданного расстояния» (околоссылочный текст) (Claim 5).<strong>) и структурные свойства (например, позиция текста). Это предполагает, что оформление и расположение ссылки могут влиять на ее интерпретацию.Sorted Anchor Maps (для индексации текста/релевантности) и Sorted Link Maps (для расчета авторитетности/PageRank).Layered Sets и Merge Operations с использованием Delete Entry позволяет эффективно обновлять ссылочный граф, учитывая появление и удаление ссылок.Anchor Map и используется при индексации целевой страницы.Annotations включают текст в пределах «заданного расстояния» от ссылки, крайне важно, чтобы контент, окружающий ссылку на странице-доноре, тематически соответствовал целевой странице. Контекст должен усиливать сигнал анкора.STRONG, EM, CITE и т.д.) как часть Annotation. Использование логического выделения ключевых терминов в анкорном тексте или рядом с ним может влиять на интерпретацию аннотации.Delete Entry подчеркивает, что Google имеет эффективную систему для учета удаленных ссылок. Необходимо регулярно отслеживать и восполнять потерю важных ссылок.Annotation, что может снизить ценность ссылки.Anchor Maps на предмет неестественности.Annotation.Этот патент является фундаментальным для SEO. Он подтверждает, что релевантность страницы определяется не только ее собственным контентом, но и тем, как ее описывает остальной веб. Стратегически это означает, что линкбилдинг и внутренняя перелинковка должны фокусироваться не только на количестве или авторитетности ссылок, но и в равной степени на качестве, контексте и атрибутах самих анкоров. Долгосрочная стратегия должна быть направлена на формирование естественного и тематически релевантного анкорного профиля.
Сценарий 1: Оптимизация околоссылочного текста и атрибутов при аутриче
Annotation будет включать анкор, атрибут <strong> и релевантный окружающий текст («защищенный протокол», «настройка редиректов»), так как он находится в пределах predetermined distance.Сценарий 2: Индексирование PDF-документа
Annotation для заполнения Anchor Map для PDF-файла, позволяя ему ранжироваться по запросу [отчет о рынке электромобилей 2025], даже если сам PDF плохо индексируется.Что такое Annotation в контексте этого патента и чем она отличается от Anchor Text?
Annotation — это более широкое понятие. Она включает сам Anchor Text (текст внутри тега <a>), а также текст, находящийся в "пределах заданного расстояния" (околоссылочный контекст). Кроме того, Annotation хранит атрибуты этого текста, такие как выделение (strong, em) или цитирование (cite). Для SEO это означает, что оптимизировать нужно не только анкор, но и весь текстовый фрагмент вокруг ссылки.
Учитывает ли Google форматирование анкорного текста (например, выделение жирным)?
Да. В патенте указано, что Annotations включают список атрибутов (Attributes) текста. Приводятся конкретные примеры: <STRONG> (Strongly Emphasized), <EM> (Emphasized), <CITE> (Citation). Это означает, что форматирование анкора или окружающего текста сохраняется системой и может учитываться при индексировании.
В чем разница между Link Log, Link Map и Anchor Map?
Link Log – это сырые данные краулинга, организованные по источнику (Откуда -> Куда + Текст). Link Map – это обработанные данные, организованные по источнику, но без текста (Откуда -> Куда), используемые для расчета PageRank. Anchor Map – это инвертированные данные, организованные по цели (Куда <- Откуда + Текст), используемые для определения релевантности целевой страницы.
Как система обрабатывает удаление ссылок или изменение анкора?
Когда исходная страница пересканируется, Global State Manager обнаруживает изменения. Если ссылка удалена, генерируется Delete Entry. Если анкор изменился, создается новая запись. Эти изменения фиксируются в новых слоях Anchor Map. Во время процесса слияния (Merging) система обрабатывает эти записи хронологически и консолидирует актуальное состояние, отдавая приоритет более свежим данным.
Объясняет ли этот патент, почему Google медленно учитывает новые или удаленные ссылки?
Да, объясняет. Процесс не происходит в реальном времени. Сначала страница должна быть пересканирована (генерация Link Log). Затем Global State Manager должен обработать этот лог (генерация новой Anchor Map). И, наконец, для полной консолидации данных должен пройти цикл слияния (Merging) старых и новых карт. Эта многоступенчатая архитектура неизбежно приводит к задержкам.
Может ли страница ранжироваться, если Google ее еще не сканировал?
Да. Патент явно указывает это как одно из преимуществ. Если на новую страницу уже ведут ссылки с других известных сайтов, информация из их аннотаций попадает в Anchor Map и позволяет проиндексировать целевую страницу по этим текстам еще до ее фактического сканирования.
Как этот патент влияет на линкбилдинг для изображений или PDF?
Он подчеркивает критическую важность линкбилдинга для нетекстового контента. Поскольку в самих файлах мало или нет текста, Annotations (анкор и контекст) входящих ссылок становятся основным источником информации о содержании файла. Ссылки на такие файлы должны иметь максимально точный и описательный контекст.
Использует ли система информацию о дубликатах страниц при обработке анкоров?
Да. Патент упоминает, что индексаторы могут также получать доступ к информации в Sorted Anchor Maps, соответствующей ссылкам на дубликаты индексируемой страницы. Это позволяет агрегировать анкорный текст не только канонической страницы, но и ее дубликатов (в патенте указано ограничение размера этого списка, например, от 2 до 10 записей), что расширяет охват и полезно, например, для сбора анкоров на разных языках.
Влияет ли этот механизм на внутреннюю перелинковку?
Абсолютно. Внутренние ссылки обрабатываются точно так же, как и внешние. Они попадают в Link Log и используются для генерации Sorted Anchor Maps. Это делает внутреннюю перелинковку мощным инструментом для управления тем, как Google понимает контент и контекст страниц внутри сайта.
Используется ли этот патент сегодня?
Да, это фундаментальный патент, описывающий базовую архитектуру обработки ссылок в Google. Хотя конкретные реализации могли эволюционировать, базовые принципы инверсии ссылочного графа для индексации анкоров (Sorted Anchor Map) и расчета авторитетности (Sorted Link Map) остаются центральными для работы поисковой системы.

Структура сайта
SERP
Ссылки

Ссылки
Мультиязычность
Семантика и интент

Семантика и интент
Структура сайта
Техническое SEO

Ссылки
Семантика и интент
Индексация

Ссылки
Структура сайта
Семантика и интент

Ссылки
Антиспам
SERP

Ссылки
SERP
Поведенческие сигналы

Ссылки
SERP

Антиспам
Ссылки
Техническое SEO

Антиспам
Ссылки
Семантика и интент

Local SEO
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Local SEO

Ссылки
Семантика и интент
Техническое SEO

Поведенческие сигналы
SERP

Безопасный поиск
Поведенческие сигналы
Семантика и интент
