
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
Патент решает проблему ограниченности традиционных методов поиска информации, которые часто полагаются только на содержание документа (текст) и базовые метаданные (автор, дата создания) или жесткие иерархические структуры каталогов. Это затрудняет поиск релевантной информации, если пользователь не знает точного содержания или расположения документа. Изобретение улучшает качество поиска за счет учета того, как пользователи концептуально организуют информацию.
Запатентована система, которая использует определяемые пользователем организационные структуры (user-defined organizational relationships) для расчета независимого от запроса рейтинга документов (Ranking Score). Эти структуры включают логические каталоги, виртуальные структуры (например, ярлыки/метки, как в Gmail) и закладки. Система рассматривает эти организационные связи как 'ссылки' между документами и использует алгоритмы, подобные PageRank, для расчета рейтинга на основе этих концептуальных связей.
Система работает в несколько этапов:
degree of relatedness): документы в одной папке связаны сильнее, чем документы в соседних (сестринских) папках.Ranking Score для документов на основе этих связей. Учитывается количество связей, их сила и рейтинг связанных документов (используется итеративный алгоритм типа PageRank). Также может учитываться количество разных пользователей, создавших связь.IR score) и комбинирует его с предварительно рассчитанным Ranking Score для определения итогового рейтинга в выдаче.Средняя. Патент подан в 2004 году и описывает механизмы, которые изначально были актуальны для десктопного, персонализированного или корпоративного поиска (например, Gmail, Google Desktop). Однако базовые принципы использования концептуальных и структурных связей для передачи ранжирующего веса остаются фундаментальными для SEO и архитектуры веб-сайтов, хотя методы их идентификации в современном вебе (например, через нейронные сети и анализ сущностей) ушли далеко вперед.
Патент имеет высокое значение (7/10) для понимания принципов информационной архитектуры и внутреннего ссылочного графа сайта. Он формализует идею о том, что структурная и концептуальная организация контента напрямую влияет на ранжирование. Механизм передачи веса между документами, основанный на их структурной близости (общие папки/ярлыки против сестринских папок/ярлыков), дает четкое обоснование для построения сильной архитектуры сайта, оптимизации структуры URL и создания тематических кластеров.
PageRank.IR Score и Ranking Score.Claim 1 (Независимый пункт): Описывает основной механизм дифференцированного учета связей разной силы для ранжирования.
First Relationship) между первым и вторым документом. Эта связь интерпретируется как "Первая ссылка" (First Link). Условия для Первой связи: общий иерархический ярлык, общая поддиректория ИЛИ общая папка закладок. (Это сильная связь).Second Relationship) между первым и третьим документом. Эта связь интерпретируется как "Вторая ссылка" (Second Link). Условия для Второй связи: сестринские (sibling) ярлыки, сестринские поддиректории ИЛИ сестринские папки закладок. (Это более слабая связь).Ranking Score на основе Первой и Второй ссылок.Ranking Score, чем Вторая ссылка.Claim 6 (Зависимый от 1): Уточняет механизм расчета рейтинга. Ranking Score первого документа основывается на Ranking Score второго и третьего документов. Это подтверждает использование итеративного алгоритма, подобного PageRank, где связанные документы передают свой вес.
Claim 7 (Зависимый от 1): Уточняет, что Ranking Score также зависит от количества других документов, которые разделяют ту же организационную структуру (ярлык, директорию, закладку) с первым документом.
Claim 9 (Независимый пункт): Описывает механизм с акцентом на ярлыки (Labels) и учет мнения нескольких пользователей.
Ranking Score (вклад Первой ссылки больше, чем Второй).Ranking Score дополнительно основывается на количестве разных пользователей, присвоивших ярлыки.Ranking Score первого документа модифицируется на основе этой Третьей ссылки.Изобретение применяется на этапах индексирования для расчета структурного рейтинга и на этапе ранжирования для его применения.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная работа по анализу структур и расчету рейтинга.
First Relationship, Second Relationship) между документами и определяются степени близости (degree of relatedness).Ranking Score для каждого документа на основе этих связей (например, используя PageRank). Эти оценки сохраняются в индексе.RANKING – Ранжирование
На этом этапе предварительно рассчитанный рейтинг используется для сортировки результатов.
IR Score).IR Score с предварительно рассчитанным Ranking Score (основанным на связях) для получения Total Score.Total Score.Входные данные:
Выходные данные:
Ranking Score для каждого документа, основанный на концептуальных связях.Хотя патент в первую очередь описывает системы, где Google имеет прямой доступ к пользовательским организационным структурам (десктопный поиск, Gmail, корпоративный поиск), его принципы применимы к веб-поиску через анализ аналогичных структур на сайтах:
Ranking Score на основе связей происходит в процессе индексирования и обновляется по мере изменения организационных структур.Ranking Score используется как фактор ранжирования при обработке поисковых запросов, комбинируясь с IR Score.Процесс А: Расчет рейтинга на основе связей (Индексирование)
Degree of Relatedness): First Relationship): Общий ярлык/папка.Second Relationship): Сестринский ярлык/папка.Ranking Score для документа A. Может использоваться формула, подобная PageRank: Где R1..Rn – связанные документы. При этом вклад каждого связанного документа (слагаемого в скобках) дополнительно взвешивается в зависимости от силы связи (First Relationship вносит больший вклад, чем Second Relationship).Ranking Score сохраняется в индексе.Процесс Б: Обработка запроса (Ранжирование)
IR Score) для каждого документа.Ranking Score) из индекса.Total Score) путем комбинации IR Score и Ranking Score.Total Score и отображение результатов пользователю.Патент фокусируется на использовании структурных данных, созданных пользователями.
First Relationship (Высокая): Общая папка/ярлык.Second Relationship (Низкая): Сестринская папка/ярлык.PageRank (см. Пошаговый алгоритм).Ranking Score и IR Score.Links) между документами.PageRank для расчета рейтинга на основе этих структурных ссылок. Документы передают вес друг другу в зависимости от их собственного рейтинга.Degree of Relatedness). Более тесные связи (First Relationship, например, в одной папке) передают значительно больше веса, чем более слабые связи (Second Relationship, например, в сестринских папках).Ranking Score.Total Score) является комбинацией его релевантности запросу (IR Score) и его структурного рейтинга (Ranking Score).Хотя патент описывает анализ пользовательских структур (папки, ярлыки), его принципы напрямую переносятся на проектирование архитектуры веб-сайтов, поскольку структура сайта является аналогом этих организационных систем.
/blog/seo/) формируют сильные связи (First Relationship) и активно обмениваются весом.First Relationship.Degree of Relatedness.Second Relationship). Проектируйте архитектуру так, чтобы наиболее важные страницы получали максимальный вес через сильные связи.Multiple Users).site.com/page1, site.com/page2) не позволяет системе идентифицировать четкие концептуальные группы и сильные связи (First Relationship), что затрудняет передачу структурного веса.Ranking Score.Second Relationship), что снижает общую эффективность передачи веса.Патент подтверждает критическую важность информационной архитектуры (IA) для SEO. Он предоставляет математическую модель (PageRank по структуре) и четкие правила (дифференциация сильных и слабых связей) для проектирования сайтов. Стратегически, это означает, что структура сайта — это не просто удобство для пользователя, а мощный инструмент управления распределением ранжирующего веса. Понимание того, как структурная близость влияет на передачу веса, является ключом к созданию эффективной SEO-стратегии на уровне архитектуры.
Сценарий: Оптимизация архитектуры интернет-магазина
Применение принципов дифференциации связей для распределения веса.
/shoes/running/product1.html и /shoes/hiking/product2.html./shoes/running/ тесно связаны между собой (общая поддиректория). Они активно обмениваются весом друг с другом и со страницей категории /shoes/running/. Это усиливает ранжирование всех страниц в этом кластере по запросам, связанным с беговой обувью./shoes/running/ и /shoes/hiking/ связаны слабее, так как это сестринские директории. Они обмениваются весом, но в значительно меньшей степени, чем внутри своих категорий./shoes/running/ (блоки похожих товаров, навигация по бренду внутри категории).Ranking Score для страниц внутри кластеров.Описывает ли этот патент внутренние ссылки на сайте?
Патент напрямую не описывает внутренние ссылки на веб-сайтах. Он описывает "концептуальные связи", основанные на пользовательских организационных структурах, таких как файловые директории, ярлыки (labels) и закладки. Однако в контексте веб-поиска структура сайта (URL-адреса, навигация, внутренняя перелинковка) является прямым аналогом этих организационных структур. Принципы передачи веса, описанные в патенте, применимы к анализу внутреннего ссылочного графа сайта.
Что такое "First Relationship" и "Second Relationship" и как это использовать в SEO?
First Relationship — это сильная связь между документами в одной группе (общая папка, ярлык). Second Relationship — это более слабая связь между документами в соседних (сестринских) группах. В SEO это означает, что страницы внутри одного тематического кластера или одной поддиректории URL (например, /blog/seo/) имеют сильную связь и активно обмениваются весом. Страницы в соседних разделах (например, /blog/seo/ и /blog/ppc/) имеют слабую связь и обмениваются весом в меньшей степени. Нужно максимизировать перелинковку внутри кластера.
В патенте упоминается PageRank. Значит ли это, что структура сайта формирует отдельный вид PageRank?
Да, именно так. Патент предлагает использовать итеративный алгоритм, аналогичный PageRank (и даже приводит формулу), для расчета рейтинга документа (Ranking Score) исключительно на основе его концептуальных и структурных связей с другими документами. Этот "структурный PageRank" затем комбинируется со стандартной оценкой релевантности (IR Score) для финального ранжирования.
Как влияет на ранжирование количество документов в разделе или кластере?
Согласно патенту (Claim 7), Ranking Score документа зависит от количества других документов, разделяющих ту же организационную структуру. В теории, принадлежность к большой, хорошо организованной группе (кластеру или разделу) может положительно влиять на рейтинг, при условии, что документы в этой группе также имеют хороший рейтинг и тесно связаны между собой.
Что означает учет "разных пользователей" (Multiple Users) в патенте для веб-поиска?
В патенте указано, что если несколько пользователей независимо присваивают ярлык или добавляют документ в закладки, это повышает его рейтинг. В веб-поиске прямым аналогом этого являются внешние ссылки с разных, независимых сайтов или социальные сигналы/упоминания. Это подтверждает важность разнообразия и естественности ссылочного профиля как сигнала доверия.
Стоит ли использовать плоскую структуру URL, чтобы все страницы были максимально связаны?
Исходя из принципов этого патента, плоская структура не оптимальна. Хотя все страницы будут находиться в одной "папке" (корне сайта), отсутствие иерархии не позволяет системе идентифицировать четкие концептуальные группы и управлять распределением веса. Иерархическая структура позволяет создавать сильные тематические кластеры и более эффективно направлять структурный вес на нужные страницы.
Как этот патент соотносится с современными алгоритмами, такими как BERT или MUM?
Этот патент описывает использование структуры, а не содержания. Алгоритмы типа BERT и MUM фокусируются на понимании языка и семантики контента для расчета IR Score. Описанный в патенте механизм расчета Ranking Score на основе структуры дополняет семантический анализ. Оба типа оценок (структурная и семантическая) комбинируются для итогового ранжирования.
Влияют ли непрямые связи на ранжирование?
Да. Патент (Claim 9) описывает учет непрямых связей (Третья ссылка). Например, если ваш документ A связан с документом B (общая метка), а документ B связан с документом C (другая общая метка), то рейтинг документа C может повлиять на рейтинг документа A, хотя и в меньшей степени, чем прямые связи. Это стандартный принцип распространения веса в графовых алгоритмах типа PageRank.
Актуален ли этот патент, учитывая, что он подан в 2004 году?
Хотя патент старый и фокусировался на технологиях того времени (десктопный поиск), описанные в нем фундаментальные принципы — использование структуры для ранжирования, дифференциация силы связей на основе близости и применение PageRank к этим связям — остаются крайне актуальными для понимания основ SEO и информационной архитектуры сегодня.
Как лучше всего комбинировать релевантность контента и структурный рейтинг?
Необходимо обеспечить, чтобы страницы с наиболее релевантным контентом (высокий потенциальный IR Score) также занимали стратегически важные позиции в архитектуре сайта, получая максимальный структурный вес (высокий Ranking Score). Это достигается путем размещения ключевых страниц в центре сильных тематических кластеров и обеспечения мощной внутренней перелинковки на них.

Семантика и интент
Ссылки
SERP

Индексация
Local SEO
Структура сайта

EEAT и качество
Knowledge Graph
SERP

Семантика и интент

Поведенческие сигналы
Персонализация

Поведенческие сигналы
Персонализация
SERP

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
SERP
Структура сайта

Семантика и интент
SERP
Ссылки

Семантика и интент
Поведенческие сигналы
EEAT и качество

Свежесть контента
Антиспам
Ссылки

Поведенческие сигналы
Ссылки
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

Поведенческие сигналы
Семантика и интент
SERP

Индексация
Ссылки
SERP
