
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
Патент решает задачу улучшения разнообразия поисковой выдачи (diverse search results), особенно для неоднозначных запросов (ambiguous query). Цель – переупорядочить (re-arranged) результаты поиска таким образом, чтобы топовые результаты представляли более широкий спектр информации. Кроме того, система позволяет определять взаимосвязи между документами, которые не связаны друг с другом прямыми гиперссылками.
Запатентован метод оценки и переранжирования набора документов, основанный на анализе взаимосвязей терминов (word relationships) внутри них. Система анализирует локальные взаимодействия терминов, агрегирует их в глобальный граф с учетом исходного порядка документов (initial order), и на основе этого строит граф взаимосвязей между документами (document relationship graph). Финальный скоринг производится путем анализа ссылок (link analysis) на этом графе, например, с помощью алгоритмов типа PageRank.
Система работает по следующему алгоритму на этапе переранжирования:
Term Score). Определяются локальные взаимосвязи (local term relationships) на основе близости (например, в одном параграфе) и рассчитывается их вес.global term relationship graph). При этом учитывается исходный порядок: связи из более поздних документов добавляются, только если они сильнее существующих.Term-Document Weight (TDW) – метрика, показывающая семантический вклад документа в понимание термина.Document Relationship Graph. Связи основаны на общих терминах, а направление зависит от того, какой документ имеет больший суммарный TDW.PageRank) для расчета новых оценок и переранжирования набора.Высокая. Хотя конкретные формулы, описанные в патенте (подан в 2008), могли эволюционировать с развитием нейросетевых моделей, базовые концепции анализа семантических связей, близости терминов (proximity) и использования графовых структур для определения авторитетности контента остаются фундаментальными для современного поиска и понимания Topical Authority.
Патент имеет высокое значение (8.5/10) для SEO-стратегии. Он описывает конкретный механизм оценки авторитетности и взаимосвязей документов без опоры на гиперссылки. Это подчеркивает критическую важность глубокой проработки темы, использования релевантных терминов и сущностей в тесной связке друг с другом (co-occurrence и proximity), а также важность семантической структуры контента для ранжирования.
TDW. Используется для финального скоринга.TDW.local term relationships из набора документов. Отражает самые сильные взаимодействия между терминами, выбранные с учетом initial order.Claim 1 (Независимый пункт): Описывает основной метод ранжирования.
initial order).local term relationships). Это включает генерацию local term relationships graph для каждого документа.document relationships) на основе локальных взаимосвязей И исходного порядка документов. Это включает: global term relationships graph на основе локальных графов.document relationships graph на основе глобального графа.score) для каждого документа на основе взаимосвязей документов.Ядро изобретения — использование анализа внутренних текстовых связей и обязательный учет исходного порядка документов для построения графа связей между документами и их последующего переранжирования.
Claim 4 (Зависимый от 1): Уточняет критерий локальной взаимосвязи.
Локальная взаимосвязь между парой терминов существует, если оба термина расположены в одном и том же параграфе (same paragraph) внутри документа.
Claim 5 (Зависимый от 1): Уточняет расчет веса локальной связи.
Величина (magnitude) локальной взаимосвязи определяется на основе разницы позиций пары терминов в документе (близости) и/или самих позиций этих терминов (раннее появление).
Claim 8 (Зависимый от 1): Уточняет метод финального скоринга.
Финальный скоринг и упорядочивание включают выполнение анализа ссылок (link analysis) графа взаимосвязей документов.
Claim 9 (Зависимый от 1): Уточняет процесс идентификации терминов.
Идентификация локальных взаимосвязей включает определение оценки (score) для каждого термина, выбор подмножества терминов на основе их оценок и анализ взаимосвязей только среди этого подмножества.
Изобретение представляет собой механизм переранжирования, который применяется после основного этапа ранжирования.
RANKING – Ранжирование
На этом этапе система генерирует исходный набор результатов поиска, которые удовлетворяют запросу и имеют исходный порядок (initial order), основанный на стандартных оценках (например, релевантности, PageRank).
RERANKING – Переранжирование
Основное применение патента. Система принимает на вход упорядоченный набор документов (например, Топ-1000) с этапа RANKING и выполняет глубокий семантический анализ контента для переоценки их авторитетности и взаимосвязей.
Term Scores, построение локальных и глобальных графов терминов.Document Relationship Graph на основе семантического вклада (TDW).link analysis к графу документов.Входные данные:
Initial Order).Выходные данные:
score-based order).ambiguous query), где требуется повысить разнообразие выдачи (diverse search results). Также влияет на информационные запросы, где авторитетность определяется глубиной и связностью раскрытия темы.Процесс переранжирования набора документов.
Этап 1: Подготовка и Идентификация Терминов
TF-IDF).Этап 2: Построение Локальных Графов Терминов
interactions) между выбранными терминами на основе близости (например, в одном параграфе).Local Term Relationship Graph.Term Scores обоих терминов и расстояние между ними во взаимодействии (Формула 2).Этап 3: Построение Глобального Графа Терминов
Global Term Relationship Graph.initial order документов.Этап 4: Построение Графа Документов
TDW. Это произведение Term Weight и суммы скоростей увеличения весов ребер, которые пришли из этого документа (Формула 4). TDW показывает семантический вклад («новизну») документа.TDW.Document Relationship Graph.TDW всех общих терминов. Если Сумма TDW(Dm) > Сумма TDW(Dn), ребро направлено от Dn к Dm.Этап 5: Скоринг и Ранжирование
PageRank).Система использует исключительно контентные и структурные факторы из предоставленного набора документов, а также их исходный порядок.
named entity).initial order) документов в наборе.В патенте описаны конкретные формулы для расчета ключевых метрик.
1. Term Score (S) (Оценка термина в документе)
Метрика значимости термина в документе (Equation 1).
Term Score), тем сильнее связь (выше Edge Weight).Term Score и Edge Weight придают больший вес терминам, которые появляются раньше в документе (меньший знаменатель в формулах). Это предполагает, что основная тема и ключевые сущности должны быть заявлены в начале текста.Initial Order) критически важен. При построении глобального графа предпочтение отдается связям из документов, которые изначально ранжировались выше. Это значит, что базовая релевантность или авторитетность влияет на интерпретацию семантики всего набора.TDW) по общим терминам. Это механизм выявления экспертного контента, который глубже или по-новому раскрывает взаимосвязи терминов.Local Term Relationships.Term Score и Edge Weight зависят от позиции первого вхождения, важно использовать наиболее значимые термины как можно раньше в тексте (в первых предложениях/параграфах).TDW и, как следствие, более высокий финальный скоринг.Term Score может быть повышен для именованных сущностей. Насыщение контента релевантными сущностями и обеспечение их взаимодействия с другими терминами является важной стратегией.TDW.Term Score) будет занижена из-за формулы расчета, что негативно скажется на всем процессе анализа.Патент подтверждает стратегическую важность семантического SEO и построения Topical Authority. Он демонстрирует механизм для оценки качества и авторитетности контента путем анализа того, насколько хорошо и глубоко в нем проработаны взаимосвязи между терминами и сущностями. Долгосрочная стратегия должна фокусироваться не на наличии ключевых слов, а на создании экспертного контента, структурированного для максимизации силы семантических связей внутри текста.
Сценарий: Оптимизация статьи "Уход за Хаски"
Плохая реализация (Слабые связи):
Результат: Термины "Хаски", "линька", "фурминатор" разнесены по разным параграфам. Взаимодействия нет. Term Score для "Хаски" низкий из-за позднего вхождения.
Хорошая реализация (Сильные связи):
Результат: Термины "Хаски", "линька", "шерсть", "фурминатор", "подшерсток" находятся в одном параграфе и часто в одном предложении. Term Score для "Хаски" высокий. Система идентифицирует сильные локальные связи (высокий Edge Weight), что увеличивает вероятность высокого финального скоринга.
Как этот патент связан с концепцией Topical Authority?
Патент напрямую описывает механизм, который может использоваться для измерения Topical Authority на основе контента. Система оценивает, насколько сильно и глубоко связаны различные термины внутри документа и в рамках всего набора. Документы, которые демонстрируют наиболее сильные и значимые связи между терминами в определенной теме, получат более высокий Term-Document Weight (TDW) и, как следствие, будут считаться более авторитетными.
Заменяет ли этот алгоритм PageRank?
Нет, не обязательно заменяет. Патент описывает этот механизм как способ переранжирования уже существующего набора результатов. Однако алгоритм анализа ссылок (подобный PageRank) применяется на финальном этапе, но уже не к графу гиперссылок, а к графу семантических связей документов (Document Relationship Graph), построенному на основе контента.
Что важнее согласно патенту: частота термина или его позиция?
Оба фактора важны и входят в формулу Term Score. Однако позиция первого вхождения имеет очень большое значение, так как используется в знаменателе формулы. Чем раньше термин встречается впервые (меньше номер предложения), тем выше его оценка при прочих равных. Это подчеркивает важность размещения ключевых терминов в самом начале документа.
Как система определяет, что два термина взаимодействуют?
Взаимодействие (interaction) определяется по близости (proximity). В патенте приведены примеры: нахождение в одном предложении, в одном параграфе (Claim 4) или на расстоянии предопределенного количества предложений друг от друга. Нахождение в одном параграфе является ключевым условием, упомянутым в Claims.
Почему важен исходный порядок документов (Initial Order)?
Исходный порядок критичен при построении Глобального графа терминов. Система обрабатывает документы последовательно. Связь из документа, идущего позже (ниже в рейтинге), заменит связь из документа, идущего раньше (выше в рейтинге), только если её вес выше. Это создает уклон в сторону интерпретации семантики, заданной документами, которые уже считаются авторитетными или релевантными.
Что такое TDW (Term-Document Weight) простыми словами?
TDW – это метрика, показывающая, насколько данный документ обогащает понимание конкретного термина в контексте всего набора результатов. Он учитывает общую важность термина и то, насколько сильно этот документ улучшил (усилил) связи этого термина по сравнению с предыдущими документами. Высокий TDW указывает на высокую семантическую ценность или новизну документа по данному термину.
Как оптимизировать контент под этот алгоритм?
Ключевая стратегия – оптимизация близости (Proximity Optimization). Необходимо размещать семантически связанные термины и сущности как можно ближе друг к другу (в одном предложении/параграфе) и делать это как можно раньше в тексте. Контент должен быть структурирован так, чтобы максимизировать силу и количество взаимодействий между релевантными терминами.
Влияет ли этот алгоритм на все типы запросов?
В патенте указано, что одно из преимуществ системы – улучшение разнообразия результатов для неоднозначных запросов (ambiguous query). Вероятно, он оказывает наибольшее влияние на информационные и широкие запросы, где важно определить авторитетные источники и различные аспекты темы, а не на узкие транзакционные или навигационные запросы.
Как система определяет, какие термины являются значимыми?
Система использует фильтрацию (например, TF-IDF) для удаления общих слов, а затем рассчитывает Term Score на основе частоты, позиции и типа термина (например, бонусы для именованных сущностей). Для анализа взаимосвязей выбирается только подмножество терминов с наивысшими оценками (например, Топ-20).
Как определяется направление связи в графе документов?
Направление определяется сравнением суммарного семантического вклада (TDW) общих терминов для двух документов. Если Документ А имеет больший суммарный TDW по общим терминам, чем Документ Б, то связь будет направлена от Б к А. Это означает, что Документ А считается более семантически авторитетным источником по этим терминам.

Семантика и интент
SERP

EEAT и качество
Knowledge Graph
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы

Local SEO
Семантика и интент
Индексация

Поведенческие сигналы

SERP
Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
SERP

SERP
Семантика и интент
Ссылки

Local SEO
Поведенческие сигналы

SERP
EEAT и качество
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Поведенческие сигналы
SERP
Семантика и интент

Структура сайта
SERP
Ссылки

Поведенческие сигналы
SERP
Мультимедиа
