
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
Патент решает проблему фрагментации сигналов релевантности внутри одного веб-сайта. Часто стандартные алгоритмы не могут определить наиболее полезную страницу на сайте, потому что ключевые сигналы привязаны к другим страницам того же домена. Например, главная страница может быть авторитетной для бренда (Authoritative Term), но не содержать специфики продукта, в то время как страница продукта содержит специфику, но не наследует авторитетность бренда. Аналогично, адрес компании может быть указан на странице контактов, но отсутствовать на главной. Это приводит к тому, что в ответ на запрос (например, "бренд + продукт" или "компания + город") поисковая система может ранжировать неоптимальную страницу сайта или не ранжировать сайт вовсе.
Запатентована система для анализа структуры веб-сайта (URL Hierarchy) и переноса (пропагации) важных информационных сигналов между его страницами для улучшения результатов поиска. Система работает в двух основных направлениях: (1) распространение "авторитетных терминов" (например, брендов) вниз по иерархии сайта и (2) распространение "высокоописательной информации" (например, адресов, категорий, уникальных терминов) вверх по иерархии. Цель — ассоциировать эту информацию с релевантными страницами, даже если она физически на них не присутствует, тем самым повышая их Search Score.
Механизм использует иерархию URL для определения взаимосвязей между страницами и осуществляет перенос информации:
IDF, категории) на внутренних страницах. Эта информация агрегируется и с определенной степенью уверенности (Confidence Score) переносится на страницы выше по иерархии (например, на главную).Эти новые ассоциации сохраняются в индексе и используются при расчете релевантности.
Высокая. Понимание того, как Google интерпретирует архитектуру сайта и распределяет сигналы (авторитетность, релевантность) внутри домена, критически важно для современного SEO. Описанные механизмы лежат в основе концепций построения иерархической структуры сайта, внутренней перелинковки и управления распределением веса и тематической авторитетности. Это особенно актуально для крупных e-commerce и контентных проектов.
Патент имеет высокое значение (8/10) для SEO-стратегии, особенно в области технического SEO и архитектуры сайта. Он демонстрирует, что релевантность страницы зависит не только от ее контента, но и от контекста, предоставляемого другими страницами сайта через иерархическую структуру. Это напрямую влияет на стратегии построения структуры URL, внутренней перелинковки и оптимизации крупных сайтов, подтверждая необходимость четкой и логичной организации контента.
Uncommon Terms).Search Score), который отражает, насколько контент документа соответствует терминам поискового запроса.IDF часто считаются высокоописательными.Патент описывает два основных механизма, которые отражены в независимых пунктах формулы изобретения: распространение информации вниз (Claim 1) и вверх (Claim 13).
Claim 1 (Независимый пункт): Распространение авторитетности вниз.
Описывает метод улучшения поискового индекса для сайта с иерархической структурой URL:
Strongly Associated Term / Авторитетным) для всего веб-сайта, используя данные, внешние по отношению к сайту (data external to the Website).Search Score второй страницы по запросам, содержащим этот термин.Claim 13 (Независимый пункт): Распространение описательной информации вверх.
Описывает альтернативный метод улучшения поискового индекса:
Highly Descriptive Term), потому что он "необычный" (uncommon).Search Score второй страницы по запросам, содержащим этот термин.Claim 34 (Независимый пункт): Объединенная система.
Описывает общую логику работы системы:
Search Score.Изобретение применяется в основном на этапе индексирования и влияет на ранжирование.
CRAWLING – Сканирование и Сбор данных
На этом этапе собирается контент страниц и информация о структуре сайта (URL Hierarchy), которая необходима для последующего анализа пропагации.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Intra-Website Information Association Operations анализируют собранные данные:
Authoritative Terms.Highly Descriptive Information (например, с помощью IDF или распознавания адресов).Weight Boost).RANKING – Ранжирование
На этом этапе эффект патента реализуется. При расчете Search Score система использует модифицированные данные индекса. Страницы получают более высокий балл за термины, которые были с ними ассоциированы в процессе пропагации, даже если эти термины физически отсутствуют на странице.
Входные данные:
URL Hierarchy).Выходные данные:
Revised Website/Web Page Information), содержащий дополнительные ассоциации между терминами и страницами сайта.Алгоритм применяется при выполнении специфических условий для каждого направления пропагации.
Условия для распространения вниз:
Authoritative Term) на основе внешних доказательств.Условия для распространения вверх:
Highly Descriptive Information (адреса, редкие термины) на страницах ниже по иерархии.Confidence Score превышает порог. Уверенность рассчитывается на основе агрегации доказательств со всех страниц ниже по иерархии.Процесс А: Распространение авторитетной информации вниз (Downward Propagation)
Authoritative Terms).URL Hierarchy.Authoritative Terms с оставшимися целевыми страницами.Weight Boost).Процесс Б: Распространение описательной информации вверх (Upward Propagation)
Highly Descriptive Information (адреса, локации, термины с высоким IDF) на внутренних страницах сайта.URL Hierarchy. На каждом уровне агрегируются все доказательства (источники, частота упоминаний) со всех страниц, расположенных ниже.Confidence Score для каждой единицы информации на каждой целевой странице (например, с использованием машинного обучения для взвешивания доказательств).Confidence Score порог. Также проверка на наличие слишком большого количества разных локаций (что может привести к отмене переноса).Система использует комбинацию внутренних и внешних данных.
Внутренние данные (On-Site):
Highly Descriptive Information, включая адреса и редкие термины).URL Hierarchy и направления распространения).Внешние данные (Off-Site):
Authoritative Terms).uncommon) терминов, которые считаются высокоописательными.hit count) в инвертированном индексе.Weight Boost), который может применяться выборочно в зависимости от запроса.URL Hierarchy является основным механизмом, определяющим направление переноса сигналов (вверх или вниз). Четкая и логичная структура URL напрямую способствует правильному распределению сигналов.IDF) на внутренних страницах и агрегирует ее на более высоких уровнях иерархии.Confidence Score), чтобы избежать некорректного переноса информации. Например, авторитетность не переносится на форумы или пресс-релизы, а слишком большое количество разных адресов может блокировать их перенос на главную.site.com/category/product). Это напрямую помогает Google определить отношения между страницами и корректно распространять информацию вверх и вниз по иерархии.Authoritative Terms, которые затем будут распространены на внутренние страницы.Highly Descriptive Information для распространения вверх.site.com/page1, site.com/page2) затрудняет определение URL Hierarchy и мешает эффективному распространению информации.Highly Descriptive Information.Authoritative Terms.Этот патент подчеркивает стратегическую важность архитектуры сайта не просто как элемента навигации, а как ключевого фактора ранжирования. Он объясняет, как Google использует структуру для создания контекста и переноса сигналов. Для SEO-специалистов это означает, что организация контента и структура URL напрямую влияют на то, как авторитетность и релевантность распределяются по сайту. Долгосрочная стратегия должна включать регулярный аудит и оптимизацию архитектуры сайта для обеспечения эффективной пропагации сигналов.
Сценарий 1: E-commerce (Распространение вниз)
Authoritative Term распространяется вниз по иерархии на страницу nike.com/t/air-max-270.Сценарий 2: Локальный бизнес (Распространение вверх)
saigon2.com/contact, а "Фо" — на saigon2.com/menu. Пользователь ищет "ресторан фо в Пало-Альто".Highly Descriptive Information на внутренних страницах. Эта информация распространяется вверх по иерархии на главную страницу saigon2.com.Как именно Google определяет, что сайт является "авторитетным" для определенного термина?
Патент указывает, что авторитетность (Authoritative Term) определяется на основе данных, внешних по отношению к сайту (data external to the Website). Конкретные источники включают: анкорный текст входящих ссылок, упоминания в справочниках (Yellow Pages), регистрационные данные домена, информацию о товарных знаках. Также используется анализ поведения пользователей: высокая вероятность того, что запрос с этим термином приведет к удовлетворительному клику именно на этот сайт.
Заменяет ли этот механизм необходимость во внутренней перелинковке?
Нет, не заменяет. Хотя патент описывает распространение информации на основе URL Hierarchy, внутренняя перелинковка остается критически важным сигналом. Однако этот механизм дополняет перелинковку, позволяя передавать контекст и авторитетность даже при отсутствии прямых ссылок, если страницы связаны иерархически через структуру URL.
Что произойдет, если структура моего сайта не является строго иерархической или использует плоскую структуру URL?
Механизмы, описанные в патенте, полагаются на URL Hierarchy для определения направления распространения информации (вверх или вниз). Плоская или нечеткая структура URL значительно затрудняет работу этого алгоритма. Система не сможет надежно определить отношения "родитель-потомок", что приведет к неэффективному распределению авторитетности и описательных сигналов.
Как обрабатываются сайты с большим количеством филиалов и адресов?
Патент предусматривает механизм защиты от "размытия" локальных сигналов. Если система обнаруживает слишком много разных адресов, ассоциированных с сайтом в целом (например, у общенациональной сети), она может решить не распространять эти адреса вверх на главную страницу или ослабить их влияние. Это делается для того, чтобы сайты без четкого "физического фокуса" не получали неоправданного преимущества в локальном поиске по всем адресам сразу.
Что считается "высокоописательной информацией", кроме адресов?
Помимо адресов и локаций, патент упоминает "необычные термины" (Uncommon Terms), определяемые, например, через высокий показатель IDF (редко встречающиеся в вебе). Также упоминаются категории страниц или продуктов. На практике это могут быть уникальные артикулы, названия специфических услуг или нишевые термины.
Может ли авторитетность бренда быть перенесена на нерелевантные страницы сайта?
Патент предусматривает исключения для предотвращения этого. Авторитетные термины не распространяются на определенные типы страниц, такие как пресс-релизы, форумы, гостевые книги или страницы на другом языке. Также распространение может быть ограничено определенной глубиной иерархии от источника информации.
Как рассчитывается "Оценка уверенности" (Confidence Score) при распространении информации вверх?
Confidence Score рассчитывается для каждой целевой страницы путем агрегации доказательств со всех страниц, расположенных ниже нее в иерархии. Учитываются источники информации, частота упоминаний и контекст. Патент предполагает использование систем машинного обучения для взвешивания этих разнородных доказательств и определения итогового уровня уверенности.
Влияет ли этот механизм на PageRank или только на текстовую релевантность (IR Score)?
Патент упоминает, что ассоциация информации может влиять как на компонент информационного поиска (IR Score), так и на компонент ранжирования контента (например, PageRank Score). Например, распространение авторитетного термина может быть реализовано как добавление виртуальных ссылок с этим анкором на целевую страницу, что повлияет на ее ссылочный профиль и потенциально на PageRank.
Как быстро происходит перенос информации после изменения структуры сайта или контента?
Процесс анализа и распространения информации происходит на этапе индексирования (INDEXING). Изменения будут учтены после того, как поисковая система пересканирует измененные страницы, переиндексирует их и выполнит пересчет внутренних ассоциаций для всего сайта или затронутого сегмента.
Если я добавлю адрес на главную страницу, нужен ли мне этот механизм распространения вверх?
Если информация уже присутствует на странице, механизм распространения не требуется для этой конкретной информации. Однако система все равно может использовать распространение вверх для других Highly Descriptive Terms (например, категорий услуг или уникальных терминов), которые отсутствуют на главной, но присутствуют на внутренних страницах.

Структура сайта
Техническое SEO
EEAT и качество

Ссылки
Семантика и интент
Индексация

EEAT и качество
Knowledge Graph
SERP

Поведенческие сигналы
Ссылки
SERP

EEAT и качество
Свежесть контента
Индексация

Поведенческие сигналы
SERP
Мультимедиа

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Ссылки
SERP

Семантика и интент
Персонализация
EEAT и качество

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

SERP
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
SERP
Антиспам

Поведенческие сигналы
SERP
EEAT и качество
