Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования

PROPAGATING USEFUL INFORMATION AMONG RELATED WEB PAGES, SUCH AS WEB PAGES OF A WEBSITE (Распространение полезной информации среди связанных веб-страниц, например, веб-страниц веб-сайта)

US7933890B2
Google LLC
2006-03-31
2011-04-26

Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.

Какую проблему решает

Патент решает проблему фрагментации сигналов релевантности внутри одного веб-сайта. Часто стандартные алгоритмы не могут определить наиболее полезную страницу на сайте, потому что ключевые сигналы привязаны к другим страницам того же домена. Например, главная страница может быть авторитетной для бренда (Authoritative Term), но не содержать специфики продукта, в то время как страница продукта содержит специфику, но не наследует авторитетность бренда. Аналогично, адрес компании может быть указан на странице контактов, но отсутствовать на главной. Это приводит к тому, что в ответ на запрос (например, "бренд + продукт" или "компания + город") поисковая система может ранжировать неоптимальную страницу сайта или не ранжировать сайт вовсе.

Что запатентовано

Запатентована система для анализа структуры веб-сайта (URL Hierarchy) и переноса (пропагации) важных информационных сигналов между его страницами для улучшения результатов поиска. Система работает в двух основных направлениях: (1) распространение "авторитетных терминов" (например, брендов) вниз по иерархии сайта и (2) распространение "высокоописательной информации" (например, адресов, категорий, уникальных терминов) вверх по иерархии. Цель — ассоциировать эту информацию с релевантными страницами, даже если она физически на них не присутствует, тем самым повышая их Search Score.

Как это работает

Механизм использует иерархию URL для определения взаимосвязей между страницами и осуществляет перенос информации:

Распространение вниз (Authoritative Terms): Система определяет термины, по которым сайт является авторитетным (используя внешние данные: анкоры ссылок, желтые страницы, поведение пользователей). Эти термины (например, название бренда) переносятся с главной страницы на внутренние релевантные страницы (например, страницы продуктов), повышая их рейтинг по брендированным запросам.
Распространение вверх (Highly Descriptive Information): Система идентифицирует высокоописательную информацию (адреса, редкие термины с высоким IDF, категории) на внутренних страницах. Эта информация агрегируется и с определенной степенью уверенности (Confidence Score) переносится на страницы выше по иерархии (например, на главную).

Эти новые ассоциации сохраняются в индексе и используются при расчете релевантности.

Актуальность для SEO

Высокая. Понимание того, как Google интерпретирует архитектуру сайта и распределяет сигналы (авторитетность, релевантность) внутри домена, критически важно для современного SEO. Описанные механизмы лежат в основе концепций построения иерархической структуры сайта, внутренней перелинковки и управления распределением веса и тематической авторитетности. Это особенно актуально для крупных e-commerce и контентных проектов.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегии, особенно в области технического SEO и архитектуры сайта. Он демонстрирует, что релевантность страницы зависит не только от ее контента, но и от контекста, предоставляемого другими страницами сайта через иерархическую структуру. Это напрямую влияет на стратегии построения структуры URL, внутренней перелинковки и оптимизации крупных сайтов, подтверждая необходимость четкой и логичной организации контента.

Термины и определения

Authoritative Term (Авторитетный термин): Термин (слово или фраза), сильно ассоциированный с веб-сайтом в целом. Часто это бренд или название организации. Авторитетность определяется на основе внешних сигналов (например, анкорный текст входящих ссылок, данные справочников, поведение пользователей).
Highly Descriptive Information (Высокоописательная информация): Информация, которая хорошо описывает сущность или тематику сайта, но часто находится на внутренних страницах, а не на главной. Примеры: адреса, локации, категории продуктов, редкие или "необычные" термины (Uncommon Terms).
URL Hierarchy (Иерархия URL): Структура веб-сайта, определяемая путем организации URL-адресов (например, по количеству слэшей). Используется системой для определения отношений "родитель-потомок" между страницами и направления распространения информации (вверх или вниз).
Intra-Website Information Association Operations (Операции по ассоциации информации внутри сайта): Процессы, которые идентифицируют полезную информацию на одной странице сайта и ассоциируют ее с другими связанными страницами того же сайта.
Information Retrieval (IR) Score (Оценка информационного поиска): Компонент общего рейтинга (Search Score), который отражает, насколько контент документа соответствует терминам поискового запроса.
PageRank Score (Оценка PageRank): Компонент общего рейтинга, отражающий авторитетность или важность страницы на основе ссылочной структуры Интернета. В патенте упоминается как один из возможных компонентов, на который может влиять распространение информации.
Inverse Document Frequency (IDF) (Обратная частота документа): Метрика, используемая для идентификации "необычных" или редких терминов. Термины с высоким IDF часто считаются высокоописательными.
Confidence Score (Оценка уверенности): Метрика, определяющая вероятность того, что распространяемая информация (особенно при движении вверх) действительно релевантна для целевой страницы.

Ключевые утверждения (Анализ Claims)

Патент описывает два основных механизма, которые отражены в независимых пунктах формулы изобретения: распространение информации вниз (Claim 1) и вверх (Claim 13).

Claim 1 (Независимый пункт): Распространение авторитетности вниз.

Описывает метод улучшения поискового индекса для сайта с иерархической структурой URL:

Система сканирует веб-страницы и поддерживает индекс.
Выбирается термин-кандидат с первой веб-страницы (например, главной).
Определяется, что этот термин является "сильно ассоциированным" (Strongly Associated Term / Авторитетным) для всего веб-сайта, используя данные, внешние по отношению к сайту (data external to the Website).
Идентифицируется вторая веб-страница, которая находится ниже первой в иерархии URL.
Индекс обновляется, чтобы ассоциировать термин-кандидат со второй веб-страницей. Эта ассоциация приводит к повышению Search Score второй страницы по запросам, содержащим этот термин.

Claim 13 (Независимый пункт): Распространение описательной информации вверх.

Описывает альтернативный метод улучшения поискового индекса:

Система сканирует веб-страницы и поддерживает индекс.
Выбирается термин-кандидат с первой веб-страницы (например, внутренней).
Определяется, что этот термин является "высокоописательным" (Highly Descriptive Term), потому что он "необычный" (uncommon).
Идентифицируется вторая веб-страница, которая находится выше первой в иерархии URL.
Индекс обновляется, чтобы ассоциировать термин-кандидат со второй веб-страницей. Эта ассоциация приводит к повышению Search Score второй страницы по запросам, содержащим этот термин.

Claim 34 (Независимый пункт): Объединенная система.

Описывает общую логику работы системы:

Выбор термина-кандидата на первой странице.
Определение типа термина: (1) Авторитетный ИЛИ (2) Высокоописательный.
Идентификация второй страницы: (1) Ниже первой, если термин авторитетный, ИЛИ (2) Выше первой, если термин высокоописательный.
Обновление индекса для ассоциации термина со второй страницей и повышения ее Search Score.

Где и как применяется

Изобретение применяется в основном на этапе индексирования и влияет на ранжирование.

CRAWLING – Сканирование и Сбор данных
На этом этапе собирается контент страниц и информация о структуре сайта (URL Hierarchy), которая необходима для последующего анализа пропагации.

INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Intra-Website Information Association Operations анализируют собранные данные:

Определяется иерархия сайта.
Анализируются внешние сигналы (анкоры, справочники, логи запросов) для определения Authoritative Terms.
Анализируется контент внутренних страниц для определения Highly Descriptive Information (например, с помощью IDF или распознавания адресов).
Выполняются операции распространения информации вверх и вниз по иерархии.
Результаты (новые ассоциации терминов и страниц) сохраняются в индексе (например, в инвертированном индексе) в виде дополнительных терминов или бустинга (Weight Boost).

RANKING – Ранжирование
На этом этапе эффект патента реализуется. При расчете Search Score система использует модифицированные данные индекса. Страницы получают более высокий балл за термины, которые были с ними ассоциированы в процессе пропагации, даже если эти термины физически отсутствуют на странице.

Входные данные:

Контент веб-страниц сайта.
Структура сайта (URL Hierarchy).
Внешние данные: анкорный текст входящих ссылок, данные Yellow Pages, информация о товарных знаках, регистрационные данные домена, логи поисковых запросов и кликов.

Выходные данные:

Модифицированный поисковый индекс (Revised Website/Web Page Information), содержащий дополнительные ассоциации между терминами и страницами сайта.

На что влияет

Конкретные типы контента и ниши:
- E-commerce: Критически важно для переноса авторитетности бренда на страницы категорий и товаров (вниз), а также для переноса названий категорий и уникальных характеристик товаров на главную страницу (вверх).
- Локальный бизнес: Важно для переноса адресов и локаций с внутренних страниц на главную (вверх).
- Крупные корпоративные сайты: Помогает ранжировать специфические отделы или продукты по брендированным запросам.
Специфические запросы:
- Брендированные запросы (Brand + Product/Service): Улучшает ранжирование внутренних страниц.
- Локализованные запросы (Service/Business + Location): Улучшает ранжирование главной страницы, если адрес был перенесен с внутренних.

Когда применяется

Алгоритм применяется при выполнении специфических условий для каждого направления пропагации.

Условия для распространения вниз:

Триггер: Сайт должен быть признан авторитетным для определенного термина (Authoritative Term) на основе внешних доказательств.
Исключения: Распространение может быть ограничено определенной глубиной иерархии (например, не более 2 уровней от источника). Также исключаются определенные типы страниц: пресс-релизы, форумы, гостевые книги, страницы на другом языке.

Условия для распространения вверх:

Триггер: Наличие Highly Descriptive Information (адреса, редкие термины) на страницах ниже по иерархии.
Пороги уверенности: Информация переносится только если Confidence Score превышает порог. Уверенность рассчитывается на основе агрегации доказательств со всех страниц ниже по иерархии.
Исключения (Dampening): Если сайт ассоциирован со слишком большим количеством разных локаций (например, общенациональная сеть), распространение адресов может быть отменено или ослаблено, так как сайт не имеет "физического фокуса".

Пошаговый алгоритм

Процесс А: Распространение авторитетной информации вниз (Downward Propagation)

Прием информации о сайте: Получение данных о контенте и структуре сайта.
Определение авторитетных терминов: Анализ внешних источников (анкоры, справочники, логи запросов) для определения терминов, по которым сайт авторитетен (Authoritative Terms).
Валидация терминов: Проверка силы авторитетности (например, вероятность того, что пользователь ищет именно этот сайт по данному термину).
Определение связанных страниц: Идентификация страниц, находящихся ниже исходной страницы (обычно главной) в URL Hierarchy.
Применение исключений: Исключение страниц, не подходящих для наследования авторитетности (форумы, пресс-релизы, другая языковая версия).
Ассоциация информации: Связывание Authoritative Terms с оставшимися целевыми страницами.
Сохранение данных: Обновление поискового индекса для отражения новых ассоциаций (например, добавление Weight Boost).

Процесс Б: Распространение описательной информации вверх (Upward Propagation)

Прием информации о сайте: Получение данных о контенте и структуре сайта.
Идентификация описательной информации: Поиск Highly Descriptive Information (адреса, локации, термины с высоким IDF) на внутренних страницах сайта.
Распространение и агрегация: Перенос информации вверх по URL Hierarchy. На каждом уровне агрегируются все доказательства (источники, частота упоминаний) со всех страниц, расположенных ниже.
Расчет уверенности: Определение Confidence Score для каждой единицы информации на каждой целевой странице (например, с использованием машинного обучения для взвешивания доказательств).
Проверка порогов и исключений: Проверка, превышает ли Confidence Score порог. Также проверка на наличие слишком большого количества разных локаций (что может привести к отмене переноса).
Ассоциация информации: Если условия выполнены, информация ассоциируется с целевой страницей (например, главной).
Сохранение данных: Обновление поискового индекса.

Какие данные и как использует

Данные на входе

Система использует комбинацию внутренних и внешних данных.

Внутренние данные (On-Site):

Контентные факторы: Текст на страницах (используется для поиска Highly Descriptive Information, включая адреса и редкие термины).
Технические факторы: Структура URL (критически важна для определения URL Hierarchy и направления распространения).

Внешние данные (Off-Site):

Ссылочные факторы: Анкорный текст входящих ссылок (ключевой источник для определения Authoritative Terms).
Поведенческие факторы: Логи запросов и кликов. Используются для валидации авторитетности (вероятность того, что запрос, содержащий термин, приведет к удовлетворительному клику на этот сайт).
Внешние базы данных: Данные Yellow Pages (справочники), информация о регистрации товарных знаков, регистрационные данные домена (используются для определения авторитетности и локаций).

Какие метрики используются и как они считаются

Strength of Association (Сила ассоциации / Авторитетность): Определяет, насколько сильно термин связан с сайтом. Рассчитывается на основе совокупности внешних доказательств.
Confidence Score (Оценка уверенности): Используется при распространении вверх. Рассчитывается для каждой страницы на основе агрегированных доказательств с нижележащих страниц. Может использовать машинное обучение для взвешивания различных источников информации.
Inverse Document Frequency (IDF): Используется для определения "необычных" (uncommon) терминов, которые считаются высокоописательными.
Search Score Boost (Повышение оценки ранжирования): Механизм применения ассоциации. Патент предлагает различные способы реализации:
- Увеличение веса термина (hit count) в инвертированном индексе.
- Добавление специального бустинга (Weight Boost), который может применяться выборочно в зависимости от запроса.
- Мультипликативное повышение итогового балла. Упоминается формула, где новый балл рассчитывается как:

Активный перенос сигналов внутри сайта: Google не рассматривает страницы изолированно. Система активно анализирует и переносит сигналы релевантности и авторитетности между страницами одного домена для улучшения качества поиска.
Критичность иерархической структуры URL: URL Hierarchy является основным механизмом, определяющим направление переноса сигналов (вверх или вниз). Четкая и логичная структура URL напрямую способствует правильному распределению сигналов.
Внешнее определение авторитетности: Авторитетность сайта для термина (например, бренда) определяется в первую очередь внешними факторами (ссылки, упоминания, поведение пользователей), а затем распространяется внутри сайта на релевантные страницы.
Идентификация описательной информации: Система идентифицирует ключевую описательную информацию (локации, уникальные термины/IDF) на внутренних страницах и агрегирует ее на более высоких уровнях иерархии.
Баланс и предотвращение "загрязнения" сигналов: Система использует механизмы исключений и оценок уверенности (Confidence Score), чтобы избежать некорректного переноса информации. Например, авторитетность не переносится на форумы или пресс-релизы, а слишком большое количество разных адресов может блокировать их перенос на главную.

Best practices (это мы делаем)

Построение четкой иерархической структуры URL: Внедряйте логичную структуру URL (например, site.com/category/product). Это напрямую помогает Google определить отношения между страницами и корректно распространять информацию вверх и вниз по иерархии.
Укрепление авторитетности бренда (Внешние сигналы): Работайте над тем, чтобы сайт стал авторитетным источником для своего бренда. Получайте внешние ссылки с брендовыми анкорами, обеспечьте корректное присутствие в справочниках (Yellow Pages). Это создает Authoritative Terms, которые затем будут распространены на внутренние страницы.
Размещение высокоописательной информации на внутренних страницах: Убедитесь, что ключевая информация (точные адреса, уникальные названия продуктов, специфические термины ниши) присутствует на соответствующих внутренних страницах. Это создает источник Highly Descriptive Information для распространения вверх.
Использование уникальных и редких терминов (High IDF): При описании продуктов или услуг используйте специфическую терминологию. Такие термины с большей вероятностью будут идентифицированы как высокоописательные и перенесены на страницы категорий или главную.
Локальный фокус для филиалов: Если у вас несколько филиалов, создавайте четкую структуру для каждого из них. Убедитесь, что система может уверенно ассоциировать конкретный адрес с конкретным разделом сайта, чтобы избежать блокировки переноса из-за слишком большого количества локаций на сайте в целом.

Worst practices (это делать не надо)

Плоская архитектура сайта: Размещение всех страниц на одном уровне (site.com/page1, site.com/page2) затрудняет определение URL Hierarchy и мешает эффективному распространению информации.
Скрытие ключевой информации: Размещение адресов или уникальных терминов в изображениях или скриптах, недоступных для индексации, не позволит системе идентифицировать их как Highly Descriptive Information.
Игнорирование структуры разделов "для пользователей": Создание больших разделов с форумами или пользовательским контентом (UGC) без четкого отделения от основного контента может привести к "загрязнению" сигналов, хотя патент и упоминает механизмы исключения таких разделов.
Непоследовательное использование брендинга: Использование разных вариантов написания бренда или отсутствие четкой связи между брендом и доменом усложняет определение Authoritative Terms.

Стратегическое значение

Этот патент подчеркивает стратегическую важность архитектуры сайта не просто как элемента навигации, а как ключевого фактора ранжирования. Он объясняет, как Google использует структуру для создания контекста и переноса сигналов. Для SEO-специалистов это означает, что организация контента и структура URL напрямую влияют на то, как авторитетность и релевантность распределяются по сайту. Долгосрочная стратегия должна включать регулярный аудит и оптимизацию архитектуры сайта для обеспечения эффективной пропагации сигналов.

Практические примеры

Сценарий 1: E-commerce (Распространение вниз)

Сайт: Официальный интернет-магазин Nike (nike.com).
Ситуация: Пользователь ищет "Nike Air Max 270".
Работа механизма: Google определяет, что nike.com авторитетен для термина "Nike" (на основе внешних сигналов). Этот Authoritative Term распространяется вниз по иерархии на страницу nike.com/t/air-max-270.
Результат: Страница товара получает буст за счет унаследованной авторитетности по слову "Nike". Это помогает ей ранжироваться выше, чем аналогичная страница товара на сайте мультибрендового ритейлера (например, footlocker.com) по этому запросу.

Сценарий 2: Локальный бизнес (Распространение вверх)

Сайт: Сайт ресторана "Saigon II" (saigon2.com).
Ситуация: На главной странице нет адреса и не упоминается блюдо "Фо" (Pho). Адрес есть на странице saigon2.com/contact, а "Фо" — на saigon2.com/menu. Пользователь ищет "ресторан фо в Пало-Альто".
Работа механизма: Google идентифицирует адрес (Пало-Альто) и редкий термин "Фо" как Highly Descriptive Information на внутренних страницах. Эта информация распространяется вверх по иерархии на главную страницу saigon2.com.
Результат: Главная страница получает буст по терминам "Фо" и "Пало-Альто", даже если они на ней отсутствуют, что позволяет ей ранжироваться по данному запросу.

Как именно Google определяет, что сайт является "авторитетным" для определенного термина?

Патент указывает, что авторитетность (Authoritative Term) определяется на основе данных, внешних по отношению к сайту (data external to the Website). Конкретные источники включают: анкорный текст входящих ссылок, упоминания в справочниках (Yellow Pages), регистрационные данные домена, информацию о товарных знаках. Также используется анализ поведения пользователей: высокая вероятность того, что запрос с этим термином приведет к удовлетворительному клику именно на этот сайт.

Заменяет ли этот механизм необходимость во внутренней перелинковке?

Нет, не заменяет. Хотя патент описывает распространение информации на основе URL Hierarchy, внутренняя перелинковка остается критически важным сигналом. Однако этот механизм дополняет перелинковку, позволяя передавать контекст и авторитетность даже при отсутствии прямых ссылок, если страницы связаны иерархически через структуру URL.

Что произойдет, если структура моего сайта не является строго иерархической или использует плоскую структуру URL?

Механизмы, описанные в патенте, полагаются на URL Hierarchy для определения направления распространения информации (вверх или вниз). Плоская или нечеткая структура URL значительно затрудняет работу этого алгоритма. Система не сможет надежно определить отношения "родитель-потомок", что приведет к неэффективному распределению авторитетности и описательных сигналов.

Как обрабатываются сайты с большим количеством филиалов и адресов?

Патент предусматривает механизм защиты от "размытия" локальных сигналов. Если система обнаруживает слишком много разных адресов, ассоциированных с сайтом в целом (например, у общенациональной сети), она может решить не распространять эти адреса вверх на главную страницу или ослабить их влияние. Это делается для того, чтобы сайты без четкого "физического фокуса" не получали неоправданного преимущества в локальном поиске по всем адресам сразу.

Что считается "высокоописательной информацией", кроме адресов?

Помимо адресов и локаций, патент упоминает "необычные термины" (Uncommon Terms), определяемые, например, через высокий показатель IDF (редко встречающиеся в вебе). Также упоминаются категории страниц или продуктов. На практике это могут быть уникальные артикулы, названия специфических услуг или нишевые термины.

Может ли авторитетность бренда быть перенесена на нерелевантные страницы сайта?

Патент предусматривает исключения для предотвращения этого. Авторитетные термины не распространяются на определенные типы страниц, такие как пресс-релизы, форумы, гостевые книги или страницы на другом языке. Также распространение может быть ограничено определенной глубиной иерархии от источника информации.

Как рассчитывается "Оценка уверенности" (Confidence Score) при распространении информации вверх?

Confidence Score рассчитывается для каждой целевой страницы путем агрегации доказательств со всех страниц, расположенных ниже нее в иерархии. Учитываются источники информации, частота упоминаний и контекст. Патент предполагает использование систем машинного обучения для взвешивания этих разнородных доказательств и определения итогового уровня уверенности.

Влияет ли этот механизм на PageRank или только на текстовую релевантность (IR Score)?

Патент упоминает, что ассоциация информации может влиять как на компонент информационного поиска (IR Score), так и на компонент ранжирования контента (например, PageRank Score). Например, распространение авторитетного термина может быть реализовано как добавление виртуальных ссылок с этим анкором на целевую страницу, что повлияет на ее ссылочный профиль и потенциально на PageRank.

Как быстро происходит перенос информации после изменения структуры сайта или контента?

Процесс анализа и распространения информации происходит на этапе индексирования (INDEXING). Изменения будут учтены после того, как поисковая система пересканирует измененные страницы, переиндексирует их и выполнит пересчет внутренних ассоциаций для всего сайта или затронутого сегмента.

Если я добавлю адрес на главную страницу, нужен ли мне этот механизм распространения вверх?

Если информация уже присутствует на странице, механизм распространения не требуется для этой конкретной информации. Однако система все равно может использовать распространение вверх для других Highly Descriptive Terms (например, категорий услуг или уникальных терминов), которые отсутствуют на главной, но присутствуют на внутренних страницах.

Как Google использует внутреннюю структуру сайта и авторитетность для корректировки ранжирования

Google использует механизм для уточнения позиций в поиске, анализируя как внешние сигналы (авторитетность сайта), так и внутренние сигналы (структура сайта, внутренние ссылки). Система вычисляет «Внутрисайтовую оценку ранжирования» для определения важности страницы внутри сайта и использует её для корректировки «Глобальной оценки ранжирования». Однако влияние внутренних факторов ограничивается уровнем доверия к сайту.

US8843477B1
2014-09-23

Структура сайта
Техническое SEO
EEAT и качество

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта

Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.

US9208233B1
2015-12-08

Ссылки
Семантика и интент
Индексация

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента

Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.

US7603350B1
2009-10-13

EEAT и качество
Knowledge Graph
SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента

Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.

US8959093B1
2015-02-17

Поведенческие сигналы
Ссылки
SERP

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент

Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.

US8874558B1
2014-10-28

EEAT и качество
Свежесть контента
Индексация

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)

Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.

US8898150B1
2014-11-25

Поведенческие сигналы
SERP
Мультимедиа

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов

Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.

US7610282B1
2009-10-27

Поведенческие сигналы
SERP
Семантика и интент

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи

Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.

US8838587B1
2014-09-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта

Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.

US7962462B1
2011-06-14

Поведенческие сигналы
Ссылки
SERP

Как Google использует пользовательский контент (UGC) и историю поиска для сбора структурированных отзывов

Google анализирует пользовательский контент (фотографии, посты, метаданные) и историю поиска, чтобы определить, с какими объектами (места, продукты, услуги) взаимодействовал пользователь. Система проактивно предлагает оставить структурированный отзыв, используя шаблон, который может быть предварительно заполнен на основе тональности исходного UGC. Это направлено на увеличение объема и подлинности отзывов.

US20190278836A1
2019-09-12

Семантика и интент
Персонализация
EEAT и качество

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей

Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.

US9116957B1
2015-08-25

Поведенческие сигналы
Семантика и интент
SERP

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов

Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.

US9104759B1
2015-08-11

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google динамически перестраивает SERP в реальном времени, основываясь на взаимодействии пользователя с подзадачами

Google использует специализированные AI-модели для разбивки сложных запросов (задач) на подзадачи. Система отслеживает, с какими подзадачами взаимодействует пользователь, и динамически обновляет выдачу, подгружая больше релевантного контента для этой подзадачи прямо во время скроллинга страницы. Это позволяет уточнять интент пользователя в реальном времени.

US20250209127A1
2025-06-26

SERP
Поведенческие сигналы
Семантика и интент

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.

US8903812B1
2014-12-02

Поведенческие сигналы
SERP
Антиспам

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия

Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.

US9020927B1
2015-04-28

Поведенческие сигналы
SERP
EEAT и качество