SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google анализирует структуру URL и сигналы качества для выбора Sitelinks (Primary Resources)

SELECTING PRIMARY RESOURCES (Выбор основных ресурсов)
  • US20150199357A1
  • Google LLC
  • 2011-04-14
  • 2015-07-16
  • Структура сайта
  • Техническое SEO
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует алгоритм для идентификации наиболее важных страниц сайта (Primary Resources), которые затем отображаются как Sitelinks в поисковой выдаче. Система строит иерархическую модель сайта на основе структуры URL (а не ссылок) и оценивает каждую страницу по нескольким критериям: глубина в иерархии, количество дочерних страниц, количество внешних и внутренних ссылок, PageRank и качество контента. Этот метод позволяет выбирать Sitelinks даже без данных о трафике.

Описание

Какую проблему решает

Патент решает задачу идентификации наиболее важных и полезных страниц (Primary Resources) внутри домена для улучшения навигации пользователя. Цель — помочь пользователям быстро находить ключевые разделы или сервисы сайта (например, продукты, новости, почту), минуя промежуточные страницы и отличая их от второстепенного контента (например, политики конфиденциальности). Система выделяет эти ресурсы, отображая их в виде Sitelinks на странице результатов поиска (SERP). Важной особенностью является способность системы выполнять эту задачу без использования данных о трафике или истории посещений.

Что запатентовано

Запатентована система выбора Primary Resources (функционально эквивалентных Sitelinks) на основе структурного и качественного анализа домена. Система генерирует иерархическую модель (hierarchical model или sitemap) сайта, основываясь исключительно на структуре URL (хостнеймы и пути), а не на ссылочных связях между страницами. Затем узлы этой модели оцениваются по различным метрикам (глубина, количество потомков, ссылочный авторитет, качество контента), и наиболее важные страницы выбираются как Primary Resources.

Как это работает

Ключевой механизм включает несколько этапов:

  • Генерация иерархической модели: Система анализирует URL ресурсов домена и строит древовидную структуру. Положение узла определяется его URL (например, example.com/news является потомком example.com).
  • Оценка узлов: Для каждого узла рассчитываются оценки по нескольким критериям: Node Depth (глубина в иерархии), Descendant Node Score (количество дочерних узлов), Link Scores (внутренние, внешние ссылки, PageRank) и Content Score (качество контента).
  • Комбинированная оценка: Индивидуальные оценки агрегируются в Combined Score.
  • Выбор основных ресурсов: Для определенного ресурса (например, главной страницы) выбирается N потомков с наивысшими Combined Scores. Они назначаются Primary Resources.
  • Отображение: Ссылки на эти Primary Resources отображаются вместе со ссылкой на родительский ресурс в SERP (Sitelinks).

Актуальность для SEO

Высокая. Генерация Sitelinks остается критически важным элементом SERP. Описанные в патенте фундаментальные принципы — использование иерархической структуры сайта (IA), ссылочного авторитета и качества контента — остаются актуальными для SEO. Метод особенно важен как надежный механизм для анализа новых сайтов или разделов, где поведенческие данные (трафик, клики) еще не накоплены.

Важность для SEO

Патент имеет высокое значение для SEO (85/100). Он раскрывает конкретные механизмы, которые Google может использовать для выбора Sitelinks, и подтверждает критическую важность Информационной Архитектуры. Это напрямую влияет на стратегии оптимизации структуры URL, внутренней перелинковки и наращивания ссылочной массы. Понимание этих механизмов позволяет SEO-специалистам влиять на то, какие страницы будут выбраны в качестве Primary Resources, что критично для CTR и распределения трафика.

Детальный разбор

Термины и определения

Combined Score (Комбинированная оценка)
Агрегированная оценка узла, основанная на двух или более индивидуальных критериях (например, взвешенное среднее). Используется для финального выбора Primary Resources.
Content Score (Оценка контента)
Метрика, оценивающая качество контента ресурса. Может основываться на качестве заголовков (Title) и степени соответствия заголовка тексту анкоров (Anchor Text) ссылок, ведущих на ресурс.
Descendant Node Score (Оценка количества потомков)
Метрика, основанная на количестве дочерних узлов (потомков) в иерархической модели. Указывает на навигационную полезность узла: чем больше потомков, тем больше навигационных опций предоставляет ресурс.
Hierarchical Model / Hierarchical Sitemap (Иерархическая модель / Карта сайта)
Структура данных (например, дерево или направленный ациклический граф), моделирующая иерархию домена. Узлы представляют ресурсы, а их положение определяется исключительно структурой URL (хостнейм и путь), а не ссылками между страницами.
Link Analysis Score (Оценка анализа ссылок)
Метрика качества и авторитетности, основанная на анализе ссылок, например, PageRank.
Node Depth Score (Оценка глубины узла)
Метрика, основанная на позиции узла в иерархической модели, например, расстояние (количество ребер) от корневого узла. Меньшая глубина обычно указывает на большую важность ресурса.
Off-domain Link Score (Оценка внешних ссылок)
Метрика, основанная на количестве ссылок на ресурс извне данного домена.
On-domain Link Score (Оценка внутренних ссылок)
Метрика, основанная на количестве ссылок на ресурс внутри данного домена.
Primary Resources (Основные ресурсы)
Ресурсы в домене, идентифицированные как наиболее важные или полезные. Функционально эквивалентно Sitelinks в поисковой выдаче.

Ключевые утверждения (Анализ Claims)

Анализ основан на финальной версии Claims (1, 62-87), представленной в документе.

Claim 1 (Независимый пункт): Описывает базовый метод классификации ресурсов.

  1. Генерация иерархической карты сайта (hierarchical sitemap) интернет-домена.
  2. Генерация оценки (score) для конкретного узла, основанной как минимум на позиции этого узла в иерархической карте сайта.
  3. Классификация ресурса, соответствующего этому узлу, как основного ресурса (primary resource) на основе этой оценки.

Ядро изобретения — использование структурной позиции ресурса (определяемой его URL) как фактора для определения его важности.

Claim 66 (Зависимый от 1): Определяет основу иерархической карты.

Позиция каждого узла основана на пути (path) и имени хоста (hostname) URL ресурса. Подтверждает, что модель строится на URL, а не на краулинге ссылок.

Claim 62 и 63 (Зависимые от 1): Уточняют, что подразумевается под «позицией».

  • Claim 62: Оценка основывается на количестве узлов-потомков (quantity of descendent nodes). Это подтверждает важность страниц-хабов (Descendant Node Score).
  • Claim 63: Оценка основывается на расстоянии (distance) через иерархическую карту сайта. Это подтверждает важность глубины (Node Depth Score).

Claim 64 (Зависимый от 1): Критически важное условие.

Генерация оценки выполняется без использования информации, указывающей на трафик (without using information indicating traffic) на ресурс. Этот метод выбора Sitelinks не зависит от поведенческих факторов.

Claim 69 (Зависимый): Описывает полный процесс с использованием нескольких критериев.

  1. Генерация оценок по нескольким критериям.
  2. Генерация комбинированной оценки (combined score).
  3. Выбор одного или нескольких узлов-потомков для родительского узла на основе их combined scores.
  4. Назначение этих ресурсов как Primary Resources для родительского узла.

Это описывает практическую реализацию: агрегация различных сигналов (структурных, ссылочных, контентных) для выбора лучших Sitelinks.

Claim 70 (Зависимый от 69): Описывает применение в поиске (SERP).

Предоставление для отображения ссылки на родительский ресурс и, в ассоциации с ней, ссылок на его Primary Resources, исключая ссылки на неосновные ресурсы (non-primary resources) в этой ассоциации. Это точное описание блока Sitelinks.

Где и как применяется

Изобретение затрагивает этапы индексирования для расчета метрик и финальные этапы формирования выдачи для отображения результатов.

INDEXING – Индексирование и извлечение признаков
Основной этап применения логики патента. Здесь происходит:

  • Анализ URL всех ресурсов домена и построение Hierarchical Model.
  • Расчет индивидуальных метрик для каждого узла: структурных (Node Depth, Descendant Score), ссылочных (Link Scores, PageRank) и контентных (Content Score).
  • Агрегация метрик в Combined Score.
  • Выбор и сохранение списка Primary Resources для опорных ресурсов (например, главной страницы). Эта работа выполняется офлайн.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
На этом этапе система использует предварительно рассчитанные данные для формирования SERP. Когда опорный ресурс (например, главная страница) появляется в результатах поиска, система извлекает связанный с ним список Primary Resources и формирует блок Sitelinks.

Входные данные:

  • Набор URL ресурсов в домене (включая структуру хостнеймов и путей).
  • Данные о ссылках (внутренних и внешних), включая анкорный текст.
  • Метрики авторитетности (например, PageRank).
  • Контент ресурсов (в частности, заголовки Title).

Выходные данные:

  • Hierarchical Model домена.
  • Набор оценок (Scores) для каждого ресурса.
  • Список назначенных Primary Resources (Sitelinks), связанных с опорным ресурсом.

На что влияет

  • Типы контента: Наибольшее влияние оказывается на страницы, которые служат навигационными хабами (категории, основные разделы услуг), имеющие много дочерних элементов и относительно небольшую глубину вложенности.
  • Специфические запросы: В первую очередь влияет на навигационные и брендовые запросы, по которым высоко ранжируется главная страница или крупный раздел сайта, что запускает отображение Sitelinks.
  • Новые сайты: Механизм критически важен для новых сайтов или сайтов с низким трафиком, так как он явно не требует поведенческих данных для выбора Sitelinks.

Когда применяется

  • Условия работы алгоритма: Алгоритм расчета применяется во время индексирования (офлайн). Отображение результатов происходит в реальном времени при генерации SERP.
  • Триггеры активации: Патент предлагает этот метод как способ, который может быть использован, когда данных о трафике или логов запросов недостаточно для использования поведенческих методов выбора Sitelinks, или как базовый метод структурного анализа.
  • Частота применения: Пересчет может происходить периодически или при обнаружении значительных изменений в структуре домена или его ссылочном профиле.

Пошаговый алгоритм

Этап 1: Построение иерархической модели

  1. Сбор данных: Получение списка URL ресурсов домена.
  2. Нормализация и фильтрация: Идентификация эквивалентных ресурсов (дубликатов) по контенту (например, с помощью хеширования). Выбор канонического ресурса для представления в модели. Обработка редиректов.
  3. Генерация модели: Построение древовидной структуры (Hierarchical Model). Положение узла определяется исключительно анализом его URL (субдомены и элементы пути). Ссылки между страницами не влияют на структуру модели.

Этап 2: Расчет оценок узлов

  1. Расчет структурных метрик:
    • Descendant Node Score: Подсчет количества потомков для каждого узла.
    • Node Depth Score: Определение расстояния от корневого узла до каждого узла.
  2. Расчет ссылочных метрик:
    • Off-domain и On-domain Link Scores: Подсчет внешних и внутренних ссылок.
    • Link Analysis Score: Использование PageRank или аналогичных метрик.
  3. Расчет контентных метрик:
    • Content Score: Оценка качества контента, например, путем анализа соответствия заголовка (Title) и анкорного текста входящих ссылок.

Этап 3: Агрегация и выбор

  1. Генерация комбинированной оценки: Расчет Combined Score для каждого узла (например, взвешенное среднее индивидуальных оценок). Применение штрафов или порогов (например, требование наличия внешних ссылок).
  2. Выбор Primary Resources: Для опорного ресурса (например, главной страницы) анализируются оценки его потомков. Выбирается подмножество потомков (например, Топ-N) с наивысшими Combined Scores.
  3. Назначение и сохранение: Выбранные ресурсы назначаются как Primary Resources и сохраняются в индексе.
  4. Подготовка заголовков: Для каждого Primary Resource выбирается заголовок. Система может удалять избыточные части, дублирующие название опорного ресурса (например, сокращение "Example Mail" до "Mail" для сайта "Example").

Какие данные и как использует

Данные на входе

Система использует несколько групп факторов, при этом явно указывается возможность работы без поведенческих данных (Claim 64).

  • Структурные факторы (Критически важно):
    • Структура URL (пути и хостнеймы). Это основа для построения Hierarchical Model и расчета Node Depth и Descendant Node Score.
  • Ссылочные факторы:
    • Входящие внешние и внутренние ссылки (количество).
    • Анкорный текст входящих ссылок (используется для Content Score).
    • Метрики авторитетности (Link Analysis Score, например, PageRank).
  • Контентные факторы:
    • Заголовки страниц (Title). Используются для расчета Content Score и для отображения в Sitelinks.
    • Контент страниц (используется для обнаружения дубликатов).
  • Поведенческие факторы:
    • Система спроектирована так, чтобы функционировать без использования информации о трафике или логов запросов.

Какие метрики используются и как они считаются

Система вычисляет следующие ключевые метрики:

  • DescendantNodeScoreDescendant Node ScoreDescendantNodeScore: Подсчет количества дочерних узлов в иерархической модели. Чем больше, тем лучше (указывает на навигационную полезность).
  • NodeDepthScoreNode Depth ScoreNodeDepthScore: Расстояние от корневого узла. Чем меньше глубина, тем лучше (указывает на общую важность).
  • LinkScoresLink ScoresLinkScores: Включают On-domain, Off-domain (количество) и Link Analysis Score (PageRank).
  • ContentScoreContent ScoreContentScore: Рассчитывается, например, на основе степени совпадения заголовка (Title) страницы с текстом анкоров входящих ссылок.
  • CombinedScoreCombined ScoreCombinedScore: Агрегация (например, взвешенное среднее) вышеуказанных метрик.

Выводы

  1. Структура URL определяет иерархию сайта для Google: Патент четко указывает, что Hierarchical Model строится на основе анализа URL (субдомены и пути), независимо от внутренней перелинковки. Это подчеркивает критическую важность логичной и чистой структуры URL для SEO.
  2. Sitelinks могут определяться без данных о трафике: Ключевой вывод (Claim 64) — Google имеет механизм для выбора Primary Resources (Sitelinks), который не зависит от трафика или CTR. Это позволяет формировать Sitelinks для новых или низкочастотных сайтов на основе структуры и ссылок.
  3. Идеальный кандидат для Sitelink: Это страница, которая (1) находится неглубоко в иерархии URL (низкий Node Depth), (2) является структурным хабом с множеством дочерних страниц (высокий Descendant Score), и (3) имеет сильный ссылочный профиль (высокие Link Scores и PageRank).
  4. Важность навигационных хабов (Descendant Score): Система предпочитает страницы, которые предоставляют пользователю много навигационных опций (много потомков), так как они считаются более полезными для навигации.
  5. Ссылки подтверждают важность: Структурной значимости недостаточно. Ресурсы должны подтвердить свою важность через ссылки. Отсутствие внешних ссылок может привести к пессимизации при расчете Combined Score.
  6. Качество контента через анализ Title и Анкоров: Content Score учитывает, насколько хорошо Title страницы соответствует анкорам входящих ссылок, подчеркивая важность консистентности между тем, как на страницу ссылаются, и тем, как она себя позиционирует.

Практика

Best practices (это мы делаем)

  • Проектирование логичной иерархической структуры URL: Информационная архитектура должна быть отражена в URL. Используйте понятные пути, отражающие иерархию (например, /category/subcategory/). Это напрямую формирует Hierarchical Model, которую анализирует Google.
  • Уменьшение глубины важных страниц в URL: Ключевые разделы и сервисы должны иметь короткие URL и находиться близко к корню домена (низкий Node Depth Score). Например, example.com/services лучше, чем example.com/main/info/services.
  • Развитие структурных хабов: Убедитесь, что страницы категорий или разделов структурно (по URL) находятся выше страниц, которые в них входят. Это повышает Descendant Node Score для страниц-хабов, увеличивая их шансы стать Primary Resources.
  • Наращивание ссылочного авторитета на ключевые разделы: Активно стройте внешние ссылки (для повышения Off-domain Link Score и PageRank) и оптимизируйте внутреннюю перелинковку (для повышения On-domain Link Score) на те страницы, которые вы хотите видеть в Sitelinks.
  • Оптимизация согласованности Title и Анкоров: Убедитесь, что заголовки (Title) ключевых страниц четкие и описательные, и что текст внутренних и внешних ссылок, ведущих на эти страницы, релевантен этим заголовкам. Это повышает Content Score.
  • Каноникализация и устранение дубликатов: Система объединяет эквивалентные ресурсы в один узел. Необходимо обеспечить корректную каноникализацию, чтобы ссылочные сигналы консолидировались на правильной версии страницы.

Worst practices (это делать не надо)

  • Использование плоской структуры URL для больших сайтов: Размещение всех страниц на одном уровне (например, example.com/page1) не позволяет системе построить осмысленную Hierarchical Model и рассчитать Descendant Scores, что затрудняет выбор Primary Resources.
  • Создание избыточно глубоких URL: Сложные и длинные URL увеличивают Node Depth, что снижает вероятность выбора страницы в качестве Primary Resource.
  • Игнорирование ссылочного профиля внутренних разделов: Если ключевые разделы сайта не имеют достаточного количества внутренних и внешних ссылок, их Combined Score будет низким, даже если они структурно расположены правильно.
  • Использование неинформативных или нерелевантных анкоров: Использование анкоров, не соответствующих заголовку целевой страницы, негативно сказывается на Content Score.

Стратегическое значение

Патент подтверждает фундаментальную важность продуманной Информационной Архитектуры (IA) и структуры URL в SEO. Он показывает, что Google имеет механизмы для алгоритмического понимания иерархии сайта, основанные на анализе самих URL, а не только на краулинге ссылок. Стратегически, это означает, что техническое SEO и проектирование структуры являются основой не только для ранжирования, но и для представления сайта в SERP (Sitelinks).

Практические примеры

Сценарий: Оптимизация Sitelinks для сайта Ecommerce

Задача: Добиться того, чтобы в Sitelinks отображались ключевые категории товаров, а не информационные страницы.

  1. Анализ текущей структуры URL: Сайт имеет плоскую структуру: store.com/category-name.html для категорий и store.com/product-name.html для товаров.
  2. Проблема: Система не видит иерархии. Descendant Score для категорий равен нулю.
  3. Реализация (Best Practice): Изменение структуры URL на иерархическую: store.com/category/ и store.com/category/product-name/.
  4. Результат: Система строит Hierarchical Model, где категории являются родителями товаров. Descendant Score для категорий значительно увеличивается.
  5. Дополнительная оптимизация: Усиление перелинковки на страницы категорий из меню (повышение On-domain Link Score) и получение внешних ссылок на ключевые категории (повышение Off-domain Link Score и PageRank).
  6. Итог: Страницы категорий получают высокий Combined Score и выбираются в качестве Primary Resources (Sitelinks).

Вопросы и ответы

Как Google строит иерархическую модель сайта согласно патенту?

Ключевой момент: модель строится исключительно на основе анализа структуры URL (хостнеймов и путей), а не на основе ссылок между страницами. Например, example.com/news/world считается потомком example.com/news из-за структуры пути. Субдомены также формируют иерархию (mail.example.com является потомком example.com). Это подчеркивает важность логичной структуры URL.

Что такое Primary Resources и как они связаны с Sitelinks?

Primary Resources — это термин патента для обозначения наиболее важных и полезных страниц в домене, выбранных алгоритмом. В патенте описано, что эти ресурсы предоставляются для отображения в ассоциации с основным результатом поиска (Claim 70), чтобы облегчить навигацию. Это функционально эквивалентно тому, что SEO-специалисты называют Sitelinks.

Влияет ли трафик или CTR на выбор Sitelinks согласно этому патенту?

Нет, и это важная особенность. Патент явно указывает (Claim 64), что описанный метод может генерировать оценки и выбирать Primary Resources без использования информации о трафике или логов запросов. Это позволяет системе выбирать Sitelinks на основе структурных и качественных сигналов, особенно когда поведенческих данных недостаточно.

Как повысить шансы страницы попасть в Sitelinks, основываясь на этом патенте?

Нужно максимизировать её Combined Score. Для этого страница должна находиться неглубоко в структуре URL (низкий Node Depth), быть структурным хабом (высокий Descendant Score, т.е. иметь много дочерних страниц, определенных через URL), обладать значительным количеством качественных внутренних и внешних ссылок, а также иметь четкий заголовок, соответствующий анкорам входящих ссылок.

Как структура URL влияет на выбор Sitelinks?

Она влияет напрямую через два фактора. Во-первых, через Node Depth: чем короче путь в URL от корня, тем лучше. Во-вторых, через Descendant Score: если страница А (/cat/) является структурным родителем для многих страниц Б (/cat/prod1/, /cat/prod2/), то страница А получает более высокий балл как навигационный хаб и имеет больше шансов попасть в Sitelinks.

Что делать, если у сайта плоская структура URL?

Сайтам с плоской структурой (все страницы в корне) будет сложнее воспользоваться преимуществами этого алгоритма, так как система не сможет построить глубокую иерархическую модель и рассчитать Descendant Scores. В этом случае выбор Sitelinks будет больше зависеть от ссылочных и контентных факторов. Рекомендуется пересмотреть архитектуру в пользу иерархической структуры.

Как патент предлагает оценивать качество контента (Content Score)?

Один из предложенных методов — анализ согласованности между заголовком (Title) ресурса и текстом анкоров (Anchor Text) ссылок, ведущих на этот ресурс. Чем выше степень совпадения и чем больше ссылок имеют релевантный анкор, тем выше Content Score. Это подчеркивает важность оптимизации Title и управления анкор-листом.

Могут ли страницы без внешних ссылок попасть в Sitelinks?

Это маловероятно в рамках данного алгоритма. Патент упоминает, что отсутствие или очень малое количество внешних ссылок (Off-domain links) может указывать на низкое качество или спам. Система может накладывать штраф на Combined Score или устанавливать минимальный порог по количеству внешних ссылок для кандидатов в Primary Resources.

Как обрабатываются дубликаты контента при выборе Sitelinks?

Перед построением Hierarchical Model система идентифицирует ресурсы с идентичным или эквивалентным контентом (например, с помощью хеширования). Они объединяются и представляются одним узлом в модели. Оценки для этого узла могут базироваться на агрегированных данных всех эквивалентных ресурсов (например, суммироваться входящие ссылки на все дубликаты).

Применяется ли этот алгоритм только для главной страницы?

Нет. Алгоритм может быть применен для любого узла в иерархии (Claim 69). Это означает, что система может рассчитывать Sitelinks не только для главной страницы (example.com), но и для важных внутренних разделов (например, example.com/news/), если они появляются в выдаче и для них рассчитаны свои Primary Resources.

Похожие патенты

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google идентифицирует и игнорирует навигацию, футеры и рекламу на странице для понимания основного контента
Google использует технологию анализа структуры документа (DOM-дерева) для отделения основного содержания страницы от шаблонных элементов (boilerplate) — таких как навигационные меню, футеры, списки ссылок и рекламные блоки. Система анализирует геометрические, структурные и иерархические признаки элементов (например, размер, форму, количество дочерних ссылок, расположение), чтобы классифицировать контент как шаблонный и исключить его при анализе тематики страницы.
  • US8898296B2
  • 2014-11-25
  • Структура сайта

  • Семантика и интент

  • Техническое SEO

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта
Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.
  • US9348846B2
  • 2016-05-24
  • Структура сайта

  • SERP

  • Ссылки

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
  • US9081832B2
  • 2015-07-14
  • Ссылки

  • SERP

  • Свежесть контента

Популярные патенты

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов
Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.
  • US9436709B1
  • 2016-09-06
  • EEAT и качество

  • Поведенческие сигналы

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google автоматически генерирует блоки "Связанные ссылки" и "Похожие запросы", анализируя контент страницы при загрузке
Патент описывает систему для динамической генерации виджетов связанных ссылок. При загрузке страницы система извлекает текст (заголовок, контент, запрос из реферера), определяет наиболее важные ключевые слова с помощью глобального репозитория (Keyword Repository), выполняет поиск по этим словам (часто в пределах того же домена) и отображает топовые результаты для улучшения навигации.
  • US9129009B2
  • 2015-09-08
  • Ссылки

  • Семантика и интент

  • Техническое SEO

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
  • US8412699B1
  • 2013-04-02
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

seohardcore