SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче

CLASSIFYING SITES AS LOW QUALITY SITES (Классификация сайтов как низкокачественных)
  • US9002832B1
  • Google LLC
  • 2012-06-04
  • 2015-04-07
  • Ссылки
  • Антиспам
  • SERP
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.

Описание

Какую проблему решает

Патент решает задачу идентификации низкокачественных сайтов путем анализа характеристик их ссылочного профиля. Он направлен против манипуляций, таких как покупка ссылок или использование ссылочных ферм. Вместо того чтобы просто учитывать количество или совокупный авторитет входящих ссылок, система фокусируется на распределении качества этих ссылок. Цель — выявить сайты, чей профиль преимущественно состоит из ссылок низкого качества, и понизить такие сайты в результатах поиска.

Что запатентовано

Запатентована система (Link Quality Engine) для вычисления Link Quality Score сайта. Этот показатель рассчитывается на основе Resource Quality Scores (оценок качества) страниц, ссылающихся на сайт, после применения строгих фильтров для удаления шума. Система группирует входящие ссылки по качеству и использует взвешенную формулу для расчета итоговой оценки. Если Link Quality Score ниже определенного порога, сайт классифицируется как low quality site.

Как это работает

Система работает в несколько этапов:

  • Сбор данных: Идентифицируются ресурсы, ссылающиеся на целевой сайт.
  • Фильтрация: Применяется Boilerplate filtering (удаление шаблонных ссылок, например, из футера) и Diversity Filtering (если с одного сайта или из схожего контентного контекста ведет много ссылок, учитывается только одна, лучшая).
  • Группировка: Оставшиеся ссылки группируются по качеству (например, Vital, Good, Bad) на основе их Resource Quality Scores.
  • Расчет оценки: Вычисляется Link Quality Score по взвешенной формуле, которая придает значительно больший вес ссылкам из высококачественных групп (Vital).
  • Классификация и применение: Если оценка ниже порога, сайт помечается как низкокачественный. Во время ранжирования Ranking Scores таких сайтов понижаются.

Актуальность для SEO

Высокая. Оценка качества ссылочного профиля и борьба со ссылочным спамом остаются фундаментальными задачами Google (наследие алгоритма Penguin). Этот патент описывает конкретный механизм для алгоритмической оценки естественности и качества ссылок на уровне всего сайта. Учитывая, что одним из изобретателей является Rajan Patel, этот механизм тесно связан с общей философией алгоритмов качества Google.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO, особенно для стратегий линкбилдинга. Он детально описывает, как Google может анализировать ссылочный профиль, отфильтровывать неестественные или малозначимые ссылки (Diversity Filtering) и выносить вердикт о качестве всего сайта на основе распределения качества оставшихся ссылок. Это напрямую влияет на необходимость фокусироваться на получении ссылок с высококачественных, разнообразных источников и подчеркивает риски использования низкокачественных ссылочных схем.

Детальный разбор

Термины и определения

Link Quality Engine
Компонент поисковой системы, отвечающий за генерацию Link Quality Scores для сайтов.
Link Quality Score
Метрика, рассчитываемая для сайта на основе распределения качества ресурсов, которые на него ссылаются. Используется для классификации сайта как низкокачественного.
Resource Quality Score
Предварительно рассчитанная оценка качества отдельного ресурса (например, веб-страницы), который содержит ссылку на целевой сайт.
Resource Quality Groups (Группы качества ресурсов)
Категории, на которые делятся ссылающиеся ресурсы на основе их Resource Quality Score. В патенте приводятся примеры: Vital (жизненно важные, наивысшее качество), Good (хорошие, среднее качество) и Bad (плохие, низшее качество).
Boilerplate Section (Шаблонный раздел)
Часть ресурса, которая повторяется на многих страницах (например, навигационная панель, футер). Ссылки из этих разделов могут быть отфильтрованы.
Diversity Filtering (Фильтрация по разнообразию)
Процесс отбрасывания ресурсов, которые предоставляют избыточную информацию. Включает фильтрацию на уровне сайта (учет только одной ссылки с домена) и на уровне контентного контекста.
Content Context (Контентный контекст)
Характеристика содержания ресурса, например, обсуждаемая тема или машинная классификация ресурса. Используется при Diversity Filtering.
Ranking Score (Оценка ранжирования)
Числовое значение, определяющее позицию ресурса в результатах поиска. Может быть понижено для low quality sites.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод расчета Link Quality Score и классификации сайта.

  1. Система получает Resource Quality Score для каждого ресурса, ссылающегося на сайт.
  2. Каждый ресурс назначается в одну из Resource Quality Groups на основе диапазона его оценки.
  3. Подсчитывается количество ресурсов в каждой группе.
  4. Определяется Link Quality Score для сайта с использованием этих подсчетов. Механизм расчета включает взвешивание:
    • Умножение количества ресурсов в первой группе на первый вес.
    • Умножение количества ресурсов во второй группе на второй вес.
    • Сложение этих произведений для получения суммы.
    • Определение соотношения (ratio) с использованием этой суммы и общего количества ресурсов.
  5. Если Link Quality Score ниже порогового значения, сайт классифицируется как low quality site.

Claim 2 (Зависимый от 1): Описывает применение классификации в поиске.

Как следствие классификации сайта как low quality site, система уменьшает Ranking Score для результата, идентифицирующего этот сайт. Величина уменьшения основана на Link Quality Score.

Claim 4 (Зависимый от 1): Детализирует этап фильтрации (Boilerplate).

Система отбрасывает кандидатов, которые ссылаются на сайт только из Boilerplate Section.

Claim 5 и 6 (Зависимые от 1): Детализируют этап фильтрации (Diversity - Site Level).

Если несколько ресурсов принадлежат одному и тому же стороннему сайту, все, кроме одного, отбрасываются. Согласно Claim 6, оставшимся ресурсом выбирается тот, у которого наивысший Resource Quality Score среди группы.

Claim 7 (Зависимый от 5): Детализирует этап фильтрации (Diversity - Content Context).

Если несколько ресурсов имеют одинаковый Content Context, все, кроме одного, отбрасываются.

Claim 22 (Зависимый от 1): Уточняет формулу расчета и веса.

Первый вес (например, для Vital) больше 1. Второй вес (например, для Good) равен 1. Link Quality Score определяется путем расчета соотношения (ratio), где числитель — это сумма взвешенных произведений, а знаменатель включает взвешенное произведение первой группы и количество ресурсов в остальных группах.

Где и как применяется

Изобретение применяется на этапах индексирования (для расчета) и ранжирования (для применения).

INDEXING – Индексирование и извлечение признаков
Основная работа алгоритма происходит на этом этапе (офлайн или периодически). Link Quality Engine анализирует ссылочный граф (Link Data).

  1. Предварительные расчеты: Система использует предварительно рассчитанные Resource Quality Scores для страниц в индексе.
  2. Анализ и Фильтрация: Для целевого сайта анализируются входящие ссылки, применяются фильтры (Boilerplate, Diversity).
  3. Расчет и Классификация: Рассчитывается Link Quality Score и сайт классифицируется. Эта классификация сохраняется в индексе и ассоциируется с сайтом.

RANKING – Ранжирование / RERANKING – Переранжирование
На этом этапе используется результат расчетов в реальном времени.

  1. Ranking Engine получает базовые Ranking Scores.
  2. Система проверяет классификацию сайтов.
  3. Для сайтов, классифицированных как low quality, Ranking Score понижается на величину, основанную на Link Quality Score.

Входные данные:

  • Ссылочный граф (Link Data).
  • Resource Quality Scores для ссылающихся ресурсов.
  • Данные для идентификации Boilerplate Sections, доменов и Content Context.

Выходные данные:

  • Link Quality Score для целевого сайта.
  • Классификация сайта (low quality site или нет).
  • Скорректированные Ranking Scores во время обработки запроса.

На что влияет

  • Все типы сайтов и ниши: Алгоритм влияет на любой сайт, который получает ссылки.
  • Конкурентные и спамные ниши: Наибольшее влияние оказывается на ниши, где активно применяются манипулятивные техники линкбилдинга (коммерческие тематики, финансы, YMYL).

Когда применяется

  • Расчет оценки: Link Quality Score рассчитывается во время индексирования или в рамках периодического офлайн-анализа. В патенте упоминается, что расчет может активироваться для сайтов, имеющих минимальное количество входящих ссылок.
  • Применение оценки: Понижение применяется в реальном времени на этапе ранжирования.
  • Пороговое значение: Классификация low quality применяется, только если Link Quality Score падает ниже определенного порога (в патенте приводятся примеры: 0.05, 0.10, 0.15 или 0.20).

Пошаговый алгоритм

Процесс А: Расчет Link Quality Score и Классификация (Этап Индексирования)

  1. Идентификация кандидатов: Определить все ресурсы-кандидаты, ссылающиеся на целевой сайт.
  2. Фильтрация Boilerplate: Отбросить кандидатов, которые ссылаются только из шаблонных разделов (например, навигации, футера).
  3. Фильтрация Diversity: Применить фильтрацию по разнообразию для устранения избыточности:
    • Сайт-уровень: Если несколько ресурсов с одного стороннего сайта ссылаются на цель, отбросить все, кроме одного (выбирается ресурс с наивысшим Resource Quality Score).
    • Контекст-уровень: Если несколько ресурсов имеют одинаковый Content Context, отбросить все, кроме одного.
  4. Получение оценок качества: Получить Resource Quality Scores для всех оставшихся ресурсов.
  5. Группировка: Распределить оставшиеся ресурсы по Resource Quality Groups (например, Vital, Good, Bad) на основе диапазонов их оценок.
  6. Подсчет: Подсчитать количество ресурсов в каждой группе.
  7. Взвешенный расчет: Вычислить Link Quality Score. Умножить количество ресурсов в высокоприоритетных группах на соответствующие веса (например, вес W для Vital, вес 1 для Good) и рассчитать соотношение.
  8. Классификация: Сравнить Link Quality Score с пороговым значением. Если оценка ниже порога, классифицировать сайт как low quality site.

Процесс Б: Применение в Ранжировании (Этап Ранжирования)

  1. Получение запроса и базовых оценок: Получить запрос и базовые Ranking Scores для кандидатов.
  2. Применение понижения: Идентифицировать результаты, принадлежащие сайтам, классифицированным как low quality sites. Уменьшить их Ranking Scores. Величина уменьшения может быть функцией от Link Quality Score (в патенте упоминаются примеры: умножение на квадратный корень или логарифм от Link Quality Score).
  3. Ранжирование и Предоставление результатов: Отсортировать кандидатов по итоговым Ranking Scores и предоставить выдачу.

Какие данные и как использует

Данные на входе

  • Ссылочные факторы: Критически важные данные. Используется структура входящих ссылок на сайт (кто ссылается и откуда).
  • Факторы качества (Site/Resource Quality): Используются предварительно рассчитанные Resource Quality Scores для ссылающихся страниц.
  • Технические/Структурные факторы: Данные для идентификации Boilerplate Sections. Доменное имя или IP-адрес ссылающихся ресурсов для Diversity Filtering.
  • Контентные факторы: Content Context (характеристика контента ссылающейся страницы) может использоваться для Diversity Filtering.

Какие метрики используются и как они считаются

  • Resource Quality Groups (Vital, Good, Bad): Метрики, основанные на разделении диапазона Resource Quality Scores на сегменты.
  • Link Quality Score (r): Основная метрика патента. Рассчитывается по взвешенной формуле, учитывающей распределение ссылок по группам качества. Пример формулы из патента:
    r=w⋅∣vital∣+∣good∣w⋅∣vital∣+∣good∣+∣bad∣r = \frac{w \cdot |vital| + |good|}{w \cdot |vital| + |good| + |bad|}
    Где w — это вес, а |group| — количество ресурсов в группе.
  • Весовой коэффициент (w): Множитель для группы Vital. В патенте приводятся примеры: 5, 10, 15 или 20.
  • Threshold Score (Пороговая оценка): Значение (например, 0.10 или 0.20), ниже которого сайт классифицируется как low quality.
  • Demotion Amount (Величина понижения): Рассчитывается на основе Link Quality Score для корректировки Ranking Score.

Выводы

  1. Фокус на распределении качества, а не на количестве или среднем значении: Google оценивает соотношение хороших и плохих ссылок. Сайт с несколькими отличными ссылками и множеством плохих может быть пессимизирован, так как плохие ссылки (Bad) увеличивают знаменатель в формуле и снижают итоговую оценку.
  2. Значительное предпочтение авторитетных ссылок (Vital): Формула явно демонстрирует, что ссылки из категории Vital имеют значительно больший вес (W > 1, например 10 или 20) в расчете Link Quality Score, чем ссылки из категории Good (W = 1).
  3. Агрессивная фильтрация ссылочного шума (Diversity Filtering): Система активно нейтрализует манипуляции:
    • Boilerplate filtering игнорирует шаблонные и навигационные ссылки.
    • Site Diversity filtering учитывает только одну, лучшую (с наивысшим Resource Quality Score) ссылку с каждого домена.
    • Content Context filtering предотвращает манипуляции через размещение схожего контента на разных сайтах.
  4. Механизм сайт-уровневой пессимизации: Link Quality Score применяется для классификации всего сайта. Если сайт помечен как low quality на основе его ссылочного профиля, это приводит к понижению всех его страниц в ранжировании.
  5. Качество вашего сайта зависит от качества доноров: Ключевым входным параметром является Resource Quality Score ссылающейся страницы.

Практика

Best practices (это мы делаем)

  • Приоритет качества над количеством в линкбилдинге: Фокусируйтесь на получении ссылок с ресурсов, которые Google может классифицировать как Vital. Из-за высокого весового коэффициента (W) одна ссылка с Vital ресурса может быть ценнее десятков ссылок с Good ресурсов.
  • Максимизация разнообразия качественных доменов: Так как Diversity Filtering учитывает только одну лучшую ссылку с каждого домена, стратегия должна быть направлена на увеличение количества уникальных качественных ссылающихся доменов, а не на получение множества ссылок с одного сайта.
  • Аудит и чистка ссылочного профиля (Disavow): Регулярно проводите аудит входящих ссылок. Большое количество ссылок категории Bad активно снижает Link Quality Score. Используйте инструмент Disavow для нейтрализации их влияния и улучшения общего распределения качества.
  • Фокус на редакционных ссылках (Editorial Links): Поскольку ссылки из Boilerplate Sections (футеры, сайдбары) фильтруются, необходимо стремиться к получению ссылок, размещенных внутри основного контента страницы.
  • Разнообразие контентного контекста: Избегайте массового размещения однотипных статей или пресс-релизов на разных площадках, так как Content Context Filtering может учесть только одну ссылку из такой группы.

Worst practices (это делать не надо)

  • Использование PBN низкого качества и ссылочных ферм: Ссылки с таких ресурсов, скорее всего, будут классифицированы как Bad. Большое количество таких ссылок приведет к низкому Link Quality Score и пессимизации.
  • Покупка сайт-вайд (сквозных) ссылок: Размещение ссылок в футерах или боковых панелях неэффективно. Они будут либо отфильтрованы как Boilerplate, либо учтены только один раз из-за Diversity Filtering.
  • Массовый прогон по каталогам и форумам: Получение большого количества легкодоступных ссылок с ресурсов низкого качества (Bad) активно ухудшает Link Quality Score.
  • Фокус на количестве ссылок с одного домена: Попытки получить много ссылок с разных страниц одного сайта не дадут эффекта, так как система выберет только лучшую ссылку.

Стратегическое значение

Этот патент подтверждает стратегическую важность построения естественного и качественного ссылочного профиля и формализует концепцию, близкую к алгоритму Google Penguin. Он демонстрирует, что любые попытки манипулировать ранжированием с помощью низкокачественных ссылок могут быть алгоритмически обнаружены и привести к сайт-уровневой пессимизации. Долгосрочная SEO-стратегия должна рассматривать линкбилдинг как процесс построения репутации (PR, контент-маркетинг), фокусируясь на привлечении редакционных ссылок из авторитетных (Vital) источников.

Практические примеры

Сценарий 1: Влияние распределения качества ссылок

Сравним два сайта, используя формулу из патента с весом w=10.

  • Сайт А (Массовый линкбилдинг): 1000 ссылок (после фильтрации). Распределение: Vital=5, Good=50, Bad=945.
  • Сайт Б (Качественный линкбилдинг): 100 ссылок (после фильтрации). Распределение: Vital=20, Good=50, Bad=30.

Расчет для Сайта А:
Числитель: (10 * 5) + 50 = 100
Знаменатель: (10 * 5) + 50 + 945 = 1045
Link Quality Score A = 100 / 1045 ≈ 0.095

Расчет для Сайта Б:
Числитель: (10 * 20) + 50 = 250
Знаменатель: (10 * 20) + 50 + 30 = 280
Link Quality Score B = 250 / 280 ≈ 0.892

Результат: Если порог классификации low quality установлен на 0.15 (как предложено в патенте), Сайт А будет классифицирован как низкокачественный и пессимизирован, несмотря на в 10 раз большее общее количество ссылок.

Сценарий 2: Эффект Diversity Filtering

Сайт С получает 50 обратных ссылок с разных страниц одного и того же домена (например, крупного блога).

Действие системы: Link Quality Engine применит Diversity Filtering. Он оценит Resource Quality Score каждой из 50 ссылающихся страниц и выберет только одну — ту, у которой этот показатель максимален.

Результат: Для расчета Link Quality Score Сайта С будет учтена только 1 ссылка из 50. Остальные 49 игнорируются.

Вопросы и ответы

Как Google определяет Resource Quality Score для страницы-донора?

Патент не детализирует расчет Resource Quality Score, предполагая, что это предварительно вычисленная метрика. На практике это может быть комбинация различных сигналов качества, включая PageRank, сигналы E-E-A-T, качество контента самой страницы-донора, ее собственный ссылочный профиль и трастовые метрики.

Что такое «Vital» ссылки и чем они отличаются от «Good»?

Vital — это ресурсы с наивысшими Resource Quality Scores, а Good — со средними. Ключевое отличие в формуле: ссылки Vital получают значительно больший вес (W, например, 10 или 20), в то время как ссылки Good имеют вес 1. Это означает, что система значительно предпочитает ссылки с самых авторитетных источников.

Учитывает ли система все ссылки с одного домена?

Нет. Патент описывает Diversity Filtering на уровне сайта. Если с одного стороннего сайта ведет несколько ссылок на целевой сайт, система учитывает только одну из них — ту, которая расположена на странице с наивысшим Resource Quality Score на этом домене.

Что происходит со ссылками из футера или боковой панели (сквозными ссылками)?

Такие ссылки часто попадают в Boilerplate Section. Патент прямо указывает, что ссылки, исходящие только из таких шаблонных разделов, отбрасываются и не участвуют в расчете Link Quality Score. Это делает практику размещения сайт-вайд ссылок неэффективной.

Как ссылки категории «Bad» влияют на итоговую оценку?

Ссылки категории Bad не добавляют ценности в числителе формулы Link Quality Score, но они увеличивают знаменатель. Таким образом, наличие большого количества «плохих» ссылок активно снижает общую оценку качества сайта, даже при наличии хороших ссылок.

Является ли этот механизм частью алгоритма Google Penguin?

Патент подан в 2012 году, вскоре после запуска оригинального Penguin. Логика патента (анализ качества ссылок для борьбы со спамом и понижение сайтов) полностью соответствует целям Penguin. Можно с высокой вероятностью предположить, что описанный механизм Link Quality Score является частью или развитием систем, используемых в Penguin и последующих алгоритмах борьбы со ссылочным спамом.

Что такое фильтрация по «Content Context»?

Это еще один вариант Diversity Filtering. Если несколько ресурсов имеют одинаковый Content Context (например, одну и ту же тему или классификацию) и ссылаются на целевой сайт, система может учесть только один из них. Это направлено на предотвращение манипуляций через сети сайтов или массовое размещение однотипного контента.

Насколько сильно понижается сайт, если он классифицирован как «low quality»?

Патент указывает, что величина понижения основана на Link Quality Score. В качестве примеров приводятся умножение Ranking Score на квадратный корень или логарифм от Link Quality Score. Чем ниже Link Quality Score, тем сильнее будет понижение.

Поможет ли удаление или отклонение (Disavow) плохих ссылок улучшить Link Quality Score?

Да. Если «плохие» ссылки (категория Bad) будут удалены из расчета (через удаление или, предположительно, через Disavow), знаменатель в формуле уменьшится, а числитель останется прежним. Это приведет к увеличению Link Quality Score и может помочь сайту преодолеть порог классификации low quality.

Влияет ли этот алгоритм на уровне отдельных страниц или всего сайта?

Алгоритм работает на уровне сайта. Он анализирует общий ссылочный профиль и выносит вердикт о классификации всего сайта как low quality. Затем эта классификация применяется для понижения всех страниц этого сайта при ранжировании.

Похожие патенты

Как Google определяет язык и языковую релевантность страницы, анализируя контекст входящих и исходящих ссылок
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.
  • US9098582B1
  • 2015-08-04
  • Ссылки

  • Мультиязычность

  • Семантика и интент

Как Google анализирует структуру URL и сигналы качества для выбора Sitelinks (Primary Resources)
Google использует алгоритм для идентификации наиболее важных страниц сайта (Primary Resources), которые затем отображаются как Sitelinks в поисковой выдаче. Система строит иерархическую модель сайта на основе структуры URL (а не ссылок) и оценивает каждую страницу по нескольким критериям: глубина в иерархии, количество дочерних страниц, количество внешних и внутренних ссылок, PageRank и качество контента. Этот метод позволяет выбирать Sitelinks даже без данных о трафике.
  • US20150199357A1
  • 2015-07-16
  • Структура сайта

  • Техническое SEO

  • SERP

Как Google подмешивает результаты из альтернативных запросов, чтобы вытеснить низкокачественные сайты из топа выдачи
Google использует механизм улучшения качества поисковой выдачи. Если по исходному запросу в топе ранжируется слишком много низкокачественных сайтов, система находит связанный альтернативный запрос, который возвращает высококачественные результаты. Затем эти результаты агрессивно повышаются в ранжировании и подмешиваются в исходную выдачу, чтобы гарантировать пользователю доступ к качественному контенту.
  • US9135307B1
  • 2015-09-15
  • SERP

  • EEAT и качество

Как Google определяет, какие параметры URL влияют на контент, чтобы выбрать канонический URL и оптимизировать краулинг
Google использует систему для статистического анализа динамических URL-адресов и определения того, какие параметры являются значимыми для контента (content-relevant), а какие нет (content-irrelevant). Система группирует URL-адреса, ведущие на одинаковый контент, в «Классы эквивалентности» и выбирает один «Представительский URL» для сканирования и индексации, экономя краулинговый бюджет и решая проблемы дублированного контента.
  • US7680773B1
  • 2010-03-16
  • Техническое SEO

  • Краулинг

  • Индексация

Как Google идентифицирует и игнорирует навигацию, футеры и рекламу на странице для понимания основного контента
Google использует технологию анализа структуры документа (DOM-дерева) для отделения основного содержания страницы от шаблонных элементов (boilerplate) — таких как навигационные меню, футеры, списки ссылок и рекламные блоки. Система анализирует геометрические, структурные и иерархические признаки элементов (например, размер, форму, количество дочерних ссылок, расположение), чтобы классифицировать контент как шаблонный и исключить его при анализе тематики страницы.
  • US8898296B2
  • 2014-11-25
  • Структура сайта

  • Семантика и интент

  • Техническое SEO

Популярные патенты

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора
Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.
  • US7844603B2
  • 2010-11-30
  • Ссылки

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

seohardcore