SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами

DETERMINING QUALITY OF LINKED DOCUMENTS (Определение качества связанных документов)
  • US7783639B1
  • Google LLC
  • 2004-06-30
  • 2010-08-24
  • Ссылки
  • Антиспам
  • EEAT и качество
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.

Описание

Какую проблему решает

Патент решает проблему манипулирования оценками качества документов (например, PageRank), основанными на ссылочной структуре. Он направлен против линк-ферм, PBN и других схем, где группа аффилированных (связанных) сайтов или страниц искусственно завышает рейтинг целевого документа путем множественных перекрестных ссылок. Изобретение улучшает объективность оценки качества, делая ее устойчивой к подобным манипуляциям.

Что запатентовано

Запатентована система для расчета Ranking Score (оценки качества) связанных документов, которая учитывает аффилированность (affiliation) между источниками ссылок. Ключевым изобретением является метод расчета вклада ссылок (SETCONTRIB), который изменяется в зависимости от степени аффилированности. Для независимых ссылок вклад суммируется (оператор SUM), а для полностью аффилированных – учитывается только максимальный вклад от группы (оператор MAX). Система может использовать как бинарную, так и непрерывную модель аффилированности.

Как это работает

Система работает в несколько этапов:

  • Идентификация аффилированности: Анализируются документы для выявления связей. Факторы включают структуру ссылочного графа, паттерны трафика, схожесть хостов или IP-адресов.
  • Группировка: Документы объединяются в наборы аффилированных документов (affiliated sets).
  • Расчет вклада (CONTRIB): Для каждого документа рассчитывается его индивидуальный вклад, основанный на его собственном Ranking Score и количестве исходящих ссылок.
  • Агрегация вклада (SETCONTRIB): Вместо суммирования всех CONTRIB внутри аффилированного набора, система применяет функцию, которая стремится к MAX (учитывается только самая сильная ссылка из набора), если аффилированность сильная, и к SUM, если аффилированность слабая.
  • Итеративный расчет Ranking Score: Итоговый Ranking Score документа вычисляется путем суммирования SETCONTRIB от всех наборов, которые на него ссылаются. Процесс повторяется итеративно до сходимости.

Актуальность для SEO

Критически высокая. Борьба с линк-схемами, PBN и искусственным наращиванием ссылочного веса является одной из главных задач Google. Этот патент описывает фундаментальный механизм, позволяющий алгоритмически снижать ценность неестественных ссылок. Учитывая авторов (ключевые инженеры поиска Google, включая Amit Singhal и Paul Haahr), эти принципы лежат в основе современных систем оценки качества ссылок.

Важность для SEO

Патент имеет критическое значение (95/100) для SEO, особенно в области линкбилдинга. Он объясняет механизм, с помощью которого Google может идентифицировать и нейтрализовать линк-фермы и PBN. Если система классифицирует группу сайтов как аффилированную, ссылочный вес, передаваемый между ними или от них к целевому сайту, будет радикально снижен. Это подчеркивает стратегическую важность получения ссылок из разнообразных, независимых и авторитетных источников.

Детальный разбор

Термины и определения

Affiliation (Аффилированность)
Связь между документами или сайтами. Может определяться на основе общей структуры ссылок, паттернов трафика, схожести имен хостов или IP-адресов.
Affiliated Set (Набор аффилированных документов)
Группа документов, идентифицированных как связанные между собой.
Binary Model (Бинарная модель)
Модель, в которой документы либо аффилированы, либо нет. Все аффилированные наборы считаются равнозначными.
Continuous Model (Непрерывная модель)
Модель, в которой аффилированность измеряется непрерывным значением (например, Gamma γ), позволяя различать сильную и слабую связь.
CONTRIB(D) (Вклад документа)
Значение, которое документ D может передать по своим исходящим ссылкам. Рассчитывается как Ranking Score документа, деленный на количество исходящих ссылок (OutD(D)).
Gamma (γ)
Параметр степени аффилированности в непрерывной модели. γ=0 означает полную аффилированность, γ=1 означает полную независимость.
OutD(D) (Outdegree)
Количество исходящих ссылок из документа D.
Ranking Component
Система, отвечающая за расчет оценок ранжирования.
Ranking Score
Оценка качества документа, рассчитанная на основе ссылочной структуры и аффилированности. Аналог PageRank.
SETCONTRIB(S) (Вклад набора)
Агрегированный вклад, который набор аффилированных документов S передает по ссылкам. Рассчитывается с использованием операторов MAX/SUM или их интерполяции, чтобы избежать завышения веса от связанных источников.
Set Location Component
Компонент системы, отвечающий за идентификацию аффилированности и группировку документов в наборы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод расчета Ranking Score с учетом аффилированности.

  1. Система идентифицирует связанные документы (Документ 1, на который ссылается Документ 2, входящий в аффилированный набор).
  2. Рассчитывается первое значение (CONTRIB) для каждого документа в наборе на основе его Ranking Score и количества исходящих ссылок.
  3. Рассчитывается второе значение (SETCONTRIB) как максимум из первых значений для документов в наборе.
  4. Ranking Score Документа 1 присваивается на основе второго значения.
  5. Процесс присвоения Ranking Score включает:
    • Определение степени аффилированности набора (слабая или сильная).
    • Установку вклада Документа 2 в Ranking Score Документа 1 с помощью функции, которая действует как оператор Суммирования (SUM), если набор слабо аффилирован, и как оператор Максимума (MAX), если набор сильно аффилирован.
  6. Функция интерполяции (SETCONTRIB) определена как (Обобщенное среднее): (CONTRIB(D1)a+CONTRIB(D2)a+...+CONTRIB(Dk)a)1/a(CONTRIB(D_1)^a + CONTRIB(D_2)^a + ... + CONTRIB(D_k)^a)^{1/a}
  7. Где 'a' определяется как: 1/(e+(1−e)γ)1 / (e + (1-e)γ), где 'e' — константа, а γ (Gamma) — непрерывная мера аффилированности.

Ключевой защищенный механизм — это использование интерполяции между SUM и MAX для расчета ссылочного веса в зависимости от степени аффилированности источников.

Claim 6 (Зависимый от 1): Детализирует методы идентификации аффилированности.

Аффилированность определяется на основе по крайней мере одного из следующих факторов: структура ссылочного графа документов, паттерны трафика к документам, схожесть имен хостов (hostnames) документов или схожесть IP-адресов документов.

Claim 8 (Зависимый от 1): Уточняет процесс расчета.

Присвоение Ranking Score происходит итеративно до достижения сходимости (convergence).

Где и как применяется

Изобретение применяется на этапе индексирования и является частью глобального анализа ссылочной структуры веба.

INDEXING – Индексирование и извлечение признаков

Основной этап применения патента. Система функционирует как часть модуля анализа ссылок (Link Analysis), который рассчитывает глобальные оценки качества документов (например, PageRank).

  1. Сбор данных для анализа аффилированности: На этом этапе собираются и обрабатываются данные, необходимые для выявления связей: структура ссылок, данные об IP-адресах/хостах, а также данные о трафике/сессиях пользователей.
  2. Идентификация аффилированности: Set Location Component анализирует эти данные для группировки документов в affiliated sets и определения степени их связи (γ).
  3. Итеративный расчет качества: Rank Computation Component выполняет итеративный расчет Ranking Scores. На каждой итерации система использует модифицированный алгоритм передачи веса, который учитывает аффилированность источников.

RANKING – Ранжирование

На этапе ранжирования система использует предварительно рассчитанные Ranking Scores (полученные на этапе INDEXING) как один из сигналов для сортировки документов, релевантных запросу пользователя.

Входные данные:

  • Корпус связанных документов (ссылочный граф).
  • Данные для определения аффилированности (IP-адреса, имена хостов, паттерны трафика).
  • Начальные (seed) значения Ranking Score (для первой итерации).

Выходные данные:

  • Ranking Score для каждого документа в корпусе, устойчивый к манипуляциям со стороны аффилированных групп.

На что влияет

  • Конкретные типы контента и ниши: Влияет на все типы контента, но наиболее заметно в конкурентных коммерческих нишах (e-commerce, финансы, гемблинг), где часто используются PBN и другие линк-схемы для манипуляции ранжированием.
  • Специфические запросы: Влияет на ранжирование по любым запросам, где ссылочные факторы играют значительную роль.

Когда применяется

  • Временные рамки и частота применения: Алгоритм применяется периодически во время глобального пересчета индексов и оценок качества (пересчет PageRank). Это ресурсоемкий офлайн-процесс, а не расчет в реальном времени при обработке запроса.
  • Условия работы: Применяется ко всему корпусу документов для вычисления статических оценок качества. Активация механизма снижения веса происходит всегда, когда обнаруживается аффилированность между источниками ссылок.

Пошаговый алгоритм

Описание процесса расчета Ranking Score (например, с использованием Непрерывной модели).

  1. Определение аффилированности (Предварительный этап):
    • Set Location Component анализирует корпус документов.
    • Идентифицируются наборы аффилированных документов (Affiliated Sets S).
    • Для каждого набора определяется степень аффилированности Gamma (γ).
  2. Инициализация: Каждому документу присваивается начальный Ranking Score.
  3. Итеративный расчет (повторяется до сходимости):
    1. Расчет индивидуального вклада (CONTRIB): Для каждого документа D рассчитывается CONTRIB(D) по формуле: RankingScore(D)/OutD(D)RankingScore(D) / OutD(D).
    2. Расчет вклада набора (SETCONTRIB): Для каждого аффилированного набора S рассчитывается SETCONTRIB(S, γ).
      • Сначала вычисляется параметр 'a': a=1/(e+(1−e)γ)a = 1 / (e + (1-e)γ).
      • Затем вычисляется SETCONTRIB с помощью функции интерполяции MAX/SUM (Обобщенное среднее): (CONTRIB(D1)a+...+CONTRIB(Dk)a)1/a(CONTRIB(D_1)^a + ... + CONTRIB(D_k)^a)^{1/a}.
    3. Обновление Ranking Score: Для каждого документа X рассчитывается новый Ranking Score путем суммирования SETCONTRIB от всех наборов (Si), которые ссылаются на X: RankingScore(X)=α+β∗Σ(SETCONTRIB(Si,γi))RankingScore(X) = α + β * Σ(SETCONTRIB(Si, γi)).
  4. Проверка сходимости: Проверяется, насколько сильно изменились Ranking Scores по сравнению с предыдущей итерацией. Если изменения минимальны (достигнута сходимость), процесс останавливается. В патенте упоминается, что обычно достаточно около 50 итераций.
  5. Нормализация (Опционально): Итоговые Ranking Scores могут быть нормализованы.

Какие данные и как использует

Данные на входе

Система использует несколько типов данных для определения аффилированности и расчета оценок:

  • Ссылочные факторы: Структура ссылочного графа (кто на кого ссылается). Количество входящих и исходящих ссылок (OutD(D)). Сила связи между сайтами на основе ссылок.
  • Технические факторы: Имена хостов (Hostnames). IP-адреса веб-серверов. Патент явно упоминает сравнение IP-адресов: если первые два или три компонента (октета) IP-адреса идентичны, можно сделать вывод об аффилированности.
  • Поведенческие факторы (Traffic patterns): Паттерны трафика в вебе. Аффилированность может быть обнаружена между веб-документами, которые посещаются многими пользователями в течение одной сессии.

Какие метрики используются и как они считаются

Патент определяет конкретные метрики и формулы для их расчета:

  • CONTRIB(D) (Вклад документа) (Eq. 1): CONTRIB(D)=RankingScore(D)/OutD(D)CONTRIB(D) = RankingScore(D) / OutD(D).
  • SETCONTRIB(S) (Вклад набора - Бинарная модель) (Eq. 2): MAX[CONTRIB(D1),...,CONTRIB(DN)]MAX[CONTRIB(D1), ..., CONTRIB(DN)].
  • Gamma (γ) (Степень аффилированности): Значение от 0 (полная аффилированность) до 1 (полная независимость).
  • Параметр 'a' (Непрерывная модель) (Eq. 5): a=1/(e+(1−e)γ)a = 1 / (e + (1-e)γ). (где e - константа, например 0.05).
  • SETCONTRIB(S, γ) (Вклад набора - Непрерывная модель) (Eq. 4): (CONTRIB(D1)a+...+CONTRIB(DN)a)1/a(CONTRIB(D1)^a + ... + CONTRIB(DN)^a)^{1/a}. Эта формула интерполирует между SUM (когда γ=1, a≈1) и MAX (когда γ=0, a - большое).
  • RankingScore(X) (Итоговая оценка) (Eq. 3 и 6): α+β∗Σ(SETCONTRIB)α + β * Σ(SETCONTRIB) (Сумма по всем наборам, ссылающимся на X).

Выводы

  1. Целенаправленная борьба с линк-схемами: Патент предоставляет конкретный алгоритмический механизм для нейтрализации эффекта от линк-ферм, PBN и других групп аффилированных сайтов, пытающихся манипулировать Ranking Score.
  2. Снижение ценности аффилированных ссылок (Diminishing Returns): Ключевой вывод — множественные ссылки из аффилированных источников не дают линейного прироста качества. Вместо суммирования (SUM) их вклада, система стремится учитывать только максимальный вклад (MAX) от группы.
  3. Сложные методы обнаружения аффилированности: Google не полагается только на очевидные признаки (как один владелец). Аффилированность определяется через анализ структуры ссылок, схожесть технических параметров (IP-адреса, хосты) и даже анализ паттернов трафика (посещение сайтов в рамках одной сессии).
  4. Непрерывная, а не бинарная пессимизация: Использование непрерывной модели (Gamma γ) позволяет Google применять снижение веса пропорционально силе обнаруженной связи. Это не просто фильтр (вкл/выкл), а сложный механизм взвешивания.
  5. Приоритет независимых ссылок: Алгоритм значительно повышает относительную ценность ссылок, полученных от независимых (неаффилированных) источников, так как их вклад суммируется (SUM).
  6. Модификация PageRank: Это изобретение описывает существенную модификацию базового алгоритма расчета ссылочного качества (PageRank), делая его более устойчивым к спаму.

Практика

Best practices (это мы делаем)

  • Фокус на получении независимых ссылок: Стратегия линкбилдинга должна быть направлена на получение ссылок из авторитетных источников, которые не имеют признаков аффилированности с вашим сайтом или друг с другом. Независимые ссылки суммируются (SUM) и дают максимальный эффект.
  • Диверсификация ссылочного профиля: Обеспечьте максимальное разнообразие доноров по типам сайтов, тематикам, географии, а также по техническим параметрам (разные хостинги, разные подсети IP-адресов). Это минимизирует риск идентификации ссылок как аффилированных.
  • Осторожное использование PBN и сеток сайтов: При использовании PBN необходимо предпринимать максимальные меры для сокрытия футпринтов. Согласно патенту, следует избегать:
    • Размещения сайтов в одних и тех же блоках IP-адресов (особенно совпадения первых 2-3 октетов).
    • Массового перекрестного связывания сайтов в сети (анализ структуры графа).
    • Очевидной схожести имен хостов.
  • Анализ технических футпринтов доноров: При аудите ссылочного профиля или анализе потенциальных доноров проверяйте их IP-адреса и хостинги на предмет пересечения с другими ссылающимися сайтами.

Worst practices (это делать не надо)

  • Создание линк-ферм и очевидных PBN: Построение сетей сайтов на одном хостинге, в одной подсети IP или с активной перелинковкой между собой. Патент описывает механизм, который напрямую нейтрализует такие схемы, сводя их эффективность к весу одного, самого сильного сайта в сети (MAX).
  • Участие в схемах обмена ссылками: Группы сайтов, активно обменивающиеся ссылками, будут идентифицированы как аффилированные через анализ структуры графа.
  • Покупка ссылок из одного источника (Брокера): Если брокер размещает ссылки на сети контролируемых им сайтов, высока вероятность того, что Google идентифицирует эту сеть и применит механизм снижения веса.
  • Искусственное направление трафика между сайтами: Попытки симулировать естественный трафик между группой сайтов могут быть использованы как сигнал аффилированности (анализ паттернов трафика).

Стратегическое значение

Этот патент является одним из фундаментальных документов, определяющих подход Google к оценке ссылок. Он подтверждает, что Google давно разрабатывает и внедряет сложные механизмы для борьбы с ссылочным спамом, выходящие далеко за рамки простого подсчета ссылок. Стратегическое значение заключается в понимании того, что качество и независимость источника ссылки гораздо важнее их количества. Долгосрочная SEO-стратегия должна фокусироваться на построении реального авторитета и получении естественных упоминаний, так как любые искусственные схемы имеют встроенный механизм обесценивания.

Практические примеры

Сценарий: Нейтрализация PBN (Private Blog Network)

  1. Ситуация: SEO-специалист создал сеть из 10 сайтов (PBN) для продвижения основного проекта (Money Site). Все 10 сайтов размещены на дешевом хостинге и находятся в одной подсети класса C (например, 192.168.1.1 - 192.168.1.10). Каждый сайт ссылается на Money Site.
  2. Анализ Google (Идентификация аффилированности): Set Location Component анализирует IP-адреса. Совпадение первых трех октетов (192.168.1.*) является сильным сигналом аффилированности. Система группирует эти 10 сайтов в Affiliated Set и присваивает высокую степень аффилированности (Gamma γ близка к 0).
  3. Расчет вклада (SETCONTRIB): При расчете Ranking Score для Money Site система применяет функцию интерполяции. Так как γ близка к 0, функция действует как оператор MAX.
  4. Результат: Вместо того чтобы получить сумму веса от всех 10 сайтов, Money Site получает вес, эквивалентный весу только одного, самого авторитетного сайта из этой сети. Эффективность PBN снижается в 10 раз.

Сценарий: Диверсифицированный линкбилдинг

  1. Ситуация: SEO-специалист получил 3 ссылки из разных источников: статья в крупном СМИ, пост в независимом блоге и упоминание на форуме. Сайты технически не связаны и не имеют перекрестного трафика.
  2. Анализ Google: Система не обнаруживает признаков аффилированности (Gamma γ близка к 1).
  3. Расчет вклада (SETCONTRIB): Функция интерполяции действует как оператор SUM.
  4. Результат: Сайт получает полный суммарный вес от всех трех источников, что значительно повышает его Ranking Score.

Вопросы и ответы

Как именно Google определяет аффилированность сайтов?

Патент перечисляет несколько конкретных методов. Во-первых, это технические признаки: схожесть имен хостов и IP-адресов (особенно совпадение первых 2-3 октетов IP). Во-вторых, это анализ структуры ссылочного графа: сильная перекрестная связанность между сайтами. В-третьих, упоминается анализ паттернов трафика: если множество пользователей посещают одни и те же сайты в рамках одной сессии, это может указывать на их аффилированность.

Заменяет ли этот алгоритм PageRank?

Нет, он не заменяет его, а модифицирует и дополняет. Алгоритм использует ту же базовую итеративную логику расчета качества на основе ссылок, что и PageRank. Однако он вносит критическое изменение в способ агрегации ссылочного веса: вместо простого суммирования вклада от всех входящих ссылок, он сначала группирует ссылки по аффилированным наборам и применяет к ним функцию MAX/SUM. Это делает итоговый Ranking Score более устойчивым к спаму.

Что это значит для использования PBN?

Это означает, что PBN (Private Blog Networks) сталкиваются с алгоритмическим противодействием. Если Google сможет идентифицировать вашу сеть (обнаружить футпринты), эффективность всей сети резко упадет. Вместо суммы веса всех сайтов вы получите вес только самого сильного сайта в сети. Это делает построение эффективных PBN значительно дороже и сложнее, так как требует безупречного сокрытия всех признаков аффилированности, упомянутых в патенте.

В чем разница между бинарной и непрерывной моделями аффилированности?

В бинарной модели система просто определяет, связаны сайты или нет. Если связаны, применяется оператор MAX. В непрерывной модели система оценивает степень связи (Gamma γ). Если связь очень сильная (γ близка к 0), применяется MAX. Если связь слабая или отсутствует (γ близка к 1), применяется SUM. Если связь средней силы, применяется промежуточное значение. Это позволяет Google более точно регулировать передачу веса и не пессимизировать сайты, которые могут иметь легитимные, но слабые связи.

Влияет ли этот патент на внутреннюю перелинковку?

Да, влияет. В патенте (FIG. 1) приведен пример, где документы одного автора ссылаются друг на друга. Система признает, что дополнительные ссылки от того же автора не должны чрезмерно повышать Ranking Score. Страницы на одном сайте по определению являются сильно аффилированными. Это означает, что попытки агрессивного "скульптинга" PageRank с помощью тысяч внутренних ссылок могут быть нейтрализованы этим механизмом, так как система будет стремиться применить оператор MAX к их вкладу.

Что такое оператор MAX в контексте ссылок?

Оператор MAX означает, что из всей группы аффилированных ссылок учитывается только одна – та, которая передает максимальный индивидуальный вклад (CONTRIB). Например, если у вас есть 5 связанных сайтов, ссылающихся на целевую страницу, система выберет самый авторитетный из них и учтет только его вес, игнорируя остальные 4 ссылки при расчете SETCONTRIB.

Как избежать идентификации моих сайтов как аффилированных?

Необходимо избегать любых футпринтов, описанных в патенте. Используйте разные хостинги и регистраторов, убедитесь, что сайты находятся в разных подсетях IP-адресов (избегайте совпадения первых трех октетов). Не создавайте сильных перекрестных ссылок между сайтами. Также следует избегать неестественно схожих паттернов трафика между сайтами. Полная изоляция – ключ к тому, чтобы система рассматривала сайты как независимые (Gamma=1).

Что такое модифицированный расчет CONTRIB (Eq. 7)?

Патент предлагает вариант расчета CONTRIB, где вес делится не на общее количество исходящих ссылок, а на MAX(1, OutD(D) - THRESHOLD). Если установить порог (THRESHOLD), например, 10, то первые 10 ссылок фактически не учитываются при делении веса. Это меняет модель с классического PageRank на модель голосования, где для страниц с небольшим или средним количеством ссылок каждая ссылка передает почти полный вес источника.

Является ли размещение нескольких сайтов на Cloudflare (с общими IP) риском аффилиации?

Хотя патент упоминает общие IP как фактор, системы Google достаточно сложны, чтобы различать общие IP крупных сервисов (CDN, хостинги) и выделенные IP или небольшие хостинги. Однако использование общих IP в сочетании с другими факторами (например, сильной перелинковкой или схожими паттернами трафика) может усилить сигнал аффилированности. Для максимальной безопасности PBN лучше избегать любых пересечений.

Насколько важен этот патент сегодня, учитывая его возраст?

Несмотря на то, что патент подан в 2004 году, он описывает фундаментальные принципы обработки ссылочных графов и борьбы с манипуляциями. Эти принципы не устаревают. Современные системы Google, вероятно, используют гораздо более сложные методы обнаружения аффилированности (например, с помощью машинного обучения), но базовая логика снижения веса аффилированных ссылок (интерполяция MAX/SUM) остается крайне актуальной для понимания работы поиска.

Похожие патенты

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок
Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.
  • US7509344B1
  • 2009-03-24
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента
Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.
  • US7603350B1
  • 2009-10-13
  • EEAT и качество

  • Knowledge Graph

  • SERP

Популярные патенты

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google (YouTube) анализирует трафик конкурирующих видео для рекомендации улучшений метаданных
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
  • US10318581B2
  • 2019-06-11
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore