SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок

METHOD FOR DETECTING LINK SPAM IN HYPERLINKED DATABASES (Метод обнаружения ссылочного спама в гиперссылочных базах данных)
  • US7509344B1
  • Google LLC
  • 2004-08-18
  • 2009-03-24
  • Антиспам
  • Ссылки
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.

Описание

Какую проблему решает

Патент решает проблему уязвимости алгоритмов ранжирования на основе ссылок (таких как PageRank) к преднамеренным манипуляциям, направленным на искусственное завышение ранга узла. Он предлагает механизм для обнаружения и нейтрализации эффектов ссылочного спама (link spamming). В частности, патент фокусируется на выявлении структур типа "Link Farms" (ссылочные фермы) и "Clique Attacks" или "Web Rings" (веб-кольца/кликовые атаки).

Что запатентовано

Запатентован метод вычисления "spam likelihood value" (значения вероятности спама) или "inflation likelihood value" (значения вероятности инфляции) для узлов в связанной базе данных. Суть изобретения заключается в анализе производной (derivative) функции важности узла (например, PageRank) по отношению к коэффициенту связности (coupling factor). Этот анализ позволяет математически идентифицировать узлы, чей ранг неестественно чувствителен к изменениям в структуре ссылочного графа.

Как это работает

Система анализирует, как меняется важность узла (PageRank) при изменении coupling factor (параметра, определяющего баланс между следованием по ссылкам и случайными переходами):

  • Вычисление производной: Рассчитывается скорость изменения (производная) функции важности.
  • Анализ Web Rings: Для веб-колец (замкнутые группы, ссылающиеся друг на друга) производная оказывается резко положительной, так как ранг циркулирует внутри группы и быстро растет при усилении связности.
  • Анализ Link Farms: Для ссылочных ферм (много входящих ссылок с низким рангом) производная оказывается резко отрицательной.
  • Нормализация и Идентификация: Производная нормализуется по отношению к текущему рангу узла. Узлы с экстремально большим по модулю значением нормализованной производной идентифицируются как вероятный спам.

Актуальность для SEO

Высокая. Хотя конкретные математические имплементации, описанные в патенте, могли быть дополнены или заменены более сложными алгоритмами машинного обучения, фундаментальный принцип остается крайне актуальным. Анализ структуры ссылочного графа для выявления неестественных паттернов накопления ранга и манипулятивных схем является основой борьбы со ссылочным спамом.

Важность для SEO

Влияние на SEO высокое (8/10). Патент напрямую нацелен на борьбу с основными техниками ссылочного спама, используемыми для манипуляции PageRank. Понимание этого механизма критически важно для специалистов по линкбилдингу, так как подчеркивает огромные риски использования неестественных ссылочных структур (PBN низкого качества, схемы обмена ссылками) и важность построения органического, разнообразного ссылочного профиля.

Детальный разбор

Термины и определения

Clique Attack / Web Ring (Кликовая атака / Веб-кольцо)
Тип ссылочного спама. Набор узлов, которые преимущественно ссылаются друг на друга, чтобы создать ложное впечатление авторитетности и взаимно повысить свой ранг, удерживая его внутри группы.
Coupling Factor (c) (Коэффициент связности)
Параметр (от 0 до 1), определяющий, насколько сильно ранг узла зависит от структуры ссылок. При c=1 ранг полностью зависит от ссылок; при c=0 все узлы имеют равный ранг (только случайные переходы). Аналог Damping Factor в классическом PageRank.
Derivative Value (Значение производной)
Производная функции важности узла по отношению к coupling factor (x'(c)). Показывает скорость изменения ранга узла при изменении веса ссылок в алгоритме.
Inflation Detector (Детектор инфляции)
Компонент системы, который анализирует структуру ссылок и PageRanks для выявления узлов с искусственно завышенным рангом.
Link Farm (Ссылочная ферма)
Тип ссылочного спама. Структура, где большое количество узлов (обычно с низким рангом) ссылаются на один центральный узел, чтобы искусственно повысить его ранг.
Node Importance Function (Функция важности узла)
Функция, вычисляющая важность или ранг узлов на основе структуры ссылок (например, PageRank). Обозначается как x(c).
Normalized Derivative Value / Spam Likelihood Value (S)
Нормализованное значение производной (часто x'(c)/x(c)). Используется как количественная мера вероятности того, что ранг узла искусственно завышен из-за ссылочного спама.
Transition Probability Matrix (A(c))
Матрица NxN, представляющая структуру вероятностей переходов в направленном графе. Зависит от coupling factor c.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает общий метод идентификации узлов, являющихся бенефициарами ссылок, завышающих важность узла.

  1. Вычисление для подмножества узлов величины, соответствующей производной функции важности узла (derivative of a node importance function).
  2. Сравнение этой вычисленной величины с пороговым значением (threshold).
  3. Идентификация узлов, для которых сравнение дает предопределенный результат (например, превышение порога).

Claim 3 (Зависимый от 1): Уточняет, что производная функции важности вычисляется по отношению к коэффициенту связности (coupling factor).

Claim 36 (Зависимый от 1): Детализирует процесс вычисления с использованием матричной алгебры (Метод 1).

  1. Расчет матрицы A(c), представляющей направленный граф и зависящей от коэффициента связности c.
  2. Расчет главного собственного вектора A(c), обозначенного x(c) (это вектор рангов, например, PageRank).
  3. Расчет производной x(c) по c, обозначенной x'(c).
  4. Расчет значения вероятности инфляции (inflation likelihood value S) на основе x'(c) и ранга узла.

Claim 39 (Зависимый от 37): Определяет точную формулу для вычисления производной x'(c): x′(c)=(I−cPT)−1(P−E)Tx(c)x'(c) = (I-cP^T)^{-1}(P-E)^T x(c)x′(c)=(I−cPT)−1(P−E)Tx(c).

Claim 48 (Независимый пункт): Описывает альтернативный метод идентификации ссылочного спама (Метод 2, аппроксимация производной).

  1. Расчет матрицы A(c).
  2. Расчет главного собственного вектора для двух различных значений коэффициента c (a и b): x(a) и x(b). (Т.е. расчет PageRank дважды с разными coupling factors).
  3. Расчет значения вероятности спама (spam likelihood value S) для узла на основе компонентов x(a) и x(b), соответствующих этому узлу.

Где и как применяется

Изобретение применяется в бэкенд-системе поисковой машины (Search Engine Back End System) на этапах, связанных с анализом ссылок и расчетом рангов.

INDEXING – Индексирование и извлечение признаков
Основное применение патента происходит на этом этапе или в связанных с ним офлайн-процессах анализа данных. Система использует Link Map(s) (карты ссылок) для расчета PageRanks. Затем Inflation Detector (Детектор инфляции) анализирует Link Map(s) и рассчитанные PageRanks для вычисления производных и определения Spam Likelihood Values.

RANKING – Ранжирование
Результаты работы Inflation Detector используются на этапе ранжирования. Если узел идентифицирован как бенефициар ссылочного спама, система может предпринять контрмеры: скорректировать (понизить) его важность (adjusted importance) или удалить узел из графа/индекса.

Входные данные:

  • Link Map(s): Структура направленного графа (кто на кого ссылается).
  • PageRanks (x(c)): Рассчитанные значения важности узлов (если используется Метод 1).

Выходные данные:

  • Spam Likelihood Values (S) для узлов.
  • Скорректированные значения важности или флаги спама для идентифицированных узлов.

На что влияет

  • Конкретные типы сайтов: Наибольшее влияние оказывается на сайты, использующие искусственные схемы линкбилдинга: ссылочные фермы, PBN (Private Blog Networks), которые функционируют как веб-кольца, и другие сети сайтов, созданные для манипуляции ранжированием.
  • Конкретные ниши или тематики: Наибольшее влияние оказывается на конкурентные и коммерческие ниши, где техники ссылочного спама применяются наиболее активно.

Когда применяется

  • При каких условиях работает алгоритм: Алгоритм применяется в процессе расчета или обновления глобальных метрик важности узлов (PageRank).
  • Триггеры активации и пороговые значения: Узел идентифицируется как спам, если его Normalized Derivative Value превышает определенный порог (threshold) по модулю, или если он попадает в предопределенный процент узлов с самыми экстремальными (высокими положительными или низкими отрицательными) значениями.
  • Частота применения: Расчеты производятся периодически в офлайн-режиме по мере обновления ссылочного графа.

Пошаговый алгоритм

Патент описывает два основных метода реализации.

Метод 1: Прямой расчет производной

  1. Подготовка данных: Создание направленного графа. Формирование матрицы вероятностей переходов A(c)=[cP+(1−c)E]TA(c) = [cP + (1-c)E]^TA(c)=[cP+(1−c)E]T.
  2. Вычисление важности: Расчет функции важности узлов (PageRank, x(c)) для заданного значения coupling factor c.
  3. Вычисление производной: Расчет производной функции важности x'(c) по формуле из Claim 39. Поскольку матрица большая и разреженная, используются итеративные методы, такие как Jacobi relaxation или Gauss-Seidel.
  4. Нормализация: Вычисление Normalized Derivative Value (Spam Likelihood Value S). Часто путем деления производной на ранг узла (x'(c)/x(c)).
  5. Идентификация спама: Сравнение S с пороговыми значениями.
    • Если S сильно положительное (выше порога) — вероятно Web Ring.
    • Если S сильно отрицательное (ниже порога) — вероятно Link Farm.
  6. Применение действий: Выполнение действий над идентифицированными узлами (например, понижение ранга, удаление узла).

Метод 2: Аппроксимация производной (Averaging)

Этот метод используется, если прямой расчет производной слишком ресурсоемок.

  1. Вычисление важности для разных C: Расчет PageRank для двух разных значений coupling factor: x(a) и x(b).
  2. Расчет Spam Likelihood Value: Вычисление среднего нормализованного значения производной в интервале [a, b] по формуле: (log⁡[x(b)

    Выводы

    1. Математическое обнаружение спама: Патент предоставляет метод для автоматизированного и математически обоснованного отличия естественного накопления ссылочной массы от искусственных манипулятивных структур (Link Farms и Web Rings) на основе анализа топологии графа.
    2. Чувствительность ранга как индикатор спама: Ключевым инсайтом является то, что искусственно завышенный ранг чрезмерно чувствителен к изменениям параметров алгоритма (coupling factor). Эта чувствительность измеряется через производную функции важности.
    3. Механизм работы Web Rings (Положительная производная): Веб-кольца создают замкнутую систему, где ранг циркулирует внутри группы и не рассеивается наружу. Когда вес ссылок увеличивается (c растет), ранг узлов внутри кольца резко возрастает из-за взаимного усиления. Это приводит к большой положительной производной.
    4. Механизм работы Link Farms (Отрицательная производная): Ссылочные фермы полагаются на множество входящих ссылок с низким рангом. Когда вес ссылок увеличивается (c растет), ранг целевого узла может резко падать, так как он начинает больше зависеть от этих слабых ссылок и меньше от базовой вероятности случайного перехода. Это приводит к большой отрицательной производной.
    5. Стабильность авторитетных сайтов: Естественно авторитетные сайты имеют разнообразный профиль ссылок (как высокоранговые, так и низкоранговые источники). Эти эффекты уравновешивают друг друга, и производная их ранга не является экстремальной.
    6. Практическая реализация через аппроксимацию: Система может эффективно выявлять спам, не вычисляя точную производную, а просто рассчитывая PageRank с разными коэффициентами связности и сравнивая результаты (Метод 2).

    Практика

    Best practices (это мы делаем)

    • Построение разнообразного и органического ссылочного профиля: Стремитесь к получению ссылок из различных источников, включая как высокоавторитетные сайты (с высоким PageRank), так и тематические ресурсы среднего уровня. Разнообразие стабилизирует ранг и предотвращает экстремальные значения производной.
    • Фокус на качестве доноров: Наличие входящих ссылок с высоким PageRank снижает вероятность того, что алгоритм классифицирует профиль как Link Farm, так как это уравновешивает влияние ссылок низкого качества.
    • Естественное распределение исходящих ссылок: Сайт должен естественно ссылаться на другие релевантные и авторитетные ресурсы. Это помогает "рассеивать" PageRank и избегать формирования замкнутых структур, характерных для Web Ring, где ранг искусственно удерживается.

    Worst practices (это делать не надо)

    • Создание закрытых PBN (Web Rings): Построение сетей сайтов (Private Blog Networks) с интенсивной взаимной перелинковкой и минимальными исходящими ссылками на внешние ресурсы. Это классический паттерн Web Ring, который идентифицируется по большой положительной производной.
    • Использование низкокачественных PBN или Link Farms: Создание сетей на доменах с низким рангом исключительно для простановки ссылок на основной сайт. Это паттерн Link Farm, который идентифицируется по большой отрицательной производной.
    • Участие в схемах обмена ссылками: Активное участие в замкнутых группах сайтов для взаимной накачки ранга приводит к обнаружению структуры как Web Ring.
    • Массовая закупка низкокачественных ссылок: Приобретение большого количества ссылок с неавторитетных, заспамленных ресурсов создает структуру, функционально эквивалентную Link Farm.

    Стратегическое значение

    Патент демонстрирует, что Google анализирует не только количество и "вес" ссылок, но и глубокую топологию ссылочного графа на предмет выявления манипуляций. Он подтверждает переход от грубого подсчета ссылок к сложному анализу паттернов линкбилдинга. Для долгосрочной SEO-стратегии это означает, что любые попытки имитировать авторитетность через искусственные ссылочные структуры несут высокие риски. Естественность и разнообразие ссылочного профиля являются ключевыми факторами успеха.

    Практические примеры

    Сценарий 1: Обнаружение схемы обмена ссылками (Web Ring)

    1. Ситуация: Группа из 10 сайтов в одной нише договорилась о взаимном обмене ссылками. Каждый сайт поставил ссылки на остальные 9 сайтов и почти не ссылается на внешние ресурсы.
    2. Анализ Google: Система обнаруживает замкнутую структуру. При увеличении coupling factor c (увеличении веса ссылок), ранг этих 10 сайтов резко возрастает, так как PageRank циркулирует внутри группы и слабо рассеивается наружу.
    3. Результат: Производная оказывается сильно положительной. Spam Likelihood Value превышает порог для Web Ring. Google нейтрализует эффект от этих взаимных ссылок.

    Сценарий 2: Обнаружение низкокачественной PBN (Link Farm) с помощью Метода 2

    1. Ситуация: SEO-специалист создал сеть из 100 сайтов-сателлитов с низким собственным PageRank, ссылающихся на продвигаемый сайт.
    2. Анализ Google: Google рассчитывает PageRank дважды: с высоким coupling factor (например, b=0.9) и с низким (например, a=0.5).
    3. Наблюдение: При a=0.5 ранг сайта умеренный. При b=0.9 (когда ссылки имеют больший вес), ранг сайта значительно падает, так как он становится зависимым от множества слабых ссылок.
    4. Расчет: Система вычисляет Spam Likelihood Value S по формуле (log⁡[x(b)

      Вопросы и ответы

      Что такое "Coupling Factor" (c) и как он связан с Damping Factor в PageRank?

      Coupling Factor (c) в этом патенте функционально эквивалентен Damping Factor в классической формуле PageRank. Он определяет вероятность того, что пользователь продолжит переходить по ссылкам (например, 85%), в противовес вероятности случайного перехода на любую страницу (например, 15%). Чем выше 'c', тем большее значение имеет реальная структура ссылок.

      Почему у Web Ring (или закрытой PBN) производная положительная?

      Web Ring — это замкнутая группа сайтов, которые ссылаются друг на друга и мало ссылаются наружу. PageRank в такой структуре циркулирует внутри и не "рассеивается". Когда Coupling Factor (c) увеличивается (вес ссылок растет), эффект взаимного усиления ранга внутри кольца резко возрастает, что приводит к быстрому росту PageRank и, соответственно, к положительной производной.

      Почему патент утверждает, что у Link Farm производная отрицательная?

      Link Farm состоит из множества ссылок с очень низким рангом. Когда Coupling Factor (c) увеличивается, алгоритм начинает больше полагаться на эти слабые ссылки и меньше на базовую вероятность случайного перехода (которая одинакова для всех). Поскольку входящие ссылки очень слабые, увеличение их веса может привести к падению ранга целевой страницы по сравнению с ее рангом при более низком 'c'. Отсюда и отрицательная производная.

      Как этот алгоритм отличает Link Farm от популярного сайта, на который естественно ссылается много людей?

      Алгоритм отличает их по качеству ссылающихся узлов. На естественно популярный сайт ссылаются как ресурсы с низким, так и с высоким рангом (авторитетные сайты). Это разнообразие стабилизирует ранг, и производная не является экстремальной. Link Farm же характеризуется однородной массой ссылок исключительно низкого качества.

      Какой метод реализации более вероятен: расчет производной (Метод 1) или двойной расчет PageRank (Метод 2)?

      Метод 2 (Claim 48) значительно более практичен и вычислительно эффективен для масштабов веба. Он требует всего лишь дважды запустить стандартный алгоритм расчета PageRank с разными параметрами (например, c=0.8 и c=0.9) и сравнить результаты. Прямой расчет производной (Метод 1) значительно сложнее и требует использования специальных итеративных методов (Jacobi relaxation).

      Как SEO-специалисту защитить свой сайт от ложного срабатывания этого алгоритма?

      Ключ к защите — построение разнообразного и качественного ссылочного профиля. Необходимо фокусироваться на получении ссылок с авторитетных сайтов. Наличие качественных доноров стабилизирует ранг вашего сайта и гарантирует, что его производная не достигнет экстремальных значений, характерных для спама.

      Может ли этот алгоритм использоваться для ранжирования, а не только для поиска спама?

      Да. Патент упоминает (в описании и Claim 10), что величина производной (derivative value) может использоваться независимо как оценка важности узла. Таким образом, ее можно использовать для сортировки результатов поиска, подобно стандартному PageRank.

      Как этот патент влияет на стратегию исходящих ссылок?

      Он подчеркивает важность естественного исходящего цитирования. Сайт, который только аккумулирует входящие ссылки и не ссылается наружу, повышает риск быть классифицированным как часть Web Ring. Исходящие ссылки на авторитетные ресурсы помогают "рассеивать" PageRank естественным образом.

      Как расчет PageRank с разными коэффициентами (Метод 2) помогает найти спам?

      Этот метод является способом аппроксимации производной. Если ранг сайта сильно меняется при небольшом изменении Coupling Factor, это указывает на нестабильность ранга и высокую вероятность того, что он поддерживается искусственной структурой (фермой или кольцом).

      Означает ли этот патент, что все PBN будут обнаружены?

      Он означает, что у Google есть математический аппарат для обнаружения структурных аномалий, характерных для многих PBN. PBN, которые идеально имитируют естественную структуру ссылок (разнообразное входящее и исходящее цитирование, отсутствие закрытых циклов), обнаружить сложнее, но поддерживать такую имитацию в масштабе очень ресурсоемко.

      Похожие патенты

      Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
      Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
      • US8719276B1
      • 2014-05-06
      • Антиспам

      • Ссылки

      • Техническое SEO

      Как Google намеренно задерживает или искажает изменения в ранжировании для выявления SEO-манипуляций
      Google использует механизм для борьбы со спамом, который вносит временные задержки и неожиданные колебания в ранжирование документа после изменения его факторов. Вместо немедленного применения нового рейтинга система использует "Функцию перехода ранга". Это делается для того, чтобы запутать спамеров и проанализировать их реакцию на неожиданные изменения (например, падение позиций вместо ожидаемого роста), выявляя таким образом манипуляции.
      • US8244722B1
      • 2012-08-14
      • Антиспам

      • SERP

      • Техническое SEO

      Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
      Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
      • US7783639B1
      • 2010-08-24
      • Ссылки

      • Антиспам

      • EEAT и качество

      Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
      Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
      • US8060405B1
      • 2011-11-15
      • Антиспам

      • Ссылки

      • SERP

      Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
      Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
      • US10402457B1
      • 2019-09-03
      • Ссылки

      • Антиспам

      • Краулинг

      Популярные патенты

      Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
      Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
      • US8447760B1
      • 2013-05-21
      • Поведенческие сигналы

      • Персонализация

      • Семантика и интент

      Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph
      Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).
      • US9208229B2
      • 2015-12-08
      • Knowledge Graph

      • Ссылки

      • EEAT и качество

      Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
      Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
      • US9348945B2
      • 2016-05-24
      • Семантика и интент

      • SERP

      • Поведенческие сигналы

      Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
      Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
      • US8131754B1
      • 2012-03-06
      • Поведенческие сигналы

      • Персонализация

      • Семантика и интент

      Как Google использует данные из Local Search и Google Maps для распознавания географических названий в основном поиске
      Google анализирует поведение пользователей в интерфейсах с отдельными полями ввода "Что?" и "Где?" (например, в Google Maps). На основе этой статистики система определяет, является ли термин однозначным названием местоположения ("Нью-Йорк") или нет ("Пицца"). Это позволяет поиску отличать локальные запросы от общих и формировать "черные списки" для терминов, которые похожи на города, но ими не являются (например, "Орландо Блум").
      • US8782030B1
      • 2014-07-15
      • Local SEO

      • Семантика и интент

      • Поведенческие сигналы

      Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
      Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
      • US20150169576A1
      • 2015-06-18
      • Поведенческие сигналы

      • SERP

      • Семантика и интент

      Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
      Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
      • US9110975B1
      • 2015-08-18
      • Поведенческие сигналы

      • Семантика и интент

      • SERP

      Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
      Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
      • US10073882B1
      • 2018-09-11
      • Семантика и интент

      • Поведенческие сигналы

      Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
      Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
      • US8495483B1
      • 2013-07-23
      • Индексация

      • Ссылки

      • SERP

      Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)
      Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.
      • US9558233B1
      • 2017-01-31
      • Ссылки

      • Поведенческие сигналы

      • Антиспам

      seohardcore