SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google позволяет вебмастерам управлять весом и интерпретацией исходящих ссылок через атрибуты тега (Основа nofollow)

EMBEDDED COMMUNICATION OF LINK INFORMATION (Встроенная передача информации о ссылках)
  • US7979417B1
  • Google LLC
  • 2005-06-30
  • 2011-07-12
  • Ссылки
  • Краулинг
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google запатентовал механизм, позволяющий вебмастерам добавлять в теги ссылок () специальные пары "параметр=значение" (например, rel=nofollow или linkweight=0.5). Эта информация используется краулером и поисковой системой для изменения способа обработки ссылки, например, для корректировки передаваемого веса (PageRank) или блокировки ее учета.

Описание

Какую проблему решает

Патент решает фундаментальное ограничение стандартных HTML-тегов <A> (анкорных ссылок), которые передают только адрес целевого документа (URL), но не передают мнение, намерение или желаемый вес ссылки со стороны публикующего сайта. Это не позволяло поисковым системам понять контекст ссылки или уровень доверия, который издатель вкладывает в нее, заставляя рассматривать все ссылки как равные редакционные рекомендации.

Что запатентовано

Запатентована система, в которой теги ссылок (Link Tags) могут содержать дополнительные метаданные в виде Information Pairs (пар "параметр=значение"). Эти метаданные инструктируют краулер поисковой системы о том, как обрабатывать данную ссылку и связанный с ней контент. Это позволяет издателям контента напрямую влиять на то, как поисковая система интерпретирует исходящие ссылки.

Как это работает

Механизм работает следующим образом:

  • Встраивание информации: Вебмастера встраивают Information Pairs (например, linkweight=0.5 или opinion=offensive) непосредственно в тег <A>.
  • Обнаружение краулером: Краулер (Search Engine Crawler) получает документ, анализирует теги ссылок и считывает эти пары.
  • Выбор метода обработки: На основе обнаруженных параметров система выбирает метод обработки ссылки.
  • Исполнение: Метод может включать блокировку обработки ссылки (не переходить по ней или не передавать вес) или корректировку веса (Adjust a Weight), связанного с этой ссылкой. Это напрямую влияет на расчет Document Ranking Values (например, PageRank).

Актуальность для SEO

Крайне высокая. Этот патент, поданный в 2005 году, описывает точный механизм, который стал известен как атрибут rel="nofollow", представленный в том же году. Это основополагающая концепция для всех последующих атрибутов ссылок, таких как rel="sponsored" и rel="ugc". Учитывая состав изобретателей (включая Мэтта Каттса и Пола Хаара), это фундаментальный патент для понимания ссылочного графа Google.

Важность для SEO

Критическое влияние (10/10). Этот механизм фундаментально изменил стратегии линкбилдинга и управления контентом. Он ввел концепцию "nofollow" и позволил вебмастерам контролировать поток PageRank и сигнализировать о природе ссылок (реклама, пользовательский контент, ненадежные источники), напрямую влияя на то, как Google оценивает ссылочные профили и ранжирует сайты.

Детальный разбор

Термины и определения

Link Tag (Тег ссылки)
Улучшенный анкорный тег (например, HTML тег <A>), который может содержать дополнительные Information Pairs помимо адреса целевого документа.
Information Pair (Информационная пара)
Пара, состоящая из Parameter (Параметр) и соответствующего Value (Значение), встроенная в Link Tag. Например, rel="nofollow" или linkweight=0.5.
Parameter (Параметр)
Определяет измерение или тип дополнительной информации в ссылке (например, 'linkweight', 'opinion', 'rel').
Value (Значение)
Конкретное значение параметра (например, '0.5', 'offensive', 'nofollow').
Location Value (Значение местоположения)
Адрес (например, URL) контента или документа, на который указывает ссылка (атрибут HREF). Упоминается в Claim 1.
Weight (Вес)
Метрика, связанная со ссылкой, используемая для определения относительной важности целевого документа. Этот вес может быть скорректирован на основе Information Pairs.
Document Ranking Values (Значения ранжирования документа)
Числовые оценки важности документа (например, PageRank), вычисляемые с учетом весов входящих ссылок.
Decryption Key (Ключ дешифрования)
Ключ, используемый краулером для расшифровки информации в Link Tag, если издатель решил ее зашифровать.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс обработки документов краулером.

  1. Система (Search Engine Crawler) получает документ.
  2. В документе есть встроенный первый Link Tag.
  3. Этот тег включает location value (URL) И одну или более Information Pairs (параметр=значение), которые отличаются от URL.
  4. Система выбирает метод обработки контента (на который указывает URL) на основе этих Information Pairs.
  5. Система получает (скачивает) целевой контент.
  6. Система обрабатывает полученный контент в соответствии с выбранным методом для добавления информации в базы данных поисковой системы.

Ядро изобретения — использование дополнительной информации в ссылке для управления тем, как эта ссылка будет обработана поисковой системой.

Claim 3 и 4 (Зависимые): Детализируют один из методов обработки.

Метод обработки включает корректировку Weight (веса), указанного в соответствующей Information Pair тега ссылки (Claim 3). Далее система вычисляет Document Ranking Values (например, PageRank) для целевых документов, используя этот скорректированный вес (Claim 4).

Это прямо указывает на возможность управления передаваемым ссылочным весом.

Claim 2 (Зависимый): Описывает обработку вложенных тегов (Nesting).

Если первый Link Tag включен во второй тег (например, <div>), и этот второй тег имеет свою собственную Information Pair, то обработка контента, связанного с первой ссылкой, может выполняться в соответствии со значением из второго (внешнего) тега.

Это позволяет применять правила обработки (например, аналогичные "nofollow") к целым блокам контента, а не к каждой ссылке по отдельности.

Claims 11 и 12 (Зависимые): Описывают возможность шифрования.

Значения (Values) в Information Pairs могут быть зашифрованы, например, с использованием ключа из несимметричной пары ключей. Это позволяет издателям предоставлять информацию только доверенным краулерам.

Где и как применяется

Изобретение применяется на этапах сканирования и индексирования для управления интерпретацией ссылочного графа.

CRAWLING – Сканирование и Сбор данных
На этом этапе краулер (Search Engine Crawler) получает документ и должен разобрать HTML-код, чтобы извлечь Link Tags и связанные с ними Information Pairs. В зависимости от информации (например, указание на блокировку), это может повлиять на планирование сканирования — система может решить не переходить по ссылке.

INDEXING – Индексирование и извлечение признаков (Link Analysis)
Это основной этап применения патента. Система анализа ссылок извлекает все ссылки и их атрибуты.

  1. Извлечение признаков: Система идентифицирует Information Pairs в каждой ссылке.
  2. Выбор метода обработки: Система определяет, как интерпретировать ссылку (например, как обычную ссылку, ссылку с пониженным весом или заблокированную ссылку).
  3. Корректировка веса: Система корректирует Weight, связанный со ссылкой.
  4. Расчет рангов: Генератор ранжирования документов (Document Ranking Generator) использует эти скорректированные веса для вычисления итоговых Document Ranking Values.

Входные данные:

  • HTML-код документа.
  • Link Tags, содержащие Location Value (URL) и Information Pairs.
  • (Опционально) База данных ключей дешифрования (Decryption Key Database).

Выходные данные:

  • Скорректированные карты ссылок (Link Maps) с назначенными весами.
  • Обновленные Document Ranking Values (PageRank).
  • (Возможно) Исключение URL из очереди сканирования.

На что влияет

  • Конкретные типы контента: Наибольшее влияние на сайты с большим объемом пользовательского контента (UGC) — форумы, блоги (комментарии), социальные сети, где необходимо контролировать качество исходящих ссылок. Также критично для сайтов, размещающих рекламу или спонсорский контент.
  • Ссылочные факторы: Патент напрямую влияет на интерпретацию исходящих ссылок и расчет передаваемого ими веса (PageRank).

Когда применяется

  • Условия работы: Алгоритм применяется каждый раз, когда краулер обнаруживает и обрабатывает Link Tag в документе во время сканирования и индексирования.
  • Триггеры активации: Активация специфического метода обработки (например, блокировки или снижения веса) происходит при обнаружении распознаваемой Information Pair (например, rel="nofollow") в теге ссылки или во внешнем теге, охватывающем ссылку.

Пошаговый алгоритм

Процесс обработки ссылок краулером и индексатором

  1. Идентификация документов: Определение набора документов для сканирования и обработки.
  2. Получение документа: Загрузка документа, содержащего один или несколько встроенных Link Tags.
  3. Парсинг и извлечение: Анализ HTML для извлечения Link Tags. Для каждого тега определяется location value (URL) и любые присутствующие Information Pairs.
  4. Анализ контекста (Nesting): Определение, находится ли Link Tag внутри другого тега, который также содержит Information Pairs, влияющие на обработку ссылок (согласно Claim 2).
  5. (Опционально) Дешифрование: Если информация зашифрована, получение соответствующего ключа дешифрования (на основе идентификатора издателя или местоположения документа) и расшифровка значений.
  6. Выбор метода обработки: Определение способа обработки ссылки на основе совокупности Information Pairs из самого тега и внешних тегов.
  7. Исполнение метода обработки:
    • Вариант A (Блокировка): Если параметры указывают на блокировку, система может заблокировать обработку контента, связанного с тегом. Это может означать отказ от перехода по ссылке (на этапе CRAWLING) или присвоение нулевого веса (на этапе INDEXING).
    • Вариант B (Корректировка веса): Если параметры указывают на изменение веса (например, linkweight=0.5), система корректирует Weight, связанный с этой ссылкой.
  8. Вычисление рангов: Расчет Document Ranking Values (PageRank) для целевых документов с учетом скорректированного веса.

Какие данные и как использует

Данные на входе

Патент фокусируется на структурных и технических данных, связанных с гиперссылками.

  • Технические факторы: Location value — URL целевого документа, указанный в ссылке (например, атрибут HREF). Идентификатор или местоположение исходного документа (может использоваться для поиска ключей дешифрования).
  • Структурные факторы:
    • Структура HTML, в частности тег <A> и его атрибуты.
    • Information Pairs, встроенные в тег ссылки.
    • Вложенность тегов (Nesting) — наличие внешних тегов, которые могут влиять на интерпретацию внутренних ссылок.

Какие метрики используются и как они считаются

  • Information Pairs (Параметр=Значение): Это основной ввод данных для принятия решений. Патент приводит примеры:
    • linkweight=0.5 (указание веса).
    • offensive=very (мнение о контенте).
    • funny=somewhat (мнение о контенте).
  • Weight (Вес ссылки): Внутренняя метрика, присваиваемая ссылке. Система корректирует этот вес на основе Information Pairs. Если указано linkweight=0.5, вес может быть уменьшен. Если используется блокировка, вес может быть обнулен.
  • Document Ranking Values: Итоговые оценки важности документов (PageRank). Они рассчитываются с использованием алгоритмов ранжирования, которые принимают на вход скорректированные веса ссылок (Weights).

Выводы

  1. Явный контроль для издателей: Патент предоставляет вебмастерам механизм для явного контроля над тем, как поисковые системы должны интерпретировать исходящие ссылки на их сайте. Это переводит интерпретацию ссылок из полностью алгоритмической плоскости в плоскость, учитывающую сигналы от владельцев сайтов.
  2. Не все ссылки равны: Фундаментальный вывод заключается в том, что Google признает необходимость различать типы ссылок: редакционные рекомендации, пользовательский контент (UGC), рекламу и т.д.
  3. Прямое влияние на PageRank: Механизм напрямую влияет на расчет Document Ranking Values (PageRank) путем корректировки Weight отдельных ссылок. Это подтверждает, что атрибуты ссылок являются инструкциями для изменения веса.
  4. Гранулярный и абсолютный контроль: Патент описывает как гранулярный контроль (корректировка веса, например, 50% через linkweight=0.5), так и абсолютный контроль (полная блокировка обработки ссылки).
  5. Контроль на уровне блоков (Nesting): Возможность применять правила к целым разделам страницы через вложенные теги (Claim 2) упрощает управление ссылками на крупных сайтах (например, применение правил ко всему блоку комментариев).
  6. Основа для борьбы со спамом: Этот механизм является ключевым инструментом для борьбы со ссылочным спамом в UGC и манипуляциями через платные ссылки, позволяя Google игнорировать такие ссылки при ранжировании.

Практика

Best practices (это мы делаем)

Этот патент является технической основой для атрибутов rel="nofollow", rel="sponsored" и rel="ugc".

  • Соблюдение правил для платных ссылок: Все ссылки, размещенные за плату (реклама, спонсорские материалы, партнерские ссылки), должны быть помечены соответствующими атрибутами (rel="sponsored" или rel="nofollow"). Это необходимо для соблюдения рекомендаций Google и избежания санкций за манипуляцию ссылочным графом.
  • Управление пользовательским контентом (UGC): Ссылки в контенте, созданном пользователями (комментарии, посты на форумах), должны автоматически помечаться как rel="ugc" или rel="nofollow". Это защищает сайт от передачи веса спамным или низкокачественным ресурсам.
  • Маркировка ненадежных ссылок: Если необходимо сослаться на контент, которому вы не доверяете или не хотите передавать редакционную поддержку, используйте rel="nofollow".
  • Понимание блочного управления (Nesting): Механизм, описанный в Claim 2, показывает, что Google может учитывать блочную логику при анализе страницы. Хотя стандартный HTML не поддерживает применение rel к <div>, важно обеспечить чистоту кода и понимать, как структура документа может влиять на интерпретацию контента.

Worst practices (это делать не надо)

  • Игнорирование атрибутов для платных ссылок: Размещение платных ссылок без соответствующих атрибутов (sponsored/nofollow) является прямым нарушением правил и несет высокий риск санкций, так как патент направлен на предоставление Google инструментов для игнорирования таких ссылок.
  • Массовое применение nofollow к внутренним ссылкам (PageRank Sculpting): Попытки манипулировать распределением внутреннего PageRank путем закрытия внутренних ссылок через "nofollow" (практика, известная как PageRank Sculpting) неэффективны. Хотя технически этот патент позволяет это делать, Google изменил интерпретацию "nofollow" для внутренних ссылок, и такой подход приводит к потере веса, а не к его перераспределению.
  • Использование нестандартных атрибутов: Попытки использовать атрибуты, описанные в патенте буквально (например, linkweight=0.5), скорее всего, будут неэффективны, так как Google стандартизировал ввод через атрибут rel.

Стратегическое значение

Этот патент является краеугольным камнем современного понимания ссылочного графа. Он знаменует переход от модели, где любая ссылка является голосом, к модели, где контекст и атрибуты ссылки определяют ее ценность. Стратегически это означает, что SEO-специалисты должны сосредоточиться на получении редакционно одобренных ссылок (т.е. ссылок без ограничивающих атрибутов) и обеспечить строгое соблюдение правил для всех остальных типов ссылок. Понимание этого механизма критически важно для разработки безопасных и эффективных стратегий линкбилдинга.

Практические примеры

Сценарий 1: Управление комментариями в блоге

  1. Ситуация: На сайте WordPress разрешены комментарии, и пользователи часто оставляют ссылки на свои сайты.
  2. Применение патента: Система управления контентом (CMS) автоматически модифицирует все ссылки, оставленные пользователями.
  3. Реализация: К тегу <A> добавляется Information Pair, стандартизированная Google.
    <a href="http://example.com" rel="ugc nofollow">Мой сайт</a>
  4. Результат: Краулер Google видит эту инструкцию и выбирает метод обработки, который корректирует Weight ссылки (обычно до нуля), блокируя передачу Document Ranking Value (PageRank) на сайт example.com и защищая блог от ассоциации со спамом.

Сценарий 2: Размещение спонсорской статьи

  1. Ситуация: Новостной сайт публикует обзор продукта за плату и ставит ссылку на сайт производителя.
  2. Применение патента: Вебмастер должен указать, что эта ссылка не является органической редакционной рекомендацией.
  3. Реализация: Добавление соответствующей Information Pair.
    <a href="http://manufacturer.com" rel="sponsored">Купить продукт</a>
  4. Результат: Google учитывает эту ссылку с измененным весом (обычно нулевым или сильно пониженным), и новостной сайт избегает санкций за продажу ссылок, передающих PageRank.

Вопросы и ответы

Что конкретно описывает этот патент?

Патент описывает технический механизм, который позволяет добавлять в HTML-теги ссылок (<A>) дополнительную информацию в виде пар "параметр=значение" (Information Pairs). Эта информация используется краулером для изменения способа обработки ссылки. На практике это реализация атрибутов rel="nofollow", rel="sponsored" и rel="ugc".

Позволяет ли этот механизм только блокировать ссылки (как nofollow)?

Нет, патент описывает более широкие возможности. Помимо блокировки обработки, он явно упоминает возможность корректировки веса (Adjust a Weight). В качестве примера приводится linkweight=0.5, что подразумевает возможность указать, что ссылка должна передавать только 50% от стандартного веса.

Что такое "Information Pairs" в контексте реального SEO?

В патенте это абстрактное понятие пары "параметр=значение". В реальной практике Google стандартизировал это через атрибут rel. Например, в rel="nofollow", "rel" — это параметр, а "nofollow" — это значение. Это и есть Information Pair, которая инструктирует краулер.

Что подразумевается под "Document Ranking Values"?

Это обобщенный термин для оценки важности или авторитетности документа, используемой при ранжировании. Наиболее известный пример такой метрики — это PageRank. Патент прямо указывает, что механизм предназначен для влияния на расчет этих значений путем корректировки Weight входящих ссылок.

Что означает "Блокировка обработки" (Block Processing)?

Это инструкция поисковой системе игнорировать ссылку для определенных целей. На этапе сканирования это может означать отказ от перехода по ссылке (экономия краулингового бюджета). На этапе индексирования и анализа ссылок это означает, что ссылка не должна передавать ранжирующий вес (PageRank) целевому документу.

Какое значение имеет дата подачи заявки (2005 год)?

Это критически важно, так как 2005 год — это год, когда Google совместно с другими поисковыми системами представил атрибут rel="nofollow" для борьбы со спамом в комментариях. Этот патент является техническим описанием того, как именно nofollow был реализован в инфраструктуре Google.

Что такое функция вложенных тегов (Nesting, Claim 2) и используется ли она?

Эта функция позволяет применять атрибуты к внешнему тегу (например, <div>), и эти атрибуты будут влиять на все ссылки внутри этого блока. Это упрощает управление, позволяя, например, применить правило ко всему блоку комментариев сразу. Хотя стандартный HTML не поддерживает "nofollow" на <div>, этот механизм описывает логику, которую Google может применять при анализе структуры страницы.

Патент упоминает шифрование информации в ссылках. Используется ли это?

Патент действительно описывает возможность для издателей шифровать Information Pairs, чтобы их могли прочитать только доверенные краулеры (например, только Googlebot), используя Decryption Key. Однако на практике эта возможность не получила широкого распространения в публичном вебе и не используется в стандартных SEO-практиках.

Как этот патент влияет на внутреннюю перелинковку и PageRank Sculpting?

Технически, патент предоставляет механизм для контроля потока PageRank внутри сайта путем применения "nofollow" или снижения веса внутренних ссылок. Однако практика "PageRank Sculpting" с использованием "nofollow" была признана Google неэффективной примерно в 2009 году, так как вес не перераспределяется, а теряется. Для управления внутренней перелинковкой следует использовать структуру сайта и анкоры, а не "nofollow".

Кто изобретатели и почему это важно?

В числе изобретателей Мэтт Каттс (бывший глава отдела веб-спама Google), Пол Хаар (один из ведущих инженеров поиска Google) и Кришна Бхарат (создатель Google News). Участие ключевых фигур в области поиска и борьбы со спамом подчеркивает фундаментальную важность этого механизма для поддержания качества поисковой выдачи и управления ссылочным графом.

Похожие патенты

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования
Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.
  • US8538989B1
  • 2013-09-17
  • Семантика и интент

  • Индексация

  • Структура сайта

Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика
Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.
  • US7716225B1
  • 2010-05-11
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google использует HTTP-заголовки для извлечения и индексации метаданных из не-HTML документов (PDF, DOC и т.д.)
Google использует механизм для индексации метаданных файлов, не являющихся HTML (например, PDF, Word, Excel). Во время сканирования метаданные (автор, тема, заголовок) могут передаваться от веб-сервера через специальный HTTP-заголовок. Поисковая система извлекает эти данные, преобразует их в виртуальные META-теги и использует для индексации, улучшая понимание этих форматов.
  • US9582588B2
  • 2017-02-28
  • Индексация

  • Краулинг

  • Техническое SEO

Как Google намеренно задерживает или искажает изменения в ранжировании для выявления SEO-манипуляций
Google использует механизм для борьбы со спамом, который вносит временные задержки и неожиданные колебания в ранжирование документа после изменения его факторов. Вместо немедленного применения нового рейтинга система использует "Функцию перехода ранга". Это делается для того, чтобы запутать спамеров и проанализировать их реакцию на неожиданные изменения (например, падение позиций вместо ожидаемого роста), выявляя таким образом манипуляции.
  • US8244722B1
  • 2012-08-14
  • Антиспам

  • SERP

  • Техническое SEO

Как Google позволяет владельцам сайтов выбирать предпочтительный (канонический) домен для индексации и управлять скоростью сканирования
Патент описывает механизмы Google для решения проблемы дублирования контента, возникающей из-за нескольких эквивалентных доменных имен (например, с WWW и без). Верифицированные владельцы могут указать предпочтительный домен, который Google будет использовать для перезаписи URL-адресов перед индексацией, консолидируя сигналы ранжирования. Патент также описывает интерфейсы для управления верификацией владельцев и контроля скорости сканирования (Crawl Rate).
  • US7930400B1
  • 2011-04-19
  • Индексация

  • Краулинг

  • Техническое SEO

Популярные патенты

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования
Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.
  • US7925498B1
  • 2011-04-12
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

seohardcore