SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов

METHODS AND SYSTEMS FOR ESTABLISHING A KEYWORD UTILIZING PATH NAVIGATION INFORMATION (Методы и системы для установления ключевого слова с использованием информации о пути навигации)
  • US8005716B1
  • Google LLC
  • 2004-06-30
  • 2011-08-23
  • Поведенческие сигналы
  • Семантика и интент
  • Антиспам
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.

Описание

Какую проблему решает

Патент решает три основные задачи, преимущественно в контексте рекламных систем:

  • Генерация ключевых слов: Сложность идентификации всех релевантных ключевых слов (keywords) для продукта или услуги, включая менее очевидные ассоциации.
  • Гео-таргетинг: Повышение эффективности географического таргетинга рекламы на основе реального поведения и предпочтений пользователей.
  • Борьба с низкокачественным контентом (MFA): Обнаружение и противодействие manipulated articles (манипулятивных статей или сайтов MFA — Made for Advertising), которые содержат мало полезной информации и созданы исключительно для генерации дохода от рекламы.

Что запатентовано

Запатентована система (Document Engine), которая анализирует пути навигации пользователей (Path Navigation Information) и данные о взаимодействии с элементами на странице (Selection Data, например, CTR рекламы). Изобретение включает три механизма: генерацию новых рекламных ключевых слов на основе контекста навигации, сопоставление рекламы со страницами на основе географических предпочтений, выведенных из поведения пользователей, и идентификацию манипулятивных статей по аномально высокому CTR рекламы.

Как это работает

Система реализует три ключевых механизма:

  • Механизм 1 (Генерация ключевых слов): Если реклама на странице имеет значительный CTR (выше порога), система анализирует путь, которым пользователь пришел на эту страницу (поисковые запросы, клики). Термины из этого пути ассоциируются с рекламируемым продуктом и устанавливаются как новые ключевые слова.
  • Механизм 2 (Гео-таргетинг): Система определяет географическую привязку страницы и рекламы на основе IP-адресов пользователей, которые с ними взаимодействуют (Selection Data). Реклама подбирается так, чтобы ее географическая ассоциация совпадала с географической ассоциацией страницы.
  • Механизм 3 (Обнаружение MFA): Система анализирует CTR рекламы на странице. Аномально высокий CTR интерпретируется как признак manipulated article, так как пользователи часто кликают по рекламе, чтобы покинуть страницу с низким информационным содержанием.

Актуальность для SEO

Средняя. Патент подан в 2004 году. Технологии генерации ключевых слов и гео-таргетинга, вероятно, эволюционировали в сторону сложных нейросетевых моделей. Однако механизм обнаружения MFA-сайтов через анализ поведенческих сигналов (в частности, CTR рекламы как индикатора неудовлетворенности контентом) остается высоко актуальным и концептуально соответствует современным системам оценки качества контента (например, Helpful Content System).

Важность для SEO

Влияние на SEO значительно, но косвенное (6/10). Хотя патент в первую очередь описывает AdTech, он критически важен для понимания оценки качества контента. Ключевое значение имеет Механизм 3: он прямо указывает, что аномальное взаимодействие с рекламой на сайте (слишком высокий CTR) может быть использовано как сигнал низкого качества контента (manipulated article) и потенциально вести к пессимизации сайта в органическом поиске.

Детальный разбор

Термины и определения

Article (Статья)
Любой документ в сети (веб-страница, PDF-файл и т.д.). В контексте патента чаще всего это веб-страница, на которой размещается реклама.
Click-through Data (Данные о кликах)
Тип Selection Data. Отражает частоту кликов по элементу (рекламе). Используется для расчета CTR (отношение кликов к показам).
Document Engine (Обработчик документов)
Система, отвечающая за анализ статей, подбор рекламы, анализ путей навигации и данных о взаимодействии.
Geographical Location (Географическое местоположение)
Ассоциация статьи, элемента или пользователя с географическим регионом, часто определяемая по IP-адресу.
Item (Элемент)
Содержимое статьи, с которым может взаимодействовать пользователь (например, реклама, баннеры, ссылки).
Keyword (Ключевое слово)
Слово или фраза, используемые в рекламных системах для таргетинга объявлений.
Manipulated Article (Манипулятивная статья)
Статья (веб-страница), созданная для искусственного завышения позиций или исключительно для генерации дохода от рекламы. Характеризуется низким информационным содержанием. Соответствует термину MFA (Made for Advertising).
Path / Path Navigation Information (Путь / Информация о пути навигации)
Последовательность статей (страниц) или действий (ввод поискового запроса, клики по элементам), которые пользователь совершил перед тем, как попасть на текущую статью.
Selection Data (Данные о взаимодействии/выборе)
Данные, отражающие взаимодействие пользователя с элементами (Items) на странице. Включает Click-through data.
Term (Термин)
Слово или фраза, извлеченные из пути навигации (например, из поискового запроса, текста ссылки), которые потенциально могут стать ключевым словом (Keyword).

Ключевые утверждения (Анализ Claims)

Важно отметить, что формула изобретения (Claims) защищает только Механизм 1 (Генерация ключевых слов). Механизмы 2 (Гео-таргетинг) и 3 (Обнаружение MFA) подробно описаны в тексте патента (Description), но не являются частью защищенного ядра изобретения, описанного в Claims 1-23.

Claim 1 и Claim 7 (Независимые пункты): Описывают основной процесс генерации ключевых слов.

  1. Система идентифицирует статью/веб-страницу, содержащую рекламу продукта или услуги.
  2. Определяется или получается описание пути (path), которым пользователь пришел к этой статье. Путь включает предыдущие элементы (рекламу), статьи или введенный пользователем текст (поисковый запрос).
  3. Система (используя Term Processor) определяет термин (term), связанный с этим путем.
  4. Система устанавливает ключевое слово (keyword) на основе этого термина для обозначения продукта или услуги из рекламы на целевой странице.

Зависимые пункты (Claims 4-6, 8-11): Уточняют источники термина в пути навигации:

  • Текст рекламы, по которой был совершен переход.
  • Ключевое слово, связанное с рекламой на предыдущей странице.
  • Поисковый запрос, введенный пользователем.
  • Термин в ссылке (анкор), по которой был совершен переход.

Зависимые пункты (Claims 12-17): Уточняют процесс "установления ключевого слова":

  • Включение термина в список ключевых слов для продукта.
  • Расширение существующего списка.
  • Представление списка рекламодателю в качестве рекомендаций.

Где и как применяется

Патент описывает механизмы, которые в первую очередь относятся к рекламной экосистеме (Google Ads/AdSense), но имеют важные последствия для органического поиска в части оценки качества.

QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)

  • Механизм 1 (Генерация ключевых слов): Анализ логов поведения пользователей для понимания взаимосвязи между путями навигации (включая запросы) и конечными продуктами. Это помогает системе устанавливать семантические связи между терминами.

INDEXING – Индексирование и извлечение признаков

  • Механизм 3 (Обнаружение MFA): На этом этапе могут агрегироваться поведенческие данные (Selection Data), такие как CTR рекламы на страницах сайта. Эти данные используются для вычисления признаков качества и определения вероятности того, что страница является manipulated article.

RANKING / RERANKING – Ранжирование / Переранжирование

  • Механизм 3 (Обнаружение MFA): Если статья идентифицирована как манипулятивная на основе анализа Selection Data, эта информация может быть использована алгоритмами качества для понижения ее рейтинга в органической выдаче.

Рекламная система (Ad Serving)

  • Механизм 2 (Гео-таргетинг): Применяется в момент выбора рекламы (Matching Processor). Система использует вычисленные географические ассоциации статьи и доступных объявлений (Geographical Processor) для оптимального таргетинга.

Входные данные:

  • Пути навигации пользователей (URL, запросы, клики).
  • Данные о взаимодействии (Selection Data / CTR) с рекламой.
  • IP-адреса пользователей.

Выходные данные:

  • Новые ключевые слова (Механизм 1).
  • Выбранное рекламное объявление с учетом географии (Механизм 2).
  • Оценка вероятности того, что статья является манипулятивной (Механизм 3).

На что влияет

  • Конкретные типы контента: Наибольшее влияние оказывается на сайты, монетизируемые с помощью контекстной рекламы (информационные сайты, блоги, обзорные ресурсы). Особенно сильно влияет на MFA-сайты и контент с низкой добавленной стоимостью.
  • Конкретные ниши или тематики: Ниши, где распространено создание низкокачественного контента под дорогие ключевые слова (например, финансы, здоровье, обзоры продуктов).

Когда применяется

  • Механизм 1: Активируется, когда Selection Data (CTR) для рекламы превышает определенный порог значимости (Threshold).
  • Механизм 2: Применяется при каждом запросе на показ контекстной рекламы.
  • Механизм 3: Анализ происходит постоянно. Идентификация manipulated article происходит, когда CTR рекламы превышает порог, указывающий на аномально высокое взаимодействие (попытки покинуть страницу).

Пошаговый алгоритм

Патент описывает три независимых процесса.

Процесс А: Генерация ключевых слов на основе пути навигации

  1. Определение статьи и взаимодействия: Система идентифицирует статью и определяет Selection Data (CTR) для рекламных элементов на ней.
  2. Проверка порога значимости: Система проверяет, превышают ли Selection Data установленный порог.
    • Если НЕТ: Процесс останавливается.
    • Если ДА: Переход к шагу 3.
  3. Определение пути: Path Processor определяет путь навигации пользователя к этой статье (последовательность страниц, запросов, кликов).
  4. Извлечение терминов: Term Processor анализирует путь и извлекает ассоциированные термины (поисковые запросы, текст ссылок/рекламы).
  5. Установление ключевого слова: Извлеченные термины ассоциируются с рекламируемым продуктом/услугой и устанавливаются как новые ключевые слова.

Процесс Б: Географический таргетинг на основе поведения

  1. Определение статьи: Идентифицируется статья, запросившая рекламу.
  2. Определение географии статьи: Geographical Processor определяет географическую ассоциацию статьи на основе Selection Data (например, IP-адресов пользователей, посещающих статью).
  3. Определение кандидатов и их географии: Matching Processor определяет потенциальные объявления. Для них определяется географическая ассоциация на основе Selection Data (IP-адресов пользователей, кликающих на объявление).
  4. Выбор объявления: Система выбирает объявление для показа, основываясь на совпадении географической ассоциации статьи и объявления.

Процесс В: Обнаружение манипулятивных статей (MFA)

  1. Определение статьи: Идентифицируется статья с рекламой.
  2. Анализ взаимодействия: Определяются Selection Data (в частности, CTR) для рекламы на этой статье.
  3. Оценка вероятности манипуляции: Система определяет вероятность того, что статья является manipulated article. Высокий CTR интерпретируется как признак низкого информационного содержания (пользователи кликают на рекламу, чтобы уйти).
  4. Применение результатов: Информация о манипулятивной статье может быть использована для понижения ее рейтинга в поиске.

Какие данные и как использует

Данные на входе

Патент сосредоточен на использовании поведенческих данных.

  • Поведенческие факторы:
    • Path Navigation Information: История просмотра страниц, последовательность кликов, введенные поисковые запросы.
    • Selection Data / Click-through Data: Данные о кликах по рекламным объявлениям и ссылкам (CTR).
  • Географические факторы:
    • IP-адреса пользователей, взаимодействующих со статьями и рекламой. Используются для определения Geographical Location.
  • Контентные факторы:
    • Текст и ключевые слова, извлекаемые из пути навигации (текст ссылок, текст рекламы, поисковые запросы).

Какие метрики используются и как они считаются

  • Selection Data (CTR): Основная метрика. Отношение количества кликов на элемент (рекламу) к количеству показов.
  • Порог значимости (Threshold) для Механизма 1: Минимальный уровень CTR, при котором система активирует анализ пути навигации для генерации ключевых слов.
  • Порог для обнаружения MFA (Механизм 3): Уровень CTR, выше которого статья с высокой вероятностью классифицируется как manipulated article.
  • Geographical Association (Географическая ассоциация): Метрика, связывающая статью или рекламу с регионом на основе анализа географии IP-адресов пользователей, проявивших к ним интерес (Механизм 2).
  • Likelihood of Manipulated Article (Вероятность манипулятивной статьи): Оценка, вычисляемая на основе Selection Data.

Выводы

  1. Аномальный CTR рекламы — сигнал низкого качества (MFA): Критически важный вывод для SEO. Патент явно описывает механизм, где высокий CTR контекстной рекламы интерпретируется как негативный сигнал. Логика в том, что пользователи покидают низкокачественные (MFA) страницы через рекламу в поисках лучшего контента, тогда как на качественных страницах они удовлетворены контентом и реже кликают на рекламу.
  2. Контекст определяется путем пользователя: Google анализирует не только содержание целевой страницы, но и весь путь навигации пользователя (включая предыдущие запросы и клики), чтобы понять контекст и интент.
  3. Поведенческие данные как основа для семантических связей: Система использует данные о совместном возникновении терминов в рамках одной сессии (пути) для установления семантических связей между ними (Механизм 1).
  4. География определяется поведением: Географическая релевантность статьи или рекламы определяется на основе того, пользователи из каких регионов проявляют к ним интерес (анализ IP и Selection Data), а не только на основе контента (Механизм 2).
  5. Интеграция AdTech и оценки качества: Патент демонстрирует, как данные, собранные для оптимизации рекламы, могут быть использованы для оценки качества контента в органическом поиске.

Практика

Best practices (это мы делаем)

  • Фокус на удовлетворении интента пользователя (User Satisfaction): Создавайте контент, который полностью отвечает на запрос пользователя и предоставляет высокую ценность. Это естественным образом снижает вероятность того, что пользователь немедленно покинет страницу через рекламный блок, что защищает сайт от классификации как manipulated article (Механизм 3).
  • Оптимизация пользовательского опыта (UX) и размещения рекламы: Рекламные блоки должны быть интегрированы аккуратно и не мешать потреблению основного контента. Агрессивное размещение рекламы может искусственно повысить CTR и сигнализировать о низком качестве страницы.
  • Построение тематического авторитета (Topical Authority): Поскольку система анализирует пути навигации (Механизм 1) для установления семантических связей, важно выстраивать четкую структуру сайта и внутреннюю перелинковку, которая поддерживает логичные пути перемещения пользователя внутри темы.
  • Локальная оптимизация (для релевантных бизнесов): Усиливайте локальные сигналы. Патент подтверждает (Механизм 2), что Google ассоциирует сайты с регионами на основе поведения пользователей. Привлечение целевого локального трафика укрепит эту географическую ассоциацию.

Worst practices (это делать не надо)

  • Создание MFA-сайтов (Made for Advertising): Создание сайтов с низкокачественным или автоматически сгенерированным контентом, оптимизированным под дорогие ключевые слова с целью максимизации дохода от рекламы. Патент напрямую описывает Механизм 3 для борьбы с такими сайтами через анализ Selection Data.
  • Агрессивная реклама и темные паттерны (Dark Patterns): Использование макетов, которые провоцируют случайные клики по рекламе или вынуждают пользователей кликать на рекламу для продолжения навигации. Это приводит к аномально высокому CTR, что является триггером для идентификации manipulated article.
  • Использование кликбейта: Привлечение нерелевантного трафика, который быстро покидает сайт (в том числе через рекламу), негативно влияет на поведенческие метрики и может быть интерпретировано как низкое качество контента.

Стратегическое значение

Этот патент подтверждает, что Google использует поведенческие сигналы не только для оптимизации рекламных продуктов, но и как важный компонент для оценки качества контента в органическом поиске. Он предоставляет конкретный механизм, как данные о взаимодействии с рекламой (Ad CTR) могут быть использованы для выявления низкокачественных, манипулятивных сайтов (MFA). Это подчеркивает важность стратегии, ориентированной на удовлетворение пользователя, а не на максимизацию кликов по рекламе любой ценой.

Практические примеры

Сценарий 1: Обнаружение MFA-сайта (Механизм 3)

  1. Сайт: Блог о финансах, наполненный поверхностными статьями, сгенерированными ИИ, об оформлении кредитных карт.
  2. Макет: Агрессивное размещение рекламных блоков, затрудняющее чтение.
  3. Поведение пользователя: Пользователи приходят из поиска, быстро понимают, что контент бесполезен, и кликают на контекстную рекламу банков, чтобы найти реальные предложения.
  4. Анализ Google: Document Engine фиксирует аномально высокий CTR рекламы (например, 25%).
  5. Результат: Система классифицирует страницы как manipulated articles. Сайт теряет позиции в органической выдаче.

Сценарий 2: Генерация ключевых слов (Механизм 1)

  1. Путь пользователя: Пользователь ищет в Google "как избавиться от сырости в подвале". Переходит на форум. С форума переходит на статью о методах гидроизоляции.
  2. Целевая страница и реклама: На статье пользователь видит рекламу "Осушители воздуха для дома" и кликает на нее (CTR выше порога).
  3. Анализ Google: Система анализирует путь и извлекает термин "избавиться от сырости в подвале" (исходный запрос).
  4. Результат: Система ассоциирует этот термин с продуктом "Осушители воздуха" и предлагает его рекламодателям в качестве нового ключевого слова.

Вопросы и ответы

Означает ли этот патент, что высокий CTR рекламы на моем сайте приведет к его пессимизации?

Да, это весьма вероятно, согласно Механизму 3 данного патента. Система интерпретирует аномально высокий CTR контекстной рекламы как признак того, что страница имеет низкую информационную ценность (manipulated article или MFA). Логика в том, что пользователи кликают по рекламе, чтобы покинуть страницу, которая не удовлетворила их интент.

Как Google определяет, какой CTR считать "аномально высоким"?

Патент не указывает конкретных цифр, но упоминает сравнение с пороговым значением (threshold click-through rate). На практике это значение, вероятно, определяется динамически и зависит от тематики сайта, типа контента, макета страницы и среднего уровня CTR для похожих сайтов и рекламных форматов.

Что такое "Manipulated Article" в контексте этого патента?

Это веб-страница, созданная с целью манипулирования поисковой выдачей или исключительно для генерации дохода от рекламы, при этом не предоставляющая реальной ценности пользователю. В современном SEO это эквивалентно терминам MFA (Made for Advertising) или низкокачественный/спамный контент.

Какое отношение генерация рекламных ключевых слов (Механизм 1) имеет к органическому SEO?

Косвенное, но важное. Этот механизм показывает, что Google анализирует весь путь пользователя (Path Navigation Information), чтобы понять контекст и установить семантические связи между запросами и темами. Это подчеркивает важность понимания того, как пользователи приходят на ваш сайт и как они перемещаются по нему, для построения тематического авторитета.

Как работает механизм гео-таргетинга (Механизм 2) и влияет ли он на локальное SEO?

Механизм определяет географическую привязку сайта и рекламы на основе IP-адресов пользователей, которые с ними взаимодействуют. Это подтверждает, что для локального SEO важно не только наличие локальных ключевых слов на сайте, но и привлечение реального трафика из целевого региона, что усиливает географическую ассоциацию в системах Google.

Мой сайт не использует контекстную рекламу. Актуален ли этот патент для меня?

Механизмы 1 и 3 (генерация ключевых слов и обнаружение MFA) в описанном виде зависят от наличия рекламы и анализа ее CTR. Однако общие принципы — анализ пути навигации для понимания контекста и использование поведенческих сигналов для оценки качества — универсальны и могут применяться Google и без наличия рекламы (например, анализ кликов по исходящим ссылкам).

Стоит ли убирать рекламу с сайта, чтобы избежать рисков, связанных с Механизмом 3?

Дело не в наличии рекламы, а в качестве контента и способе интеграции рекламы. Если сайт предоставляет высокую ценность, а реклама не мешает пользователю, CTR будет в пределах нормы. Убирать рекламу не обязательно, но необходимо избегать стратегий MFA и агрессивного размещения блоков.

Что такое "Selection Data"?

Это общий термин для данных о взаимодействии пользователя с элементами на странице. Самый частый пример — Click-through Data (данные о кликах и CTR). Также может включать данные о конверсиях или других действиях после клика.

Патент подан в 2004 году. Насколько он актуален сейчас?

Несмотря на возраст, базовые принципы остаются актуальными. Анализ поведения пользователей для улучшения таргетинга и оценки качества — это фундаментальные задачи. Хотя техническая реализация, вероятно, усложнилась, логика обнаружения MFA через поведенческие аномалии по-прежнему используется Google.

Как защитить свой контентный проект от классификации как "Manipulated Article"?

Сосредоточьтесь на создании глубокого, экспертного контента (E-E-A-T), который полностью удовлетворяет интент пользователя. Обеспечьте отличный пользовательский опыт (UX) и интегрируйте рекламу так, чтобы она не доминировала над основным контентом и не провоцировала случайные клики.

Похожие патенты

Как Google классифицирует веб-страницы и персонализирует выдачу, используя историю запросов и поведенческие данные
Google использует итеративный метод для тематической классификации веб-страниц, не анализируя их контент напрямую. Система анализирует исторические логи запросов и данные о кликах. Классификация известных страниц переносится на запросы, в результатах которых они появляются, а затем классификация этих запросов переносится на новые страницы. Эти данные используются для построения профилей пользователей и персонализации поисковой выдачи.
  • US8185544B2
  • 2012-05-22
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google использует историю кликов для персонализации локальной выдачи и показа ранее посещенных страниц
Google создает «Профиль локального поиска», отслеживая, какие сайты пользователь посещал при поиске информации о конкретных местах. Когда пользователь снова ищет это место (или соседнее), Google показывает эти ранее посещенные сайты на видном месте в выдаче, даже если они не релевантны новому запросу, чтобы облегчить навигацию и помочь завершить задачу.
  • US8838621B1
  • 2014-09-16
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Популярные патенты

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)
Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.
  • US8065316B1
  • 2011-11-22
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов
Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.
  • US8005716B1
  • 2011-08-23
  • Поведенческие сигналы

  • Семантика и интент

  • Антиспам

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

seohardcore