SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске

REMOVING SUBSTITUTION RULES BASED ON USER INTERACTIONS (Удаление правил подстановки на основе взаимодействий пользователя)
  • US8965875B1
  • Google LLC
  • 2012-04-10
  • 2015-02-24
  • Поведенческие сигналы
  • Семантика и интент
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.

Описание

Какую проблему решает

Патент решает проблему деградации качества поиска, вызванную использованием некорректных или нерелевантных Substitution Rules (правил подстановки, например, синонимов) при автоматическом переписывании или расширении запросов. Если система подставляет термины, которые не соответствуют интенту пользователя, это ухудшает выдачу. Изобретение предлагает автоматизированный механизм обратной связи для валидации и удаления таких неэффективных правил на основе реальных данных о поведении пользователей.

Что запатентовано

Запатентована система автоматической оценки и управления правилами подстановки (Substitution Rules). Система анализирует агрегированные данные о взаимодействии пользователей (клики и пропуски) с результатами поиска, полученными по переписанным запросам (Revised Search Queries). Для каждого правила рассчитывается метрика качества (Quality Metric). Если метрика не удовлетворяет пороговому значению, правило автоматически удаляется из использования.

Как это работает

Система работает в два этапа:

  • Онлайн (Сбор данных): Query Reviser Engine применяет существующее правило подстановки (например, A->B) для переписывания запроса. Пользователю показываются результаты, а его взаимодействия (клики и пропуски) записываются в Query Logs.
  • Офлайн (Оценка и Действие): Substitution Engine агрегирует данные логов для этого правила. Система анализирует, выбирали ли пользователи результаты, содержащие подставленный термин (B), или пропускали их, уделяя особое внимание "чистым" сигналам (Crucial Clicks/Skips). На основе этого рассчитывается Quality Metric (по сути, частота неудач). Если метрика указывает на низкую эффективность, правило удаляется. Оценка также учитывает контекст запроса.

Актуальность для SEO

Высокая. Понимание запросов (Query Understanding) и корректная обработка синонимов являются центральными задачами современного поиска. Использование машинного обучения и поведенческих данных для валидации лингвистических моделей (NLP) — стандартная практика Google. Этот механизм обеспечивает самокоррекцию и поддержание релевантности системы синонимов.

Важность для SEO

Патент имеет значительное влияние на SEO (7.5/10). Он демонстрирует, как Google валидирует свое понимание языка и контекста через поведение пользователей. Поведенческие факторы напрямую влияют на слой Понимания Запросов. Для SEO это означает, что использование предполагаемых синонимов в контенте не гарантирует релевантности; только контент, который удовлетворяет интент пользователя и привлекает клики (подтверждая гипотезу Google о синонимичности), будет эффективным в долгосрочной перспективе.

Детальный разбор

Термины и определения

Substitution Rule (Правило подстановки)
Правило (например, A->B), указывающее, что термин B (Substitute Query Term) может быть использован для ревизии запросов, содержащих термин A (Original Query Term). Может зависеть от контекста.
Revised Query (Пересмотренный/Переписанный запрос)
Запрос, модифицированный системой с использованием правил подстановки.
Query Log Data (Данные журнала запросов)
Записи о пользовательских сессиях, включающие запросы, показанные результаты и взаимодействия пользователя (клики, пропуски).
Quality Metric (Метрика качества)
Оценка эффективности правила подстановки. Рассчитывается на основе взвешенного соотношения кликов и пропусков. В данном патенте высокая метрика указывает на низкое качество (высокую частоту неудач).
Context (Контекст)
Условия применения правила. Может быть общим (General Context) или специфическим (Specific Context), например, требующим наличия других слов в запросе.
Click (Клик)
Выбор пользователем результата, ресурс которого (i) содержит подставленный термин (B) и (ii) НЕ содержит исходный термин (A).
Skip (Пропуск)
Ситуация, когда пользователь пропускает результат (удовлетворяющий критериям Click) и выбирает результат, ранжируемый ниже.
Both Click / Both Skip (Двойной клик/пропуск)
Клик или пропуск результата, ресурс которого содержит как A, так и B. Имеет меньший вес из-за неоднозначности.
Crucial Click (Критический клик)
Сильный положительный сигнал. Клик по результату, ресурс которого (i) содержит B, (ii) НЕ содержит A и (iii) НЕ содержит никаких других подставленных терминов. Изолирует влияние правила A->B.
Crucial Skip (Критический пропуск)
Сильный отрицательный сигнал. Пропуск результата, удовлетворяющего критериям Crucial Click, при клике на нижестоящий результат.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод удаления правил подстановки.

  1. Идентификация набора пересмотренных запросов (Revised Search Queries), сгенерированных с использованием определенного правила подстановки.
  2. Доступ к Query Log Data для этих запросов, идентифицируя (i) показанные результаты и (ii) выбранный пользователем результат.
  3. Определение Quality Metric для правила на основе этих данных.
  4. Определение того, что Quality Metric не удовлетворяет пороговому значению (Threshold).
  5. В ответ на это — удаление правила подстановки.

Claim 4 (Зависимый от 1): Уточняет важность контекста.

Процесс включает идентификацию контекста (Context), связанного с правилом. Контекст определяет другие термины, которые должны присутствовать в запросе для применения правила. Оценка и удаление происходят в рамках этого контекста.

Claim 7 (Зависимый от 1): Определяет формулу для Quality Metric и используемые данные.

Метрика основана на взвешенных подсчетах: click count, skip count, both click count, both skip count, crucial click count, crucial skip count. W1-W6 — весовые коэффициенты.

Формула расчета Quality Metric:

Quality Metric=1−(crucial click count⋅W1)+(click count⋅W2)+(both click count⋅W3)(crucial click count⋅W1)+(click count⋅W2)+(crucial skip count⋅W4)+(skip count⋅W5)+(both click count⋅W3)+(both skip count⋅W6)\text{Quality Metric} = 1 - \frac{(\text{crucial click count} \cdot W1) + (\text{click count} \cdot W2) + (\text{both click count} \cdot W3)}{(\text{crucial click count} \cdot W1) + (\text{click count} \cdot W2) + (\text{crucial skip count} \cdot W4) + (\text{skip count} \cdot W5) + (\text{both click count} \cdot W3) + (\text{both skip count} \cdot W6)}

Формула представляет собой: 1 - (Взвешенные Клики / (Взвешенные Клики + Взвешенные Пропуски)). Это означает, что Quality Metric измеряет частоту неудач (Failure Rate) правила. Высокое значение метрики указывает на плохое качество.

Где и как применяется

Изобретение является механизмом контроля качества и обратной связи для системы понимания запросов.

INDEXING – Индексирование
На этом этапе система анализирует контент документов. Эти данные необходимы для последующей классификации взаимодействий (чтобы определить, содержал ли результат исходный термин, подставленный термин или оба).

QUNDERSTANDING – Понимание Запросов
Основной этап применения.

  • Онлайн: Query Reviser Engine использует активные Substitution Rules для переписывания запроса пользователя в реальном времени.
  • Офлайн: Substitution Engine выполняет процесс, описанный в патенте, — анализирует эффективность правил на основе логов и обновляет базу данных правил. Это петля обратной связи, улучшающая качество Query Understanding.

RANKING / RERANKING
Взаимодействия пользователя с SERP, сформированной на этих этапах, собираются в Query Logs. Эти поведенческие сигналы служат входными данными для Substitution Engine.

Входные данные:

  • Агрегированные Query Log Data (переписанные запросы, показанные результаты, клики, пропуски).
  • Данные о содержании документов (из индекса).
  • Текущий набор Substitution Rules и их контексты.

Выходные данные:

  • Обновленный набор Substitution Rules (удаление неэффективных правил или изменение их контекста).

На что влияет

  • Семантическое понимание: Напрямую влияет на то, какие слова Google считает взаимозаменяемыми (синонимами) в различных контекстах.
  • Специфические запросы: Особенно важно для неоднозначных запросов или запросов, где лингвистические синонимы не соответствуют поисковому интенту. Система может определить, что замена уместна в одном контексте, но неуместна в другом.

Когда применяется

  • Оценка правил: Происходит офлайн или в фоновом режиме периодически, анализируя агрегированные данные за определенный период.
  • Условия активации: Требуется накопление достаточного объема статистических данных (Query Log Data) для оценки конкретного правила.
  • Триггер удаления: Когда рассчитанная Quality Metric не удовлетворяет заданному порогу (например, превышает порог неудач в 40%).

Пошаговый алгоритм

Офлайн-процесс оценки правила подстановки (A -> B)

  1. Инициализация и Выборка: Идентифицировать набор пересмотренных запросов, сгенерированных с использованием правила A -> B.
  2. Идентификация Контекста: Определить контекст для анализа (общий или специфический).
  3. Доступ к данным: Извлечь Query Log Data для этих запросов в данном контексте (показанные результаты и действия пользователя).
  4. Классификация Взаимодействий: Для каждой сессии проанализировать контент выбранных и пропущенных ресурсов для классификации взаимодействия:
    • Crucial Click/Skip (Есть только B, нет A и других замен).
    • Click/Skip (Есть B, нет A).
    • Both Click/Skip (Есть A и B).
  5. Агрегация и Взвешивание: Подсчитать общее количество взаимодействий каждого типа и применить весовые коэффициенты (W1-W6).
  6. Расчет Метрики: Вычислить Quality Metric (Failure Rate) по формуле.
  7. Сравнение с Порогом: Сравнить Quality Metric с пороговым значением (Threshold).
  8. Принятие Решения:
    • Если метрика НЕ удовлетворяет порогу (качество плохое): Удалить правило A -> B в данном контексте.
    • Если метрика удовлетворяет порогу (качество хорошее): Сохранить или добавить правило A -> B в данном контексте.
  9. Итерация: Повторить процесс для следующего контекста правила A -> B.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые): Агрегированные данные из Query Logs о кликах (Clicks) и пропусках (Skips) результатов поиска. Ранжирование результатов в момент показа.
  • Контентные факторы (Для анализа): Содержимое ресурсов или сниппетов, связанных с результатами в логах. Используется для определения наличия исходного термина (A) и подставленного термина (B) для классификации типа взаимодействия.
  • Структурные факторы (Контекст): Данные о других терминах в запросе и их расположении используются для определения контекста (Context) применения правила.

Какие метрики используются и как они считаются

Система использует следующие метрики:

  • Счетчики взаимодействий: crucial_click_count, click_count, both_click_count, crucial_skip_count, skip_count, both_skip_count.
  • Весовые коэффициенты (W1-W6): Присваиваются каждому типу счетчика. Веса определяются эмпирически. В патенте приведен пример: 5 для Crucial, 1 для Normal, 0 для Both. Это подчеркивает важность чистых сигналов.
  • Quality Metric: Итоговая оценка правила. Рассчитывается по формуле (см. Claim 7), отражая частоту неудач правила.
  • Threshold (Порог): Значение, с которым сравнивается Quality Metric. Пример в патенте: 40%. Если Quality Metric (частота неудач) превышает порог, правило удаляется.

Выводы

  1. Пользовательское поведение как валидатор семантики: Google активно использует агрегированные поведенческие данные (клики и пропуски) для подтверждения или опровержения того, являются ли два термина взаимозаменяемыми (синонимами). Лингвистические модели и NLP проверяются реальными взаимодействиями.
  2. Фокус на чистых сигналах (Crucial Clicks/Skips): Наибольший вес придается взаимодействиям, где результат содержит только подставленный термин и не содержит исходный. Это позволяет изолировать влияние именно правила подстановки. Неоднозначные сигналы (Both Clicks/Skips) имеют меньший вес.
  3. Критичность контекста: Система оценивает правила независимо для разных контекстов. Синоним может быть эффективным в одном контексте и вредным в другом. Система может удалить общее правило, но сохранить его для специфического контекста.
  4. Самокоррекция системы понимания запросов: Патент описывает механизм обратной связи, который позволяет Google автоматически очищать свою базу синонимов от ошибок и нерелевантных связей, поддерживая высокое качество Query Understanding.
  5. Интент превыше лингвистики: Если пользователи систематически игнорируют результаты с подставленным термином, это является сильным сигналом, что термин не соответствует интенту запроса, даже если он кажется лингвистически близким.

Практика

Best practices (это мы делаем)

  • Фокус на Интенте и Вовлеченности: Обеспечивайте максимальное удовлетворение интента пользователя. Положительные поведенческие сигналы (высокий CTR, низкий показатель пропусков) подтверждают релевантность вашего контента как для исходного запроса, так и для синонимов, которые Google может использовать.
  • Использование контекстуально релевантных синонимов: Применяйте синонимы и связанные термины, которые естественно вписываются в контент и ожидаемы пользователями в данном контексте. Избегайте использования неоднозначных терминов, которые могут запутать пользователя и привести к пропускам (Skips).
  • Оптимизация Сниппетов для ясности: Title и Description должны точно отражать содержание страницы. Если ваш контент ранжируется за счет подставленного термина, сниппет должен четко сигнализировать о релевантности контента интенту запроса, чтобы стимулировать Clicks.
  • Анализ семантического поля в нише: Изучайте SERP, чтобы понять, какие термины Google считает взаимозаменяемыми в вашей тематике. Создание контента, охватывающего эти валидированные термины, повышает общую релевантность.

Worst practices (это делать не надо)

  • Искусственное внедрение синонимов (Synonym Stuffing): Попытки перечислить все возможные синонимы без учета контекста и естественности. Если эти термины нерелевантны интенту, пользователи будут пропускать такие результаты, что может привести к удалению соответствующих правил подстановки Google и ухудшению поведенческих метрик страницы.
  • Использование лингвистических синонимов без учета поискового контекста: Использование слов, которые являются синонимами по словарю, но не используются взаимозаменяемо в вашей нише. Это приведет к генерации Skips и Crucial Skips.
  • Игнорирование поведенческих метрик: Фокусировка только на позициях без анализа CTR и вовлеченности. Низкая вовлеченность сигнализирует Google о семантическом несоответствии.

Стратегическое значение

Патент подтверждает, что семантическое понимание Google — это динамическая система, которая постоянно обучается и корректируется на основе поведения пользователей. Это демонстрирует тесную связь между этапами RERANKING (где собираются поведенческие сигналы) и QUNDERSTANDING. Для долгосрочной SEO-стратегии это означает, что невозможно полагаться только на лингвистическую близость; необходимо ориентироваться на реальное поведение, язык и ожидания пользователей в нише.

Практические примеры

Сценарий: Валидация синонима в E-commerce с учетом контекста

  1. Задача: Оптимизация категории товаров (Спорт vs Мода).
  2. Действие Google: Google тестирует правило подстановки "Кроссовки -> Сникеры".
  3. Контекст 1 (Общий запрос): "Купить кроссовки". Google переписывает запрос, добавляя "сникеры". Пользователи кликают и на то, и на другое. Quality Metric в норме.
  4. Контекст 2 (Специфический запрос): "Купить беговые кроссовки". Google переписывает запрос.
  5. Взаимодействие: В выдаче появляются результаты про модные "сникеры". Пользователи, ищущие спортивную обувь, пропускают эти результаты (Crucial Skip) и кликают ниже на результаты о "беговых кроссовках".
  6. Результат по патенту: Google фиксирует много Crucial Skips. Quality Metric для правила "Кроссовки -> Сникеры" в контексте "беговые" не удовлетворяет порогу.
  7. Вывод Google: Правило удаляется для этого контекста. "Сникеры" не считаются синонимом "Кроссовки", когда речь идет о беге.
  8. Вывод для SEO: Необходимо четко разделять категории и использовать терминологию, строго соответствующую контексту, чтобы соответствовать валидированным правилам подстановки Google.

Вопросы и ответы

Что такое "Substitution Rule" (Правило подстановки) в контексте этого патента?

Это инструкция для поисковой системы, указывающая, что один термин является синонимом или релевантной заменой для другого (например, "автомобиль" -> "машина"). Система использует эти правила для расширения или переписывания исходного запроса пользователя с целью улучшения результатов поиска. Этот патент описывает, как Google проверяет качество этих правил.

Что такое "Crucial Click" (Критический клик) и почему он так важен?

Crucial Click происходит, когда пользователь кликает на результат, который содержит ТОЛЬКО подставленный термин (синоним), и НЕ содержит исходный термин (и никакие другие синонимы). Это самый чистый и сильный сигнал, подтверждающий, что именно этот синоним был полезен и релевантен пользователю. В формуле расчета качества этим кликам придается наибольший вес.

Что такое "Crucial Skip" (Критический пропуск)?

Это сильный отрицательный сигнал. Он происходит, когда пользователь пропускает результат, удовлетворяющий критериям Crucial Click (содержит только синоним), и кликает на результат ниже. Это говорит Google, что данный синоним нерелевантен для пользователя в этом контексте, и правило подстановки, вероятно, следует удалить.

Почему взаимодействия типа "Both Click/Skip" менее важны?

Both Click/Skip происходит, когда результат содержит и исходный термин, и термин-заменитель. В этом случае невозможно точно определить, какой именно термин привел к клику или пропуску. Из-за этой неоднозначности патент предлагает присваивать таким взаимодействиям меньший вес (вплоть до нуля), чтобы не искажать оценку качества правила подстановки.

Как система учитывает контекст при оценке правил?

Система анализирует правила гранулярно. Quality Metric рассчитывается отдельно для каждого контекста (например, когда в запросе присутствуют другие определенные слова). Это позволяет сохранить правило для контекста, где оно полезно (много кликов), но удалить его для общего использования или других контекстов, где оно снижает качество выдачи (много пропусков).

Как рассчитывается Quality Metric и что означает её высокое значение?

Она рассчитывается по формуле: 1 минус (Взвешенные Клики / (Взвешенные Клики + Взвешенные Пропуски)). Эта формула измеряет частоту неудач (Failure Rate). Высокое значение Quality Metric (близкое к 1) означает ПЛОХОЕ качество правила (много пропусков). Если эта частота неудач превышает определенный порог (например, 40%), правило удаляется.

Означает ли этот патент, что CTR является фактором ранжирования?

Патент не описывает использование CTR для прямого ранжирования документов. Однако он четко показывает, что агрегированные поведенческие данные (клики и пропуски) используются для обучения и валидации систем понимания запросов (Query Understanding). Это косвенно влияет на ранжирование, определяя, какие синонимы будут использоваться при поиске.

Как SEO-специалисту использовать знания из этого патента на практике?

Необходимо сосредоточиться на удовлетворении интента и оптимизации вовлеченности. Используйте естественный язык и контекстуально уместные синонимы. Убедитесь, что пользователи активно взаимодействуют с вашим контентом (высокий CTR, низкий Bounce Rate), так как это помогает Google валидировать семантические связи между запросами и вашим контентом.

Происходит ли оценка правил в реальном времени?

Нет. Применение правил происходит в реальном времени при обработке запроса. Однако оценка эффективности правил (расчет Quality Metric) и их удаление — это офлайн-процесс, который анализирует агрегированные исторические данные (Query Log Data) в пакетном режиме.

Может ли мой сайт перестать ранжироваться по синонимам, если Google удалит правило подстановки?

Да. Если ваш контент оптимизирован под синоним (Термин B), а пользователи ищут Термин A, и Google ранее связывал их через правило A->B. Если это правило будет удалено из-за низкой эффективности, ваш контент может перестать считаться релевантным запросу A (если связь не установлена другими механизмами, например, векторными моделями).

Похожие патенты

Как Google автоматически оценивает и удаляет неэффективные синонимы и правила расширения запросов
Google использует механизм для оценки эффективности правил подстановки (синонимов). Если подставленный термин редко встречается в топовых результатах поиска или если пользователи не кликают на результаты, содержащие этот термин, система автоматически удаляет или понижает уверенность в этом правиле. Это позволяет поддерживать качество и точность понимания запросов.
  • US8600973B1
  • 2013-12-03
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует «Решающие Клики» и «Решающие Пропуски» для валидации и очистки правил синонимов
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
  • US8965882B1
  • 2015-02-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска
Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.
  • US20140358904A1
  • 2014-12-04
  • Семантика и интент

  • SERP

Как Google использует клики и пропуски (Clicks/Skips) для определения важности порядка слов в запросе
Google анализирует поведение пользователей для оценки правил, которые меняют порядок слов в запросе (Reordering Rules). Если пользователи кликают на результаты с измененным порядком слов, правило считается полезным (Click Count). Если пропускают такие результаты ради нижестоящих (Skip Count), правило отключается. Это позволяет системе автоматически понять, когда порядок слов критичен для смысла запроса, а когда им можно пренебречь.
  • US8959103B1
  • 2015-02-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
  • US8121991B1
  • 2012-02-21
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google идентифицирует экспертов на основе их активности и позволяет фильтровать выдачу по их контенту
Google использует систему для идентификации людей (членов социальной сети), тесно связанных с темой запроса, на основе их активности (посты, взаимодействия, репосты) и квалификации. Система отображает этих людей в специальных блоках (Display Areas) рядом с результатами поиска, позволяя пользователям просматривать их профили или фильтровать выдачу, чтобы увидеть только контент, созданный, одобренный или прокомментированный этими экспертами.
  • US9244985B1
  • 2016-01-26
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

seohardcore