SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR

ENHANCING SITELINKS WITH CREATIVE CONTENT (Улучшение сайтлинков с помощью креативного контента)
  • US10650066B2
  • Google LLC
  • 2013-03-15
  • 2020-05-12
  • Ссылки
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).

Описание

Какую проблему решает

Патент решает проблему недостаточной информативности стандартных сайтлинков (Sitelinks) в рекламных объявлениях. Текст сайтлинка часто слишком короткий и не дает пользователю достаточно контекста, чтобы мотивировать клик, что снижает потенциальный CTR. Кроме того, ручное создание и управление уникальными описаниями для большого количества сайтлинков является трудоемкой задачей для рекламодателей и может приводить к проблемам консистентности.

Что запатентовано

Запатентована система и метод для автоматического улучшения (enhancing) сайтлинков путем добавления к ним релевантного текста из существующих рекламных креативов (creatives) того же рекламодателя. Система автоматически идентифицирует креативы, которые ведут на ту же целевую страницу, что и сайтлинк, путем каноникализации URL. Затем она выбирает наиболее подходящий текст для показа вместе с сайтлинком, повышая его информативность без дополнительной ручной работы.

Как это работает

Ключевым механизмом является канонизация URL и последующее сопоставление в рамках системы управления рекламой (Advertisement Management System):

  • Канонизация URL: Система обрабатывает URL креативов и сайтлинков. Происходит канонизация (Canonicalization) – процесс определения конечного целевого URL путем удаления незначащих параметров (например, трекинговых меток).
  • Кластеризация Креативов: Креативы группируются в кластеры (Creative Clusters) на основе их канонического URL. Эта работа выполняется заранее (офлайн).
  • Сопоставление: Когда сайтлинк выбран для показа, его канонический URL сравнивается с кластерами креативов. Если найдено соответствие, креативы из этого кластера становятся кандидатами.
  • Скоринг и Выбор: Система выбирает лучший креатив из кластера, используя фильтры (язык, география) и скоринг. Скоринг учитывает эффективность креатива (Impression Score) и его текстовую релевантность самому сайтлинку (IDF Score). Для нескольких сайтлинков используется оптимальное сопоставление.

Актуальность для SEO

Высокая (для контекстной рекламы). Описанный механизм лежит в основе функции «Динамические дополнительные ссылки» (Dynamic Sitelinks) в Google Ads. Автоматическое улучшение объявлений с целью повышения CTR является постоянным приоритетом для рекламных систем Google. Патент описывает конкретную реализацию этой стратегии.

Важность для SEO

Влияние на органическое SEO низкое (3/10). Патент напрямую относится к системе управления рекламой (Google Ads/PPC), а не к органическому поиску. Для SEO-специалистов ценность косвенная: патент дает глубокое понимание сложных методов, которые Google использует для каноникализации URL (включая активное сканирование и сравнение контента), и демонстрирует применение NLP (IDF Score) для автоматического подбора релевантных сниппетов.

Детальный разбор

Термины и определения

Advertisement Management System (AMS) (Система управления рекламой)
Платформа (например, Google Ads), которая управляет рекламными кампаниями, хранит креативы и обслуживает показ рекламы.
Bipartite Graph (Двудольный граф)
Структура данных, упомянутая в описании (FIG. 6, FIG. 7) и используемая для решения задачи оптимального сопоставления. Одна доля графа содержит сайтлинки, другая — креативы, а ребра взвешены по оценке соответствия (match-score).
Canonicalization (Канонизация)
Процесс приведения URL к стандартной (канонической) форме путем удаления незначащих параметров, которые не влияют на отображаемый контент целевой страницы.
Creative (Креатив)
В контексте патента – это текстовый элемент существующего рекламного объявления (например, описание), связанный с определенным целевым URL.
Creative Clusters (Кластеры креативов)
Группы креативов, которые имеют один и тот же (или очень похожий) канонический целевой URL.
Enhanced Sitelink (Улучшенный сайтлинк)
Сайтлинк, дополненный текстом релевантного креатива.
IDF Score (Inverse-Document-Frequency Score)
Метрика, используемая для оценки текстовой релевантности между текстом сайтлинка и текстом креатива.
Impression Score (Оценка показов)
Метрика, отражающая количество показов (impressions) креатива. Используется как сигнал эффективности или популярности креатива при выборе.
Sitelink (Сайтлинк, дополнительная ссылка)
Дополнительная ссылка, отображаемая под рекламным объявлением, ведущая на конкретный раздел сайта.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод автоматического сопоставления сайтлинка с креативом в AMS.

  1. Система хранит множество креативов, каждый связан с URL.
  2. Выполняется канонизация URL каждого креатива.
  3. Креативы кластеризуются. Те, у которых очень похожие (substantially similar) канонические URL, объединяются в Creative Clusters.
  4. Система получает сайтлинк с его URL.
  5. Выполняется канонизация URL сайтлинка.
  6. Канонический URL сайтлинка сопоставляется с одним из кластеров для генерации набора кандидатов.
  7. Выбранный креатив из набора кандидатов ассоциируется с сайтлинком на основе фильтров (filter rules) и/или методологии скоринга (scoring methodology).

Claim 4 (Зависимый от 1): Детализирует один из методов канонизации URL сайтлинка.

Канонизация включает сканирование (crawling) URL сайтлинка с параметром и без него, сравнение полученных целевых страниц (landing pages) и удаление параметра из URL, если страницы совпадают. Это ключевой механизм для игнорирования трекинговых меток.

Claim 5 и 7 (Зависимые от 1): Уточняют методы каноникализации.

Каноникализация может включать обработку правил, предоставленных вебмастером (webmaster supplied rules), указывающих на релевантность параметров URL.

Claim 9 (Зависимый от 1): Описывает алгоритм выбора креатива при наличии нескольких сайтлинков.

Используется оптимальный алгоритм, сконфигурированный для максимизации суммарной оценки соответствия (total matching scores) между множеством полученных сайтлинков и множеством доступных (еще не сопоставленных) креативов.

Claim 10 и 11 (Зависимые от 1): Детализируют методологию скоринга.

  • Claim 10: Скоринг включает определение Impression Score (количество показов креатива).
  • Claim 11: Скоринг включает определение IDF score (схожесть терминов между текстом сайтлинка и текстом креатива).

Где и как применяется

Этот патент описывает внутренние процессы платформы Google Ads (Advertisement Management System) и не применяется к архитектуре органического поиска. В контексте обработки рекламы он затрагивает следующие этапы:

INDEXING (Предварительная обработка данных)
Значительная часть работы выполняется офлайн, до момента показа рекламы. Система индексирует креативы, выполняет сложную каноникализацию их URL (включая сканирование и сравнение страниц, как указано в Claim 4) и создает Creative Clusters. Эта информация сохраняется в таблице поиска (cluster lookup table).

RANKING / RERANKING (Выбор и показ рекламы)
Основное применение патента происходит в момент показа объявления. Когда система выбирает основное объявление и определяет доступные сайтлинки, активируется механизм улучшения. Система каноникализирует URL сайтлинков, обращается к предварительно рассчитанным кластерам, применяет фильтры, рассчитывает оценки (IDF Score, Impression Score) и выполняет алгоритм оптимального сопоставления для выбора описаний.

Входные данные:

  • База данных креативов рекламодателя (тексты и URL).
  • Сайтлинки, выбранные для показа (тексты и URL).
  • Статистика показов креативов (для Impression Score).
  • Правила каноникализации (включая webmaster supplied rules).
  • Контент целевых страниц (для валидации каноникализации).

Выходные данные:

  • Улучшенные сайтлинки (Enhanced Sitelinks) – комбинация исходного сайтлинка и текста выбранного креатива.

На что влияет

  • Типы контента: Влияет исключительно на текстовые рекламные объявления (PPC), содержащие расширения типа Sitelink. Не влияет на органические результаты.
  • Ниши и тематики: Наибольшее влияние в конкурентных нишах (E-commerce, финансы, услуги), где рекламодатели активно используют сайтлинки и имеют большое количество креативов.
  • Метрики: Напрямую влияет на CTR (Click-Through Rate) рекламных объявлений.

Когда применяется

  • Условия работы: Алгоритм применяется в момент показа рекламного объявления, когда для него активирован показ сайтлинков.
  • Триггеры активации: Наличие в аккаунте рекламодателя активных креативов, чей канонический URL совпадает с каноническим URL сайтлинка. Если совпадений нет или креативы не проходят фильтры, улучшение не происходит.

Пошаговый алгоритм

Процесс А: Предварительная обработка (Офлайн)

  1. Сбор данных: Извлечение креативов и связанных с ними URL из базы данных AMS.
  2. Канонизация URL креативов: Обработка каждого URL для приведения к канонической форме. Это включает:
    • Применение правил вебмастера.
    • Сканирование URL с параметрами и без них, сравнение контента целевых страниц. Удаление параметров, если контент совпадает.
  3. Кластеризация: Группировка креативов в Creative Clusters на основе общего канонического URL.
  4. Расчет метрик: Расчет или обновление Impression Score для креативов.
  5. Сохранение: Сохранение кластеров в таблице поиска (cluster lookup table).

Процесс Б: Обработка в реальном времени (Онлайн)

  1. Идентификация сайтлинков: Определение набора сайтлинков для показа.
  2. Канонизация URL сайтлинков: Приведение URL сайтлинков к канонической форме.
  3. Поиск кандидатов: Поиск соответствующего кластера креативов в cluster lookup table для URL каждого сайтлинка.
  4. Фильтрация и Прунинг: Удаление креативов, не подходящих по фильтрам (язык, гео, устройство), а также удаление дубликатов или избыточных (redundant) креативов.
  5. Скоринг кандидатов: Расчет оценки соответствия (match-score) для оставшихся креативов. Оценка является функцией от Impression Score и IDF Score.
  6. Оптимальное сопоставление (Matching): Выполнение алгоритма сопоставления (например, с использованием Bipartite Graph) для максимизации суммарного скоринга для всех показанных сайтлинков и предотвращения дублирования креативов.
  7. Формирование выдачи: Выбранные креативы добавляются к сайтлинкам, формируя Enhanced Sitelinks.

Какие данные и как использует

Данные на входе

  • Технические факторы:
    • URL креативов и сайтлинков.
    • URL Parameters.
    • Контент целевых страниц (Landing pages), полученный в результате сканирования для верификации каноникализации.
    • Правила, предоставленные вебмастером (webmaster supplied rules), касающиеся значимости параметров URL.
  • Контентные факторы:
    • Текст креативов.
    • Текст сайтлинков (используется для расчета IDF Score).
  • Поведенческие/Статистические факторы:
    • Данные о показах (Impressions) креативов (используются для расчета Impression Score).
  • Пользовательские и Географические факторы:
    • Язык, местоположение, тип устройства, платформа пользователя (используются как фильтры при выборе креатива).

Какие метрики используются и как они считаются

  • Canonical URL: Вычисляется путем нормализации и активной проверки (сканирования) для удаления незначащих параметров из исходного URL.
  • Impression Score: Метрика, основанная на количестве показов креатива за определенный период (например, неделю).
  • IDF Score: Метрика текстовой схожести. Текст сайтлинка и креатива нормализуется (удаление стоп-слов). IDF Score рассчитывается как взвешенная сумма общих слов.
  • Creative Score / Match-Score: Агрегированная оценка для выбора лучшего креатива. В описании патента упоминается формула расчета: Creative Score=w1×Impression Score+w2×IDF Score\text{Creative Score} = w1 \times \text{Impression Score} + w2 \times \text{IDF Score}Creative Score=w1×Impression Score+w2×IDF Score, где w1 и w2 – весовые коэффициенты.

Выводы

Патент описывает внутренние процессы Google Ads. Он не дает прямых рекомендаций для SEO, но демонстрирует ключевые технологические подходы Google к обработке данных.

  1. Сложная и активная каноникализация URL: Google использует многоуровневый подход к каноникализации. Он не просто удаляет известные параметры, но может активно сканировать URL с параметрами и без них и сравнивать контент целевых страниц (Claim 4) для подтверждения их эквивалентности. Также учитываются правила, предоставленные вебмастерами (Claim 5).
  2. Автоматизация через повторное использование контента: Система стремится повысить CTR путем автоматического переиспользования существующих эффективных данных (креативов) вместо того, чтобы требовать создания нового контента для описания сайтлинков.
  3. Многофакторный выбор релевантного текста: Выбор описания основан не только на совпадении URL. Система комбинирует сигналы эффективности (Impression Score) и семантической релевантности (IDF Score) между текстом ссылки и предлагаемым описанием.
  4. Глобальная оптимизация сопоставления: Для показа нескольких сайтлинков одновременно Google использует сложные алгоритмы (оптимальное сопоставление, Bipartite Graph Matching), чтобы найти глобально оптимальное сочетание, максимизируя общий результат и обеспечивая разнообразие (прунинг дубликатов).

Практика

Best practices (это мы делаем)

Хотя патент относится к Google Ads (PPC), описанные в нем технологии каноникализации и текстового анализа дают важные подтверждения для SEO-стратегий.

  • Активное управление параметрами URL: Необходимо четко управлять всеми параметрами URL (UTM-метки, фасеты, сортировки). Патент подтверждает (Claim 5), что Google учитывает правила, предоставленные вебмастером (webmaster supplied rules). Используйте инструменты (например, в Google Search Console), чтобы сообщить Google о незначащих параметрах.
  • Обеспечение консистентности канонических страниц: Убедитесь, что страницы, доступные по разным URL с параметрами, но имеющие одинаковый контент, не конфликтуют. Патент показывает (Claim 4), что Google может активно сравнивать контент страниц для определения эквивалентности. Любые расхождения (например, разный контент при наличии UTM-меток) могут нарушить каноникализацию.
  • Использование rel="canonical": Обеспечьте наличие корректных тегов rel="canonical" для всех страниц, чтобы помочь системам Google определить основную версию, дополняя автоматические методы, описанные в патенте.
  • Фокус на семантической связи ссылок и контента: Использование IDF Score для сопоставления заголовка ссылки и описания подтверждает важность семантической связи. В SEO это транслируется в необходимость обеспечения релевантности между текстом внутренних ссылок (anchor text) и контентом целевой страницы.

Worst practices (это делать не надо)

  • Использование параметров, меняющих основной контент: Избегайте ситуаций, когда добавление трекингового или аналитического параметра изменяет основной контент страницы. Механизм, описанный в патенте, основан на предположении, что контент должен совпадать при удалении незначащих параметров.
  • Сложные и нестабильные редиректы: Использование цепочек редиректов или клиентских редиректов может помешать системам Google корректно и быстро определить конечный канонический URL, что критично как для SEO, так и для работы описанного механизма в PPC.
  • Игнорирование инструментов для вебмастеров: Неиспользование доступных инструментов для управления параметрами URL увеличивает нагрузку на автоматические системы Google и повышает риск ошибок каноникализации.

Стратегическое значение

Стратегическое значение этого патента для SEO заключается в демонстрации того, насколько серьезно Google подходит к каноникализации URL. Система готова тратить ресурсы на активное сканирование и сравнение контента для борьбы с неоднозначностью URL. Это подтверждает, что техническое SEO, особенно управление структурой URL, параметрами и каноникализацией, является фундаментальным требованием для эффективного взаимодействия с поисковыми системами.

Практические примеры

Сценарий: Диагностика проблем каноникализации на основе патента

SEO-специалист может использовать логику патента (Claim 4) для проверки корректности обработки параметров на сайте.

  1. Идентификация URL: Выбирается страница товара site.com/product/123 и ее версия с аналитическим параметром site.com/product/123?session_id=XYZ.
  2. Симуляция действия Google: Специалист сканирует оба URL (с одинаковыми user-agent и настройками).
  3. Сравнение контента: Проводится сравнение HTML-кода и основного контента двух версий.
  4. Анализ (по патенту): Если контент идентичен, система Google должна считать параметры незначащими и каноникализировать оба URL к site.com/product/123.
  5. Вывод для SEO: Если контент различается (например, меняются заголовки, описания или внутренние ссылки из-за параметра session_id), это является серьезной технической проблемой, требующей исправления, так как это нарушает базовые принципы каноникализации, описанные Google.

Вопросы и ответы

Описывает ли этот патент, как генерируются органические сайтлинки в поиске Google?

Нет. Патент сфокусирован исключительно на рекламной платформе (Advertisement Management System), такой как Google Ads. Он описывает, как автоматически добавляются описания к рекламным сайтлинкам (Sitelink Extensions), используя тексты из других объявлений. Механизмы органических сайтлинков в этом документе не рассматриваются.

Какое значение имеет процесс каноникализации, описанный в патенте, для SEO?

Он имеет критическое значение, так как демонстрирует сложность методов Google. Патент показывает (Claim 4), что Google может активно сканировать URL с параметрами и без них и сравнивать контент целевых страниц для подтверждения эквивалентности. Это подчеркивает необходимость для SEO-специалистов обеспечивать чистоту структуры URL и консистентность контента для правильной каноникализации.

Упоминается ли в патенте использование правил вебмастеров для каноникализации?

Да, в Claim 5 и 7 явно указывается на возможность использования правил, предоставленных вебмастером (webmaster supplied rules), для определения релевантности параметров URL. Это соответствует инструментам управления параметрами URL в Google Search Console и подтверждает важность их использования.

Что такое «Креатив» (Creative) и «Кластеры Креативов» (Creative Clusters)?

Креатив – это текст существующего рекламного объявления в аккаунте. Creative Clusters – это группы таких креативов, которые ведут на одну и ту же каноническую целевую страницу. Система формирует эти кластеры заранее, чтобы быстро находить все возможные описания для конкретного URL сайтлинка.

Как система выбирает лучший креатив для сайтлинка из кластера?

Система использует комбинированную оценку. Она учитывает Impression Score (историческую эффективность/популярность креатива, основанную на показах) и IDF Score (текстовую релевантность между заголовком сайтлинка и текстом креатива). Это позволяет выбрать не только популярный, но и семантически подходящий текст.

Что такое IDF Score и почему он важен?

IDF Score (Inverse-Document-Frequency) – это метрика текстовой релевантности. Она помогает системе выбрать креатив, который лучше всего соответствует тексту сайтлинка по смыслу. Например, для сайтлинка «Распродажа обуви» система предпочтет креатив со словом «Распродажа», а не общий текст о компании. При расчете тексты нормализуются и учитывается вес общих слов.

Что происходит, если система покажет несколько сайтлинков одновременно?

Патент описывает использование алгоритмов оптимального сопоставления (Claim 9), таких как двудольное сопоставление (Bipartite Graph Matching). Система стремится выбрать уникальный креатив для каждого сайтлинка так, чтобы максимизировать общую сумму оценок для всего набора, обеспечивая разнообразие и избегая повторов.

Могут ли мои UTM-метки или трекинг-параметры помешать работе этой системы?

Если они настроены корректно и не влияют на контент страницы, система должна их успешно игнорировать в процессе каноникализации (путем сравнения страниц). Однако, если параметры изменяют контент, это может привести к тому, что система будет считать URL разными, и соответствие между креативом и сайтлинком не будет найдено.

Может ли система использовать текст с самой целевой страницы для описания сайтлинка?

Патент не описывает использование контента целевой страницы в качестве источника текста для описания. Он фокусируется исключительно на повторном использовании существующих рекламных креативов (creatives). Контент страницы используется только для валидации процесса каноникализации.

Должны ли креатив и сайтлинк находиться в одной рекламной кампании для сопоставления?

Нет. В описании патента указано, что сайтлинки и креативы не обязаны принадлежать к одной кампании или группе объявлений, если они связаны с одним и тем же рекламодателем. Система ищет соответствия на уровне аккаунта, основываясь на совпадении канонических URL.

Похожие патенты

Как Google автоматически конвертирует текстовые объявления в графические, используя изображения с целевых страниц
Google использует систему для автоматического преобразования текстовых рекламных объявлений в визуально привлекательные графические блоки. Система анализирует целевую страницу (landing page) текстового объявления, извлекает или генерирует из нее изображение и объединяет его с текстом объявления. Эти новые графические блоки затем отображаются в виде матрицы (сетки) на сайтах паблишеров.
  • US9779065B1
  • 2017-10-03
  • Мультимедиа

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google Ads прогнозирует конверсию ключевых слов, используя кластеризацию интентов и агрегированные данные рынка
Google использует ML-систему для прогнозирования эффективности (например, коэффициента конверсии) ключевых слов в Google Ads, особенно для рекламодателей с недостаточными данными. Система анализирует контент сайта, определяет ключевые слова и соотносит их с кластерами запросов (интентами). Эффективность прогнозируется на основе агрегированных исторических данных о конверсиях для всего кластера интентов, а не только данных конкретного рекламодателя.
  • US20250110978A1
  • 2025-04-03
  • Семантика и интент

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах
Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.
  • US9501549B1
  • 2016-11-22
  • Поведенческие сигналы

Популярные патенты

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")
Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.
  • US10346417B2
  • 2019-07-09
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя и интерактивное уточнение для обучения моделей поиска
Google может инициировать поиск пассивно, основываясь на контексте действий пользователя (например, чтении статьи или телефонном звонке). Система позволяет пользователю уточнить этот поиск, выбрав один из использованных критериев (например, тапнув на сущность в тексте), чтобы повысить его значимость. Реакция пользователя на уточненные результаты используется для машинного обучения и улучшения взвешивания критериев в будущих поисковых запросах.
  • US11568003B2
  • 2023-01-31
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

seohardcore