Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует высокоэффективные и синтетические запросы для улучшения результатов поиска

    QUERY AUGMENTATION (Аугментация запросов)
    • US9916366B1
    • Google LLC
    • 2018-03-13
    • 2009-03-16
    2009 Патенты Google Поведенческие сигналы Семантика и интент Техническое SEO

    Google идентифицирует запросы, которые исторически показывают высокую эффективность (на основе CTR и Long Clicks), и генерирует синтетические запросы из структурированных данных (заголовков, анкоров). Когда пользователь вводит запрос, система находит похожий высокоэффективный или синтетический запрос и использует его для аугментации (дополнения или изменения) результатов поиска, приоритезируя тип аугментации в зависимости от интента пользователя.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоптимальных результатов поиска, возникающих из-за того, что пользователи часто формулируют запросы неэффективно. Причины могут включать неточное выражение информационной потребности, использование нестандартной терминологии, орфографические ошибки или случаи, когда стандартные веса терминов в поиске не отражают намерение пользователя. Изобретение направлено на улучшение качества выдачи путем замены или дополнения исходного запроса более эффективными формулировками.

    Что запатентовано

    Запатентована система для генерации, хранения и использования Augmentation Queries (Аугментирующих запросов). Система идентифицирует высокоэффективные запросы из логов поиска и генерирует Synthetic Queries (Синтетические запросы) из структурированных данных. При получении пользовательского запроса система находит наиболее похожий аугментирующий запрос и использует его для выполнения Augmented Search Operation (Аугментированной поисковой операции), чтобы улучшить релевантность и качество результатов.

    Как это работает

    Система работает в двух режимах: офлайн и онлайн.

    • Офлайн (Генерация): Система анализирует Query Logs и Click Logs для выявления запросов, которые стабильно приводят к высокому вовлечению (например, Long Clicks, высокий CTR). Параллельно система анализирует структурированные документы (например, бизнес-справочники, веб-страницы) для генерации Synthetic Queries из заголовков, анкорных текстов или списков. Эти запросы сохраняются в Augmentation Query Store.
    • Онлайн (Применение): При получении запроса система ищет кандидатов в Augmentation Query Store. Кандидаты ранжируются по схожести с исходным запросом (используя метрику Transformation Cost). Затем система корректирует это ранжирование в зависимости от интента пользователя: если интент специфический (фактический), приоритет отдается синтетическим запросам; если интент общий (исследовательский), приоритет отдается реальным пользовательским запросам. Лучший запрос используется для аугментации выдачи.

    Актуальность для SEO

    Высокая. Понимание и переписывание запросов (Query Understanding) является центральным элементом современного поиска. Механизмы, описанные в патенте, напрямую связаны с тем, как Google интерпретирует намерения пользователей и использует структурированные данные и поведенческие сигналы для формирования SERP. Использование синтетических запросов и динамическая корректировка на основе интента крайне актуальны.

    Важность для SEO

    Патент имеет критическое значение для SEO. Он показывает, что Google активно ищет «канонические» или идеальные формулировки запросов, используя для этого как поведение пользователей, так и структурированные данные на сайтах (включая анкорные тексты ссылок). Это подчеркивает важность оптимизации под естественное поведение пользователей (CTR, вовлеченность) и критическую роль структурированных данных и заголовков как источника запросов для Google.

    Детальный разбор

    Термины и определения

    Augmentation Query (Аугментирующий запрос)
    Запрос, который хорошо справляется с поиском желаемых документов, что определяется взаимодействием пользователей (например, часто выбирают результаты). Может быть как реальным пользовательским запросом, так и синтетическим.
    Augmentation Query Store (Хранилище аугментирующих запросов)
    База данных, хранящая идентифицированные высокоэффективные и синтетические запросы.
    Augmented Search Operation (Аугментированная поисковая операция)
    Действие, выполняемое поисковой системой с использованием выбранного аугментирующего запроса. Может включать добавление результатов, изменение ранжирования исходных результатов или предложение альтернативного поиска.
    Cached Search Results (Кэшированные результаты поиска)
    Предварительно вычисленные и сохраненные результаты поиска для аугментирующих запросов, используемые для ускорения ответа.
    Click Logs (Логи кликов)
    Данные о взаимодействии пользователей с результатами поиска (клики, CTR, время пребывания).
    Explicit Signals (Явные сигналы)
    Прямая обратная связь от пользователей о производительности запроса (например, опросы, рейтинги релевантности).
    Implicit Signals (Неявные сигналы)
    Сигналы, основанные на действиях пользователя, из которых можно сделать вывод о производительности запроса (например, CTR, Long Clicks, Short Clicks/Click-through reversions, частота запроса, IR scores).
    Long Click (Длинный клик)
    Неявный сигнал качества. Происходит, когда пользователь после клика на результат задерживается на целевой странице или переходит по ссылкам на ней.
    Performance Threshold (Порог производительности)
    Критерий, используемый для определения того, является ли запрос достаточно эффективным, чтобы быть сохраненным как Augmentation Query.
    Query Logs (Логи запросов)
    Записи запросов, отправленных пользователями поисковой системе.
    Quality Signal (Сигнал качества)
    Метрика (явная или неявная), указывающая на производительность запроса.
    Short Click (Click-through reversion) (Короткий клик / Возврат к выдаче)
    Неявный сигнал низкого качества. Происходит, когда пользователь быстро возвращается на страницу результатов поиска после клика на результат.
    Structured Document Corpus (Корпус структурированных документов)
    Набор документов с идентифицируемой структурой (например, бизнес-справочники, сайты с четкой разметкой), используемый для генерации синтетических запросов.
    Structure Rule Set (Набор структурных правил)
    Правила, используемые для извлечения данных из структурированных документов и формирования синтетических запросов (например, извлечение названия компании, города и штата).
    Synthetic Query (Синтетический запрос)
    Машинно сгенерированный запрос, созданный путем извлечения данных из структурированных источников (например, заголовков документов, анкорных текстов, бизнес-листингов).
    Transformation Cost (Стоимость трансформации)
    Метрика, используемая для измерения степени различия между исходным запросом пользователя и кандидатом в аугментирующие запросы. Основана на edit distance, замене синонимов, важности терминов и других лингвистических метриках.

    Ключевые утверждения (Анализ Claims)

    Патент US9916366B1 является продолжением (continuation) более ранней заявки. Ключевые утверждения фокусируются на интеграции и балансировке синтетических и пользовательских запросов.

    Claim 1 (Независимый пункт): Описывает метод использования аугментирующих запросов во время поиска с динамической корректировкой весов.

    1. Система получает запрос от пользователя.
    2. Идентифицируется ранжированный список аугментирующих запросов, включающий как пользовательские (user-generated), так и синтетические (machine-generated synthetic) запросы.
    3. Синтетические запросы генерируются из корпуса структурированных документов путем извлечения слов из определенных структурированных разделов (например, заголовков, анкоров), которые известны как источники высокоэффективных запросов.
    4. Ключевой механизм: Система корректирует ранжирование синтетических запросов относительно пользовательских на основе типа информации (type of information), на который направлен исходный запрос.
      • Ранг синтетических запросов повышается, если тип информации относится к первому типу (например, специфический, фактический интент).
      • Ранг синтетических запросов понижается, если тип информации относится ко второму типу (например, общий, исследовательский интент).
    5. Система выбирает аугментирующий запрос на основе скорректированного ранжирования.
    6. Система предоставляет пользователю результат поиска, релевантный выбранному аугментирующему запросу.

    Claim 9 (Зависимый): Уточняет, что структурированные разделы, используемые для генерации синтетических запросов, включают заголовки документа (titles), анкорный текст (anchor text) или разделы, определенные конкретными HTML-тегами.

    Где и как применяется

    Изобретение затрагивает несколько этапов поиска, работая как в офлайн, так и в онлайн режимах.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе система анализирует Structured Document Corpus. Используя Structure Rule Set, система извлекает данные из определенных разделов (Titles, Anchor text, HTML-структуры) для генерации Synthetic Queries. Это офлайн-процесс.

    QUNDERSTANDING – Понимание Запросов
    Этот этап задействован как офлайн, так и онлайн.

    • Офлайн: Анализ Query Logs и Click Logs для оценки производительности запросов с использованием Quality Signals (CTR, Long Clicks). Высокоэффективные запросы сохраняются в Augmentation Query Store.
    • Онлайн (Runtime): При получении запроса система выполняет несколько задач:
      1. Классификация интента: Определение «типа информации» (специфический или общий).
      2. Поиск кандидатов: Поиск похожих запросов в Augmentation Query Store.
      3. Ранжирование кандидатов: Расчет Transformation Cost и корректировка рангов на основе типа информации (как описано в Claim 1).
      4. Выбор лучшего аугментирующего запроса.

    RANKING / METASEARCH / RERANKING
    На этих этапах выполняется Augmented Search Operation. Система использует выбранный аугментирующий запрос для получения результатов (из кэша или путем нового поиска) и интегрирует их в выдачу. Это может включать смешивание результатов, переранжирование исходных результатов или продвижение общих результатов.

    На что влияет

    • Конкретные типы контента и Структурированные данные: Наибольшее влияние оказывается на контент, который хорошо структурирован (бизнес-листинги, энциклопедические статьи, товары). Заголовки и анкорные тексты становятся прямыми источниками запросов.
    • Специфические запросы (Фактические/Навигационные): Запросы с четким интентом (поиск адреса, названия компании, конкретного факта) с большей вероятностью будут аугментированы Synthetic Queries.
    • Общие запросы (Информационные/Исследовательские): Запросы типа «обзоры» или «лучшие способы» с большей вероятностью будут аугментированы высокоэффективными запросами реальных пользователей.
    • Поведенческие факторы: Влияет на важность CTR и Long Clicks, так как они определяют, какие запросы будут считаться высокоэффективными.

    Когда применяется

    • Триггеры активации (Офлайн): Активируется, когда Quality Signal запроса превышает Performance Threshold, или когда обнаруживаются структурированные данные, подходящие для генерации синтетического запроса.
    • Условия применения (Онлайн): Применяется для любого входящего запроса, для которого в Augmentation Query Store найдены подходящие кандидаты с достаточно низким Transformation Cost. Степень и тип применения зависят от классификации интента запроса (Claim 1).

    Пошаговый алгоритм

    Процесс А: Офлайн-генерация пользовательских аугментирующих запросов

    1. Сбор данных: Идентификация запроса в Query Log.
    2. Извлечение сигналов: Идентификация связанных Quality Signals (явных и неявных) из Click Logs (CTR, Long Clicks, Short Clicks).
    3. Оценка производительности: Сравнение производительности запроса с Performance Threshold.
    4. Сохранение: Если порог превышен, запрос сохраняется в Augmentation Query Store.
    5. Кэширование (Опционально): Выполнение запроса и сохранение топовых результатов в Cached Search Results.

    Процесс Б: Офлайн-генерация синтетических аугментирующих запросов

    1. Анализ корпуса: Идентификация структурированных данных в Structured Document Corpus.
    2. Применение правил: Генерация Synthetic Query из структурированных данных (Titles, Anchor Text) с использованием Structure Rule Set.
    3. Оценка (Опционально): Присвоение оценки синтетическому запросу (например, на основе авторитетности источника).
    4. Сохранение: Сохранение запроса в Augmentation Query Store.
    5. Ассоциация результатов: Ассоциация синтетического запроса с релевантными документами (например, документом-источником или документом, на который указывает анкорный текст).

    Процесс В: Онлайн-аугментация запроса (Runtime)

    1. Получение запроса: Система получает входящий запрос.
    2. Анализ интента: Определение «типа информации» (Специфический vs. Общий).
    3. Генерация кандидатов: Поиск в Augmentation Query Store запросов, похожих на исходный (например, путем трансформации терминов, использования синонимов или поиска подмножеств терминов).
    4. Расчет стоимости: Определение Transformation Cost для каждого кандидата.
    5. Ранжирование и Корректировка: Ранжирование кандидатов по стоимости. Корректировка рангов: повышение синтетических запросов для специфического интента; понижение синтетических запросов для общего интента.
    6. Выбор: Выбор одного или нескольких лучших аугментирующих запросов.
    7. Аугментация: Выполнение Augmented Search Operation (например, получение результатов для аугментирующего запроса и их смешивание с исходными результатами).

    Какие данные и как использует

    Данные на входе

    • Контентные и Структурные факторы:
      • Заголовки документов (Document Titles): Используются как источник для Synthetic Queries.
      • Анкорные тексты (Anchor Text): Используются как источник для Synthetic Queries. Если много ссылок с одинаковым анкором ведут на документ, этот анкор становится синтетическим запросом для документа.
      • Структурированные данные (Structured Data): Данные в формате списков, таблиц (например, бизнес-листинги с названиями, адресами) используются для генерации Synthetic Queries по правилам Structure Rule Set.
    • Поведенческие факторы:
      • Query Logs: Источник кандидатов в аугментирующие запросы.
      • Click Logs: Источник данных для оценки производительности запросов.
      • CTR (Click-through rates): Используется для оценки эффективности запроса.
      • Long Clicks: Положительный сигнал качества запроса.
      • Short Clicks (Click-through reversions): Отрицательный сигнал качества запроса.
      • Частота запроса (Frequency): Может использоваться как неявный сигнал интереса к теме.
    • Пользовательские факторы (Явные):
      • Обратная связь/Опросы (Survey/Engagement): Прямые данные от пользователей о релевантности результатов.

    Какие метрики используются и как они считаются

    • Quality Signal (Сигнал качества запроса): Агрегированная метрика производительности запроса, вычисляемая на основе явных и неявных сигналов (CTR, Long/Short Clicks).
    • Performance Threshold (Порог производительности): Заданное значение Quality Signal, необходимое для включения запроса в Augmentation Query Store.
    • Transformation Cost (Стоимость трансформации): Метрика схожести между двумя запросами. Учитывает:
      • Edit distance (редакционное расстояние).
      • Synonym substitution (стоимость замены на синоним).
      • Term importance (важность термина, например, существительные важнее прилагательных).
      • Term frequency (частотность термина в корпусе).
      • Контекст термина (например, стоимость изменения локации зависит от других слов в запросе).
    • Тип информации (Type of Information): Классификация интента запроса (например, Специфический/Фактический vs. Общий/Исследовательский), используемая для корректировки весов синтетических и пользовательских запросов.

    Выводы

    1. Google активно использует «идеальные» запросы для улучшения выдачи: Система не полагается только на запрос пользователя. Она поддерживает базу высокоэффективных запросов (Augmentation Query Store) и использует их для аугментации, если они семантически близки к исходному запросу.
    2. Поведение пользователей определяет эффективность запросов: Long Clicks и высокий CTR являются ключевыми метриками (Quality Signals), которые определяют, какие пользовательские запросы считаются высокоэффективными и будут использоваться повторно для других пользователей.
    3. Структурированные данные, заголовки и анкоры — это запросы: Google генерирует Synthetic Queries непосредственно из заголовков документов, анкорных текстов входящих ссылок и структурированных данных (например, листингов). Это означает, что то, как контент структурирован и как на него ссылаются, буквально формирует запросы, по которым он может ранжироваться.
    4. Интент определяет источник аугментации (Критически важно из Claim 1): Система динамически выбирает между реальными пользовательскими запросами и синтетическими запросами в зависимости от интента. Для фактических/специфических запросов предпочтительнее синтетические запросы (из структурированных данных). Для общих/исследовательских запросов предпочтительнее высокоэффективные запросы других пользователей.
    5. Семантическая близость через Transformation Cost: Google использует сложную метрику (Transformation Cost) для определения схожести запросов, учитывая не только синонимы и расстояние, но и важность и контекст отдельных терминов.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под вовлеченность (Engagement Optimization): Фокусируйтесь на максимизации Long Clicks и минимизации Short Clicks. Контент должен полностью удовлетворять интент пользователя, чтобы запросы, ведущие на ваш сайт, были классифицированы как высокоэффективные. Это увеличит вероятность их использования для аугментации.
    • Стратегическое использование заголовков (Titles): Формулируйте заголовки страниц (Title и H1) как четкие, полные и естественные запросы. Патент подтверждает, что заголовки могут быть использованы как Synthetic Queries.
    • Управление анкорными текстами (Anchor Text Management): Входящие анкорные тексты (как внутренние, так и внешние) должны быть релевантными и описательными. Google может использовать популярные анкоры как Synthetic Queries для целевой страницы.
    • Внедрение структурированных данных: Используйте структурированные данные и четкую HTML-разметку для фактической информации (адреса, названия организаций, характеристики продуктов). Это позволяет Google генерировать Synthetic Queries, которые получат приоритет при специфических интентах.
    • Анализ семантического поля и синонимов: Понимайте Transformation Cost. Оптимизируйте контент так, чтобы он был релевантен различным формулировкам запроса, учитывая синонимы и важность терминов (фокус на существительных и объектах).

    Worst practices (это делать не надо)

    • Создание контента, провоцирующего Short Clicks (Кликбейт): Если пользователи быстро возвращаются в выдачу, это снижает оценку эффективности запросов, ведущих на ваш сайт, уменьшая их шансы стать Augmentation Queries.
    • Игнорирование структурирования контента: Отсутствие четкой структуры, разметки и описательных заголовков лишает Google возможности генерировать Synthetic Queries из вашего контента.
    • Манипуляции с анкорными текстами (Переспам): Использование неестественных или спамных анкоров неэффективно. Система ищет анкоры, которые естественно описывают контент и часто используются разными источниками.
    • Фокус только на точном вхождении ключевых слов: Поскольку система активно ищет альтернативные (аугментирующие) запросы, чрезмерная оптимизация под одну конкретную формулировку менее эффективна, чем обеспечение релевантности широкому семантическому кластеру.

    Стратегическое значение

    Этот патент подтверждает, что Query Understanding — это не просто понимание слов пользователя, а активный процесс поиска наилучшего запроса для достижения результата. Стратегически важно понимать, что Google оценивает не только качество страниц, но и качество запросов, которые на них ведут. SEO-стратегия должна включать оптимизацию пути пользователя (от запроса до удовлетворения интента) и обеспечение максимальной структурированности данных, чтобы помочь Google генерировать эффективные синтетические запросы из вашего контента.

    Практические примеры

    Сценарий 1: Приоритет синтетического запроса (Специфический интент)

    1. Офлайн: Google анализирует структурированные данные вашего сайта (листинг компании) и генерирует Synthetic Query: [Название Компании] [Город] [Адрес].
    2. Запрос пользователя: Пользователь вводит неточный запрос, например: «[Название Компании] где находится».
    3. Анализ интента: Google определяет интент как специфический (поиск локации).
    4. Аугментация: Система находит синтетический запрос. Согласно Claim 1, ранг синтетического запроса повышается, так как интент специфический.
    5. Результат: Google использует синтетический запрос для аугментации поиска, гарантируя точное отображение локации и релевантных данных компании в выдаче.

    Сценарий 2: Приоритет пользовательского запроса (Общий интент)

    1. Офлайн: Google анализирует логи и видит, что запрос «лучшие кроссовки для бега по асфальту» имеет высокий CTR и много Long Clicks. Он сохраняется как Augmentation Query.
    2. Запрос пользователя: Пользователь вводит: «кроссовки асфальт обзор».
    3. Анализ интента: Google определяет интент как общий/исследовательский.
    4. Аугментация: Система находит высокоэффективный пользовательский запрос. Согласно Claim 1, его ранг будет выше, чем у возможных синтетических запросов, так как интент общий.
    5. Результат: Выдача аугментируется результатами для более эффективного и популярного запроса «лучшие кроссовки для бега по асфальту».

    Вопросы и ответы

    Что такое Augmentation Query (Аугментирующий запрос)?

    Это запрос, который система идентифицировала как высокоэффективный для поиска определенной информации. Он может быть либо реальным запросом, который пользователи часто используют и который приводит к высокому вовлечению (например, Long Clicks), либо Synthetic Query, сгенерированным машиной из структурированных данных, заголовков или анкорных текстов.

    Как Google определяет, что запрос является высокоэффективным?

    Google использует Quality Signals, которые делятся на явные (например, опросы пользователей) и неявные. Ключевыми неявными сигналами являются поведенческие метрики из Click Logs: высокий CTR, большое количество Long Clicks (пользователь нашел то, что искал, и задержался на странице) и малое количество Short Clicks (пользователь быстро вернулся в выдачу).

    Что такое Synthetic Query и откуда он берется?

    Synthetic Query — это запрос, сгенерированный автоматически, а не введенный пользователем. Источниками являются структурированные данные на сайтах (например, бизнес-листинги, таблицы характеристик), заголовки документов (Titles) и анкорные тексты входящих ссылок. Google извлекает эту информацию и формирует из нее запросы.

    Как патент влияет на важность анкорных текстов ссылок?

    Влияние очень велико. Патент прямо указывает, что анкорный текст является источником для генерации Synthetic Queries. Если множество ссылок используют один и тот же описательный анкор для указания на страницу, этот анкор может стать аугментирующим запросом для этой страницы, улучшая ее ранжирование по схожим запросам.

    Что такое Transformation Cost и почему это важно для SEO?

    Transformation Cost — это мера того, насколько сильно нужно изменить исходный запрос пользователя, чтобы он совпал с аугментирующим запросом. Она учитывает синонимы, редакционное расстояние и важность терминов. Для SEO это означает, что нужно охватывать семантическое ядро широко, чтобы снизить стоимость трансформации между различными формулировками пользовательских запросов и вашим контентом.

    Когда Google предпочтет синтетический запрос реальному пользовательскому?

    Согласно Claim 1, Google корректирует ранжирование в зависимости от типа информации (интента). Синтетические запросы (из структурированных данных) получают приоритет, когда интент пользователя специфический или фактический — например, поиск адреса, номера телефона или конкретной характеристики товара.

    Когда Google предпочтет реальный пользовательский запрос синтетическому?

    Высокоэффективные запросы реальных пользователей получают приоритет, когда интент пользователя общий или исследовательский — например, поиск обзоров, сравнений или инструкций. В этом случае система полагается на то, как другие люди успешно искали подобную информацию.

    Как этот патент связан с E-E-A-T и качеством контента?

    Связь прямая через поведенческие сигналы. Контент высокого качества (удовлетворяющий E-E-A-T) естественным образом генерирует Long Clicks и снижает Short Clicks. Это приводит к тому, что запросы, ведущие на такой контент, классифицируются как высокоэффективные и используются для аугментации поиска у других пользователей.

    Стоит ли оптимизировать заголовки (Titles) под запросы?

    Да, абсолютно. Патент явно указывает, что заголовки документов используются для генерации Synthetic Queries. Четкий, описательный заголовок, сформулированный как естественный запрос, может напрямую использоваться Google для аугментации поиска, повышая видимость страницы.

    Что происходит, если по моему запросу нет результатов?

    В этом случае система может использовать выбранный аугментирующий запрос (наиболее близкий по смыслу, но высокоэффективный) и представить его результаты пользователю, возможно, с указанием, что поиск был модифицирован. Это позволяет избежать пустой выдачи.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.