Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google итеративно переписывает запросы в кастомизированных поисковых системах (Custom Search Engines) для улучшения результатов

    SYSTEM AND METHOD FOR QUERY RE-ISSUE IN SEARCH ENGINES (Система и метод повторной отправки запросов в поисковых системах)
    • US20150331906A1
    • Google LLC
    • 2015-11-19
    • 2007-10-17
    2007 Индексация Патенты Google

    Google использует механизм итеративного уточнения запросов для кастомизированных поисковых систем (например, Google Custom Search). Если результаты поиска не соответствуют спецификациям, заданным разработчиком, система автоматически модифицирует запрос (добавляя ключевые слова или ограничивая поиск по сайтам) и отправляет его повторно, прежде чем показать результаты пользователю.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему недостаточного качества или релевантности результатов поиска в контексте кастомизированных или специализированных поисковых систем (например, Google Custom Search Engine — CSE). В таких системах разработчик (Developer) задает специфические критерии (Search Specification), которым должна соответствовать выдача. Если первоначальные результаты неудовлетворительны (например, их слишком мало или они не с тех сайтов), изобретение позволяет автоматически улучшить их. Патент направлен на улучшение функциональности CSE, а не на устранение SEO-манипуляций в основном поиске.

    Что запатентовано

    Запатентована система автоматического итеративного уточнения и повторной отправки запроса (Query Re-issue). Промежуточная поисковая система (Search Engine System) оценивает качество результатов, полученных от основной инфраструктуры (Search Infrastructure). Если качество признано неприемлемым (unacceptable) на основе оценки Quality Estimator, система автоматически модифицирует и повторно отправляет запрос, пытаясь получить лучшие результаты до их показа пользователю.

    Как это работает

    Система работает как посредник итеративно:

    • Получение и Оценка: Запрос отправляется в основную поисковую инфраструктуру. Полученные результаты анализируются компонентом Quality Estimator на соответствие Search Specification.
    • Принятие решения: Если качество низкое, компонент Query Re-issuer инициирует пересмотр запроса.
    • Модификация и Повторная отправка: Query Modifier изменяет запрос, используя предопределенные стратегии (например, добавление ключевых слов или использование операторов site: для ограничения поиска по доменам). Этот новый запрос отправляется повторно.

    Актуальность для SEO

    Средняя. Механизмы итеративного уточнения запросов актуальны для продуктов типа Google Programmable Search Engine (ранее CSE). Однако данный патент описывает реализацию, сильно зависящую от Search Specification, предоставляемой сторонним разработчиком. Важно отметить, что хотя эта публикация датирована 2015 годом, она является продолжением (continuation) более ранней заявки, оригинальная из которых подана в 2007 году.

    Важность для SEO

    Минимальное влияние (1/10). Патент описывает внутренние процессы, связанные преимущественно с платформой Custom Search Engine (CSE) или аналогичными кастомизированными поисковыми решениями, а не с алгоритмами ранжирования основного веб-поиска Google. Он не дает прямых рекомендаций или инсайтов для SEO-специалистов, занимающихся продвижением сайтов в общей органической выдаче.

    Детальный разбор

    Термины и определения

    Developer (Разработчик)
    Пользователь (например, администратор сайта), который настраивает поведение кастомизированной поисковой системы с помощью Search Specification.
    Quality Estimator (Оценщик качества)
    Компонент, который оценивает качество полученных результатов поиска. Оценка может базироваться на количестве результатов, их соответствии Search Specification, а также учитывать стоимость повторной отправки запроса (задержка, вычислительные ресурсы).
    Query Modifier / Query Reviser (Модификатор запроса)
    Компонент, который изменяет исходный запрос на основе Search Specification или инструкций от Query Re-issuer.
    Query Re-issuer (Инициатор повторной отправки запроса)
    Компонент, который на основе оценки Quality Estimator принимает решение о необходимости модификации и повторной отправки запроса.
    Search Engine System (Система поискового движка)
    Промежуточный слой, реализующий логику патента (например, CSE). Принимает запросы пользователя и взаимодействует с Search Infrastructure.
    Search Infrastructure (Поисковая инфраструктура)
    Бэкенд-система, выполняющая поиск по индексу (например, основной индекс Google).
    Search Specification (Спецификация поиска)
    Конфигурация, предоставленная разработчиком (Developer), определяющая поведение кастомизированного поиска. Может включать ключевые слова, URL паттерны, метки (labels), предпочтения по ранжированию и фильтрации.
    site: modifiers (Модификаторы site:)
    Операторы поискового запроса, используемые для ограничения поиска по конкретным доменам или URL. Используются в стратегии «Trim Sites».
    Bloom filter (Фильтр Блума)
    Эффективная структура данных для вероятностной проверки принадлежности элемента к множеству. Упоминается как возможная реализация фильтра (Filter) для проверки соответствия URL заданным паттернам.

    Ключевые утверждения (Анализ Claims)

    Анализ сфокусирован на активных пунктах формулы изобретения (Claims 2-21), так как Claim 1 отменен.

    Claim 2 (Независимый пункт): Описывает основной метод работы модификатора запроса (query reviser).

    1. Query reviser получает от query re-issuer: (i) информацию о том, что результаты исходного запроса были автоматически идентифицированы как неприемлемые (unacceptable), и (ii) инструкцию модифицировать исходный запрос для повторной отправки.
    2. В ответ на получение инструкции, query reviser генерирует модифицированный поисковый запрос.
    3. Query reviser отправляет модифицированный запрос в поисковую систему.

    Ядром изобретения является автоматизированный процесс принятия решения о неприемлемости результатов и последующая инструкция по модификации и повторной отправке запроса.

    Claim 3 (Зависимый от 2): Уточняет временной аспект.

    Идентификация результатов как неприемлемых происходит до того, как результаты будут выведены на устройство пользователя. Это означает, что весь итеративный процесс улучшения качества скрыт от пользователя.

    Claim 5 (Зависимый от 2): Уточняет данные, передаваемые в цикле.

    Модификатор запроса получает данные, указывающие количество раз, которое запрос уже был повторно отправлен. Это механизм контроля итераций.

    Claim 8 (Зависимый от 2): Уточняет причину переписывания.

    Информация о неприемлемости результатов генерируется на основе оценки качества (estimate of quality) поисковых результатов.

    Где и как применяется

    Изобретение реализовано в виде промежуточного слоя (Search Engine System), например Google CSE, между пользователем и основной поисковой инфраструктурой (Search Infrastructure). Оно не описывает стандартный поток обработки запросов в основном поиске Google.

    QUNDERSTANDING – Понимание Запросов
    Query Modifier использует Search Specification для первоначальной модификации запроса. На этом же этапе происходит последующая реформулировка запроса на основе обратной связи от Query Re-issuer.

    RANKING / RERANKING (Итеративный цикл)
    Система итеративно взаимодействует с этими этапами:

    1. RANKING: Система отправляет запрос в Search Infrastructure и получает результаты.
    2. RERANKING (Обработка и Оценка): Result Processor обрабатывает результаты (фильтрует, ранжирует на основе меток). Quality Estimator оценивает качество этого набора.
    3. Принятие решения: Если качество низкое, вместо вывода результатов запускается новый цикл, возвращаясь к этапу QUNDERSTANDING (переписывание запроса).

    Входные данные:

    • Исходный запрос пользователя.
    • Search Specification (конфигурация от разработчика).
    • Результаты поиска от Search Infrastructure для каждой итерации.

    Выходные данные:

    • Модифицированные запросы (внутренний обмен данными).
    • Финальный набор результатов поиска для пользователя.

    На что влияет

    • Специфические системы: Влияет исключительно на результаты поиска в рамках кастомизированных поисковых систем (Google CSE / Programmable Search Engine), где «Разработчик» определяет область поиска и желаемое поведение через Search Specification.
    • Типы контента и запросов: Не влияет на ранжирование конкретных типов контента или запросов в основном индексе Google.

    Когда применяется

    • Триггеры активации: Алгоритм повторной отправки активируется, когда Quality Estimator определяет, что текущий набор результатов является «неприемлемым» (unacceptable).
    • Условия срабатывания: Неприемлемость определяется на основе сравнения результатов с Search Specification. Примеры, упомянутые в патенте:
      • Недостаточное или избыточное количество результатов.
      • Низкий процент результатов, соответствующих терминам или меткам (labels) из конфигурации.
      • Высокая частота ошибок фильтра (Filter error rates).
      • Оценка стоимости повторного запроса (вычислительные затраты, задержка/latency).

    Пошаговый алгоритм

    Процесс работы Search Engine System:

    1. Получение запроса: Система получает запрос от пользователя.
    2. Первичная модификация: Query Modifier генерирует первую версию запроса на основе Search Specification.
    3. Отправка запроса: Запрос отправляется в Search Infrastructure.
    4. Получение и обработка результатов: Система получает результаты, фильтрует их (используя Filter, например Bloom filter) и ранжирует (используя Result Processor).
    5. Оценка качества: Quality Estimator оценивает качество обработанных результатов.
    6. Принятие решения: Система проверяет, нужна ли модификация запроса (т.е. являются ли результаты неприемлемыми).
      • Если НЕТ: Результаты отображаются пользователю. Процесс завершен.
      • Если ДА: Переход к шагу 7.
    7. Определение типа модификации: Система определяет стратегию для следующей итерации. В патенте описан пример с двумя основными стратегиями.
    8. Стратегия A (Add Keywords): Проверяется, нужно ли добавить ключевые слова к запросу (взятые из Search Specification). Если да, запрос модифицируется и возвращается к шагу 3.
    9. Стратегия B (Trim Sites): Если Стратегия A не применялась или не дала результата, к запросу добавляются модификаторы site: (используя подмножество URL из Search Specification). Запрос модифицируется и возвращается к шагу 3.

    Система может хранить результаты всех итераций и в итоге выбрать лучший набор или скомбинировать их.

    Какие данные и как использует

    Данные на входе

    Система не анализирует стандартные SEO-факторы (контентные, ссылочные, поведенческие) для ранжирования. Она использует конфигурационные данные для извлечения и фильтрации результатов:

    • Конфигурационные данные (Структурные/Технические): Search Specification. Это ключевой источник данных, включающий:
      • Ключевые слова для добавления/продвижения/исключения.
      • Метки (Labels) для фильтрации и ранжирования (функция CSE).
      • Шаблоны URL и домены. Используются для создания Filter и добавления модификаторов site:.
    • Пользовательские факторы: Исходный текст запроса пользователя.

    Какие метрики используются и как они считаются

    Основная метрика — это оценка качества (Estimate of Quality), которая рассчитывается Quality Estimator. Патент определяет ее как комплексную метрику, включающую:

    • Соответствие конфигурации: Сравнение полученных результатов с требованиями Search Specification.
    • Метрики соответствия (Matching Metrics): Количество или процент результатов, которые соответствуют терминам запроса или меткам (labels).
    • Метрики эффективности (Efficiency Metrics):
      • Количество полученных результатов (слишком мало или слишком много может снижать качество).
      • Вычислительные затраты (computational cost).
      • Сетевые затраты (network cost).
      • Задержка (latency).
    • Метрики фильтрации (Filter Metrics): Частота ошибок фильтра (error rates of filter), например, Фильтра Блума.

    Выводы

    1. Фокус на кастомизируемом поиске (CSE): Патент описывает инфраструктуру для специализированных поисковых систем (таких как Google CSE), а не алгоритмы ранжирования основного веб-поиска Google. Search Engine System выступает как промежуточный слой, оптимизирующий запросы к основному индексу.
    2. «Качество» относительно конфигурации: Термин «Качество» (Quality) в этом патенте не имеет отношения к E-E-A-T или качеству контента на страницах. Оно измеряет, насколько хорошо набор результатов соответствует требованиям, заданным «Разработчиком» в Search Specification, а также метрикам эффективности.
    3. Итеративный подход к реформулировке: Система использует многопроходный итеративный подход для улучшения результатов. Если первый проход не удался, применяются предопределенные стратегии модификации запроса. Этот процесс происходит до показа результатов пользователю.
    4. Примеры стратегий модификации: Патент явно упоминает две стратегии: «Add Keywords» (добавление ключевых слов из конфигурации) и «Trim Sites» (добавление операторов site: для ограничения поиска по доменам из конфигурации).
    5. Нулевая ценность для общего SEO: Для специалистов, работающих над продвижением в основном поиске Google, этот патент не предоставляет практически полезной информации о факторах ранжирования или методах оптимизации контента.

    Практика

    ВАЖНО: Патент является инфраструктурным и описывает работу продукта Google Custom Search (Programmable Search Engine). Он не дает практических выводов для SEO в основном поиске Google.

    Best practices (это мы делаем)

    Рекомендации применимы ТОЛЬКО для SEO-специалистов, использующих Google CSE на своих сайтах:

    • Оптимизация Search Specification: Тщательно прорабатывайте конфигурацию CSE (Search Specification). Четко определяйте ключевые слова, метки (labels) и шаблоны сайтов (URL patterns). Это напрямую влияет на способность системы эффективно реформулировать запросы пользователей, используя механизмы «Add Keywords» и «Trim Sites».
    • Учет задержки (Latency): Понимайте, что запросы, возвращающие низкокачественные результаты (по меркам конфигурации), могут запускать итеративный процесс повторной отправки. Это увеличивает время ответа (latency) для конечного пользователя.

    Worst practices (это делать не надо)

    • Интерпретация «Качества»: Ошибочно полагать, что Quality Estimator, описанный в патенте, имеет отношение к оценке E-E-A-T или Helpful Content в основном поиске Google.
    • Применение выводов к Web Search: Пытаться использовать описанные механизмы для влияния на ранжирование в основном веб-поиске. Патент описывает логику на стороне клиента (CSE), а не на стороне сервера (основной индекс).

    Стратегическое значение

    Патент подтверждает, что Google рассматривает специализированные поисковые продукты (CSE) как отдельные системы, которые взаимодействуют с основным индексом. Он демонстрирует инженерный подход к решению проблемы несоответствия результатов ожиданиям в рамках жестко заданной конфигурации. Стратегически это показывает важность механизмов автоматической реформулировки запросов для улучшения пользовательского опыта в нишевых поисковых продуктах.

    Практические примеры

    Практических примеров для SEO в основном поиске нет. Ниже приведен пример работы механизма в рамках Google Custom Search.

    Сценарий: Использование CSE на сайте медицинской библиотеки

    Конфигурация (Search Specification):

    • Сайты для включения: *.nih.gov, *.thelancet.com.
    • Дополнительные ключевые слова: «clinical trial».

    Процесс:

    1. Пользователь вводит запрос: «new treatments for asthma».
    2. Итерация 1 (First Pass): CSE отправляет запрос в Google. Quality Estimator определяет, что результатов недостаточно.
    3. Итерация 2 (Add Keywords): CSE автоматически модифицирует запрос: «new treatments for asthma clinical trial». Запрос отправляется повторно.
    4. Оценка: Результаты улучшились, но все еще не оптимальны.
    5. Итерация 3 (Trim Sites): CSE модифицирует запрос, явно ограничивая поиск: «new treatments for asthma clinical trial (site:nih.gov OR site:thelancet.com)». Запрос отправляется повторно.
    6. Результат: Quality Estimator признает этот набор результатов наилучшим, и он отображается пользователю.

    Вопросы и ответы

    Применяется ли этот патент к основному веб-поиску Google?

    Нет. Патент явно описывает Search Engine System, который является посредником между пользователем и основной Search Infrastructure. Эта архитектура соответствует кастомизируемым поисковым системам, таким как Google Custom Search Engine (CSE) или Programmable Search Engine, а не стандартному поиску Google.com.

    Что означает «Качество» (Quality) в контексте этого патента?

    «Качество» здесь не относится к E-E-A-T или качеству контента веб-страниц. Оно измеряет, насколько хорошо набор результатов соответствует конфигурации (Search Specification), заданной владельцем CSE. Также учитываются метрики эффективности: количество результатов, вычислительные затраты и задержка (latency).

    Что такое «Search Specification» и кто ее создает?

    Это конфигурационный файл, который определяет правила работы кастомизируемого поиска: какие сайты включать/исключать, какие ключевые слова добавлять к запросам, какие метки использовать для фильтрации. Ее создает «Разработчик» (Developer) — как правило, это владелец сайта или администратор, настраивающий CSE.

    Как именно система модифицирует запрос, если результаты плохие?

    Патент описывает итеративный процесс с предопределенными стратегиями. В приведенном примере используются две основные стратегии: 1) «Add Keywords» — добавление к запросу ключевых слов, указанных в конфигурации; 2) «Trim Sites» — добавление операторов site: для явного ограничения поиска по доменам из конфигурации.

    Влияет ли этот механизм на скорость поиска?

    Да, может влиять. Если первоначальные результаты признаны неприемлемыми, система запускает одну или несколько дополнительных итераций поиска (повторная отправка запроса). Это увеличивает общую задержку (latency), прежде чем пользователь увидит финальные результаты.

    Что такое Фильтр Блума (Bloom filter), упомянутый в патенте?

    Фильтр Блума — это эффективная структура данных для быстрой вероятностной проверки, принадлежит ли элемент множеству. В патенте он упоминается как способ реализации фильтра для проверки, входит ли URL результата в список разрешенных URL паттернов, заданных в Search Specification.

    Могу ли я использовать этот патент для улучшения ранжирования моего сайта в Google?

    Нет. Этот патент не описывает факторы ранжирования основного индекса Google. Он описывает только логику работы промежуточного слоя (CSE) по извлечению результатов из этого индекса в соответствии с заданной конфигурацией.

    Что происходит, если система не может найти приемлемые результаты даже после нескольких итераций?

    Патент предполагает, что процесс повторяется до тех пор, пока качество не станет приемлемым или пока не будут исчерпаны варианты модификации (система отслеживает количество итераций). В итоге система предоставит лучший набор результатов из всех выполненных итераций.

    Что означает, если результаты автоматически идентифицированы как «неприемлемые» (unacceptable)?

    Это означает, что Quality Estimator определил низкое соответствие результатов требованиям Search Specification. Например, было найдено слишком мало результатов, или большинство результатов не соответствуют заданным меткам/сайтам, или возникли проблемы с эффективностью (например, высокая частота ошибок фильтра).

    Какова роль «Разработчика» (Developer) в этой системе?

    Роль разработчика критична. Именно он определяет, что является «качественным» результатом для данной поисковой системы, предоставляя Search Specification. Описанный в патенте механизм направлен на то, чтобы максимально удовлетворить требования, заданные разработчиком.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.