Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google переписывает и маршрутизирует естественно-языковые запросы в специализированные поисковые движки для генерации прямых ответов

    REFORMATTING QUERIES FOR SEARCH ENGINES AND DATA REPOSITORIES (Переформатирование запросов для поисковых систем и репозиториев данных)
    • US20160140228A1
    • Google LLC
    • 2016-05-19
    • 2013-02-27
    2013 Патенты Google Семантика и интент

    Google использует систему для обработки запросов на естественном языке (например, голосовых). Она определяет тематическую область запроса (домен), выбирает наиболее подходящий специализированный поисковый движок или базу данных и переформатирует исходный запрос в оптимизированный структурированный вид. Цель — повысить точность и сгенерировать единственный прямой ответ (single result).

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неэффективности обработки свободных (freeform) или естественно-языковых (natural-language) запросов, которые часто поступают от персональных ассистентов или через голосовой ввод. Такие запросы могут быть неоптимальными для стандартных поисковых систем или специализированных баз данных (data repositories). Изобретение улучшает точность поиска, преобразуя разговорный язык в структурированные, оптимизированные для конкретного движка запросы (search-engine-friendly query).

    Что запатентовано

    Запатентована система переформатирования запросов. Она идентифицирует тематическую область (domain) и структуру (pattern) входящего запроса, выбирает оптимальную специализированную поисковую систему или репозиторий (back-end server) для этой области и переписывает запрос, используя специфичные для этой системы правила (set of rules). Конечная цель, согласно патенту, — сгенерировать единственный точный ответ (single result).

    Как это работает

    Система работает как интеллектуальный препроцессор и маршрутизатор запросов:

    • Анализ и Переписывание: Используя Rewrite Engine, система извлекает сущности (entities), действия (actions) и атрибуты (attributes), удаляет стоп-слова и добавляет контекст (локацию, время).
    • Распознавание и Маршрутизация: Распознается предопределенный паттерн запроса, определяется его domain (например, спорт, кино, финансы). Система выбирает лучший специализированный движок для этого домена.
    • Переформатирование: Запрос адаптируется под специфический синтаксис и правила выбранного движка.
    • Генерация ответа: Полученные результаты анализируются для извлечения single result.

    Актуальность для SEO

    Высокая. С ростом популярности голосового поиска, персональных ассистентов и систем прямых ответов (Answer Engines), обработка естественно-языковых запросов является критически важной задачей. Этот патент описывает фундаментальный механизм для этапа Query Understanding, включающий классификацию интента, извлечение сущностей и маршрутизацию запросов в соответствующие вертикали или базы знаний (например, Knowledge Graph).

    Важность для SEO

    Патент имеет высокое стратегическое значение (75/100), особенно для SEO под голосовой поиск и оптимизации под системы ответов (AEO). Он демонстрирует, что ранжирование часто происходит не по исходному запросу пользователя, а по его переписанной, структурированной версии, направленной в специализированный индекс. Это подчеркивает критическую важность точного определения сущностей, использования структурированных данных и соответствия контента распознаваемым паттернам запросов для генерации прямых ответов.

    Детальный разбор

    Термины и определения

    Domain (Домен)
    Тематическая область или предметная область запроса (например, кино, спорт, шопинг, карты, финансы).
    Entity, Action, Attribute (Сущность, Действие, Атрибут)
    Компоненты, извлекаемые из запроса с помощью обученной модели (trained learner) для структурирования запроса в формат, например, [сущность, действие, атрибут].
    Language Conversions (Языковые преобразования)
    Замена разговорных идиом на прямой язык или идиомы, специфичные для домена (например, «покажи мне путь» заменяется на «Directions:»).
    Natural Language Query (Естественно-языковой запрос)
    Запрос, введенный пользователем в свободной разговорной форме, часто через голосовой ввод.
    Pattern (Паттерн)
    Распознаваемая предопределенная структура запроса. Часто описывается в формате [сущность: специфический атрибут], например, [название компании: цена акции].
    Proper Name (Официальное название)
    Точное и полное (каноническое) название сущности, хранящееся в репозитории (например, «New York Yankees» вместо «Yanks»).
    Reformat Engine (Механизм переформатирования)
    Компонент, управляющий процессом: определение домена, выбор поисковой системы и применение специфических правил переформатирования для выбранного движка.
    Refinement Information (Информация об уточнениях)
    Данные о том, как пользователи уточняют свои запросы в последующих поисковых сессиях (цепочки уточнений). Используется для проактивного улучшения переписывания запросов.
    Rewrite Engine (Механизм переписывания)
    Компонент, преобразующий естественный запрос в оптимизированный формат. Выполняет удаление стоп-слов, замену идиом, добавление контекста (локация, время), извлечение и нормализацию сущностей.
    Search System / Back-end Server (Поисковая система / Бэкенд-сервер)
    Конкретная специализированная поисковая система или репозиторий данных (например, вертикаль поиска или Knowledge Graph), куда направляется переформатированный запрос.
    Single Result (Единственный результат)
    Точный ответ, сгенерированный системой путем анализа результатов поиска на соответствие исходному паттерну запроса. Часто предоставляется визуально или аудиально.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод обработки запроса для генерации прямого ответа через специализированную систему.

    1. Получение запроса от клиентского устройства.
    2. Определение предопределенного паттерна (predefined pattern), которому удовлетворяет запрос. Паттерн включает сущность (entity) и атрибуты (attributes).
    3. Сопоставление паттерна с конкретным доменом (domain) с использованием индекса.
    4. Выбор конкретной поисковой системы (particular search engine) из множества различных поисковых систем на основе домена.
    5. Переформатирование запроса специально для выбранной поисковой системы на основе ее набора правил (set of rules).
    6. Отправка переформатированного запроса и получение результатов.
    7. Анализ результатов поиска с использованием определенного паттерна для генерации *единственного результата* (single result), релевантного запросу.
    8. Предоставление этого single result клиентскому устройству.

    Ядро изобретения — это интеллектуальная маршрутизация запроса на основе распознанного паттерна в специализированную систему и адаптация запроса под ее специфические требования с конечной целью генерации прямого ответа (single result).

    Claim 4 (Зависимый): Уточняет, что переписывание может основываться на идентификации языковых преобразований (language conversions) — замене разговорных идиом на формальные термины.

    Claim 6 (Зависимый): Уточняет, что single result может быть предоставлен в аудиоформате, что критично для голосовых ассистентов.

    Claim 19 (Зависимый): Добавляет шаг нормализации сущности: ассоциирование определенной сущности с ее официальным названием (proper name) и переписывание запроса на основе этого официального названия.

    Где и как применяется

    Изобретение применяется преимущественно на этапе обработки входящего запроса, функционируя как интеллектуальный маршрутизатор и оптимизатор.

    QUNDERSTANDING – Понимание Запросов
    Это основной этап применения патента. Rewrite Engine и Reformat Engine работают здесь, выполняя анализ естественного языка, извлечение сущностей и атрибутов, распознавание паттернов, определение домена и обогащение запроса контекстом (время, местоположение).

    METASEARCH – Метапоиск (Маршрутизация / Triggering)
    Система определяет, какую именно специализированную поисковую систему (вертикаль, базу данных или Knowledge Graph) следует задействовать для ответа на запрос. Это процесс выбора источника данных.

    RERANKING (Генерация ответа)
    На финальном этапе полученные результаты анализируются на соответствие исходному интенту (распознанному паттерну) для генерации single result.

    Входные данные:

    • Исходный Natural Language Query.
    • Контекстуальные данные с клиентского устройства (локация, время).
    • Базы данных паттернов, сущностей (proper names), языковых преобразований и правил форматирования.
    • Исторические данные о поведении пользователей (Refinement Information).

    Выходные данные:

    • Переформатированный запрос, оптимизированный для конкретного Back-end Server.
    • Single result (прямой ответ), предоставленный пользователю.

    На что влияет

    • Специфические запросы: Наибольшее влияние на информационные запросы, ищущие конкретные факты (цены, даты, расписания), локальные запросы («рядом со мной») и голосовые запросы к ассистентам.
    • Конкретные ниши или тематики: Влияет на ниши с хорошо структурированными данными, где существуют четкие сущности и атрибуты: финансы, спорт, погода, кино, локальный бизнес, путешествия.
    • Типы контента: Повышает значимость структурированного контента (например, с микроразметкой), который может быть использован для генерации single result.

    Когда применяется

    • Триггеры активации: Получение запроса на естественном языке, особенно через голосовой ввод или интерфейс ассистента.
    • Условия работы: Когда система распознает в запросе predefined pattern или entity, которые можно сопоставить с конкретным domain и для которых существует специализированный поисковый движок с известным set of rules.

    Пошаговый алгоритм

    Процесс обработки запроса с использованием Reformat/Rewrite Engines:

    Этап 1: Переписывание и Обогащение (Rewrite Engine)

    1. Получение запроса и контекста: Система принимает Natural Language Query и данные устройства (GPS, время).
    2. Нормализация: Удаление стоп-слов и элементов речи.
    3. Дополнение контекстом: Замена имплицитных ссылок на явные данные. Например, «погода завтра» переписывается с указанием точной локации и даты.
    4. Применение языковых преобразований: Замена разговорных идиом на доменные термины (domain idiom). Например, «покажи мне путь» заменяется на «Directions».
    5. Использование данных об уточнениях: Применение refinement information для замены простого запроса на более точный.

    Этап 2: Структурирование и Классификация

    1. Извлечение компонентов: Использование обученной модели (trained learner) для извлечения Entity, Action и Attribute.
    2. Нормализация сущности: Поиск официального названия (proper name) сущности в репозитории. Например, замена «Yanks» на «New York Yankees».
    3. Распознавание паттерна: Идентификация структуры запроса (например, [sports team: schedule: date]).
    4. Идентификация домена: Сопоставление паттерна с тематической областью (например, «Sports»).

    Этап 3: Маршрутизация и Переформатирование (Reformat Engine)

    1. Выбор поисковой системы: Определение оптимального Back-end Server для домена.
    2. Переформатирование: Применение специфических правил (set of rules) выбранного сервера. Например, изменение формата даты или использование аббревиатур, принятых на этом конкретном сервере.

    Этап 4: Выполнение и Ответ

    1. Выполнение поиска: Отправка финального запроса в выбранную систему.
    2. Генерация ответа: Анализ результатов на соответствие исходному паттерну и генерация single result в нужном формате (визуальный/аудио).

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст исходного запроса.
    • Пользовательские и Географические факторы (Client device knowledge): Активно используются данные с клиентского устройства: текущая локация (GPS), дата и время. Они применяются для преобразования имплицитных ссылок в явные. Также упоминается возможность использования персональных данных (например, контактов).
    • Поведенческие факторы: Refinement information — исторические данные о цепочках запросов, которые пользователи используют для уточнения поиска. Используются для обучения Rewrite Engine и определения паттернов.

    Какие метрики используются и как они считаются

    Патент фокусируется на качественных преобразованиях и классификации, а не на количественных метриках ранжирования.

    • Алгоритмы машинного обучения (NLP): Используется обученный классификатор (trained learner) для извлечения Entity, Action и Attribute из текста запроса.
    • Распознавание паттернов (Pattern Recognition): Сопоставление структуры запроса с базой данных predefined patterns.
    • Нормализация сущностей: Определение канонического имени (proper name) с помощью репозитория сущностей.
    • Индексы и Репозитории: Система полагается на заранее созданные базы данных:
      • Индекс соответствия паттернов/сущностей и доменов.
      • Индекс поисковых систем, ассоциированных доменов и их правил (set of rules).
      • Репозиторий языковых преобразований (идиом).

    Выводы

    1. Фундаментальная роль Query Understanding: Патент демонстрирует сложный, многоступенчатый процесс интерпретации, обогащения и полного переписывания запроса, который происходит до этапа ранжирования.
    2. Паттерны и Сущности как ядро запроса: Идентификация Entity, Action, Attribute и распознавание Patterns (обычно Сущность-Атрибут) являются критически важными для определения интента и дальнейшей обработки.
    3. Интеллектуальная маршрутизация (Query Routing): Система часто не использует общий веб-индекс. Она определяет domain и направляет запрос в специализированный движок (вертикаль поиска или базу данных), оптимизируя синтаксис запроса под этот конкретный движок.
    4. Цель — единственный точный ответ (AEO): Ключевое утверждение в Claim 1 подчеркивает цель системы — сгенерировать single result. Это основа работы голосовых ассистентов и систем прямых ответов (Answer Engines).
    5. Контекст пользователя критичен: Локация, время и дата пользователя активно используются для уточнения и обогащения запроса, делая имплицитные ссылки явными.
    6. Ранжирование происходит по переписанному запросу: Поисковая система ранжирует контент по оптимизированной, структурированной версии запроса, которая может значительно отличаться от исходной формулировки пользователя.

    Практика

    Best practices (это мы делаем)

    • Фокус на оптимизации под Сущности (Entity Optimization): Убедитесь, что ключевые сущности вашего бизнеса (бренды, продукты, персоны, локации) представлены на сайте с использованием четких, официальных названий (proper name). Это поможет Rewrite Engine корректно идентифицировать и нормализовать сущность.
    • Структурирование данных под Паттерны Запросов: Анализируйте распространенные паттерны запросов в вашей нише (например, [продукт: цена], [событие: дата]). Организуйте контент и используйте микроразметку (Schema.org) так, чтобы система могла легко извлечь атрибуты, соответствующие этим паттернам (Entity-Attribute pairs).
    • Оптимизация под Answer Engine (AEO): Создавайте контент, который дает четкий, лаконичный и фактологически точный ответ на естественно-языковые вопросы. Поскольку система стремится извлечь single result, наличие готового ответа повышает шансы попасть в блоки с ответами или быть озвученным голосовым ассистентом.
    • Актуальность данных для Локального SEO: Поскольку контекст локации (GPS) активно используется для переписывания запросов типа «рядом», поддержание точных и полных данных в Google Business Profile критически важно для корректной обработки локальных запросов.

    Worst practices (это делать не надо)

    • Использование жаргона и неоднозначных названий: Если название вашего бренда или продукта использует разговорные формы или жаргон, Rewrite Engine может не распознать его как целевую сущность или не сможет найти соответствующее proper name.
    • Игнорирование интента за естественным языком: Оптимизация страниц под точное вхождение длинных естественно-языковых запросов малоэффективна. Система перепишет запрос в структурированный вид (например, извлечет сущность и атрибут). Нужно оптимизировать под итоговую структурированную версию.
    • Пренебрежение структурированными данными: Отсутствие микроразметки для ключевых атрибутов (цены, даты, характеристики) усложняет для системы задачу извлечения single result, соответствующего распознанному паттерну.

    Стратегическое значение

    Патент подтверждает стратегический приоритет семантического поиска, основанного на сущностях (Entity-based SEO) и структурированных данных. Этот механизм является основой для понимания того, как работают голосовой поиск и системы прямых ответов. Долгосрочная SEO-стратегия должна быть направлена на то, чтобы стать надежным источником структурированной информации в своем домене, помогая Google легко идентифицировать сущности, их атрибуты и соответствие паттернам запросов.

    Практические примеры

    Сценарий: Оптимизация страницы рецепта для голосового поиска

    1. Исходный запрос пользователя (Голос): «Сколько времени готовится лазанья Болоньезе?».
    2. Анализ системой (по патенту):
      • Rewrite Engine извлекает Сущность: «лазанья Болоньезе» (нормализуется); Атрибут: «время приготовления».
      • Распознается Паттерн: [Recipe: Cooking Time].
      • Определяется Домен: Cooking/Recipes.
      • Запрос маршрутизируется в специализированную базу данных рецептов.
    3. Действия SEO-специалиста: На странице рецепта внедрена микроразметка Schema.org/Recipe с четко заполненным полем cookTime. Текст структурирован для легкого извлечения этого атрибута.
    4. Ожидаемый результат: Система легко извлекает значение атрибута из вашего сайта и генерирует single result (прямой ответ в выдаче или голосовой ответ ассистента): «Время приготовления лазаньи Болоньезе составляет 1 час 30 минут».

    Вопросы и ответы

    Что такое «Domain» (Домен) в контексте этого патента и как он определяется?

    Домен — это тематическая область запроса, например, «Кино», «Спорт», «Покупки», «Финансы». Он определяется путем анализа запроса на наличие известных сущностей (entities) или предопределенных паттернов (predefined patterns). Система использует индекс, который связывает конкретные паттерны (например, [Команда: Расписание]) с соответствующими доменами (например, Спорт). Это необходимо для выбора наиболее подходящей специализированной поисковой системы.

    Что конкретно делает Rewrite Engine?

    Rewrite Engine преобразует естественный язык в оптимизированный формат. Он выполняет несколько задач: удаляет стоп-слова; заменяет разговорные идиомы на формальные термины (например, «покажи путь» на «Directions»); добавляет контекст, заменяя имплицитные ссылки (например, «завтра») на явные (точная дата и локация); извлекает и нормализует сущности.

    Что означает генерация «single result» (Единственный результат), упомянутая в Claim 1?

    Это означает, что конечная цель системы — не предоставить список из 10 ссылок, а сгенерировать один точный, релевантный ответ на вопрос пользователя. Система анализирует результаты поиска на соответствие исходному паттерну и извлекает нужный факт. Это механизм работы блоков с ответами (Featured Snippets) и ответов голосовых ассистентов.

    Что такое «паттерн запроса» и почему он важен для SEO?

    Паттерн — это распознаваемая структура запроса, обычно в формате [Сущность: Атрибут], например, [Фильм: Дата выхода]. Распознавание паттерна позволяет системе понять точный интент. Для SEO это означает, что контент должен быть структурирован (включая микроразметку) так, чтобы четко предоставлять атрибуты для ключевых сущностей, облегчая системе извлечение single result.

    Как система определяет официальное название сущности (proper name)?

    После извлечения сущности Rewrite Engine обращается к репозиторию (например, Knowledge Graph), чтобы найти ее каноническое название. Например, если пользователь сказал «Yanks», система заменит ее на «New York Yankees». Это подчеркивает важность использования официальных, полных названий брендов и продуктов в SEO.

    Влияет ли этот патент на локальный поиск?

    Да, очень сильно. Патент прямо указывает на использование данных GPS с устройства пользователя для переписывания запросов. Имплицитные локальные запросы (например, «Где купить ботинки рядом?») переписываются с добавлением точной локации пользователя. Это делает сигналы локального SEO и точность данных в GBP критически важными.

    Означает ли это, что оптимизация под длинные (long-tail) естественно-языковые запросы бесполезна?

    Оптимизация под точное вхождение таких запросов неэффективна, так как запрос будет полностью переписан и структурирован. Однако оптимизация под *интент*, выраженный в этих запросах, становится еще более важной. Нужно фокусироваться на предоставлении ответов, соответствующих паттернам и сущностям, которые система извлекает из этих длинных запросов.

    Использует ли система данные других пользователей для переписывания моего запроса?

    Да, патент упоминает использование refinement information — данных о том, как другие пользователи уточняли похожие запросы. Если многие пользователи после запроса А вводят запрос Б (уточнение), система может научиться сразу переписывать запрос А в запрос Б, чтобы быстрее предоставить более точные результаты.

    Где происходит переформатирование – на устройстве пользователя или на сервере Google?

    Патент описывает оба варианта. Переформатирование может происходить на стороне клиента (например, в приложении ассистента на смартфоне), что позволяет использовать контекст устройства (GPS, контакты). Также оно может происходить на стороне сервера на ранних этапах обработки поиска.

    Использует ли система машинное обучение для этого процесса?

    Да. В патенте упоминается использование trained learner (обученного классификатора). Этот компонент машинного обучения используется для анализа текста запроса и извлечения из него ключевых компонентов: Сущностей (Entities), Действий (Actions) и Атрибутов (Attributes). Также Rewrite Engine может быть построен с использованием ML-техник.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.