
Google обрабатывает голосовые запросы, идентифицируя стандартный результат (ссылка и сниппет) и одновременно находя или синтезируя прямой ответ в форме законченного предложения. Этот ответ адаптируется под контекст пользователя (например, местоположение), конвертируется в аудиоформат и озвучивается вместе с отображением визуальной выдачи.
Патент решает проблему предоставления результатов поиска пользователям, которые используют голосовой ввод (Voice Query) и могут быть не в состоянии взаимодействовать с экраном устройства (например, во время вождения). Он улучшает пользовательский опыт, предоставляя прямой, озвученный ответ, что устраняет необходимость смотреть на экран, но при этом сохраняет доступ к визуальной выдаче для дальнейшего изучения.
Запатентована система для обработки голосовых запросов, которая идентифицирует и озвучивает прямой ответ. В ответ на запрос система находит не только стандартный результат (ссылку и сниппет), но и специфический Second Set of Text (Второй набор текста), который является ответом в форме законченного предложения (Complete Sentence Form). Ключевой особенностью, согласно формуле изобретения (Claims), является то, что этот ответ должен включать контекстуальные данные пользователя (Contextual Data). Система конвертирует этот текст в аудио и предоставляет его вместе с визуальными результатами.
Система работает следующим образом:
Textual Representation) и получает контекстуальные данные (например, местоположение) от устройства.First Set of Text) и прямой ответ (Second Set of Text).OneBox results или веб-страницы) или синтезируется, обязательно включая контекстуальные данные пользователя.Second Set of Text конвертируется в аудиоформат (Audible Version) с помощью Text-to-Speech (TTS).Высокая. С ростом популярности голосовых ассистентов (Google Assistant) и умных колонок, механизмы выбора, синтеза и озвучивания контента критически важны. Описанный процесс напрямую связан с тем, как Google формирует ответы для голосовой выдачи, что часто пересекается с механизмами Featured Snippets и использованием Knowledge Graph.
Патент имеет высокое влияние на SEO (8/10), особенно в области оптимизации под голосовой поиск и Featured Snippets. Он определяет критерии выбора контента для озвучивания (законченное предложение) и подчеркивает критическую важность контекстуализации (Local SEO), как того требуют Claims. Понимание этих механизмов необходимо для попадания в голосовую выдачу, что напрямую влияет на контент-стратегию.
Second Set of Text, конвертированный в звуковой формат. Это может быть аудиофайл (MP3, WAV), ссылка на сервис TTS или инструкции для синтеза речи на устройстве клиента.Second Set of Text. Текст должен представлять собой грамматически завершенный и самодостаточный ответ на запрос.Second Set of Text.Second Set of Text.Complete Sentence Form и включает Contextual Data. Это текст, выбранный для озвучивания. Он может быть извлечен, получен из структурированных данных или синтезирован.Анализ основан на ключевых независимых пунктах формулы изобретения (Claims 1, 7, 13, 17), которые определяют ядро изобретения.
Claim 1 и Claim 7 (Независимые пункты): Описывают процесс на стороне поисковой системы.
First Set of Text (сниппет) и Second Set of Text (ответ).Second Set of Text в аудиоверсию.Second Set of Text ДОЛЖЕН включать контекстуальные данные (Contextual Data), сгенерированные клиентским устройством.Ядром изобретения является не просто озвучивание сниппета, а генерация или выбор ответа, который динамически адаптирован под контекст пользователя (например, его местоположение или время). Это подразумевает синтез ответа на лету.
Claim 13 и Claim 17 (Независимые пункты): Описывают процесс на стороне клиентского устройства.
Contextual Data устройства) и его аудиоверсию.Claim 5 и Claim 21 (Зависимые пункты): Уточняют источники Second Set of Text.
designated location) документа (Claim 5).First Set of Text (сниппета), если он распознан как полный ответ (Claim 21).Изобретение затрагивает несколько этапов поиска, фокусируясь на генерации контекстуализированного ответа и его доставке.
QUNDERSTANDING – Понимание Запросов
На этом этапе голосовой запрос конвертируется в текст. Система также получает и обрабатывает Contextual Data (время, местоположение) с устройства, что критически важно для выполнения требований Claims.
INDEXING / RANKING – Индексирование и Ранжирование
Система ищет релевантные документы и извлекает потенциальные ответы. Это включает поиск в веб-индексе и структурированных базах данных (для OneBox Results). Происходит извлечение признаков (Feature Extraction) для идентификации законченных предложений.
METASEARCH / RERANKING – Метапоиск и Переранжирование
Основной этап применения патента. Здесь финализируется Second Set of Text. Он может быть извлечен или синтезирован с использованием Contextual Data. Затем система выполняет конвертацию текста в аудио (TTS) и формирует финальный ответ (Second Document), упаковывая визуальные и аудио компоненты.
Входные данные:
Contextual Data с устройства пользователя (местоположение, время).Выходные данные:
First Set of Text, Second Set of Text (с учетом контекста) и Audible Version (аудиофайл, ссылка или инструкции TTS).Contextual Data (местоположения) в ответ (Claims).Featured Snippets и OneBox results, так как они служат основным источником для озвучивания.Voice Query).Second Set of Text, который соответствует критериям Complete Sentence Form и может корректно включать Contextual Data.Этап 1: Ввод и предварительная обработка (Клиент/Сервер)
Textual Representation (на устройстве или на сервере).Contextual Data (например, местоположение) передаются в поисковую систему.Этап 2: Поиск и генерация ответа (Сервер)
First Set of Text (стандартный сниппет).OneBox result из структурированных данных.Contextual Data пользователя.Этап 3: Формирование и доставка ответа (Сервер)
Second Set of Text конвертируется в Audible Version. Это может быть генерация аудиофайла, формирование ссылки на TTS-сервис или добавление специальных HTML-атрибутов для TTS на клиенте.Этап 4: Вывод результата (Клиент)
Audible Version воспроизводится через динамик (автоматически или по запросу).First Set of Text). Они анализируются для извлечения или валидации ответа.designated location) (Claim 5).OneBox results).Contextual Data (время и местоположение). Эти данные критически важны, так как Claims требуют их включения в озвучиваемый ответ.Патент не детализирует метрики ранжирования, но определяет критерии для Second Set of Text:
Contextual Data.Методы идентификации/генерации ответа:
Contextual Data), что сильно поддерживается формулировкой Claims.Complete Sentence Form). Это фундаментальное требование для выбора Second Set of Text.Contextual Data пользователя. Это означает, что система не просто зачитывает статический текст, а синтезирует или выбирает ответ, динамически адаптированный под контекст (например, локализацию).OneBox), извлечен из сниппета или определенного места на странице (designated location), или синтезирован системой на лету.Second Set of Text тесно связан с Featured Snippets. Необходимо создавать краткие (40-60 слов), четкие ответы на популярные вопросы, сформулированные в виде законченного предложения.<p>, <li>). Это помогает системе идентифицировать Complete Sentence Response.Contextual Data (местоположения), критически важно иметь сильные локальные сигналы. Информация (часы работы, адрес) должна быть актуальной и легко сопоставляемой с местоположением пользователя для синтеза локализованного ответа.OneBox results и облегчения извлечения фактов, необходимых для синтеза контекстуализированных ответов.Contextual Data.Патент подтверждает стратегический сдвиг в сторону предоставления прямых, контекстуализированных ответов пользователям, особенно в контексте голосового взаимодействия. Доминирование в «нулевой позиции» (Position Zero / Featured Snippets) становится ключевым элементом стратегии. Патент также подчеркивает слияние Local SEO и контент-стратегии, делая адаптацию под контекст пользователя неотъемлемой частью генерации голосового ответа.
Сценарий: Оптимизация страницы локального бизнеса для голосового ответа с учетом контекста.
LocalBusiness, openingHoursSpecification).Second Set of Text, используя данные сайта и контекст пользователя: "Магазин [Название Магазина] рядом с вами сегодня работает до 21:00."Audible Version и озвучивает пользователю, предоставляя ссылку на источник.Что такое "Second Set of Text" и почему это важно для SEO?
Second Set of Text — это фрагмент текста, который система идентифицирует как прямой ответ на голосовой запрос в форме законченного предложения (Complete Sentence Form). Это критически важно для SEO, поскольку именно этот текст конвертируется в аудио и озвучивается пользователю. Завоевание этой позиции (часто называемой Позиция Ноль) обеспечивает максимальную видимость в голосовом поиске.
Означает ли этот патент, что Google синтезирует ответы, а не просто зачитывает текст с сайта?
Да, патент явно указывает на возможность синтеза ответа. Более того, требование Claims о включении Contextual Data пользователя (например, местоположения) в ответ подразумевает, что система часто должна синтезировать финальное предложение на лету, комбинируя извлеченные данные с контекстом пользователя, а не просто зачитывать статичный текст со страницы.
Как требование о "Contextual Data" влияет на SEO стратегию?
Это требование радикально повышает важность Local SEO и создания контента, адаптированного под локальный интент. Стратегия должна фокусироваться на предоставлении информации, которая может быть корректно синтезирована с учетом текущего местоположения и времени пользователя. Это делает адаптацию под контекст неотъемлемой частью оптимизации под голосовой поиск.
Как этот патент связан с Featured Snippets (Блоками с ответами)?
Существует прямая связь. Требования к Second Set of Text практически идентичны критериям выбора контента для Featured Snippets. Оптимизация под Featured Snippets является лучшей стратегией для попадания в голосовую выдачу, так как они часто служат источником для озвучивания.
Какие источники Google использует для генерации озвучиваемых ответов?
Патент описывает несколько источников: экстракция текста непосредственно с релевантной веб-страницы (из сниппета или «обозначенного места» - designated location), структурированные базы данных (OneBox results, Knowledge Graph), а также синтез ответа на лету с использованием контекстуальных данных.
Как оптимизировать контент, чтобы он стал источником для голосового ответа?
Необходимо фокусироваться на ясности и структуре. Формулируйте ответы в виде законченных предложений (оптимально 40-60 слов). Используйте формат Вопрос-Ответ. Размещайте ключевую информацию в начале документа (designated location) и внедряйте микроразметку Schema.org.
Упоминает ли патент конкретные HTML-атрибуты для обозначения текста для озвучивания?
Патент упоминает возможность использования предопределенных HTML-атрибутов для маркировки текста, который должен быть конвертирован в аудио. Также он упоминает, что система может выбирать текст из «обозначенных мест» (designated locations) на странице (Claim 5), что подчеркивает важность структурной оптимизации.
Как технически Google передает аудио ответ на устройство?
Патент предлагает три варианта: 1) Генерация аудиофайла (например, MP3) на сервере и его передача в HTML. 2) Передача гиперссылки на сервис, который генерирует аудио на лету (TTS-сервис). 3) Добавление специальных HTML-атрибутов к тексту, которые инструктируют браузер пользователя самостоятельно выполнить преобразование текста в речь.
Какое значение имеют структурированные данные (Schema.org) в контексте этого патента?
Структурированные данные имеют высокое значение. Они помогают системе извлекать факты и понимать контекст информации на странице. Поскольку патент упоминает OneBox results и синтез ответов, наличие разметки облегчает Google использование вашего контента для формирования точных и контекстуально релевантных голосовых ответов.
Применяется ли этот механизм только к мобильным устройствам?
Нет. Хотя мобильные устройства часто упоминаются в примерах (например, вождение), технология применима к любому устройству (client device), способному принимать голосовой ввод и воспроизводить аудио, включая ПК, планшеты и умные колонки.

Семантика и интент
SERP

Семантика и интент

Семантика и интент
Персонализация

Персонализация
Семантика и интент
Поведенческие сигналы

SERP
Семантика и интент
Поведенческие сигналы

Семантика и интент
Индексация
Структура сайта

Мультимедиа
Поведенческие сигналы
SERP

Ссылки
EEAT и качество
Свежесть контента

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
SERP
Персонализация

Local SEO
Ссылки
SERP

Семантика и интент
Поведенческие сигналы
Local SEO

Ссылки
SERP
Поведенческие сигналы

Антиспам
Ссылки
SERP
