
Система Google для анализа информации, захваченной из различных источников (вводимый текст, изображения документов, аудиопотоки) в реальном времени. Система автоматически распознает контент, выделяет ключевые фрагменты, формирует поисковые запросы и мгновенно предоставляет пользователю релевантный цифровой контент или связанные действия без явных запросов. Это механизм, лежащий в основе технологий визуального (Lens) и голосового поиска.
Патент решает задачу устранения разрыва между информацией, которую пользователь потребляет в данный момент (читает, пишет или слышит), и связанным с ней цифровым контентом. Он автоматизирует процесс поиска, устраняя необходимость для пользователя вручную формулировать запросы. Система позволяет устройствам становиться «осведомленными» (aware) об окружающей информации (физической, звуковой, текстовой) и проактивно предоставлять дополнительный контент в реальном времени.
Запатентована система и метод для автоматического предоставления контента на основе информации, захваченной в реальном времени. Система способна отслеживать ввод пользователя (набираемый текст) или захватывать информацию из окружающей среды (оптический захват с rendered document, захват audio stream). Суть изобретения заключается в автоматическом анализе этого ввода, формировании запроса (query construction) и поиске соответствующего цифрового контента или действий, которые затем предоставляются пользователю.
Ключевой механизм заключается в непрерывном мониторинге и обработке входящей информации для запуска поиска:
Speech-to-text для аудио) для извлечения текста или сигнатур.markup) – дополнительные данные или функциональность (например, реклама, действия).Критически высокая. Патент описывает основополагающие механизмы для технологий мультимодального поиска, таких как Google Lens (визуальный поиск), и проактивных ассистентов (Google Assistant). Автоматическая генерация запросов на основе визуальной и звуковой информации является стратегическим направлением развития поиска и AI в 2025 году.
Патент имеет высокое стратегическое значение для SEO (8.5/10). Он не описывает алгоритмы ранжирования, но определяет, как поиск инициируется вне традиционной поисковой строки. Это фундаментально для понимания визуального и голосового поиска. SEO-специалистам необходимо адаптироваться к тому, что запросы генерируются автоматически из окружающей среды, что требует оптимизации контента для распознавания сущностей и доступности во всех модальностях (текст, аудио, изображение).
Speech-to-text.user and account info) и контекст захвата (context engines) для повышения релевантности.Actions).Анализ основан на Abstract и Detailed Description патента, которые описывают ключевые процессы изобретения.
Ключевой процесс 1 (Основа для Claims о вводе текста, например, Claim 1): Описывает метод автоматического предоставления информации, релевантной вводимому тексту в приложении.
Ядро изобретения здесь — это проактивный поиск в реальном времени, интегрированный в среду потребления/создания контента, работающий без явного запроса пользователя.
Ключевой процесс 2 (Основа для Claims о захвате из документа, например, Claim 8): Описывает метод для захвата информации из отображаемого документа (визуальный поиск).
rendered document с помощью устройства захвата (например, камеры).Ключевой процесс 3 (Основа для Claims об аудио, см. FIG. 11, 12): Описывает аналогичный процесс для аудиопотоков.
Изобретение описывает интерфейс и механизмы инициирования поиска, затрагивая преимущественно начальные этапы взаимодействия пользователя с поисковой системой.
CRAWLING & INDEXING
Система полагается на существующие indices & search engines. Контент должен быть проиндексирован, чтобы его можно было найти через этот механизм. Также может индексироваться markup (связанные действия/данные).
QUNDERSTANDING – Понимание Запросов
Ключевая область применения. Система выполняет распознавание (Text Recognition) из мультимодальных источников (изображение, аудио, текст) и автоматически осуществляет Query Construction. Это включает выбор ключевых фрагментов из потока информации. Также применяется Context Analysis, использующий данные о пользователе и контексте захвата для уточнения запроса и выбора подходящего индекса.
RANKING & METASEARCH
Система инициирует поиск (Search) и получает результаты ранжирования. Она также выполняет Markup Analysis для определения дополнительного контента или действий (Actions), которые следует представить пользователю, что является формой смешивания результатов или пост-обработки.
Входные данные:
user and account info).Выходные данные:
Actions, Markup).while the text is being captured). Система постоянно анализирует поток и генерирует запросы без явной команды пользователя, как только распознает значимый фрагмент.Обобщенный алгоритм работы системы (на основе FIG. 1A и описания):
Система использует широкий спектр входных данных и контекстуальную информацию:
rendered documents или объектов. Аудиопотоки (живая речь, записи).user and account info), история предыдущих захватов и действий. Используются для персонализации и анализа контекста.Патент фокусируется на процессе извлечения информации и инициирования поиска, а не на метриках ранжирования. Конкретные формулы не указаны. Основные механизмы обработки включают:
Query Construction. Это требует глубокого понимания контекста и намерений.Context Analysis, использующий данные пользователя и окружающей среды, является неотъемлемой частью для правильной интерпретации захваченной информации и выбора релевантного индекса.Markup позволяет связывать дополнительную функциональность (покупки, бронирования, рекламу) непосредственно с захваченной информацией.Speech-to-text и проиндексировать содержание.Context Analysis использует местоположение, поддержание актуальной информации в Google Business Profile критично для локального бизнеса. Это гарантирует, что при визуальном захвате вывески или упоминании бизнеса в разговоре система предоставит корректные данные.Markup).Этот патент имеет фундаментальное значение для понимания эволюции поиска от реактивного к проактивному и основанному на окружающей среде (Ambient Search). Он закладывает основу мультимодального поиска. Стратегически, SEO-специалисты должны перейти от оптимизации страниц к оптимизации сущностей и их представлений во всех форматах. Долгосрочная стратегия должна быть направлена на обеспечение максимальной доступности и понятности информации для систем ИИ, которые "смотрят" и "слушают" мир от имени пользователя.
Сценарий 1: Оптимизация для визуального обнаружения (E-commerce / Google Lens)
Product с GTIN. Убедиться, что текст на упаковке (бренд, модель) соответствует тексту на сайте.Capture и Text Recognition (OCR текста на упаковке) или распознавание объекта. Формируется запрос (Query Construction). Система идентифицирует продукт в индексе и использует Markup Analysis для предложения действия "Купить" (Action).Сценарий 2: Оптимизация контента для захвата из аудио (Подкаст/Лекция)
DefinedTerm. Предоставить транскрипт лекции.Capture), применяет Speech-to-text, идентифицирует термин, формирует запрос. Context Analysis помогает понять образовательное намерение.Является ли этот патент описанием Google Lens или Google Assistant?
Патент описывает общую инфраструктуру и методы, которые лежат в основе таких технологий. Он предоставляет фреймворк для захвата визуальной информации (как в Lens) и аудиоинформации (как в Assistant), их преобразования в запросы и проактивного предоставления результатов. Это фундаментальное описание того, как устройство может стать «осведомленным» об окружающей информации.
Влияет ли этот патент напрямую на алгоритмы ранжирования в поиске Google?
Нет, патент не описывает, как ранжируются результаты поиска. Он фокусируется на том, как инициируется поиск из нетрадиционных источников ввода (визуальных, аудио, вводимого текста) в реальном времени. Он полагается на существующие поисковые системы для фактического ранжирования, но определяет новый механизм доступа к ним.
Какое значение имеет концепция "Markup" (Разметка) для SEO?
Markup относится к дополнительным данным или функциональности, связанным с контентом (например, реклама, действия, аннотации). Для SEO это подчеркивает важность структурированных данных (Schema.org) и интеграции с Google Actions. Предоставление четкой разметки позволяет системе не только находить ваш контент, но и предлагать пользователям конкретные действия (купить, забронировать), что критично для конверсии.
Как оптимизировать контент для системы, которая захватывает аудиопотоки?
Ключевым моментом является преобразование речи в текст. Чтобы оптимизировать аудиоконтент (подкасты, видео), необходимо обеспечить высокое качество звука для лучшего распознавания речи и обязательно предоставлять точные транскрипты. Это позволяет системе корректно индексировать содержание аудио и сопоставлять его с захваченными аудиофрагментами.
Что такое "Rendered Document" в понимании этого патента?
Термин используется очень широко. Это не только печатный документ, но и любой физический объект, предоставляющий информацию, воспринимаемую человеком. Сюда входят экраны компьютеров, билборды, знаки, а также аудио- и видеопотоки. Все это рассматривается как потенциальный источник для захвата информации.
Как система обеспечивает релевантность, если запросы генерируются автоматически?
Релевантность обеспечивается за счет комбинации точного распознавания (OCR/Speech-to-Text), глубокого понимания языка для выбора ключевых терминов при Query Construction и использования обширного контекстного анализа (Context Analysis). Контекст помогает сузить область поиска и предоставить наиболее подходящий результат.
Что означает обработка "в реальном времени" в этом патенте?
Это означает, что система не ждет завершения захвата или команды пользователя. Как описано в патенте, система проактивно анализирует входящий поток данных (например, по мере набора текста или поступления аудио) и начинает процесс поиска и предоставления результатов немедленно.
Может ли эта система работать офлайн?
Патент упоминает возможность локального кэширования индекса для повышения производительности или использования в офлайн-режиме. Это предполагает, что часть функциональности, например, доступ к ограниченному индексу (например, для конкретной книги), может быть доступна без подключения к сети.
Как система решает, в каком индексе искать (например, Веб, Новости или Покупки)?
Система выполняет Context Analysis и анализирует природу захваченной информации, чтобы выбрать наиболее подходящий индекс. Если захвачено изображение товара, система может выбрать индекс Google Shopping; если захвачен текст из научной статьи – Google Scholar или общий веб-индекс.
Каков главный вывод для SEO-стратегии из этого патента?
Главный вывод заключается в необходимости перехода к стратегии, ориентированной на мультимодальное обнаружение. SEO больше не ограничивается оптимизацией под клавиатурный ввод. Стратегия должна гарантировать, что сущности и контент бренда четко определены (с помощью структурированных данных) и легко распознаются через визуальные и аудио каналы, чтобы участвовать в проактивном поиске.

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент

Мультимедиа
Семантика и интент

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Knowledge Graph

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Local SEO
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Индексация
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Антиспам
Ссылки
SERP

Поведенческие сигналы
SERP
Семантика и интент
