
Google использует технологию, позволяющую инициировать поиск жестами (например, обведением объекта на экране). Система анализирует выбранный контент (текст, изображения, видео), извлекает ключевые темы, учитывает контекст страницы и пользователя (местоположение, время), взвешивает эти данные и автоматически формирует релевантный поисковый запрос.
Патент решает проблему сложности и неестественности ввода текстовых запросов на устройствах (особенно мобильных), когда объект интереса уже отображается на экране. Вместо ручного ввода текста изобретение предлагает интуитивный способ инициировать поиск, напрямую взаимодействуя с отображаемым контентом через жесты (например, обводку или встряхивание).
Запатентована система для генерации поисковых критериев (запросов) в ответ на жестовые действия пользователя (gesture-based user actions) по отношению к отображаемому контенту. Ключевым элементом является механизм интерпретации жеста, идентификации мультимодального контента (текст, изображения, видео) в выбранной области, извлечения тем (topics) и взвешивания этих тем с учетом их типа и источника для формирования итогового запроса.
Система работает следующим образом:
drawing a loop, или встряхивание устройства).remaining content) и контекстуальной информации (время, местоположение, история поиска).weights). Темы из выбранной пользователем области получают более высокий приоритет. Вес также зависит от типа объекта.Критически высокая. Описанные в патенте механизмы лежат в основе современных функций мультимодального и контекстного поиска, таких как Google Lens и, в особенности, «Circle to Search» (Обвести и найти). Патент точно описывает технологии, которые стали стандартом для взаимодействия с контентом на мобильных устройствах.
Влияние на SEO значительное (8.5/10). Хотя патент не описывает алгоритмы ранжирования веб-индекса, он описывает фундаментальный сдвиг в поведении пользователей — переход от ввода ключевых слов к визуальному и контекстному инициированию поиска. Это подчеркивает критическую важность оптимизации визуальных активов (Visual Search) и обеспечения четкой, легко интерпретируемой связи между текстом и медиа на странице, поскольку любой элемент на экране может стать отправной точкой для поискового запроса.
drawing a loop) или встряхивание устройства (shake input).search criteria). Извлекаются из текста, метаданных, анкорного текста или путем анализа визуальной информации.other users' search trends).Claim 1 (Независимый пункт): Описывает основной метод поиска на основе жестов и мультимодального контента.
gesture data), связанные с выбором пользователем части отображаемого контента.respective object types).Ядро изобретения заключается в способности системы обрабатывать мультимодальный ввод (жест, охватывающий разнородный контент) и применять дифференцированное взвешивание тем в зависимости от типа контента (текст, изображение и т.д.) для формирования итогового запроса.
Claim 6 (Зависимый от 1): Уточняет, что идентификация объектов включает парсинг выбранной части контента, которая может содержать текст, изображение, аудио, видео или их комбинацию.
Claim 8 и 9 (Зависимые от 1): Уточняют, что определение запросов также включает получение и взвешивание метаданных (Claim 8) или контекстных данных (Claim 9), связанных с выбранным контентом.
Этот патент описывает механизмы, которые функционируют на стыке пользовательского интерфейса и бэкенда поисковой системы.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система преобразует нетрадиционный ввод (жест + визуальный и текстовый контекст на экране) в структурированный поисковый запрос. Происходит извлечение тем из визуальных и текстовых элементов, их взвешивание и формирование запроса. Это форма мультимодального понимания запроса, где запрос определяется тем, на что указал пользователь.
Входные данные:
Contextual information (местоположение устройства, время, история пользователя, тренды).Выходные данные:
Search Criteria).Алгоритм применяется при выполнении пользователем специфических действий на устройстве:
substantially closed loop) вокруг интересующего контента на сенсорном экране (например, «Circle to Search»).shake input) для анализа всего видимого контента.search mode) с последующим жестом выбора.Процесс А: Поиск на основе выделения области
anchor text) или путем визуального/аудио анализа.remaining content).Contextual Information (время, местоположение, история, тренды).Query Expansion – синонимы, исправление ошибок).Процесс Б: Поиск на основе встряхивания (Shake to Search)
Система использует разнообразные данные для формирования запроса:
remaining content).Visual information (форма, цвет, яркость, компоновка) и аудио информация (транскрипция речи, ритм).metadata), включая подписи (captions), транскрипты диалогов, временные метки, а также анкорный текст (anchor text).other users' search trends), включая «горячие» или «растущие» темы.remaining content. Видимый контент получает больший вес, чем невидимый (при встряхивании).Search Criteria. Включает добавление синонимов, омонимов, исправление орфографии, слов с тем же корнем (стемминг).Weight).remaining content (остальную часть страницы) и Contextual Information (местоположение, историю, тренды) для уточнения запроса, хотя эти данные имеют меньший вес, чем явно выбранный контент.Metadata, подписи (captions) и анкорный текст (anchor text). Это имеет прямое значение для оптимизации мультимедиа.captions), анкорного текста и окружающего текста (remaining content). Размещайте изображения в релевантном текстовом контексте и используйте описательные подписи.Topics.Contextual Information. Усиливайте локальные сигналы (Local SEO), так как система может автоматически добавлять локальный интент к сгенерированным запросам.remaining content и генерации неточных запросов.Этот патент имеет высокое стратегическое значение, подтверждая вектор развития Google в сторону мультимодального поиска. Технологии вроде «Circle to Search» меняют паттерны поведения пользователей, делая любой контент на экране потенциальной точкой входа в поиск. Для SEO это означает, что оптимизация должна быть комплексной, охватывая не только текст, но и визуальное представление, структуру и контекстную релевантность всех элементов страницы для обеспечения максимальной видимости в ответ на автоматически сгенерированные запросы.
Сценарий: Оптимизация карточки товара для жестового поиска («Circle to Search»)
Задача: Убедиться, что при выделении изображения товара на смартфоне система корректно его идентифицирует и сгенерирует релевантный коммерческий запрос.
remaining content для контекста.caption). Внедрить микроразметку Product.Является ли этот патент описанием Google Lens или Circle to Search?
Патент (подан в 2013 году) описывает фундаментальные методы, которые лежат в основе этих технологий. Он детально описывает процесс инициирования поиска путем обведения контента на экране («Circle to Search»). Хотя современные реализации используют более продвинутые модели ИИ, базовая архитектура — получение жеста, идентификация контента, извлечение тем, взвешивание и генерация запроса — полностью соответствует этому патенту.
Как система определяет, что важнее, если пользователь выделил и текст, и изображение одновременно?
Патент указывает, что система обрабатывает такой ввод мультимодально. Она идентифицирует разные типы объектов и присваивает веса темам, учитывая тип объекта. Она извлекает темы из текста и темы из изображения (визуальные характеристики, метаданные), а затем комбинирует их для формирования единого, наиболее релевантного запроса.
Имеет ли значение контент за пределами выделенной пользователем области?
Да, имеет. Патент явно описывает шаг извлечения тем из remaining content (остального контента). Однако темам, извлеченным из области, которую пользователь явно выделил жестом, присваивается более высокий вес. Окружающий контент используется для уточнения контекста и разрешения неоднозначностей.
Как этот патент влияет на Image SEO?
Он значительно повышает важность Image SEO. Поскольку пользователи все чаще используют изображения для инициирования поиска, оптимизация визуальных активов становится критически важной. Это включает использование четких изображений, релевантных подписей (captions), метаданных и обеспечение правильного текстового контекста вокруг изображения, так как все это является источником тем для генерации запроса.
Что такое «контекстуальная информация», которую использует система?
Патент определяет ее как дату, время, местоположение пользователя, его историю поиска и предпочтения, а также глобальные поисковые тренды (other users' search trends). Например, если пользователь выделяет название ресторана, система может использовать местоположение для генерации запроса о маршруте или часах работы.
Влияет ли структура верстки (HTML/CSS) на работу этого механизма?
Да, косвенно. Чистая и семантическая верстка помогает системе корректно идентифицировать объекты на экране и их взаимосвязи (например, какой текст является подписью к какому изображению). Если макет перегружен или элементы расположены хаотично, точность извлечения тем может снизиться.
Что такое «Shake to Search» (Поиск по встряхиванию), описанный в патенте?
Это альтернативный метод инициирования поиска. Если пользователь встряхивает устройство, система анализирует весь контент на странице. При этом темам из видимого на экране контента присваивается больший вес, чем темам из невидимой части документа (например, ниже по прокрутке). Это позволяет быстро получить информацию о том, что находится перед глазами пользователя.
Может ли система обрабатывать несколько выделений одновременно?
Да, патент предусматривает сценарии, когда пользователь делает несколько отдельных выделений (например, обводит текст в одном месте и изображение в другом). Система извлечет темы из всех выделенных областей и присвоит им высокие веса при формировании единого поискового запроса.
Должен ли я оптимизировать свой контент специально под «Circle to Search»?
Специальная оптимизация не требуется, но следование лучшим практикам SEO становится более важным. Убедитесь, что ваши ключевые сущности (продукты, места) представлены четко как в тексте, так и визуально, и что между ними существует ясная связь на странице. Это гарантирует, что при выделении вашего контента Google извлечет правильные темы.
Использует ли система OCR (распознавание текста на изображениях)?
Патент упоминает извлечение тем из visual information. Хотя OCR явно не упоминается как термин, он является стандартным методом анализа визуальной информации для извлечения текста из изображений, и его использование подразумевается в современных реализациях этой технологии для точного понимания контента.

Семантика и интент

Мультимедиа

SERP
Поведенческие сигналы
Персонализация

Семантика и интент
Knowledge Graph

Семантика и интент
Knowledge Graph

Семантика и интент
EEAT и качество

Антиспам
SERP
Ссылки

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Семантика и интент

Семантика и интент
Техническое SEO
EEAT и качество

Ссылки
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
Поведенческие сигналы
Мультимедиа

Поведенческие сигналы
Семантика и интент
SERP
