Как Google распознает сущности в результатах поиска по описательным запросам и предлагает их для уточнения поиска

Google использует этот механизм для улучшения поиска, особенно по картинкам. Если пользователь вводит описательный запрос (например, «коричневая собака-пловец»), система распознает конкретные сущности в найденных результатах (например, «Чесапик-бей-ретривер») и отображает их названия как кликабельные элементы. Это позволяет пользователю перейти от общего описания к поиску конкретной сущности.

Описание

Какую задачу решает

Патент решает проблему навигации и уточнения поиска, когда пользователь использует описательный язык (Descriptive Search Query) вместо конкретных названий сущностей. Например, пользователь ищет объект по его характеристикам («wooly undercoat swimming brown dog»), не зная точного названия. Система помогает преодолеть разрыв между общим описанием и конкретной сущностью (Entity), позволяя пользователю инициировать специфичный для сущности поиск (entity-specific search).

Что запатентовано

Запатентована система для динамической модификации результатов поиска в ответ на описательные запросы. Система использует специфические критерии (Descriptive Query Criteria) для определения того, что запрос является описательным. Если это так, она анализирует сущности (Entities), распознанные в найденных ресурсах (особенно в изображениях), и добавляет интерактивные элементы интерфейса (UI elements) — метки с названиями сущностей. Эти метки кликабельны и запускают новый поиск по конкретной сущности.

Как это работает

Система работает в несколько этапов:

Индексирование и Распознавание: На этапе индексации Entity Recognition Engine анализирует ресурсы (используя текст, метаданные или компьютерное зрение) и ассоциирует их с метками сущностей (Entity Tags).
Анализ Запроса и Выдачи: При получении запроса система проверяет его на соответствие Descriptive Query Criteria (например, много прилагательных, общих терминов или большое разнообразие сущностей в результатах).
Фильтрация Меток: Если критерии выполнены, система применяет правила, чтобы не перегружать интерфейс: показываются только наиболее специфичные (гипонимы) или редкие в данной выдаче сущности.
Генерация UI-элементов: Для отобранных сущностей генерируются кликабельные метки (UI elements), которые отображаются в результатах поиска.

Актуальность для SEO

Высокая. Распознавание сущностей в мультимедийном контенте (Image Search, Google Lens, Мультимодальный поиск) и связывание их с Knowledge Graph является ключевым направлением развития поиска. Этот патент описывает базовый механизм взаимодействия пользователя с распознанными сущностями при неточных запросах, что остается критически важной задачей.

Важность для SEO

Патент имеет высокое значение (7.5/10), особенно для Image SEO и E-commerce. Он не описывает алгоритмы ранжирования, но подчеркивает критическую важность того, чтобы Google мог четко идентифицировать сущности в визуальном контенте. Корректное распознавание сущностей на ваших ресурсах может улучшить видимость по описательным запросам и предоставить пользователю дополнительные точки взаимодействия в SERP.

Детальный разбор

Термины и определения

Descriptive Search Query (Описательный поисковый запрос): Запрос, который система идентифицирует как описание объекта, а не его название. Определяется по Descriptive Query Criteria.
Descriptive Query Criteria (Критерии описательного запроса): Набор условий для идентификации описательного запроса. Включает лингвистический анализ запроса и статистический анализ результатов.
Entity (Сущность): Человек, место, вещь или концепция.
Entity Database (База данных сущностей): Репозиторий информации о сущностях и связях между ними (например, иерархии гипероним-гипоним).
Entity Recognition Engine (Движок распознавания сущностей): Компонент системы, отвечающий за идентификацию сущностей в ресурсах с использованием анализа текста, метаданных или компьютерного зрения.
Entity Tag (Тег сущности): Метка, ассоциированная с ресурсом, которая уникально идентифицирует сущность, присутствующую в этом ресурсе. Включает название сущности (Entity Name).
Hypernym (Гипероним) / Hyponym (Гипоним): Иерархические отношения. Гипероним — более общий термин (например, «собака»). Гипоним — более специфический (например, «Чесапик-бей-ретривер»).
Keyword Tag (Тег ключевого слова): Тег, описывающий контент ресурса. Может использоваться как источник для генерации Entity Tag.
UI element (Элемент пользовательского интерфейса): Интерактивный элемент (например, текстовая метка на изображении), который отображает название сущности и позволяет пользователю инициировать поиск по этой сущности (entity-specific search).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы и критерии активации.

Система поддерживает индекс ресурсов, ассоциированных с Entity Tags.
Получает поисковый запрос и идентифицирует множество релевантных ресурсов.
Проверка Триггеров (Descriptive Query Criteria): Система определяет, выполняется ли ХОТЯ БЫ ОДНО из следующих условий:
1. Запрос содержит больше первого порогового числа (Threshold 1) различных существительных, являющихся гиперонимами (hypernyms).
2. Запрос содержит больше второго (отличного от первого) порогового числа (Threshold 2) различных прилагательных.
3. Найденные ресурсы ассоциированы с количеством различных Entity Tags, превышающим третье (отличное от других) пороговое число (Threshold 3).
Действие: Если триггер сработал (запрос описательный), система обрабатывает Entity Tags в результатах:
1. Определяет, нужно ли отображать UI element для конкретного тега (применяя фильтры).
2. Если да, генерирует данные UI element. Этот элемент кликабелен для запуска поиска по этой сущности.
Генерирует и отправляет страницу результатов, включающую эти UI element данные.

Claim 2 (Зависимый от 1): Уточняет одно из правил фильтрации (Шаг 4.i).

Система решает отобразить UI element, если соответствующий Entity Tag является ЕДИНСТВЕННЫМ тегом сущности, ассоциированным с данным ресурсом (Правило эксклюзивности).

Claim 3 (Зависимый от 1): Уточняет второе правило фильтрации (Шаг 4.i).

Система решает отобразить UI element, если этот тег ассоциирован с менее чем пороговым процентом от общего числа идентифицированных ресурсов (Правило редкости/специфичности).

Claim 4 (Зависимый от 1): Описывает метод генерации Entity Tags из Keyword Tags.

Система обрабатывает Keyword Tags ресурса. Если ключевое слово является названием сущности, генерируется соответствующий Entity Tag.

Claims 5-8 (Зависимые от 1): Детализируют методы распознавания сущностей в ресурсах (особенно изображениях) на этапе индексирования.

Claim 5: Общий процесс определения визуального представления сущности в ресурсе (image content) и присвоения Entity Tag.
Claim 6: Распознавание через анализ текстового контента ресурса.
Claim 7: Распознавание через анализ метаданных ресурса.
Claim 8: Распознавание через компьютерное зрение: сравнение признаков (features) изображения с признаками другого изображения, которое уже ассоциировано с известной сущностью.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, от индексирования до финального формирования выдачи.

INDEXING – Индексирование и извлечение признаков
Ключевой этап. Entity Recognition Engine работает здесь. Он анализирует ресурсы, используя мультимодальный подход (Claims 4-8): анализ текста, метаданных, Keyword Tags и компьютерное зрение. Цель — идентифицировать сущности и присвоить ресурсам Entity Tags. Данные сохраняются в индексе и Entity Database.

QUNDERSTANDING – Понимание Запросов
Система анализирует текст запроса на соответствие лингвистическим критериям Descriptive Query Criteria: подсчитывает количество прилагательных и существительных-гиперонимов (Критерии i и ii из Claim 1).

RANKING – Ранжирование
Генерируется первичный набор результатов, удовлетворяющих запросу.

METASEARCH / RERANKING (Формирование UI)
Основной этап применения патента. Система анализирует сгенерированные результаты:

Оценка разнообразия: Подсчитывается количество уникальных Entity Tags во всем наборе результатов (Критерий iii из Claim 1).
Активация: Если любой из трех Descriptive Query Criteria выполнен (на этапах QUNDERSTANDING или здесь), активируется логика добавления UI elements.
Фильтрация и Генерация: Система применяет правила фильтрации (Claims 2, 3 и другие) и генерирует интерактивные метки для отображения поверх или рядом с результатами поиска (например, изображениями).

Входные данные:

Поисковый запрос.
Набор идентифицированных ресурсов и их Entity Tags.
Entity Database (включая данные об иерархии сущностей и названиях).

Выходные данные:

Страница результатов поиска (SERP), дополненная интерактивными UI elements (метками сущностей).

На что влияет

Конкретные типы контента: В первую очередь влияет на ресурсы, содержащие изображения (Image Search). Патент явно акцентирует внимание на image content.
Специфические запросы: Влияет на описательные, исследовательские (exploratory) запросы, где пользователь описывает признаки объекта, не зная его названия.
Конкретные ниши: E-commerce (идентификация товаров), природа (породы, виды), путешествия (достопримечательности) и другие ниши с выраженной визуальной составляющей.

Когда применяется

Алгоритм применяется выборочно, только при срабатывании одного из трех триггеров (Descriptive Query Criteria), описанных в Claim 1:

Триггер 1 (Лингвистический): Когда запрос содержит больше порогового числа общих существительных (гиперонимов).
Триггер 2 (Лингвистический): Когда запрос содержит больше порогового числа прилагательных.
Триггер 3 (Анализ Выдачи): Когда результаты поиска содержат больше порогового числа различных распознанных сущностей (большое разнообразие Entity Tags).

Пошаговый алгоритм

Процесс А: Индексирование и Распознавание Сущностей (Офлайн)

Сканирование ресурсов: Система получает доступ к ресурсу (изображение, текст, метаданные).
Анализ контента (Entity Recognition): Entity recognition engine анализирует ресурс, используя комбинацию методов:
- Анализ текста и метаданных на наличие названий сущностей (Claims 6, 7).
- Анализ Keyword Tags и их преобразование в Entity Tags (Claim 4).
- Компьютерное зрение: сравнение признаков (features) изображения с признаками известных сущностей (Claim 8).
Присвоение меток: Если сущность распознана, система генерирует Entity Tag и ассоциирует его с ресурсом в индексе.

Процесс Б: Обработка запроса (Real-time)

Получение запроса и идентификация ресурсов: Система получает запрос и находит релевантные ресурсы.
Проверка критериев описательного запроса: Система проверяет три пороговых условия (Гиперонимы в запросе, Прилагательные в запросе, Уникальные Entity Tags в результатах).
Ветвление логики:
- Если НИ ОДНО условие не выполнено: Сгенерировать стандартную SERP.
- Если ХОТЯ БЫ ОДНО условие выполнено: Перейти к шагу 4.
Обработка Entity Tags: Для найденных ресурсов система анализирует ассоциированные Entity Tags.
Применение правил фильтрации: Система определяет, нужно ли показывать UI element для каждой метки. Применяются фильтры (согласно Claims и описанию):
- Эксклюзивность (Claim 2): Является ли метка единственной для этого ресурса?
- Редкость (Claim 3): Встречается ли метка в менее чем пороговом проценте результатов?
- Специфичность: Если есть иерархия (гипероним/гипоним), предпочтение отдается гипониму.
- Количество и Разнообразие: Ограничение максимального числа меток и выбор меток разных типов для одного ресурса.
Генерация UI Elements: Для меток, прошедших фильтрацию, генерируются данные для отображения интерактивных элементов.
Формирование и отправка SERP: Система генерирует финальную страницу результатов, включающую стандартные сниппеты и сгенерированные UI elements.

Какие данные и как использует

Данные на входе

Контентные факторы: Текстовый контент ресурса. Используется для распознавания сущностей (Claim 6).
Мультимедиа факторы: Изображения (image content). Признаки (features) изображений анализируются с помощью компьютерного зрения для распознавания сущностей (Claim 8).
Технические/Структурные факторы: Метаданные ресурса (Claim 7) и Keyword Tags (Claim 4). Используются для распознавания сущностей.
Лингвистические данные (Системные): Данные из Entity Database о гиперонимах и гипонимах. Используются для анализа запроса (Триггеры 1, 2) и для фильтрации меток.

Какие метрики используются и как они считаются

Система использует несколько конкретных пороговых значений (Thresholds) для принятия решений:

Порог 1 (T1): Минимальное количество различных существительных-гиперонимов в запросе для активации механизма.
Порог 2 (T2): Минимальное количество различных прилагательных в запросе для активации механизма.
Порог 3 (T3): Минимальное количество различных Entity Tags в наборе результатов для активации механизма.
Threshold Percentage (TP): Максимальный процент ресурсов в выдаче, с которыми может быть ассоциирована метка, чтобы она считалась «редкой» и была показана (Claim 3).
Методы анализа: NLP для анализа текста и запросов (определение частей речи, иерархий); Компьютерное зрение для сравнения визуальных характеристик (features matching).

Выводы

От описания к сущности (Knowledge Graph): Патент демонстрирует конкретный механизм перевода неструктурированных описательных запросов в структурированные сущности. Цель — помочь пользователю уточнить интент, перейдя от общих слов к конкретным объектам.
Мультимодальное распознавание сущностей критично: Google использует комбинацию сигналов для идентификации сущностей: анализ текста, метаданных, Keyword Tags и компьютерное зрение. Оптимизация должна быть комплексной.
Четкие критерии активации (Триггеры): Механизм активируется только при выполнении одного из трех условий: избыток прилагательных, избыток гиперонимов в запросе или большое разнообразие сущностей в результатах.
Приоритет специфичности и редкости (Фильтрация): Система активно фильтрует распознанные сущности для улучшения UX. Предпочтение отдается более конкретным (гипонимам), эксклюзивным для ресурса или редко встречающимся в данной выдаче тегам. Слишком общие теги отсеиваются.
Критическая важность Image SEO: Патент сфокусирован на image content. Корректная оптимизация и контекстуализация изображений необходимы для того, чтобы Entity Recognition Engine мог связать их с правильной сущностью.

Практика

Best practices (это мы делаем)

Оптимизация изображений для компьютерного зрения (Claim 8): Используйте четкие, высококачественные изображения, где ключевые объекты (товары, люди, места) хорошо видны и являются основным объектом. Это повышает вероятность корректного распознавания сущности через сравнение признаков (features).
Насыщение контекста вокруг медиа (Claim 6): Размещайте изображения в релевантном текстовом окружении (подписи, окружающий параграф), которое содержит точные названия изображенных сущностей. Это напрямую помогает распознаванию через анализ текста.
Точные метаданные и Alt-тексты (Claim 7): Используйте описательные и точные alt-тексты. Анализ метаданных является одним из ключевых методов распознавания сущностей.
Использование специфичных терминов (Гипонимов): В контенте и метаданных фокусируйтесь на наиболее специфичном названии сущности. Система предпочитает отображать гипонимы (например, конкретную модель камеры, а не просто «фотоаппарат»).
Структурирование данных (Schema.org): Используйте микроразметку (Product, Person, Place и т.д.) для явного указания сущностей и их свойств на странице. Это служит надежным источником данных для Entity Recognition Engine.

Worst practices (это делать не надо)

Использование размытых или перегруженных изображений: Изображения низкого качества или те, где основной объект неясен, мешают работе компьютерного зрения и снижают вероятность корректного распознавания.
Игнорирование контекста и метаданных: Отсутствие Alt-текстов и окружающего текста усложняет идентификацию сущностей, заставляя систему полагаться только на визуальный анализ, который может быть неточным.
Использование только общих терминов (Гиперонимов): Описание контента только общими словами (например, только «платье» без указания модели/бренда). Такие общие теги, скорее всего, будут отфильтрованы системой как слишком частые (Claim 3).
Спам в тегах и метаданных (Claim 4): Использование нерелевантных Keyword Tags или метаданных в попытке манипулировать видимостью. Система использует несколько источников (включая визуальный анализ) для верификации.

Стратегическое значение

Патент подтверждает стратегическую важность Entity SEO и комплексной оптимизации медиаконтента. Google стремится «понять», что именно изображено, и связать это с Knowledge Graph. Для E-commerce и контентных проектов это означает, что качество визуального контента и точность данных о нем напрямую влияют на то, как Google сможет использовать этот контент в различных сценариях поиска, включая описательные запросы и визуальный поиск (например, Google Lens).

Практические примеры

Сценарий: Оптимизация карточки товара в E-commerce (Ниша: Электроника)

Ситуация: Пользователь ищет «смартфон с тремя камерами и большим экраном 2025». Это Descriptive Search Query (много прилагательных/атрибутов, Триггер 2).
Действия SEO-специалиста (для страницы Samsung Galaxy S25 Ultra):
- Разместить высококачественные изображения, где хорошо виден дизайн и камеры (для компьютерного зрения, Claim 8).
- В тексте описания, характеристиках и Alt-тексте явно указать название модели и бренд (для текстового анализа и метаданных, Claims 6, 7).
- Внедрить микроразметку Schema.org/Product.
Работа системы:
- Google определяет запрос как описательный.
- Страница товара попадает в результаты.
- Entity recognition engine успешно связывает страницу и изображения с сущностью «Samsung Galaxy S25 Ultra».
Результат: В поиске по картинкам Google отображает фото смартфона. Рядом с ним (или при взаимодействии) появляется кликабельный UI element (тег) «Samsung Galaxy S25 Ultra». Пользователь может кликнуть на него, чтобы перейти к поиску именно этой модели.

Вопросы и ответы

Что такое «описательный запрос» (Descriptive Search Query) согласно патенту?

Это запрос, который активирует специальную логику показа меток сущностей. Патент определяет три критерия: (1) запрос содержит много прилагательных, (2) запрос содержит много общих существительных (гиперонимов), или (3) результаты поиска содержат очень много разных распознанных сущностей. Достаточно выполнения одного из этих условий.

Касается ли этот патент только поиска по картинкам?

В первую очередь да. Патент неоднократно упоминает image content и приводит примеры из поиска по изображениям. Хотя технически он описывает «ресурсы», основной фокус направлен на распознавание визуальных объектов и добавление интерактивных элементов (UI elements) к изображениям в выдаче.

Как Google распознает сущности на изображениях?

Патент описывает комбинацию методов. Во-первых, анализ текстового контента на странице рядом с изображением (Claim 6). Во-вторых, анализ метаданных изображения (Claim 7) или связанных с ним Keyword Tags (Claim 4). В-третьих, компьютерное зрение, когда система сравнивает визуальные признаки (features) изображения с признаками уже известных сущностей (Claim 8).

Как я могу помочь Google распознать товары на фотографиях моего сайта?

Необходимо использовать комплексный подход. Обеспечьте высокое качество и четкость фотографий для облегчения работы компьютерного зрения. Обязательно добавляйте релевантный контекст: описательные Alt-тексты, подписи к фото, а также точное описание товара в тексте страницы и микроразметке Schema.org.

Будет ли Google показывать метки для всех сущностей, которые распознал на фото?

Нет, система применяет фильтры, чтобы не перегружать интерфейс. Метка будет показана, если это единственная сущность на фото (Claim 2), или если эта сущность редко встречается в текущей поисковой выдаче (Claim 3). Также система предпочитает более специфичные сущности (гипонимы), например, покажет «Лабрадор», а не «Собака».

Что такое гиперонимы и как они влияют на этот механизм?

Гиперонимы — это общие слова (например, «устройство», «животное»). Согласно патенту, если в запросе пользователя слишком много таких общих слов (Триггер 1), система может активировать показ меток сущностей в результатах, чтобы помочь пользователю сузить поиск до конкретных объектов (например, от «животное для дома» к «Сиамская кошка»).

Влияет ли этот патент на ранжирование?

Напрямую нет. Патент не описывает, как изменяются Ranking Scores. Он описывает механизм модификации пользовательского интерфейса после того, как ранжирование уже произошло. Однако улучшение взаимодействия с пользователем и успешное распознавание сущностей косвенно полезны для SEO.

Как разнообразие сущностей в выдаче влияет на поиск?

Это один из триггеров (Триггер 3). Если система видит, что по какому-то запросу в топе ранжируется контент с очень большим количеством разных Entity Tags, она классифицирует запрос как описательный. Это сигнал, что пользователи, вероятно, исследуют тему, и им нужно помочь с навигацией, показав конкретные сущности.

Связан ли этот патент с Google Lens?

Да, описанные механизмы очень похожи на его функциональность. Распознавание объектов с помощью компьютерного зрения (Claim 8) и предоставление интерактивных меток для дальнейшего поиска по сущности являются базовыми принципами работы Google Lens. Этот патент описывает серверную реализацию подобной логики для традиционного поиска.

Как я могу проверить, какие Entity Tags Google ассоциирует с моими изображениями?

Прямого инструмента в Search Console нет. Однако можно использовать Google Cloud Vision API (или его демо-версию) для анализа изображений и просмотра меток (labels) и сущностей (entities), которые система распознает визуально. Это даст хорошее представление о том, как Entity Recognition Engine интерпретирует ваш визуальный контент.