Как Google распознает сущности в результатах поиска по описательным запросам и предлагает их для уточнения поиска

SEARCH RESULTS FOR DESCRIPTIVE SEARCH QUERIES (Результаты поиска для описательных поисковых запросов)

US9418121B2
Google LLC
2013-03-12
2016-08-16

Google использует этот механизм для улучшения поиска, особенно по картинкам. Если пользователь вводит описательный запрос (например, «коричневая собака-пловец»), система распознает конкретные сущности в найденных результатах (например, «Чесапик-бей-ретривер») и отображает их названия как кликабельные элементы. Это позволяет пользователю перейти от общего описания к поиску конкретной сущности.

Какую проблему решает

Патент решает проблему навигации и уточнения поиска, когда пользователь использует описательный язык (Descriptive Search Query) вместо конкретных названий сущностей. Например, пользователь ищет объект по его характеристикам («wooly undercoat swimming brown dog»), не зная точного названия. Система помогает преодолеть разрыв между общим описанием и конкретной сущностью (Entity), позволяя пользователю инициировать специфичный для сущности поиск (entity-specific search).

Что запатентовано

Запатентована система для динамической модификации результатов поиска в ответ на описательные запросы. Система использует специфические критерии (Descriptive Query Criteria) для определения того, что запрос является описательным. Если это так, она анализирует сущности (Entities), распознанные в найденных ресурсах (особенно в изображениях), и добавляет интерактивные элементы интерфейса (UI elements) — метки с названиями сущностей. Эти метки кликабельны и запускают новый поиск по конкретной сущности.

Как это работает

Система работает в несколько этапов:

Индексирование и Распознавание: На этапе индексации Entity Recognition Engine анализирует ресурсы (используя текст, метаданные или компьютерное зрение) и ассоциирует их с метками сущностей (Entity Tags).
Анализ Запроса и Выдачи: При получении запроса система проверяет его на соответствие Descriptive Query Criteria (например, много прилагательных, общих терминов или большое разнообразие сущностей в результатах).
Фильтрация Меток: Если критерии выполнены, система применяет правила, чтобы не перегружать интерфейс: показываются только наиболее специфичные (гипонимы) или редкие в данной выдаче сущности.
Генерация UI-элементов: Для отобранных сущностей генерируются кликабельные метки (UI elements), которые отображаются в результатах поиска.

Актуальность для SEO

Высокая. Распознавание сущностей в мультимедийном контенте (Image Search, Google Lens, Мультимодальный поиск) и связывание их с Knowledge Graph является ключевым направлением развития поиска. Этот патент описывает базовый механизм взаимодействия пользователя с распознанными сущностями при неточных запросах, что остается критически важной задачей.

Важность для SEO

Патент имеет высокое значение (7.5/10), особенно для Image SEO и E-commerce. Он не описывает алгоритмы ранжирования, но подчеркивает критическую важность того, чтобы Google мог четко идентифицировать сущности в визуальном контенте. Корректное распознавание сущностей на ваших ресурсах может улучшить видимость по описательным запросам и предоставить пользователю дополнительные точки взаимодействия в SERP.

Термины и определения

Descriptive Search Query (Описательный поисковый запрос): Запрос, который система идентифицирует как описание объекта, а не его название. Определяется по Descriptive Query Criteria.
Descriptive Query Criteria (Критерии описательного запроса): Набор условий для идентификации описательного запроса. Включает лингвистический анализ запроса и статистический анализ результатов.
Entity (Сущность): Человек, место, вещь или концепция.
Entity Database (База данных сущностей): Репозиторий информации о сущностях и связях между ними (например, иерархии гипероним-гипоним).
Entity Recognition Engine (Движок распознавания сущностей): Компонент системы, отвечающий за идентификацию сущностей в ресурсах с использованием анализа текста, метаданных или компьютерного зрения.
Entity Tag (Тег сущности): Метка, ассоциированная с ресурсом, которая уникально идентифицирует сущность, присутствующую в этом ресурсе. Включает название сущности (Entity Name).
Hypernym (Гипероним) / Hyponym (Гипоним): Иерархические отношения. Гипероним — более общий термин (например, «собака»). Гипоним — более специфический (например, «Чесапик-бей-ретривер»).
Keyword Tag (Тег ключевого слова): Тег, описывающий контент ресурса. Может использоваться как источник для генерации Entity Tag.
UI element (Элемент пользовательского интерфейса): Интерактивный элемент (например, текстовая метка на изображении), который отображает название сущности и позволяет пользователю инициировать поиск по этой сущности (entity-specific search).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы и критерии активации.

Система поддерживает индекс ресурсов, ассоциированных с Entity Tags.
Получает поисковый запрос и идентифицирует множество релевантных ресурсов.
Проверка Триггеров (Descriptive Query Criteria): Система определяет, выполняется ли ХОТЯ БЫ ОДНО из следующих условий:
1. Запрос содержит больше первого порогового числа (Threshold 1) различных существительных, являющихся гиперонимами (hypernyms).
2. Запрос содержит больше второго (отличного от первого) порогового числа (Threshold 2) различных прилагательных.
3. Найденные ресурсы ассоциированы с количеством различных Entity Tags, превышающим третье (отличное от других) пороговое число (Threshold 3).
Действие: Если триггер сработал (запрос описательный), система обрабатывает Entity Tags в результатах:
1. Определяет, нужно ли отображать UI element для конкретного тега (применяя фильтры).
2. Если да, генерирует данные UI element. Этот элемент кликабелен для запуска поиска по этой сущности.
Генерирует и отправляет страницу результатов, включающую эти UI element данные.

Claim 2 (Зависимый от 1): Уточняет одно из правил фильтрации (Шаг 4.i).

Система решает отобразить UI element, если соответствующий Entity Tag является ЕДИНСТВЕННЫМ тегом сущности, ассоциированным с данным ресурсом (Правило эксклюзивности).

Claim 3 (Зависимый от 1): Уточняет второе правило фильтрации (Шаг 4.i).

Система решает отобразить UI element, если этот тег ассоциирован с менее чем пороговым процентом от общего числа идентифицированных ресурсов (Правило редкости/специфичности).

Claim 4 (Зависимый от 1): Описывает метод генерации Entity Tags из Keyword Tags.

Система обрабатывает Keyword Tags ресурса. Если ключевое слово является названием сущности, генерируется соответствующий Entity Tag.

Claims 5-8 (Зависимые от 1): Детализируют методы распознавания сущностей в ресурсах (особенно изображениях) на этапе индексирования.

Claim 5: Общий процесс определения визуального представления сущности в ресурсе (image content) и присвоения Entity Tag.
Claim 6: Распознавание через анализ текстового контента ресурса.
Claim 7: Распознавание через анализ метаданных ресурса.
Claim 8: Распознавание через компьютерное зрение: сравнение признаков (features) изображения с признаками другого изображения, которое уже ассоциировано с известной сущностью.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, от индексирования до финального формирования выдачи.

INDEXING – Индексирование и извлечение признаков
Ключевой этап. Entity Recognition Engine работает здесь. Он анализирует ресурсы, используя мультимодальный подход (Claims 4-8): анализ текста, метаданных, Keyword Tags и компьютерное зрение. Цель — идентифицировать сущности и присвоить ресурсам Entity Tags. Данные сохраняются в индексе и Entity Database.

QUNDERSTANDING – Понимание Запросов
Система анализирует текст запроса на соответствие лингвистическим критериям Descriptive Query Criteria: подсчитывает количество прилагательных и существительных-гиперонимов (Критерии i и ii из Claim 1).

RANKING – Ранжирование
Генерируется первичный набор результатов, удовлетворяющих запросу.

METASEARCH / RERANKING (Формирование UI)
Основной этап применения патента. Система анализирует сгенерированные результаты:

Оценка разнообразия: Подсчитывается количество уникальных Entity Tags во всем наборе результатов (Критерий iii из Claim 1).
Активация: Если любой из трех Descriptive Query Criteria выполнен (на этапах QUNDERSTANDING или здесь), активируется логика добавления UI elements.
Фильтрация и Генерация: Система применяет правила фильтрации (Claims 2, 3 и другие) и генерирует интерактивные метки для отображения поверх или рядом с результатами поиска (например, изображениями).

Входные данные:

Поисковый запрос.
Набор идентифицированных ресурсов и их Entity Tags.
Entity Database (включая данные об иерархии сущностей и названиях).

Выходные данные:

Страница результатов поиска (SERP), дополненная интерактивными UI elements (метками сущностей).

На что влияет

Конкретные типы контента: В первую очередь влияет на ресурсы, содержащие изображения (Image Search). Патент явно акцентирует внимание на image content.
Специфические запросы: Влияет на описательные, исследовательские (exploratory) запросы, где пользователь описывает признаки объекта, не зная его названия.
Конкретные ниши: E-commerce (идентификация товаров), природа (породы, виды), путешествия (достопримечательности) и другие ниши с выраженной визуальной составляющей.

Когда применяется

Алгоритм применяется выборочно, только при срабатывании одного из трех триггеров (Descriptive Query Criteria), описанных в Claim 1:

Триггер 1 (Лингвистический): Когда запрос содержит больше порогового числа общих существительных (гиперонимов).
Триггер 2 (Лингвистический): Когда запрос содержит больше порогового числа прилагательных.
Триггер 3 (Анализ Выдачи): Когда результаты поиска содержат больше порогового числа различных распознанных сущностей (большое разнообразие Entity Tags).

Пошаговый алгоритм

Процесс А: Индексирование и Распознавание Сущностей (Офлайн)

Сканирование ресурсов: Система получает доступ к ресурсу (изображение, текст, метаданные).
Анализ контента (Entity Recognition): Entity recognition engine анализирует ресурс, используя комбинацию методов:
- Анализ текста и метаданных на наличие названий сущностей (Claims 6, 7).
- Анализ Keyword Tags и их преобразование в Entity Tags (Claim 4).
- Компьютерное зрение: сравнение признаков (features) изображения с признаками известных сущностей (Claim 8).
Присвоение меток: Если сущность распознана, система генерирует Entity Tag и ассоциирует его с ресурсом в индексе.

Процесс Б: Обработка запроса (Real-time)

Получение запроса и идентификация ресурсов: Система получает запрос и находит релевантные ресурсы.
Проверка критериев описательного запроса: Система проверяет три пороговых условия (Гиперонимы в запросе, Прилагательные в запросе, Уникальные Entity Tags в результатах).
Ветвление логики:
- Если НИ ОДНО условие не выполнено: Сгенерировать стандартную SERP.
- Если ХОТЯ БЫ ОДНО условие выполнено: Перейти к шагу 4.
Обработка Entity Tags: Для найденных ресурсов система анализирует ассоциированные Entity Tags.
Применение правил фильтрации: Система определяет, нужно ли показывать UI element для каждой метки. Применяются фильтры (согласно Claims и описанию):
- Эксклюзивность (Claim 2): Является ли метка единственной для этого ресурса?
- Редкость (Claim 3): Встречается ли метка в менее чем пороговом проценте результатов?
- Специфичность: Если есть иерархия (гипероним/гипоним), предпочтение отдается гипониму.
- Количество и Разнообразие: Ограничение максимального числа меток и выбор меток разных типов для одного ресурса.
Генерация UI Elements: Для меток, прошедших фильтрацию, генерируются данные для отображения интерактивных элементов.
Формирование и отправка SERP: Система генерирует финальную страницу результатов, включающую стандартные сниппеты и сгенерированные UI elements.

Какие данные и как использует

Данные на входе

Контентные факторы: Текстовый контент ресурса. Используется для распознавания сущностей (Claim 6).
Мультимедиа факторы: Изображения (image content). Признаки (features) изображений анализируются с помощью компьютерного зрения для распознавания сущностей (Claim 8).
Технические/Структурные факторы: Метаданные ресурса (Claim 7) и Keyword Tags (Claim 4). Используются для распознавания сущностей.
Лингвистические данные (Системные): Данные из Entity Database о гиперонимах и гипонимах. Используются для анализа запроса (Триггеры 1, 2) и для фильтрации меток.

Какие метрики используются и как они считаются

Система использует несколько конкретных пороговых значений (Thresholds) для принятия решений:

Порог 1 (T1): Минимальное количество различных существительных-гиперонимов в запросе для активации механизма.
Порог 2 (T2): Минимальное количество различных прилагательных в запросе для активации механизма.
Порог 3 (T3): Минимальное количество различных Entity Tags в наборе результатов для активации механизма.
Threshold Percentage (TP): Максимальный процент ресурсов в выдаче, с которыми может быть ассоциирована метка, чтобы она считалась «редкой» и была показана (Claim 3).
Методы анализа: NLP для анализа текста и запросов (определение частей речи, иерархий); Компьютерное зрение для сравнения визуальных характеристик (features matching).

От описания к сущности (Knowledge Graph): Патент демонстрирует конкретный механизм перевода неструктурированных описательных запросов в структурированные сущности. Цель — помочь пользователю уточнить интент, перейдя от общих слов к конкретным объектам.
Мультимодальное распознавание сущностей критично: Google использует комбинацию сигналов для идентификации сущностей: анализ текста, метаданных, Keyword Tags и компьютерное зрение. Оптимизация должна быть комплексной.
Четкие критерии активации (Триггеры): Механизм активируется только при выполнении одного из трех условий: избыток прилагательных, избыток гиперонимов в запросе или большое разнообразие сущностей в результатах.
Приоритет специфичности и редкости (Фильтрация): Система активно фильтрует распознанные сущности для улучшения UX. Предпочтение отдается более конкретным (гипонимам), эксклюзивным для ресурса или редко встречающимся в данной выдаче тегам. Слишком общие теги отсеиваются.
Критическая важность Image SEO: Патент сфокусирован на image content. Корректная оптимизация и контекстуализация изображений необходимы для того, чтобы Entity Recognition Engine мог связать их с правильной сущностью.

Best practices (это мы делаем)

Оптимизация изображений для компьютерного зрения (Claim 8): Используйте четкие, высококачественные изображения, где ключевые объекты (товары, люди, места) хорошо видны и являются основным объектом. Это повышает вероятность корректного распознавания сущности через сравнение признаков (features).
Насыщение контекста вокруг медиа (Claim 6): Размещайте изображения в релевантном текстовом окружении (подписи, окружающий параграф), которое содержит точные названия изображенных сущностей. Это напрямую помогает распознаванию через анализ текста.
Точные метаданные и Alt-тексты (Claim 7): Используйте описательные и точные alt-тексты. Анализ метаданных является одним из ключевых методов распознавания сущностей.
Использование специфичных терминов (Гипонимов): В контенте и метаданных фокусируйтесь на наиболее специфичном названии сущности. Система предпочитает отображать гипонимы (например, конкретную модель камеры, а не просто «фотоаппарат»).
Структурирование данных (Schema.org): Используйте микроразметку (Product, Person, Place и т.д.) для явного указания сущностей и их свойств на странице. Это служит надежным источником данных для Entity Recognition Engine.

Worst practices (это делать не надо)

Использование размытых или перегруженных изображений: Изображения низкого качества или те, где основной объект неясен, мешают работе компьютерного зрения и снижают вероятность корректного распознавания.
Игнорирование контекста и метаданных: Отсутствие Alt-текстов и окружающего текста усложняет идентификацию сущностей, заставляя систему полагаться только на визуальный анализ, который может быть неточным.
Использование только общих терминов (Гиперонимов): Описание контента только общими словами (например, только «платье» без указания модели/бренда). Такие общие теги, скорее всего, будут отфильтрованы системой как слишком частые (Claim 3).
Спам в тегах и метаданных (Claim 4): Использование нерелевантных Keyword Tags или метаданных в попытке манипулировать видимостью. Система использует несколько источников (включая визуальный анализ) для верификации.

Стратегическое значение

Патент подтверждает стратегическую важность Entity SEO и комплексной оптимизации медиаконтента. Google стремится «понять», что именно изображено, и связать это с Knowledge Graph. Для E-commerce и контентных проектов это означает, что качество визуального контента и точность данных о нем напрямую влияют на то, как Google сможет использовать этот контент в различных сценариях поиска, включая описательные запросы и визуальный поиск (например, Google Lens).

Практические примеры

Сценарий: Оптимизация карточки товара в E-commerce (Ниша: Электроника)

Ситуация: Пользователь ищет «смартфон с тремя камерами и большим экраном 2025». Это Descriptive Search Query (много прилагательных/атрибутов, Триггер 2).
Действия SEO-специалиста (для страницы Samsung Galaxy S25 Ultra):
- Разместить высококачественные изображения, где хорошо виден дизайн и камеры (для компьютерного зрения, Claim 8).
- В тексте описания, характеристиках и Alt-тексте явно указать название модели и бренд (для текстового анализа и метаданных, Claims 6, 7).
- Внедрить микроразметку Schema.org/Product.
Работа системы:
- Google определяет запрос как описательный.
- Страница товара попадает в результаты.
- Entity recognition engine успешно связывает страницу и изображения с сущностью «Samsung Galaxy S25 Ultra».
Результат: В поиске по картинкам Google отображает фото смартфона. Рядом с ним (или при взаимодействии) появляется кликабельный UI element (тег) «Samsung Galaxy S25 Ultra». Пользователь может кликнуть на него, чтобы перейти к поиску именно этой модели.

Что такое «описательный запрос» (Descriptive Search Query) согласно патенту?

Это запрос, который активирует специальную логику показа меток сущностей. Патент определяет три критерия: (1) запрос содержит много прилагательных, (2) запрос содержит много общих существительных (гиперонимов), или (3) результаты поиска содержат очень много разных распознанных сущностей. Достаточно выполнения одного из этих условий.

Касается ли этот патент только поиска по картинкам?

В первую очередь да. Патент неоднократно упоминает image content и приводит примеры из поиска по изображениям. Хотя технически он описывает «ресурсы», основной фокус направлен на распознавание визуальных объектов и добавление интерактивных элементов (UI elements) к изображениям в выдаче.

Как Google распознает сущности на изображениях?

Патент описывает комбинацию методов. Во-первых, анализ текстового контента на странице рядом с изображением (Claim 6). Во-вторых, анализ метаданных изображения (Claim 7) или связанных с ним Keyword Tags (Claim 4). В-третьих, компьютерное зрение, когда система сравнивает визуальные признаки (features) изображения с признаками уже известных сущностей (Claim 8).

Как я могу помочь Google распознать товары на фотографиях моего сайта?

Необходимо использовать комплексный подход. Обеспечьте высокое качество и четкость фотографий для облегчения работы компьютерного зрения. Обязательно добавляйте релевантный контекст: описательные Alt-тексты, подписи к фото, а также точное описание товара в тексте страницы и микроразметке Schema.org.

Будет ли Google показывать метки для всех сущностей, которые распознал на фото?

Нет, система применяет фильтры, чтобы не перегружать интерфейс. Метка будет показана, если это единственная сущность на фото (Claim 2), или если эта сущность редко встречается в текущей поисковой выдаче (Claim 3). Также система предпочитает более специфичные сущности (гипонимы), например, покажет «Лабрадор», а не «Собака».

Что такое гиперонимы и как они влияют на этот механизм?

Гиперонимы — это общие слова (например, «устройство», «животное»). Согласно патенту, если в запросе пользователя слишком много таких общих слов (Триггер 1), система может активировать показ меток сущностей в результатах, чтобы помочь пользователю сузить поиск до конкретных объектов (например, от «животное для дома» к «Сиамская кошка»).

Влияет ли этот патент на ранжирование?

Напрямую нет. Патент не описывает, как изменяются Ranking Scores. Он описывает механизм модификации пользовательского интерфейса после того, как ранжирование уже произошло. Однако улучшение взаимодействия с пользователем и успешное распознавание сущностей косвенно полезны для SEO.

Как разнообразие сущностей в выдаче влияет на поиск?

Это один из триггеров (Триггер 3). Если система видит, что по какому-то запросу в топе ранжируется контент с очень большим количеством разных Entity Tags, она классифицирует запрос как описательный. Это сигнал, что пользователи, вероятно, исследуют тему, и им нужно помочь с навигацией, показав конкретные сущности.

Связан ли этот патент с Google Lens?

Да, описанные механизмы очень похожи на его функциональность. Распознавание объектов с помощью компьютерного зрения (Claim 8) и предоставление интерактивных меток для дальнейшего поиска по сущности являются базовыми принципами работы Google Lens. Этот патент описывает серверную реализацию подобной логики для традиционного поиска.

Как я могу проверить, какие Entity Tags Google ассоциирует с моими изображениями?

Прямого инструмента в Search Console нет. Однако можно использовать Google Cloud Vision API (или его демо-версию) для анализа изображений и просмотра меток (labels) и сущностей (entities), которые система распознает визуально. Это даст хорошее представление о том, как Entity Recognition Engine интерпретирует ваш визуальный контент.

Как Google использует атрибуты сущностей для генерации «Дополненных запросов» и уточнения поиска

Google использует механизм для помощи в исследовании тем, связанных с сущностями (люди, места, продукты). Система распознает сущность в запросе, определяет ее ключевые атрибуты (анализируя результаты поиска или Knowledge Graph) и автоматически генерирует список предлагаемых «дополненных запросов» (Сущность + Атрибут). Это позволяет пользователю одним кликом запустить новый, более сфокусированный поиск по теме.

US10055462B2
2018-08-21

Семантика и интент
Knowledge Graph
SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank

Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.

US8122026B1
2012-02-21

Семантика и интент
Ссылки
Knowledge Graph

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки

Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.

US9110943B2
2015-08-18

Knowledge Graph
Мультимедиа
Семантика и интент

Как Google определяет сущности (например, болезни) по списку признаков (например, симптомов) в запросе пользователя

Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы.

US8843466B1
2014-09-23

Семантика и интент
Knowledge Graph
Индексация

Как Google динамически фильтрует выдачу, уточняя интент пользователя после клика по результату

Google использует механизм для обработки неоднозначных запросов. Если выдача содержит результаты, относящиеся к разным сущностям (например, «Ягуар» как животное и как автомобиль), клик пользователя по одному из результатов сигнализирует о его интересе к конкретной сущности. При возврате на страницу выдачи система модифицирует SERP, скрывая или понижая результаты, связанные с нерелевантными сущностями, и фокусируя выдачу на выбранном интенте.

US9355158B2
2016-05-31

Семантика и интент
SERP
Поведенческие сигналы

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи

Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.

US8838587B1
2014-09-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента

Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.

US8959093B1
2015-02-17

Поведенческие сигналы
Ссылки
SERP

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов

Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.

US9971746B2
2018-05-15

Структура сайта
SERP
Ссылки

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы

Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.

US11782998B2
2023-10-10

Семантика и интент
Индексация
Мультимедиа

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию

Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.

US8321463B2
2012-11-27

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов

Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.

US7610282B1
2009-10-27

Поведенческие сигналы
SERP
Семантика и интент

Как Google использует машинное обучение для оптимизации обхода Knowledge Graph и поиска связанных концепций

Google оптимизирует обход Knowledge Graph для эффективного поиска семантически связанных фраз. Вместо анализа всех связей сущности система использует ML-модели для выбора только тех отношений (свойств), которые вероятнее всего приведут к ценным результатам. Этот выбор основан на истории поисковых запросов и контексте пользователя, что позволяет экономить вычислительные ресурсы и повышать релевантность предложений.

US10140286B2
2018-11-27

Knowledge Graph
Семантика и интент
Персонализация

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей

Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.

US8595225B1
2013-11-26

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов

Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.

US8495483B1
2013-07-23

Индексация
Ссылки
SERP

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования

Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.

US8862572B2
2014-10-14

Поведенческие сигналы
Ссылки