SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google индексирует и ранжирует контент дополненной реальности и цифровые дополнения для визуального поиска (Google Lens)

DIGITAL SUPPLEMENT ASSOCIATION AND RETRIEVAL FOR VISUAL SEARCH (Ассоциация и поиск цифровых дополнений для визуального поиска)
  • US10878037B2
  • Google LLC
  • 2018-06-21
  • 2020-12-29
  • Индексация
  • Краулинг
  • Мультимедиа
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google создал систему для индексации и ранжирования цифровых дополнений (например, AR-контента, купонов, приложений), связанных с реальными объектами. Система сканирует веб-страницы в поисках метаданных, которые связывают эти дополнения с визуальными анкорями (продуктами, изображениями, местами). При визуальном поиске Google ранжирует эти дополнения, используя сигналы престижа (аналог PageRank) и релевантности, чтобы предоставить пользователю наиболее полезный интерактивный опыт.

Описание

Какую проблему решает

Патент решает проблему обнаружения, индексации и предоставления релевантных цифровых дополнений (Digital Supplements) в ответ на визуальный поиск (Visual Search). В интернете существует множество интерактивного контента (например, AR-опыты, приложения, видео, купоны), связанного с физическими объектами, но нет централизованного способа найти этот контент, просто посмотрев на объект. Изобретение создает инфраструктуру, позволяющую поисковой системе индексировать эти дополнения, предоставляемые сторонними веб-ресурсами, и ранжировать их для пользователей визуального поиска (например, Google Lens).

Что запатентовано

Запатентована система для создания и использования индекса цифровых дополнений, связанных с визуальными анкорями (Supplement Anchors). Система сканирует сетевые ресурсы (Network-Accessible Resources) для обнаружения метаданных, описывающих дополнения и их анкоря (например, конкретные продукты, изображения или типы объектов). Эти данные индексируются. В ответ на запрос визуального контента (Visual-Content Query) система идентифицирует анкоря в изображении, находит соответствующие дополнения в индексе и возвращает упорядоченный список релевантных дополнений.

Как это работает

Система работает в двух основных фазах:

  • Индексация: Контент-краулер (Content Crawler) сканирует веб-страницы, ищет метаданные (например, XML или JSON), которые определяют цифровое дополнение и связанные с ним анкоря. Система также вычисляет метрики качества, такие как оценка престижа (Prestige Score), основанная на ссылках, и оценка релевантности (Relevance Score). Эта информация сохраняется в индексе.
  • Поиск и ранжирование: Пользователь направляет камеру на объект и инициирует визуальный поиск. Система идентифицирует анкоря в изображении (например, распознает продукт). Затем она ищет в индексе дополнения, связанные с этим анкорем. Найденные дополнения ранжируются на основе их оценок престижа, релевантности и контекста пользователя (например, местоположения), после чего предоставляются пользователю в виде упорядоченного списка.

Актуальность для SEO

Высокая. Визуальный поиск (Google Lens) и дополненная реальность (AR) являются стратегическими направлениями развития поиска Google. Этот патент описывает фундаментальную инфраструктуру, необходимую для масштабирования этих технологий путем индексации контента, предоставляемого сторонними разработчиками и вебмастерами. Актуальность возрастает по мере интеграции визуального поиска в мобильные устройства и носимые гаджеты.

Важность для SEO

Патент имеет высокое стратегическое значение для SEO, поскольку он описывает механизм, лежащий в основе оптимизации под визуальный поиск (Visual Search Optimization) и "AR SEO". Он показывает, что Google применяет классические принципы SEO (сканирование, индексация, релевантность и авторитетность/престиж) к новому типу контента — цифровым дополнениям. SEO-специалистам необходимо понимать, как публиковать метаданные для индексации своих дополнений и как повышать их Prestige Score и Relevance Score для достижения высоких позиций в выдаче визуального поиска.

Детальный разбор

Термины и определения

Digital Supplement (Цифровое дополнение)
Контент любого типа, который дополняет объект или сущность в физической среде (или изображение этого объекта). Примеры: AR-контент, изображения, аудио, видео, текст, игры, приложения, структурированные документы (HTML, XML), купоны или инициаторы рабочих процессов (например, добавление товара в корзину).
Supplement Anchor (Анкорь дополнения)
Визуальный триггер, с которым связано цифровое дополнение. Анкорь идентифицируется в запросе визуального контента. Примеры: конкретные сущности (здания, произведения искусства, продукты, книги, люди), текст, извлеченный из изображения (OCR), штрих-коды, QR-коды или типы сущностей.
Visual-Content Query (Запрос визуального контента)
Поисковый запрос, основанный на изображении. Может включать само изображение или данные, полученные из него (например, идентификаторы распознанных сущностей или текст), а также контекстную информацию (например, местоположение).
Network-Accessible Resource (Сетевой ресурс)
Веб-страница или другой доступный через сеть ресурс, который предоставляет цифровое дополнение и содержит метаданные для его индексации.
Metadata (Метаданные)
Структурированные данные (например, XML, JSON), встроенные в сетевой ресурс. Описывают цифровое дополнение, его анкоря, информацию для доступа (URL, приложение), описание, издателя и контекстные условия (например, геолокацию).
Content Crawler (Контент-краулер)
Компонент поискового сервера, который сканирует сетевые ресурсы для обнаружения и индексации цифровых дополнений на основе метаданных.
Digital Supplement Data Store (Хранилище данных цифровых дополнений)
Индекс или база данных, хранящая информацию о цифровых дополнениях, их анкорях и оценках.
Prestige Score (Оценка престижа)
Метрика популярности или авторитетности цифрового дополнения или связанного с ним сетевого ресурса. Основана на количестве и качестве ссылок, указывающих на них (аналог PageRank).
Relevance Score (Оценка релевантности)
Метрика, определяющая релевантность цифрового дополнения конкретному анкорю. Определяется на основе контента дополнения, контента связанного ресурса, контента ссылающихся сайтов и текста ссылок.

Ключевые утверждения (Анализ Claims)

Патент включает два основных независимых пункта, описывающих процесс индексации (Claim 1) и процесс поиска/извлечения (Claim 17).

Claim 1 (Независимый пункт): Процесс индексации.

  1. Поисковый сервер получает данные от сервера цифровых дополнений, определяющие цифровое дополнение и связанный с ним визуальный анкорь.
  2. Поисковый сервер генерирует экземпляр структуры данных, специфицирующий это дополнение и анкорь.
  3. Этот экземпляр сохраняется в базе данных поискового сервера, содержащей множество других подобных экземпляров.
  4. После сохранения система активирует возможность вызова (triggering) этого цифрового дополнения в ответ на запрос визуального контента, полученный от клиентского устройства, если запрос содержит изображение с этим анкорем.

Claim 2, 3, 4 (Зависимые от 1): Механизм обнаружения.

Получение данных (из п.1) включает анализ веб-страницы и идентификацию метаданных на ней. Этому может предшествовать сканирование (crawling) множества веб-страниц или получение идентификатора (URL) веб-страницы (например, через submission API).

Claim 5, 6 (Зависимые от 2): Ассоциация с оценками.

Сгенерированная структура данных ассоциируется с оценкой популярности (popularity score) веб-страницы (Claim 5) и/или оценкой релевантности (relevance score) для визуального анкоря на основе этой веб-страницы (Claim 6).

Claim 17 (Независимый пункт): Процесс поиска и извлечения.

  1. Поисковый сервер получает запрос визуального контента (включая изображение) от клиентского устройства.
  2. Поисковый сервер идентифицирует визуальный анкорь в этом изображении.
  3. Выполняется поиск в базе данных структур данных (индексе).
  4. Идентифицируются цифровые дополнения на основе найденного анкоря и результатов поиска в базе данных.
  5. Генерируется упорядоченный список (ordered list) идентифицированных цифровых дополнений.
  6. Этот упорядоченный список передается клиентскому устройству.

Claim 23 (Зависимый от 17): Ранжирование.

Цифровые дополнения в списке упорядочиваются на основе оценок популярности (popularity scores) и/или оценок релевантности (relevance scores).

Где и как применяется

Изобретение охватывает все основные этапы поисковой архитектуры, формируя полноценную вертикаль визуального поиска.

CRAWLING – Сканирование и Сбор данных
Content Crawler активно ищет сетевые ресурсы (веб-страницы), которые содержат метаданные, указывающие на наличие цифровых дополнений. Также предусмотрена возможность прямой отправки URL через форму или API.

INDEXING – Индексирование и извлечение признаков
Ключевой этап. Система анализирует полученные метаданные, извлекает информацию о дополнении, его анкорях и контекстных требованиях. На этом же этапе вычисляются критически важные метрики ранжирования: Prestige Score (на основе ссылочного графа) и Relevance Score (на основе контентного и ссылочного анализа). Данные сохраняются в Digital Supplement Data Store.

QUNDERSTANDING – Понимание Запросов
Система обрабатывает Visual-Content Query. Это включает анализ изображения с использованием технологий машинного зрения (например, сверточных нейронных сетей, CNN) для распознавания сущностей, текста (OCR) или кодов, которые служат анкорями дополнений.

RANKING – Ранжирование
Digital Supplement Search Engine использует идентифицированные анкоря для поиска кандидатов в индексе. Затем применяется алгоритм ранжирования, учитывающий Prestige Score, Relevance Score и контекст запроса (например, местоположение устройства, требуемые приложения) для формирования упорядоченного списка.

METASEARCH – Метапоиск и Смешивание
Результаты этого поиска формируют выдачу для визуального поиска (например, в Google Lens), которая может быть представлена пользователю в виде списка или наложена непосредственно на изображение в виде AR-контента.

Входные данные (Индексация):

  • URL сетевых ресурсов.
  • Метаданные (XML/JSON) с описанием дополнений и анкорей.
  • Данные ссылочного графа интернета.
  • Контент сетевых ресурсов.

Входные данные (Поиск):

  • Изображение (или видеопоток).
  • Контекстная информация (местоположение, данные пользователя).

Выходные данные:

  • Упорядоченный список цифровых дополнений, включающий данные для доступа (URL, параметры запуска приложения) и описательные данные (название, описание, изображение).

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние оказывается на E-commerce (AR-просмотр товаров, купоны), локальный бизнес (информация о ресторанах, музеях), развлечения (трейлеры фильмов по постерам) и образование. Влияет на любой контент, который может быть визуально идентифицирован и дополнен цифровой информацией.
  • Специфические запросы: Влияет на информационные и транзакционные запросы, инициированные через визуальный поиск (например, "что это за продукт", "купить это", "как это использовать").

Когда применяется

  • Триггеры активации: Активируется при получении запроса визуального контента от пользователя (например, при использовании Google Lens).
  • Условия работы алгоритма (Индексация): Применяется, когда краулер обнаруживает корректные метаданные на сетевом ресурсе.
  • Условия работы алгоритма (Поиск): Применяется, когда система успешно идентифицирует один или несколько анкорей дополнений в изображении, для которых в индексе существуют релевантные цифровые дополнения, удовлетворяющие контекстным условиям.

Пошаговый алгоритм

Процесс А: Индексация цифровых дополнений (Офлайн/Непрерывный процесс)

  1. Сканирование: Content Crawler обходит сетевые ресурсы (веб-страницы), используя стандартные методы краулинга или получая URL через API.
  2. Анализ ресурса: Система анализирует содержимое ресурса на наличие индикаторов метаданных, связанных с цифровыми дополнениями (например, специфических тегов или структур данных JSON/XML).
  3. Идентификация метаданных: При обнаружении метаданных система извлекает информацию о дополнении.
  4. Извлечение данных: Извлекаются данные доступа (URL, приложение), описательные данные (название, издатель) и, самое главное, идентификаторы анкорей дополнений и контекстная информация.
  5. Расчет оценок: Система вычисляет Prestige Score (на основе ссылок на ресурс/дополнение) и Relevance Score (на основе анализа контента и ссылок относительно анкоря).
  6. Генерация и сохранение: Генерируется экземпляр структуры данных, объединяющий всю информацию и оценки. Он сохраняется в Digital Supplement Data Store (индекс), связывая дополнение с анкорем.
  7. Активация: Дополнение становится доступным для поиска.

Процесс Б: Обработка визуального запроса (Реальное время)

  1. Получение запроса: Поисковый сервер получает Visual-Content Query от клиентского устройства, включающий изображение и контекстные данные.
  2. Идентификация анкорей: Система анализирует изображение для идентификации потенциальных анкорей дополнений (сущностей, текста, кодов).
  3. Поиск в индексе: Идентифицированные анкоря используются для запроса к Digital Supplement Data Store.
  4. Идентификация кандидатов: Система определяет набор цифровых дополнений, связанных с найденными анкорями.
  5. Контекстная фильтрация: Кандидаты проверяются на соответствие контексту запроса (например, местоположению пользователя, наличию необходимых приложений на устройстве).
  6. Ранжирование: Оставшиеся кандидаты ранжируются для формирования упорядоченного списка. Ранжирование основано на Prestige Score и Relevance Score.
  7. Ответ: Упорядоченный список передается клиентскому устройству для отображения пользователю.

Какие данные и как использует

Данные на входе

Патент описывает использование широкого спектра данных, аналогичных тем, что используются в традиционном веб-поиске, но адаптированных для визуального контекста.

  • Контентные факторы: Содержание цифрового дополнения и контент сетевого ресурса, на котором оно размещено. Используются для расчета Relevance Score.
  • Структурные факторы (Метаданные): Критически важные данные. Метаданные (XML, JSON) используются для идентификации дополнения, его названия, описания, изображения, издателя, анкорей и контекстных условий.
  • Ссылочные факторы: Входящие ссылки на цифровое дополнение или на сетевой ресурс, его предоставляющий. Используются для расчета Prestige Score. Также анализируется текст ссылок (anchor text) для расчета Relevance Score.
  • Пользовательские и Географические факторы: Местоположение устройства, идентификатор пользователя. Используются как контекстная информация для фильтрации и ранжирования дополнений (например, купон для конкретного магазина).
  • Технические факторы: Требования к устройству или необходимые приложения для доступа к дополнению (указываются в метаданных).

Какие метрики используются и как они считаются

  • Prestige Score (Оценка престижа): Метрика популярности. Рассчитывается на основе комбинации количества ссылок с других сетевых ресурсов на данное дополнение и оценок престижа этих ссылающихся ресурсов. Это прямой аналог PageRank для цифровых дополнений.
  • Relevance Score (Оценка релевантности): Метрика релевантности дополнения конкретному анкорю или тематике. Рассчитывается на основе анализа контента самого дополнения, контента связанного сетевого ресурса, контента ссылающихся сайтов и текста входящих ссылок.
  • Confidence Score (Оценка уверенности): Метрика, используемая при распознавании анкорей в изображении. Указывает на вероятность того, что объект в изображении действительно является данным анкорем.
  • Частота использования: Упоминается возможность ранжирования на основе частоты или недавности использования дополнения конкретным пользователем.

Выводы

  1. Создание "Интернета для AR" и Визуального Поиска: Патент описывает инфраструктуру, которая позволяет Google сканировать, индексировать и ранжировать интерактивный контент (цифровые дополнения), связанный с реальным миром, аналогично тому, как он индексирует веб-страницы. Это открывает возможности для "Visual Search SEO".
  2. Критичность Метаданных для Индексации: Чтобы цифровое дополнение попало в индекс, оно должно быть описано с помощью структурированных метаданных на доступном для сканирования сетевом ресурсе. Вебмастера должны явно указывать, с какими анкорями связано дополнение.
  3. Классические SEO-факторы для Ранжирования: Ранжирование цифровых дополнений основано на знакомых SEO-специалистам концепциях:
    • Авторитетность (Prestige Score): Аналог PageRank, основанный на ссылках.
    • Релевантность (Relevance Score): Основана на контенте и тексте входящих ссылок.
  4. Важность Контекста: Контекст пользователя (местоположение, устройство, установленные приложения) играет ключевую роль в фильтрации и ранжировании дополнений. Дополнение может быть релевантным анкорю, но не показано, если контекст не соответствует (например, пользователь находится не в том месте).
  5. Множественность Дополнений для Одного Анкоря: Один и тот же объект (анкорь) может иметь множество цифровых дополнений от разных поставщиков. Система ранжирует их, чтобы выбрать лучшие, предоставляя пользователю выбор.

Практика

Best practices (это мы делаем)

  • Разработка Стратегии Цифровых Дополнений: Определите, какие цифровые дополнения могут быть полезны для ваших продуктов, услуг или локаций (например, AR-примерка, 3D-модели мебели, купоны для локального магазина, инструкции по использованию продукта, видеообзоры).
  • Внедрение Структурированных Метаданных: Обеспечьте наличие на ваших веб-страницах (сетевых ресурсах) структурированных метаданных (XML/JSON), которые точно описывают ваши цифровые дополнения и связывают их с конкретными анкорями (идентификаторами продуктов, изображениями). Хотя стандарт не указан в патенте, необходимо следить за рекомендациями Google для Visual Search.
  • Оптимизация под Relevance Score: Убедитесь, что контент на странице, где размещены метаданные, и контент самого дополнения максимально релевантны анкорю. Используйте релевантный текст и описания.
  • Наращивание Prestige Score (Link Building): Применяйте стратегии линкбилдинга для страниц, на которых размещены ваши цифровые дополнения. Авторитетные ссылки повысят Prestige Score и улучшат ранжирование ваших дополнений в визуальном поиске по сравнению с конкурентами.
  • Оптимизация Анкорей (Изображений): Убедитесь, что ваши продукты, логотипы или изображения в каталогах легко распознаются системами машинного зрения. Четкие, высококонтрастные изображения улучшают идентификацию анкорей.
  • Использование Контекстных Сигналов: Для локального бизнеса используйте контекстную информацию (геолокацию) в метаданных, чтобы предоставлять дополнения (например, купоны) только пользователям, находящимся поблизости.

Worst practices (это делать не надо)

  • Игнорирование Визуального Поиска: Отсутствие стратегии по созданию и индексации цифровых дополнений приведет к потере видимости в Google Lens и аналогичных сервисах.
  • Создание Низкокачественных Дополнений (Spam): Попытки манипулировать выдачей путем создания бесполезных дополнений или неточного связывания их с популярными анкорями будут неэффективны из-за механизмов ранжирования по релевантности и престижу.
  • Отсутствие Метаданных: Создание полезного AR-контента или приложений без предоставления метаданных для индексации не позволит поисковой системе обнаружить и предложить их пользователям визуального поиска.
  • Игнорирование Ссылочного Профиля: Фокусировка только на создании дополнения без работы над авторитетностью хост-страницы приведет к низким позициям в ранжировании.

Стратегическое значение

Этот патент подтверждает, что Google строит экосистему визуального поиска, основанную на открытых веб-стандартах и классических принципах ранжирования. Это не закрытая платформа, а расширение веба в физический мир. Долгосрочная SEO-стратегия должна включать оптимизацию под визуальный поиск как отдельное направление, требующее интеграции технического SEO (метаданные), контент-стратегии (создание дополнений) и PR/Link Building (повышение престижа). Это особенно критично для E-commerce и брендов, чьи продукты существуют в физическом мире.

Практические примеры

Сценарий 1: Индексация AR-модели для E-commerce

  1. Задача: Мебельный магазин хочет, чтобы пользователи могли увидеть 3D-модель дивана в своей комнате через Google Lens.
  2. Действие: На странице продукта (сетевой ресурс) размещается код JSON (метаданные). В нем указывается URL 3D-модели (цифровое дополнение) и идентификатор продукта (анкорь).
  3. Индексация: Google сканирует страницу, индексирует метаданные, рассчитывает Prestige Score страницы.
  4. Результат: Когда пользователь сканирует диван в каталоге или в шоуруме (визуальный запрос), система распознает анкорь и предлагает опцию "Просмотр в комнате" (если ранг дополнения достаточно высок).

Сценарий 2: Локальный маркетинг и купоны

  1. Задача: Сеть кофеен хочет предлагать купон посетителям.
  2. Действие: На сайте кофейни создается страница с метаданными, описывающими купон (цифровое дополнение). В качестве анкоря используется логотип кофейни, а в качестве контекстного условия — геолокация магазинов.
  3. Индексация: Google индексирует дополнение и его условия.
  4. Результат: Когда пользователь сканирует логотип на стаканчике или вывеске, находясь рядом с кофейней, система предлагает активировать купон. Если пользователь находится в другом городе, дополнение не будет показано.

Вопросы и ответы

Что такое "Цифровое дополнение" (Digital Supplement) в контексте этого патента?

Это любой тип контента, который связан с реальным объектом (анкорем) и дополняет его. Это может быть не только AR-контент (3D-модели), но и видео, текст, купоны, ссылки на покупку товара, или даже запуск определенного приложения или рабочего процесса (workflow) на устройстве пользователя. По сути, это интерактивный результат визуального поиска.

Как Google узнает о существовании моего цифрового дополнения или AR-контента?

Google использует Контент-краулер для сканирования интернета, аналогично традиционному поиску. Чтобы ваше дополнение было проиндексировано, вы должны разместить специальные структурированные метаданные (в формате XML или JSON) на вашей веб-странице (сетевом ресурсе). Эти метаданные описывают дополнение и указывают, с какими объектами (анкорями) оно связано.

Что такое "Анкорь дополнения" (Supplement Anchor)?

Это визуальный триггер в реальном мире. Система должна распознать этот анкорь в изображении, чтобы предложить соответствующее дополнение. Анкорем может быть конкретный продукт, произведение искусства, здание, логотип, текст на изображении (например, название ресторана на чеке), штрих-код или QR-код.

Как ранжируются цифровые дополнения, если для одного объекта их несколько?

Патент описывает механизм ранжирования, очень похожий на традиционный поиск. Используются две основные метрики: Prestige Score (аналог PageRank, основанный на количестве и качестве входящих ссылок на дополнение или его хост-страницу) и Relevance Score (насколько дополнение соответствует анкорю, основываясь на контенте и тексте ссылок). Также учитывается контекст пользователя (например, местоположение).

Означает ли это, что для визуального поиска нужен линкбилдинг?

Да, абсолютно. Для повышения Prestige Score вашего цифрового дополнения необходимо, чтобы на страницу, где оно описано (или на само дополнение), ссылались авторитетные ресурсы. Это делает стратегии линкбилдинга критически важными для достижения высоких позиций в выдаче визуального поиска.

Какую роль играет контекст (например, местоположение) в этом патенте?

Контекст играет роль фильтра и фактора ранжирования. В метаданных можно указать условия, при которых дополнение актуально (например, географическое положение, необходимое приложение). Если пользователь не соответствует контексту (например, находится далеко от магазина, предлагающего купон), дополнение может быть не показано, даже если анкорь распознан.

Нужно ли отправлять Google свои изображения или 3D-модели для индексации?

Нет, система работает по принципу веба. Вы размещаете контент и метаданные на своем сервере. В метаданных вы предоставляете URL, по которому клиентское устройство пользователя сможет получить доступ к дополнению (например, загрузить 3D-модель или открыть веб-страницу).

Как этот патент влияет на E-commerce SEO?

Влияние огромно. Он позволяет магазинам связывать свои продукты (анкоря) с интерактивными дополнениями: AR-примеркой, быстрой покупкой, отзывами, купонами. Для получения трафика из визуального поиска необходимо оптимизировать карточки товаров, внедрять метаданные и работать над авторитетностью сайта для повышения Prestige Score.

Упоминается ли в патенте конкретный формат метаданных, например, Schema.org?

Патент не специфицирует конкретный стандарт разметки, такой как Schema.org. Он упоминает использование XML или JSON для предоставления метаданных. SEO-специалистам следует ориентироваться на актуальную техническую документацию Google по визуальному поиску и индексации AR-контента, чтобы использовать поддерживаемый формат.

Как обеспечить точное распознавание моих продуктов как анкорей?

Патент фокусируется на индексации и ранжировании дополнений, а не на механизме распознавания изображений. Однако для эффективной работы системы необходимо, чтобы анкоря были четко идентифицируемы. Использование высококачественных, четких изображений продуктов на сайте, в каталогах и на упаковке улучшит способность систем машинного зрения распознавать их как анкоря.

Похожие патенты

Как Google индексирует и ранжирует AR-контент и действия в результатах визуального поиска (Google Lens)
Патент описывает систему Google для визуального поиска, которая позволяет находить и предоставлять пользователям «цифровые дополнения» (например, AR-контент, действия, информацию) в ответ на изображение реального мира. Система сканирует интернет в поисках метаданных о доступных дополнениях, индексирует их, связывая с визуальными анкорями (объектами, текстом, кодами), и ранжирует их в ответ на визуальный запрос пользователя.
  • US10579230B2
  • 2020-03-03
  • Индексация

  • Мультимедиа

  • Краулинг

Как Google использует визуальное сходство для связывания изображений и видео, кластеризации выдачи и обогащения метаданных
Google анализирует визуальное содержимое изображений и ключевых кадров видео для выявления сходств. Это позволяет связывать разнотипный контент, даже если у него мало текстовых данных. Система использует эти связи для переноса метаданных (например, ключевых слов или геопозиции) от одного ресурса к другому, а также для кластеризации и смешивания изображений и видео в результатах поиска.
  • US9652462B2
  • 2017-05-16
  • Мультимедиа

  • SERP

  • Семантика и интент

Как Google агрегирует и ранжирует пользовательские метки для идентификации объектов в Визуальном поиске (Google Lens)
Google использует этот механизм для повышения точности идентификации объектов при поиске по изображению. Система находит множество визуально похожих изображений, загруженных пользователями (UGC), и анализирует их текстовые метки. Метки группируются по смыслу, а затем эти группы ранжируются на основе совокупной визуальной релевантности. Это позволяет определить наиболее вероятное название объекта, опираясь на коллективное мнение.
  • US9424279B2
  • 2016-08-23
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google распознает и связывает объекты на изображении с результатами поиска (Архитектура Google Lens)
Google использует систему параллельных поисковых движков (OCR, распознавание лиц, объектов, продуктов) для анализа визуального запроса (изображения). Система создает интерактивный документ, накладывая на исходное изображение визуальные идентификаторы (например, рамки или метки) для распознанных объектов. Эти идентификаторы служат ссылками на конкретные результаты поиска для каждого объекта.
  • US9087059B2
  • 2015-07-21
  • Мультимедиа

  • Ссылки

Как Google разбирает визуальные запросы, отправляя их одновременно в несколько специализированных поисковых систем (OCR, распознавание лиц, объектов)
Google использует архитектуру для обработки визуальных запросов (изображений), которая одновременно отправляет изображение в несколько параллельных поисковых систем (распознавание текста, лиц, объектов, штрихкодов). Система агрегирует результаты, часто создавая интерактивный документ, где разные части изображения связаны с соответствующими результатами поиска, и использует обратную связь для обучения.
  • US9135277B2
  • 2015-09-15
  • Мультимедиа

  • SERP

Популярные патенты

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
  • US7664734B2
  • 2010-02-16
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)
Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.
  • US9558233B1
  • 2017-01-31
  • Ссылки

  • Поведенческие сигналы

  • Антиспам

seohardcore