SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует ИИ для анализа отзывов и создания «Бейджей», выделяющих конкретные сценарии использования продуктов в поиске

ARTIFICIAL INTELLIGENCE GENERATED BADGES FOR SEARCH (Сгенерированные искусственным интеллектом бейджи для поиска)
  • US20240378256A1 (Заявка на патент)
  • Google LLC
  • 2024-04-16 (Приоритет от 2023-05-09)
  • 2024-11-14
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google разрабатывает систему автоматического создания «Бейджей» для продуктов на основе анализа веб-данных (отзывов, описаний, FAQ) с помощью машинного обучения. Эти бейджи выделяют конкретные сценарии использования, преимущества или недостатки продукта (например, «Подходит для новичков» или «Хорош для путешествий»). Бейджи используются для ранжирования и аннотирования результатов поиска, помогая пользователям быстрее сравнивать товары.

Описание

Какую проблему решает

Патент решает проблему сложности быстрой оценки и сравнения продуктов непосредственно на странице результатов поиска (SERP). Пользователям часто трудно понять, какой продукт лучше всего подходит для конкретного сценария использования или каковы его ключевые преимущества, не переходя на многочисленные страницы и не изучая отзывы вручную. Система направлена на автоматизацию этого анализа и предоставление ключевых дифференцирующих атрибутов прямо в выдаче.

Что запатентовано

Запатентована система, использующая модели машинного обучения (machine-learned models) для анализа неструктурированной веб-информации (web information), такой как отзывы пользователей и описания продуктов. Цель — определить ключевые атрибуты: конкретные сценарии использования (particular uses), преимущества или недостатки. На основе этих данных генерируются «Бейджи» (Badges), которые затем интегрируются в поисковую систему для улучшения ранжирования, обеспечения разнообразия и аннотирования результатов поиска.

Как это работает

Система работает в несколько этапов:

  • Сбор данных: Собирается Web Information о продукте (отзывы, FAQ, описания).
  • Анализ атрибутов: Модели машинного обучения (включая NLP и анализ тональности) обрабатывают данные для выявления часто упоминаемых сценариев использования или качеств.
  • Генерация бейджей: На основе выявленных атрибутов генерируются текстовые метки (бейджи).
  • Эмбеддинги и кластеризация: Бейджи преобразуются в векторные представления (badge embeddings) и группируются в кластеры (badge clusters) для идентификации схожих атрибутов и предотвращения избыточности. В патенте упоминается возможное использование модели MUM для оценки схожести.
  • Интеграция в поиск: При получении запроса система использует бейджи и кластеры для ранжирования и отбора разнообразных результатов.
  • Отображение в SERP: Результаты поиска аннотируются соответствующими бейджами, часто рядом с генеративным ответом ИИ (model-generated response).

Актуальность для SEO

Критически высокая. Эта заявка на патент (подана в 2024 г., приоритет от 2023 г.) напрямую отражает текущие стратегические направления Google: использование ИИ для глубокого понимания продуктов (Shopping Graph) и интеграция генеративных ответов в поиск (SGE/AI Overviews). Описанные механизмы, включая использование эмбеддингов, кластеризации и моделей типа MUM, являются передовыми технологиями в современном поиске и подчеркивают важность реального опыта (Experience в E-E-A-T).

Важность для SEO

Влияние на SEO, особенно в E-commerce и на сайтах с обзорами, значительно (8/10). Патент показывает, что Google автоматизирует понимание того, для чего и для кого предназначен продукт, используя отзывы и описания как основной источник данных. Это критически меняет контент-стратегию: необходимо не просто оптимизировать под ключевые слова, а обеспечить, чтобы ИИ мог четко извлечь конкретные сценарии использования и преимущества из доступного веб-контента.

Детальный разбор

Термины и определения

Badges (Бейджи)
Сгенерированные ИИ метки (часто текстовые), которые описывают определенное качество субъекта (продукта, объекта). Основаны на выявленных сценариях использования, преимуществах (advantages) или недостатках (disadvantages).
Badge Clusters (Кластеры бейджей)
Группы семантически схожих бейджей, определенные на основе близости их эмбеддингов. Используются для обеспечения разнообразия и предотвращения избыточности в SERP.
Badge Embeddings (Эмбеддинги бейджей)
Векторные представления бейджей в многомерном пространстве. Используются для измерения семантической близости между бейджами, а также между бейджами и поисковыми запросами (Query Embedding).
ML Models (Модели машинного обучения)
Набор моделей для анализа веб-данных. Включают NLP (обработка естественного языка), Sentiment Analysis (анализ тональности), Trend analysis (анализ трендов), а также Embedding Model и Use Case Model.
MUM Model (Модель MUM)
Multitask Unified Model. Упоминается в патенте как инструмент для определения схожести между парами кандидатов в сценарии использования при кластеризации.
Particular Uses (Конкретные сценарии использования)
Ключевые атрибуты продукта, отвечающие на вопросы: Где (сценарий/место), Почему (цель), Когда (время) или Кто (тип пользователя). Примеры: «для рыбалки», «для путешествий», «для новичков».
Web Information (Веб-информация)
Исходные данные для генерации бейджей. Включают отзывы пользователей (User Reviews), редакторские обзоры (Editorial Reviews), описания продуктов, FAQ, заголовки руководств по покупке.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый процесс генерации и использования бейджей на основе сценариев использования.

  1. Получение веб-данных о конкретном продукте.
  2. Обработка данных ML-моделями для определения одного или нескольких Particular Uses.
  3. Генерация одного или нескольких Badges на основе этих сценариев.
  4. Сохранение бейджей в ассоциации с продуктом.
  5. Получение поискового запроса (связанного с типом продукта).
  6. Предоставление SERP, основанного на запросе И сгенерированных бейджах.

Claim 3 (Зависимый от 1): Уточняет механизм определения Particular Uses.

Определение основано на частоте термина (frequency of a term), анализе тональности (sentiment analysis) и семантическом понимании (semantic understanding).

Claim 5, 6 и 7 (Зависимые): Описывают роль эмбеддингов и кластеризации.

  1. Бейджи преобразуются в Badge Embeddings (Claim 5).
  2. Поисковый запрос преобразуется в Query Embedding, и результаты предоставляются на основе связи между эмбеддингом запроса и эмбеддингом бейджа (Claim 6).
  3. Эмбеддинги бейджей используются для формирования Badge Clusters, и результаты поиска определяются на основе этих кластеров (Claim 7). Это механизм обеспечения разнообразия.

Claim 11 (Независимый пункт): Описывает аналогичный процесс, но фокусируется на извлечении преимуществ или недостатков.

  1. Обработка контента веб-ресурсов ML-моделями для определения advantages или disadvantages объекта.
  2. Генерация бейджей (текстовых меток) на основе этих данных.
  3. При получении релевантного запроса предоставление результата поиска с UI-элементом, описывающим бейдж.

Где и как применяется

Изобретение охватывает несколько этапов поисковой архитектуры, с акцентом на индексирование и ранжирование.

INDEXING – Индексирование и извлечение признаков
Это основной этап работы системы. Происходит офлайн-обработка:

  • Сбор и анализ Web Information (отзывы, описания).
  • Применение ML Models (NLP, Sentiment, MUM) для извлечения атрибутов (Particular Uses, Advantages).
  • Генерация Badges.
  • Генерация Badge Embeddings и формирование Badge Clusters.
  • Сохранение этих данных в индексе в ассоциации с продуктами.

QUNDERSTANDING – Понимание Запросов
На этом этапе система генерирует Query Embedding для последующего семантического сопоставления с атрибутами продуктов (Badge Embeddings).

RANKING – Ранжирование (Retrieval)
Система использует сгенерированные данные для отбора кандидатов. Происходит сопоставление Query Embedding с Badge Embeddings. Продукты, чьи бейджи релевантны запросу, получают преимущество.

RERANKING – Переранжирование
На этом этапе применяются механизмы обеспечения разнообразия (Diversity). Используя Badge Clusters, система может гарантировать, что в топе будут представлены результаты с разными типами преимуществ, и ограничивать количество результатов из одного кластера.

Входные данные (Офлайн):

  • Web Information о продукте (отзывы, описания, FAQ).

Выходные данные (Офлайн):

  • Индексированные Badges, Badge Embeddings, Badge Clusters.

Входные данные (Онлайн):

  • Поисковый запрос пользователя.

Выходные данные (Онлайн):

  • Аннотированная SERP, где результаты содержат соответствующие бейджи.

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние на E-commerce, страницы продуктов, обзоры и маркетплейсы. Примеры в патенте включают байдарки, платья, детские коляски, лыжи, пылесосы.
  • Специфические запросы: Влияет на коммерческие и информационные запросы, направленные на сравнение или выбор товаров на основе атрибутов (например, «лучшие лыжи для паудера», «коляска для путешествий»).
  • Форматы контента: Критически повышает ценность пользовательских отзывов (UGC) и экспертных обзоров как источников данных.

Когда применяется

Алгоритм генерации применяется во время индексирования контента, при условии наличия достаточного объема Web Data (особенно отзывов) для анализа. Алгоритм использования бейджей в поиске активируется для запросов, связанных с типами продуктов, для которых бейджи были проиндексированы.

Пошаговый алгоритм

Процесс А: Генерация и индексирование бейджей (Офлайн/Индексирование)

  1. Сбор веб-данных: Идентификация и сбор Web Information (отзывы, обзоры, FAQ, описания), связанных с конкретным продуктом.
  2. Извлечение атрибутов: Обработка данных с помощью ML Models (NLP, Sentiment Analysis). Идентификация Particular Uses или Advantages/Disadvantages на основе частоты терминов, тональности и семантики. Генерация кандидатов (Candidate Use Cases).
  3. Генерация эмбеддингов: Обработка кандидатов с помощью Embedding Model для создания Badge Embeddings.
  4. Кластеризация: Анализ схожести эмбеддингов для группировки схожих бейджей в Badge Clusters. Может использоваться модель MUM для верификации схожести пар кандидатов.
  5. Выбор и сохранение: Выбор финальных бейджей и их сохранение в индексе в ассоциации с продуктом.

Процесс Б: Использование бейджей в поиске (Онлайн/Ранжирование)

  1. Получение запроса: Система получает поисковый запрос.
  2. Анализ запроса: Генерация Query Embedding.
  3. Поиск по бейджам: Сопоставление Query Embedding с Badge Embeddings и/или Badge Clusters для определения релевантных атрибутов.
  4. Отбор результатов: Идентификация продуктов, ассоциированных с релевантными бейджами.
  5. Обеспечение разнообразия: Выбор подмножества бейджей и результатов для отображения, используя Badge Clusters для минимизации дублирования атрибутов в SERP.
  6. Формирование SERP: Предоставление поисковой выдачи, где отобранные результаты аннотированы бейджами. (Опционально: интеграция с ML Response).

Какие данные и как использует

Данные на входе

Система фокусируется на анализе неструктурированного и полуструктурированного контента.

  • Контентные факторы: Критически важные данные. Включают:
    • Отзывы пользователей (User Reviews) — основной источник для анализа тональности и реальных сценариев использования.
    • Редакционные обзоры (Editorial Reviews).
    • Описания продуктов (Descriptions).
    • Ответы на часто задаваемые вопросы (FAQs).
    • Списки на маркетплейсах (Marketplace listings).
    • Заголовки страниц (TopN Page Titles, Buying Guide Page Titles).

Какие метрики используются и как они считаются

Патент описывает ключевые методы анализа и метрики для генерации бейджей:

  • Frequency of a term (Частота термина): Учитывается, как часто определенный сценарий использования или атрибут упоминается в веб-информации о продукте.
  • Sentiment Analysis (Анализ тональности): Используется для определения, является ли упоминание атрибута положительным (преимущество) или отрицательным (недостаток).
  • Semantic Understanding (Семантическое понимание): Применение NLP-моделей (включая MUM) для понимания контекста и смысла отзывов и описаний.
  • Embedding Generation (Генерация эмбеддингов): Преобразование текстовых бейджей и запросов в векторные представления.
  • Embedding Similarity (Схожесть эмбеддингов): Метрика для определения близости векторов в пространстве эмбеддингов. Используется для сопоставления запросов с бейджами и для кластеризации.
  • Clustering (Кластеризация): Группировка схожих эмбеддингов в Badge Clusters для управления разнообразием.

Выводы

  1. Переход к поиску на основе атрибутов (Attribute-based Search): Патент демонстрирует явное намерение Google структурировать SERP вокруг конкретных сценариев использования (Particular Uses) и преимуществ продуктов, а не только на основе общих ключевых слов. Google автоматизирует понимание полезности продукта.
  2. Отзывы (UGC) как критический источник данных: Генерация бейджей напрямую зависит от анализа User Reviews и Editorial Reviews. Качество, детализация и подлинность отзывов по всему интернету становятся критически важными факторами для представления продукта в поиске.
  3. Бейджи как семантические векторы: Бейджи — это не просто текстовые метки; они преобразуются в Badge Embeddings. Это позволяет выполнять семантическое сопоставление с запросом (Query Embedding) и использовать их как значимый сигнал ранжирования.
  4. Кластеризация для масштабирования и разнообразия SERP: Использование Badge Clusters (с возможным участием модели MUM для оценки схожести) является ключевым механизмом для управления разнообразием выдачи. Система группирует синонимичные атрибуты и предотвращает избыточность в SERP.
  5. Интеграция с Генеративным Поиском (SGE): Патент явно предусматривает архитектуру SERP, где аннотированные бейджами результаты отображаются рядом с генеративными ответами (ML Response), что подтверждает их роль в современной экосистеме поиска.

Практика

Best practices (это мы делаем)

  • Стимулирование детализированных и специфических отзывов: Разрабатывайте стратегии для получения подлинных отзывов, которые описывают конкретные сценарии использования (Particular Uses). Просите пользователей рассказать, *как*, *где* и *зачем* они использовали продукт (например, «Эта коляска идеально подошла для перелетов», а не просто «Хорошая коляска»).
  • Фокус на сценариях использования (Use Cases) в контенте: В описаниях продуктов, FAQ и руководствах по покупке четко артикулируйте уникальные преимущества и целевые сценарии использования (Кто, Что, Где, Когда, Почему). Убедитесь, что ваш контент соответствует положительным атрибутам, упомянутым пользователями.
  • Анализ языка пользователей (VoC): Изучайте терминологию, которую пользователи используют в отзывах (на вашем сайте и у конкурентов) для описания преимуществ. Интегрируйте этот естественный язык в ваш контент.
  • Мониторинг внешних упоминаний и обзоров: Активно отслеживайте редакторские обзоры и отзывы на сторонних платформах, так как эти данные также используются для генерации бейджей.

Worst practices (это делать не надо)

  • Генерация фейковых или шаблонных отзывов: Использование сложного семантического понимания (MUM) и анализа тональности направлено на выявление естественных паттернов. Искусственные или поверхностные отзывы не предоставят нужных данных для генерации бейджей и могут быть распознаны как манипуляция.
  • Использование общих и расплывчатых описаний: Контент, который не подчеркивает конкретные сценарии использования или уникальные преимущества, минимизирует данные, доступные Google для генерации полезных бейджей.
  • Игнорирование негативного сантимента в отзывах: Поскольку система идентифицирует как преимущества, так и недостатки (Disadvantages), часто упоминаемые проблемы могут привести к генерации негативных бейджей. Необходимо работать с обратной связью.

Стратегическое значение

Этот патент подтверждает переход Google к поиску, основанному на атрибутах и реальном пользовательском опыте (Experience в E-E-A-T). Для E-commerce SEO это означает, что управление репутацией и работа с отзывами становятся центральными элементами стратегии ранжирования. Система стремится предоставить пользователю готовые выводы из агрегированного опыта других людей. Долгосрочная стратегия должна фокусироваться на том, чтобы контент сайта и UGC четко отражали реальную ценность и сценарии использования продукта.

Практические примеры

Сценарий: Оптимизация карточки товара для детской коляски

  1. Анализ данных (Web Data): SEO-специалист анализирует отзывы и замечает, что многие пользователи хвалят коляску за то, что она «легко складывается одной рукой» и «идеально подходит для путешествий самолетом».
  2. Действия по контенту: В описании продукта и FAQ делается акцент на этих преимуществах с использованием языка пользователей.
  3. Стимулирование UGC: В форме отзыва добавляется вопрос: «Насколько удобно было использовать коляску в путешествиях?»
  4. Ожидаемый результат (Badge Generation): ML-модели Google обрабатывают отзывы и контент. Система идентифицирует ключевые атрибуты и генерирует бейджи: «Легко складывается» и «Подходит для самолета».
  5. Результат в поиске: При запросе «лучшая коляска для путешествий» данный товар получает преимущество в ранжировании из-за релевантных бейджей и отображается в SERP с соответствующими аннотациями, что повышает CTR.

Вопросы и ответы

Какие основные источники данных использует Google для генерации этих «Бейджей» (Badges)?

Патент указывает на Web Information как основной источник. Конкретно упоминаются отзывы пользователей (user reviews), редакционные обзоры (editorial reviews), описания продуктов, FAQ, а также заголовки страниц руководств по покупке. Отзывы пользователей играют центральную роль в этом процессе.

Как именно ИИ определяет, какой бейдж присвоить продукту?

Система использует комбинацию методов машинного обучения. Она анализирует частоту упоминания определенных терминов в контенте. Затем применяется анализ тональности (Sentiment Analysis), чтобы понять, является ли упоминание положительным или отрицательным. Наконец, используется семантическое понимание для интерпретации контекста и значения атрибута.

Что такое «Кластеры бейджей» (Badge Clusters) и как они влияют на SERP?

Badge Clusters — это группы семантически похожих бейджей (например, «Для новичков» и «Легко использовать»). Они определяются через анализ векторных представлений (Badge Embeddings). Кластеры используются для обеспечения разнообразия в SERP: система может показать только один репрезентативный бейдж из кластера, чтобы избежать избыточности и показать разные типы атрибутов.

Упоминается ли модель MUM в этом патенте и какова ее роль?

Да, модель MUM (Multi-task Unified Model) упоминается в описании процесса кластеризации. Она используется для оценки схожести между парами кандидатов в сценарии использования. Это помогает системе понять, являются ли два разных текстовых описания (например, «хорош для походов» и «идеален для треккинга») семантически одинаковыми для целей кластеризации.

Как этот патент связан с Генеративным поиском (SGE/AI Overviews)?

Связь прямая. Патент описывает и иллюстрирует интерфейсы SERP, где результаты с бейджами отображаются рядом с ответом, сгенерированным моделью (model-generated response или ML Response). Это указывает на то, что система бейджей интегрирована в архитектуру генеративного поиска, дополняя сводную информацию структурированными атрибутами для сравнения товаров.

Может ли система сгенерировать негативные бейджи?

Да, это возможно. Патент явно упоминает извлечение как преимуществ (advantages), так и недостатков (disadvantages). Используя анализ тональности, система может идентифицировать частые жалобы пользователей и потенциально сгенерировать бейджи, отражающие эти недостатки.

Какие типы атрибутов система пытается извлечь?

Патент приводит конкретную структуру для анализа сценариев использования (Particular Uses): Где (сценарий/место, например, «для пляжа»), Почему (цель, например, «для рыбалки»), Когда (время, например, «для зимы») и Кто (тип пользователя, например, «для детей»). SEO-специалистам следует ориентироваться на эти категории.

Как «Эмбеддинги бейджей» (Badge Embeddings) используются в ранжировании?

Badge Embeddings позволяют системе понять семантическое значение бейджа. При получении запроса система генерирует его векторное представление (Query Embedding) и ищет бейджи с близкими векторами. Продукты, ассоциированные с этими семантически релевантными бейджами, получают преимущество в ранжировании.

Как SEO-специалисту повлиять на генерацию бейджей?

Напрямую контролировать генерацию нельзя, но можно оптимизировать источники данных. Необходимо стимулировать подробные, честные отзывы, которые подчеркивают конкретные сценарии использования, и создавать четкие описания и FAQ, отражающие эти преимущества, используя естественный язык пользователей.

Что важнее для SEO в контексте этого патента: качество страницы или качество отзывов?

Оба фактора важны, но этот патент смещает акцент на качество и детализацию отзывов как уникальный источник данных о реальном использовании продукта. Подробные отзывы могут компенсировать недостатки стандартной оптимизации страницы, предоставляя Google данные для генерации бейджей, которые напрямую влияют на ранжирование по атрибутивным запросам.

Похожие патенты

Как Google динамически обогащает сниппеты, ранжируя отзывы, атрибуты и упоминания для обоснования результатов поиска
Google использует фреймворк для обогащения результатов поиска вспомогательной информацией (аннотациями), такой как редакционные упоминания, списки Топ-X, атрибуты товаров и контекстные отзывы. Система использует машинное обучение для оценки и ранжирования этих разнородных данных, чтобы динамически выбрать наиболее полезный дополнительный сниппет. Это позволяет обосновать позицию результата и повысить доверие пользователя.
  • US12164527B2
  • 2024-12-10
  • SERP

Как Google находит, извлекает и объединяет отзывы о товарах из интернета для создания агрегированных рейтингов и выявления частых фраз
Патент описывает систему Google для сбора отзывов о товарах из интернета. Система использует селективное сканирование сайтов, извлекает текст отзывов, рейтинги и авторов. Затем она автоматически определяет, к какому именно продукту относится отзыв (даже при разных названиях), и создает сводную информацию: общий рейтинг, распределение оценок и список часто упоминаемых фраз. Эта система позволяет пользователям искать информацию внутри отзывов о конкретном товаре.
  • US7962461B2
  • 2011-06-14
  • Краулинг

Как Google автоматически определяет и проверяет атрибуты, бренды и категории товаров, анализируя веб-контент и поведение пользователей
Google использует систему для автоматического извлечения и проверки «Структурных параметров» (бренды, атрибуты, категории, линейки продуктов) из неструктурированного веб-контента и логов запросов. Система валидирует классификацию с помощью анализа контекстуального сходства, целевого краулинга (поиск фраз типа «X является Y») и анализа распределения кликов. Это позволяет стандартизировать данные о товарах от разных продавцов и формировать структурированную E-commerce выдачу.
  • US9171088B2
  • 2015-10-27
  • Индексация

  • Краулинг

  • Семантика и интент

Как Google использует агрегированные поведенческие данные для маркировки результатов поиска и подсказок индикаторами ожидаемых действий
Google анализирует агрегированные данные о том, что пользователи делают после клика по результату поиска или подсказке (например, покупка, сохранение, бронирование). Если определенное действие статистически значимо для конкретного результата, Google добавляет к нему визуальный индикатор (значок или бейдж), чтобы помочь другим пользователям понять вероятный исход клика.
  • US11132406B2
  • 2021-09-28
  • Поведенческие сигналы

  • SERP

Как Google использует отзывы для сравнения, фильтрации и ранжирования сущностей в поиске
Патент Google описывает систему, которая позволяет пользователям искать внутри отзывов (UGR) сразу по нескольким сущностям (например, отелям или товарам) и сравнивать их в едином интерфейсе. Система индексирует отзывы как отдельные документы и использует их содержание для обнаружения сущностей, фильтрации результатов основного поиска и в качестве сигналов ранжирования веб-страниц.
  • US11568004B2
  • 2023-01-31
  • Индексация

  • SERP

  • Семантика и интент

Популярные патенты

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.
  • US8417692B2
  • 2013-04-09
  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore