SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга

METHOD AND SYSTEM FOR MINING IMAGE SEARCHES TO ASSOCIATE IMAGES WITH CONCEPTS (Метод и система интеллектуального анализа поисковых запросов по изображениям для связывания изображений с концепциями)
  • US11409812B1
  • Google LLC
  • 2018-11-29
  • 2022-08-09
  • Поведенческие сигналы
  • Семантика и интент
  • SERP
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.

Описание

Какую проблему решает

Патент решает фундаментальную проблему автоматической и масштабируемой идентификации содержания нетекстовых документов, в частности изображений. Традиционные методы (компьютерное зрение, анализ метаданных) могут быть неточными, ресурсоемкими или легко манипулируемыми. Изобретение предлагает метод использования коллективного интеллекта пользователей для надежной категоризации визуального контента без необходимости глубокого анализа самого файла изображения.

Что запатентовано

Запатентована система, которая ассоциирует электронные документы (изображения) с концепциями путем анализа агрегированных данных о поведении пользователей (user performance criteria). Суть изобретения — в анализе (mining) того, какие изображения пользователи выбирают (кликают) в ответ на конкретные поисковые запросы (ideas). Эти пользовательские ассоциации используются для автоматической маркировки контента, а затем применяются для улучшения ранжирования и предложения ключевых слов в рекламных кампаниях.

Как это работает

Механизм работает как петля обратной связи:

  • Сбор данных (Майнинг): Система фиксирует поисковый запрос (idea) и последующий выбор пользователя (клик) на конкретное изображение в результатах поиска. Это формирует связь idea-electronic document association.
  • Анализ и Ассоциация: Система агрегирует эти данные. Если изображение стабильно получает клики по определенным запросам, система устанавливает сильную связь между этим документом и соответствующей концепцией.
  • Применение (Поиск): Эти ассоциации используются как сигнал релевантности для улучшения ранжирования в Image Search.
  • Применение (Реклама): Когда рекламодатель загружает изображение, система анализирует его историю кликов, определяет связанные концепции (first set of terms и second set of terms) и предлагает их в качестве suggested keywords для таргетинга (основной фокус Claims этого патента).

Актуальность для SEO

Высокая. Понимание визуального контента и сущностей (Entities) является ключевым направлением развития поиска (например, Google Lens, MUM). Использование поведенческих сигналов для валидации релевантности остается фундаментальным механизмом. Хотя приоритет заявки датируется 2004 годом, выдача этого патента-продолжения в 2022 году подчеркивает сохраняющуюся актуальность технологии.

Важность для SEO

Патент имеет высокое значение (8.5/10) для SEO, особенно для оптимизации поиска по изображениям (Image SEO). Он подтверждает, что релевантность изображения определяется не только его метаданными, но и тем, как пользователи взаимодействуют с ним в результатах поиска. Для достижения высоких позиций в Image Search необходимо не только соответствовать запросу текстуально, но и стимулировать клики (высокий CTR), что напрямую усиливает связь "изображение-концепция" в системах Google.

Детальный разбор

Термины и определения

Concept (Концепция)
Абстрактное представление содержания (сущность, тема, ключевое слово), с которым ассоциируется документ. Является результатом анализа idea-electronic document associations.
Electronic Document (Электронный документ)
Любой элемент цифрового контента. В контексте патента в первую очередь подразумеваются изображения (images) и графические объявления (image ads).
Idea (Идея)
Исходный триггер для ассоциации. Чаще всего это поисковый запрос (search query), введенный пользователем.
Idea-electronic document association (Связь "Идея-Документ")
Связь, формируемая, когда пользователь вводит запрос (idea) и затем выбирает конкретный результат (document).
User performance criteria / Previous User Selections (Критерии эффективности пользователя / Предыдущие выборы пользователя)
Действия пользователя по отношению к документу. В данном контексте это в первую очередь выбор (клик) документа из списка результатов.
First set of terms (Первый набор терминов)
Термины, описывающие контент документа, определенные путем анализа previous user selections (результат майнинга).
Second set of terms (Второй набор терминов)
Расширенный набор концепций, сопоставленных с первым набором. Используется для предложения ключевых слов (Suggested Keywords).
Content distribution campaign (Кампания по распространению контента)
Рекламная кампания.

Ключевые утверждения (Анализ Claims)

Патент US11409812B1 является продолжением (continuation) более ранних заявок. Его Claims сфокусированы на применении базовой технологии майнинга ассоциаций в контексте рекламных инструментов.

Claim 1 (Независимый пункт): Описывает метод предложения ключевых слов рекламодателю на основе анализа исторических данных о кликах на изображение.

  1. Система идентифицирует электронный документ (например, изображение).
  2. Система анализирует сохраненную информацию о предыдущих выборах пользователями (previous user selections) этого документа (например, клики в Image Search).
  3. На основе этого анализа определяются ассоциации между документом и first set of terms (например, запросы, которые приводили к кликам).
  4. Определяется second set of terms, связанных с первым набором (например, синонимы, связанные сущности).
  5. Термины из второго набора предоставляются как suggested keywords для рекламной кампании через графический интерфейс (GUI).
  6. Система получает выбор конкретного ключевого слова и сохраняет его в кампании.

Claim 15 (Зависимый от 1): Подчеркивает эффективность метода.

Система определяет first set of terms, не требуя обработки самого электронного документа (т.е. без анализа пикселей), что снижает необходимую вычислительную мощность для категоризации.

Где и как применяется

Изобретение связывает процессы анализа поведения пользователей в поиске с ранжированием и рекламными системами.

INDEXING – Индексирование (Сбор данных) / QUNDERSTANDING
На этом этапе система логирует и сохраняет данные о взаимодействии пользователей: какие запросы (Ideas) вводятся и какие документы (Electronic Documents) выбираются в ответ. Формируется база idea-electronic document associations.

INDEXING (Офлайн-анализ / Mining)
Система периодически анализирует (майнит) логи поисковых сессий. Происходит агрегация данных для выявления устойчивых паттернов кликов. На основе этого анализа формируются устойчивые ассоциации "Изображение-Концепция" (first set of terms) и извлекаются новые признаки (Feature Extraction).

RANKING – Ранжирование (Применение в поиске)
Сформированные ассоциации используются как сильный сигнал релевантности при ранжировании в поиске по картинкам. Изображение с сильной историей кликов по запросу получит преимущество.

Рекламные системы (Применение для таргетинга)
Основное применение, описанное в Claims. При создании графического объявления система использует сформированные ассоциации (first set of terms), расширяет их (second set of terms) и предлагает рекламодателю в качестве suggested keywords (например, через Keyword Suggestion Tool, показанный на FIG. 11-13).

Входные данные:

  • Поисковые запросы пользователей (Ideas).
  • Данные о кликах пользователей на изображения (User performance criteria).
  • Изображения, загружаемые рекламодателями.

Выходные данные:

  • Ассоциации "Изображение-Концепция".
  • Улучшенные оценки релевантности для ранжирования изображений.
  • Списки предложенных ключевых слов для рекламных кампаний.

На что влияет

  • Типы контента: В первую очередь влияет на изображения, графику и графические объявления.
  • Специфические запросы: Наибольшее влияние на запросы с визуальным интентом (поиск товаров, людей, мест) в Image Search.
  • Конкретные ниши: Критично для E-commerce, новостей, развлечений, где визуальная идентификация контента играет ключевую роль.

Когда применяется

  • Триггеры активации (Сбор данных): Каждый раз, когда пользователь кликает на результат в поиске по изображениям.
  • Триггеры активации (Анализ/Mining): Периодически в офлайн-режиме для анализа логов и обновления ассоциаций.
  • Триггеры активации (Предложение ключевых слов): Когда рекламодатель использует Keyword Suggestion Tool при создании графического объявления.

Пошаговый алгоритм

Процесс А: Сбор данных и формирование ассоциаций (Mining)

  1. Получение запроса: Система получает поисковый запрос по картинкам (Idea).
  2. Предоставление результатов: Система предоставляет пользователю множество изображений (Documents).
  3. Получение выбора пользователя: Система регистрирует клик пользователя (User performance criteria).
  4. Регистрация связи: Фиксируется связь idea-electronic document association.
  5. Агрегация и анализ (Офлайн): Система анализирует накопленные связи от множества пользователей.
  6. Формирование концепции: Если связь устойчива, система ассоциирует документ с концепцией (first set of terms).
  7. Распространение ассоциации (Опционально): В описании упоминается Document Comparison Module, который может использоваться для переноса ассоциаций на похожие документы.

Процесс Б: Применение ассоциаций для предложения ключевых слов (Claims 1)

  1. Идентификация документа: Рекламодатель загружает изображение для кампании.
  2. Анализ исторических данных: Система извлекает сохраненную информацию о предыдущих выборах пользователями этого изображения (first set of terms).
  3. Определение второго набора терминов: Система расширяет первый набор, добавляя связанные концепции (синонимы, вариации), формируя second set of terms.
  4. Предоставление предложений: Второй набор терминов предлагается рекламодателю как suggested keywords в интерфейсе.
  5. Выбор и сохранение: Рекламодатель выбирает ключевые слова для таргетинга.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных для понимания контента.

  • Поведенческие факторы: Критически важные данные. Используются User performance criteria — клики на изображения в результатах поиска. Анализируются логи поисковых сессий, фиксирующие связку "Запрос -> Клик на изображение".
  • Контентные факторы (Изображения): Сами электронные документы (изображения), которые являются объектом ассоциации.
  • Данные запросов: Текст поисковых запросов (Ideas).
  • Пользовательские факторы (Опционально): В описании упоминается возможность использования данных о пользователе (например, если пользователь известен как энтузиаст ботаники, его клики могут сильнее влиять на ассоциацию изображений с растениями).

Какие метрики используются и как они считаются

  • Частота выбора (Selection Frequency): Как часто конкретное изображение выбирается по конкретному запросу. Основа для idea-electronic document association.
  • Сила ассоциации (Association Strength): Агрегированная метрика, основанная на частоте выбора. В описании упоминается, что требуется определенное количество ассоциаций или пользователей для установления надежной связи (порог).
  • Схожесть документов (Document Similarity): Метрика для сравнения двух изображений. Используется для распространения ассоциаций на дубликаты или похожие версии.
  • Mapping / Семантическая близость: Процесс расширения first set of terms во второй (second set of terms) с использованием синонимов (Claim 5) и вариаций (Claim 6).

Выводы

  1. Поведенческие сигналы как источник истины для Image SEO: Патент подтверждает, что Google активно использует клики пользователей (user performance criteria) в Image Search для понимания содержания изображений. Это "коллективный разум", который может быть точнее алгоритмов или метаданных.
  2. Самоусиливающийся эффект ранжирования (CTR): Чем чаще на изображение кликают по запросу, тем сильнее его ассоциация с этой концепцией, и тем выше оно будет ранжироваться. Это подчеркивает критическую важность CTR в Image Search.
  3. Идентификация контента без анализа пикселей: Система может надежно идентифицировать содержание изображения, анализируя только логи запросов и кликов, не прибегая к сложному анализу самого файла изображения (подтверждено в Claim 15).
  4. Прямая связь между органическим поиском и рекламой: Данные, собранные в органическом поиске по картинкам, напрямую используются в рекламных системах для предложения ключевых слов (suggested keywords). То, как пользователи находят изображение в органике, определяет его рекламный таргетинг.
  5. Важность уникальности и качества: Чтобы собрать сильные поведенческие сигналы, изображение должно быть достаточно привлекательным и качественным, чтобы пользователи выбирали именно его среди других результатов.

Практика

Best practices (это мы делаем)

  • Оптимизация под кликабельность в Image Search (Image CTR): Создавайте высококачественные, привлекательные и информативные изображения, которые выделяются в выдаче. Высокий CTR по релевантным запросам напрямую усиливает ассоциацию "изображение-концепция" согласно патенту.
  • Точная исходная оптимизация (Seeding): Обеспечьте релевантные текстовые метаданные (alt-text, заголовок, окружающий текст). Это необходимо, чтобы изображение начало показываться по нужным запросам и могло начать собирать поведенческие данные (idea-electronic document associations).
  • Использование уникальных изображений: По возможности используйте уникальные изображения. Это позволяет вашему сайту аккумулировать все поведенческие сигналы, связанные с этим изображением, укрепляя его авторитетность для данной концепции.
  • Стратегия для E-commerce: Используйте четкие, качественные фотографии товаров с разных ракурсов. Если пользователи, ищущие конкретную модель, стабильно кликают на вашу фотографию в Image Search, это подтверждает Google, что ваше изображение точно соответствует товару.
  • Анализ производительности изображений: Отслеживайте в GSC, по каким запросам ваши изображения получают показы и клики в поиске картинок. Усиливайте контент, демонстрирующий сильные поведенческие сигналы.

Worst practices (это делать не надо)

  • Манипуляция метаданными (Keyword Stuffing в Alt-text): Попытки ранжироваться по нерелевантным запросам путем добавления популярных ключевых слов в метаданные будут неэффективны. Если пользователи не будут кликать на изображение (низкий CTR), система не сформирует сильную ассоциацию.
  • Использование стоковых изображений для ключевых концепций: Использование популярных стоковых фото может затруднить ранжирование, так как поведенческие сигналы "размываются" между множеством сайтов. Система может предпочесть канонический источник или сайт с наибольшим авторитетом.
  • Кликбейт и подмена изображений: Использование привлекательных, но нерелевантных изображений. Хотя это может дать краткосрочный трафик, это не приведет к формированию нужных тематических ассоциаций и может привести к пессимизации другими системами (например, из-за pogo-sticking).

Стратегическое значение

Этот патент подчеркивает стратегию Google по использованию огромного объема поведенческих данных в качестве механизма валидации контента. Для SEO-специалистов это означает, что оптимизация изображений переходит от простого заполнения тегов к созданию визуального контента, который действительно удовлетворяет интент пользователя. Долгосрочная стратегия в Image SEO должна быть направлена на то, чтобы стать источником лучших изображений по конкретным темам, что подтверждается высоким взаимодействием пользователей.

Практические примеры

Сценарий: Оптимизация карточки товара для нового смартфона

  1. Задача: Занять ТОП в Google Image Search по запросу "[Бренд] [Модель] синий".
  2. Действия (Традиционный подход): Загрузить официальное фото, прописать alt="[Бренд] [Модель] синий".
  3. Действия (С учетом патента): Загрузить несколько уникальных, высококачественных "живых" фотографий смартфона в синем цвете, сделанных командой сайта. Оптимизировать их для максимальной визуальной привлекательности (четкость, освещение). Прописать точные метаданные.
  4. Механизм работы: Пользователи ищут "[Бренд] [Модель] синий". Они видят официальные рендеры и ваши живые фото. Если живые фото лучше отвечают их интенту (понять реальный вид), они кликают на них чаще.
  5. Результат: Google фиксирует эти idea-electronic document associations. Система понимает, что эти уникальные фото высоко релевантны запросу. Их позиции в Image Search растут. Если вы затем используете это фото в Google Ads, система предложит "[Бренд] [Модель] синий" как ключевое слово.

Вопросы и ответы

Означает ли этот патент, что теги ALT и заголовки больше не важны для Image SEO?

Нет, они по-прежнему очень важны. Текстовые метаданные необходимы для того, чтобы система могла первично понять изображение и начать показывать его в результатах поиска (seeding). Без этой исходной оптимизации изображение не получит показов, а значит, не сможет начать собирать поведенческие данные (клики), которые описаны в патенте для уточнения его содержания.

Как система определяет, что на картинке, если она совершенно новая и на нее еще никто не кликал?

Для новых изображений система полагается на традиционные методы: анализ текстовых метаданных (ALT, окружающий текст, заголовок страницы) и алгоритмы компьютерного зрения для распознавания объектов. Механизм, описанный в патенте, включается позже, когда накапливается достаточно статистики по кликам, и служит для валидации и уточнения первичного анализа.

Как этот патент влияет на использование стоковых фотографий?

Использование популярных стоковых фото создает проблему. Поскольку одно и то же изображение используется на множестве сайтов, поведенческие сигналы (клики) распределяются между всеми этими источниками. Это затрудняет для Google определение канонического или лучшего источника. Использование уникальных, качественных изображений дает стратегическое преимущество, так как они аккумулируют все сигналы на вашем домене.

Что важнее: количество кликов на изображение или CTR?

Важны оба показателя. Высокий CTR по релевантным запросам является сильным индикатором того, что изображение соответствует концепции и привлекательно для пользователей. Большое абсолютное количество кликов необходимо для накопления достаточного объема данных, чтобы система сформировала статистически значимую и надежную ассоциацию.

Может ли этот механизм ошибочно классифицировать изображение?

Да, это возможно, особенно если пользователи массово ищут одно, а кликают на другое по ошибке или из-за временных манипуляций в выдаче. Однако при больших объемах данных и агрегации поведения от миллионов пользователей такие ошибки, как правило, нивелируются, и система выявляет истинное содержание или доминирующий интент.

Как использовать этот механизм для улучшения позиций сайта в E-commerce?

Обеспечьте, чтобы фотографии ваших товаров были максимально привлекательными и информативными. Используйте качественные изображения, которые лучше, чем у конкурентов. Если пользователи, ищущие конкретный товар, будут стабильно выбирать ваши изображения в Image Search, это подтвердит Google релевантность ваших изображений, улучшая их ранжирование.

Применяется ли этот патент только к Google Image Search?

Хотя в патенте в качестве основного примера приводится поиск по изображениям, описанный принцип (использование кликов для ассоциации запроса с документом) универсален. Термин Electronic Document достаточно широк. Этот же принцип может применяться в основном веб-поиске, поиске видео или товаров для уточнения релевантности результатов.

Как связаны данные из органического поиска картинок и Google Ads согласно патенту?

Связь прямая и является основным фокусом Claims этого патента. Патент описывает, как данные о кликах из поиска (органики) используются для формирования базы ассоциаций "Изображение-Концепция". Затем, когда рекламодатель загружает это изображение в Google Ads, система использует эту базу, чтобы предложить рекламодателю наиболее релевантные ключевые слова для таргетинга.

Влияет ли локализация и язык пользователя на формирование ассоциаций?

Да, безусловно. Ассоциации формируются на основе языка запроса (Idea). Одно и то же изображение может иметь разные ассоциации на разных языках. Если пользователи в России кликают на изображение по запросу "кошка", а в Англии по запросу "cat", система сформирует две разные языковые ассоциации для одного и того же изображения.

Какова основная цель изобретения согласно Claims: улучшение поиска или рекламы?

Согласно Claims 1 этого конкретного патента (US11409812B1), основная цель – утилитарная: предложение ключевых слов для рекламной кампании (content distribution campaign) на основе загруженного изображения. Однако для достижения этой цели система использует базовый механизм понимания изображений через майнинг поисковых сессий, который также улучшает качество органического поиска.

Похожие патенты

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует клики пользователей для генерации альтернативных запросов и автоматической разметки изображений
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.
  • US20150161175A1
  • 2015-06-11
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Популярные патенты

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей
Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.
  • US20210125108A1
  • 2021-04-29
  • Поведенческие сигналы

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче
Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.
  • US8631001B2
  • 2014-01-14
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google позволяет вебмастерам управлять весом и интерпретацией исходящих ссылок через атрибуты тега (Основа nofollow)
Google запатентовал механизм, позволяющий вебмастерам добавлять в теги ссылок () специальные пары "параметр=значение" (например, rel=nofollow или linkweight=0.5). Эта информация используется краулером и поисковой системой для изменения способа обработки ссылки, например, для корректировки передаваемого веса (PageRank) или блокировки ее учета.
  • US7979417B1
  • 2011-07-12
  • Ссылки

  • Краулинг

  • Техническое SEO

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

seohardcore