SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений

METHOD AND SYSTEM FOR MINING IMAGE SEARCHES TO ASSOCIATE IMAGES WITH CONCEPTS (Метод и система интеллектуального анализа поисковых запросов изображений для ассоциации изображений с концептами)
  • US8065611B1
  • Google LLC
  • 2004-06-30
  • 2011-11-22
  • Поведенческие сигналы
  • Семантика и интент
  • Мультимедиа
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.

Описание

Какую проблему решает

Патент решает фундаментальную проблему автоматического понимания и категоризации нетекстового контента, в частности изображений. Традиционные методы (анализ метаданных или сложное компьютерное зрение) часто неточны, ресурсоемки и лишены человеческого контекстуального понимания. Изобретение предлагает механизм использования коллективного интеллекта пользователей (user performance criteria) для точной и масштабируемой идентификации содержания изображений.

Что запатентовано

Запатентована система, которая анализирует данные поисковых сессий по изображениям для создания ассоциаций между запросами (ideas) и изображениями, на которые кликнули пользователи (selected document). Система агрегирует эти данные и формирует устойчивую связь между изображением и концептом, производным от исходных запросов. Это позволяет автоматически маркировать (labeling) контент изображения на основе выбора пользователей.

Как это работает

Механизм работает как петля обратной связи:

  • Инициация: Пользователь вводит поисковый запрос (Idea) в поиске по картинкам (например, "Авраам Линкольн").
  • Представление: Система предоставляет набор изображений, предварительно отобранных по доступным сигналам (например, метаданным).
  • Сбор данных о поведении: Система фиксирует, какое изображение пользователь выбирает (кликает) из набора (User Performance Criteria).
  • Анализ и Ассоциация: Система агрегирует данные. Если значительное число пользователей кликают на Изображение А, система ассоциирует его с концептом "Авраам Линкольн".
  • Улучшение ранжирования: В будущем при поиске по этому концепту Изображение А будет ранжироваться выше благодаря этой подтвержденной пользователями ассоциации.
  • Распространение: Визуально похожие изображения также могут наследовать эту ассоциацию.

Актуальность для SEO

Высокая. Хотя технологии визуального распознавания (например, Google Lens, Vision AI) значительно продвинулись с момента подачи патента (2004), поведенческие данные остаются критически важным сигналом для валидации релевантности и ранжирования в Image Search. Компьютерное зрение может определить, что на картинке изображен мужчина, но именно поведенческие данные подтверждают, что это именно тот "Авраам Линкольн", которого ищут пользователи.

Важность для SEO

Патент имеет критическое значение (8.5/10) для стратегий продвижения в Google Images. Он прямо указывает, что релевантность изображения определяется не только его содержанием или текстовой оптимизацией, но и тем, насколько успешно оно привлекает клики пользователей при показе по целевым запросам. Для SEO-специалистов это подчеркивает первостепенную важность оптимизации CTR изображений и обеспечения точного соответствия визуального контента интенту пользователя.

Детальный разбор

Термины и определения

Idea (Идея)
Исходный ввод пользователя, запускающий поиск. Как правило, это поисковый запрос (search query).
Concept (Концепт)
Смысловая единица (например, ключевое слово, тема, сущность), с которой система ассоциирует документ. Концепт является производным от исходных запросов пользователей (Ideas) и используется для маркировки содержания документа.
Electronic Document / Image Document (Электронный документ / Изображение)
Любой индексируемый контент. В контексте патента преимущественно подразумеваются изображения.
Idea-electronic document association (Ассоциация Идея-Документ)
Связь, устанавливаемая, когда пользователь взаимодействует с документом после ввода определенной идеи (запроса).
User performance criteria (Критерии эффективности пользователя)
Метрика взаимодействия пользователя с документом. В контексте патента это преимущественно выбор (клик) документа из набора результатов поиска.
Mining (Интеллектуальный анализ / Майнинг)
Процесс анализа больших объемов данных (поисковых логов и кликов) для выявления паттернов и создания ассоциаций.
Document Comparison Module (Модуль сравнения документов)
Компонент, определяющий степень схожести между двумя изображениями. Используется для распространения ассоциаций на похожие документы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обучения системы на основе поведения пользователей для понимания содержания изображений.

  1. Система получает поисковые запросы.
  2. Для каждого запроса предоставляется набор изображений (результаты поиска).
  3. Система получает индикацию выбора пользователем (клик) одного или нескольких изображений из этого набора.
  4. Система автоматически идентифицирует концепты, производные от поискового запроса и выбранных изображений, основываясь на факте этого выбора (шаг обучения).
  5. Создается и сохраняется ассоциация между выбранными изображениями и этими концептами.
  6. Впоследствии, при получении нового, независимого запроса, система определяет его связь с сохраненным концептом.
  7. Изображения, ассоциированные с этим концептом, идентифицируются как релевантные новому запросу.

Ядро изобретения — использование кликов на результатах поиска по картинкам как сигнала для маркировки (labeling) этих картинок концептами, извлеченными из запросов, которые привели к этим кликам.

Claim 6 (Зависимый от 5): Уточняет значение процесса ассоциации.

Процесс ассоциации приравнивается к идентификации фактического содержания изображения (identifying content of an image). Концепт, выведенный из агрегированных пользовательских ассоциаций, считается репрезентативным тому, что изображено на картинке.

Claim 10 (Зависимый от 1): Описывает механизм распространения ассоциаций (наследование концептов через сходство).

  1. Система определяет, что неассоциированное изображение визуально похоже (substantially similar) на уже ассоциированное изображение.
  2. Неассоциированное изображение наследует концепт похожего изображения.

Claim 19 и 20 (Зависимые от 1): Подчеркивают важность агрегации.

Ассоциация основывается на множестве взаимодействий (plurality of associations) между одним изображением и концептом. Идентификация содержания происходит на основе агрегированных данных, а не единичных кликов.

Где и как применяется

Изобретение применяется в рамках вертикали поиска по изображениям (Google Images) и функционирует как механизм обратной связи для улучшения качества индекса и ранжирования, затрагивая несколько этапов поисковой архитектуры.

INDEXING – Индексирование и извлечение признаков
Результаты работы описанного алгоритма (ассоциации Изображение-Концепт) сохраняются в индексе как дополнительные признаки (метки/labels) для каждого изображения. Эти данные агрегируются (вероятно, в офлайн режиме) на основе анализа логов поведения пользователей. Также здесь работает Document Comparison Module для распространения ассоциаций (Claim 10).

RANKING – Ранжирование
На этапе отбора кандидатов (Retrieval) и последующего ранжирования система использует эти выученные ассоциации как сильный сигнал релевантности. Изображения с сильными ассоциациями с концептом запроса получают преимущество.

RERANKING / Feedback Loop (Неявный этап сбора данных)
Основное применение патента происходит в процессе обработки обратной связи. Система собирает данные о кликах (User performance criteria) из реальных поисковых сессий после показа выдачи (post-SERP). Эти данные передаются обратно в фазу Индексирования для обновления признаков.

Входные данные:

  • Журналы поисковых сессий: Поисковый запрос (Idea), набор показанных изображений, изображение, выбранное пользователем (Selected document).
  • База данных изображений и данные о визуальной схожести изображений.

Выходные данные:

  • Обновленные данные в индексе изображений с новыми метками (концептами).
  • Улучшенное ранжирование изображений для будущих запросов.

На что влияет

  • Типы контента: В первую очередь влияет на ранжирование изображений в Google Images. Также может влиять на отображение изображений в универсальной выдаче (Image Packs).
  • Специфические запросы: Наибольшее влияние на запросы, где визуальный контент является основным интентом (названия продуктов, имена знаменитостей, места). Помогает разрешать неоднозначность (например, [jaguar] как животное или автомобиль) на основе предпочтений пользователей.

Когда применяется

  • Триггеры активации: Алгоритм сбора данных работает постоянно во время сессий поиска по картинкам.
  • Частота применения: Процесс анализа агрегированных данных и обновления ассоциаций происходит периодически. Применение обновленных ассоциаций происходит при каждом новом запросе к индексу изображений.
  • Пороговые значения: Патент подразумевает необходимость накопления достаточного количества ассоциаций (plurality of associations, Claim 19) для надежной идентификации контента. Ассоциация устанавливается после достижения порога уверенности на основе агрегированных данных.

Пошаговый алгоритм

Алгоритм состоит из процессов Обучения (Mining/Analysis) и Применения (Ranking).

Процесс А: Сбор данных (Онлайн)

  1. Получение запроса: Пользователь вводит поисковый запрос (Idea).
  2. Предоставление результатов: Система генерирует и показывает набор релевантных изображений.
  3. Получение выбора: Пользователь кликает на одно из изображений (Selected document).
  4. Логирование ассоциации: Система записывает событие ассоциации Идея-Документ (Запрос-Клик).

Процесс Б: Анализ и Ассоциация (Офлайн/Пакетный режим)

  1. Агрегация данных: Система обрабатывает логи и агрегирует ассоциации Идея-Документ.
  2. Деривация концепта: Для конкретного изображения система анализирует все запросы (Ideas), которые привели к клику на него, и выводит обобщенный Концепт.
  3. Установление связи: Если агрегированные данные превышают порог уверенности, система устанавливает сильную связь между Изображением и Концептом.
  4. Распространение ассоциации (Опционально): Document Comparison Module идентифицирует визуально похожие изображения, которые наследуют этот Концепт (Claim 10).
  5. Сохранение: Обновленные ассоциации сохраняются в индексе.

Процесс В: Использование ассоциаций (Онлайн Ранжирование)

  1. Получение нового запроса: Пользователь вводит новый запрос.
  2. Анализ запроса: Система определяет связь между новым запросом и существующими Концептами.
  3. Ранжирование: При отборе и сортировке изображений система использует сохраненные ассоциации как сильный сигнал релевантности.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных и данных о схожести для понимания контента.

  • Поведенческие факторы (Критически важно): Данные о кликах (selection/User Performance Criteria) на изображения в результатах поиска. Анализируется связь между введенным запросом (Idea) и выбранным изображением.
  • Мультимедиа факторы (Визуальная схожесть): Используются данные о схожести изображений (substantially similar), полученные с помощью Document Comparison Module, для распространения ассоциаций (Claim 10).
  • Контентные факторы (Неявно): Для формирования первичной выдачи (до накопления кликов) система использует базовые факторы (текст, alt-атрибуты, имена файлов), хотя патент это детально не описывает.

Какие метрики используются и как они считаются

  • User Performance Criteria (Частота выбора / CTR): Метрики, основанные на взаимодействии. В первую очередь, это частота клика на конкретное изображение для данного запроса или группы запросов.
  • Strength of Association (Сила Ассоциации): Агрегированная метрика, показывающая, насколько сильно изображение связано с концептом. Она основана на частоте, объеме и консистентности пользовательских выборов (plurality of associations).
  • Document Similarity (Схожесть документов): Метрика, вычисляемая Document Comparison Module, определяющая степень визуального сходства между двумя изображениями.

Выводы

  1. Пользовательское поведение как источник истины для содержания изображений: Патент демонстрирует фундаментальный механизм, позволяющий Google определять содержание изображения, не полагаясь только на визуальный анализ или метаданные. Агрегированные данные о кликах используются как способ маркировки контента и валидации релевантности.
  2. Критичность CTR для ранжирования в Image Search: Для достижения высоких позиций в поиске по картинкам изображение должно не только быть показано, но и быть выбрано пользователями. Высокий CTR по целевым запросам напрямую усиливает ассоциацию изображения с этими запросами согласно описанному механизму.
  3. Важность первичной оптимизации для запуска цикла: Чтобы начать собирать клики, изображение должно попасть в первичную выдачу. Это подчеркивает важность базовой SEO-оптимизации (alt-текст, контекст) для запуска процесса накопления поведенческих данных.
  4. Автоматическое расширение семантики через схожесть: Механизм распространения ассоциаций на похожие изображения (Claim 10) позволяет системе масштабировать маркировку. Если одно изображение продукта помечено как релевантное, похожие изображения (например, другой ракурс) могут также получить эту ассоциацию.
  5. Концепты против Ключевых слов: Система ассоциирует изображения с концептами, производными от запросов (ideas), что подразумевает уровень семантического понимания выше простого совпадения ключевых слов.

Практика

Best practices (это мы делаем)

  • Оптимизация привлекательности и CTR изображений: Создавайте уникальные, высококачественные и визуально привлекательные изображения, которые выделяются в выдаче Google Images. Изображение должно максимально точно соответствовать визуальному интенту пользователя, чтобы стимулировать клик.
  • Тщательная базовая оптимизация для инициации показов: Оптимизируйте все текстовые сигналы (Alt-атрибуты, заголовки изображений, окружающий текст, имена файлов). Это критически важно для того, чтобы изображение начало показываться и могло накапливать поведенческие данные (user performance criteria).
  • Анализ выдачи Google Images и интента: Изучайте, какие типы изображений ранжируются по целевым запросам. Создавайте контент, который соответствует доминирующему визуальному интенту, чтобы максимизировать вероятность выбора вашего изображения пользователями.
  • Создание вариаций ключевых изображений: Для важных товаров предоставляйте несколько высококачественных ракурсов. Если один из ракурсов накопит сильные ассоциации благодаря кликам, другие похожие изображения могут извлечь выгоду через механизм сравнения схожести (Claim 10).

Worst practices (это делать не надо)

  • Использование кликбейтных или вводящих в заблуждение изображений: Изображения, которые не соответствуют интенту запроса. Хотя патент фокусируется на факте клика, современные системы учитывают удовлетворенность пользователя (например, быстрый возврат в выдачу), что может негативно повлиять на user performance criteria.
  • Игнорирование качества и разрешения изображений: Низкокачественные или размытые изображения менее склонны привлекать клики, что препятствует формированию сильных ассоциаций согласно патенту.
  • Переоптимизация текстовых атрибутов (Keyword Stuffing): Попытка манипулировать первичным ранжированием с помощью нерелевантных ключевых слов в alt-атрибутах. Если изображение не соответствует запросу визуально, оно не будет получать клики, и сильные ассоциации не сформируются.
  • Использование стандартных стоковых фотографий: Стандартные стоковые фото, используемые на множестве сайтов, могут сливаться в выдаче и не привлекать клики, уступая более уникальным и качественным изображениям.

Стратегическое значение

Этот патент подтверждает, что Google Images функционирует как система, обучающаяся на поведении пользователей. Стратегия продвижения в поиске по картинкам должна рассматриваться как двухэтапный процесс: (1) Добиться видимости через техническую и контентную оптимизацию и (2) Добиться кликабельности через качество и релевантность визуального контента. Долгосрочный успех зависит от способности стабильно удовлетворять визуальный интент пользователя лучше, чем конкуренты.

Практические примеры

Сценарий: Оптимизация изображений для интернет-магазина кроссовок

  1. Задача: Продвинуть изображение новой модели "Nike Air Max 2025 Blue" в Google Images.
  2. Этап 1 (Добиться видимости): Разместить изображение на странице товара. Оптимизировать Alt-текст ("Кроссовки Nike Air Max 2025, синий цвет"), окружающий текст и добавить изображение в Image Sitemap.
  3. Этап 2 (Добиться кликабельности): Использовать высококачественное, профессиональное фото на контрастном фоне. Убедиться, что превью (thumbnail) в выдаче выглядит привлекательно и четко передает суть товара.
  4. Как работает механизм патента:
    • Пользователи ищут "Nike Air Max 2025 Blue". Благодаря Этапу 1, изображение появляется в выдаче.
    • Благодаря качеству на Этапе 2, пользователи предпочитают это изображение и кликают на него (высокий CTR).
    • Google фиксирует эти клики (user performance criteria).
    • Система агрегирует данные и формирует сильную ассоциацию между изображением и концептом "Nike Air Max 2025 Blue".
  5. Результат: При последующих поисках это изображение ранжируется выше, так как система теперь "знает" (на основе поведения пользователей), что оно точно соответствует этому концепту.

Вопросы и ответы

Означает ли этот патент, что Google не использует технологии визуального распознавания (AI) для ранжирования картинок?

Нет, не означает. Современный Google активно использует передовые технологии компьютерного зрения. Однако этот патент (поданный в 2004 году) демонстрирует, что поведенческие данные также являются мощным сигналом релевантности. Вероятно, Google использует гибридный подход: AI анализирует пиксели для понимания содержания, а поведенческие данные (описанные в этом патенте) используются для валидации этой информации и определения релевантности в контексте поиска.

Что важнее для ранжирования в Google Images: оптимизация Alt-текста или CTR изображения?

Они оба критически важны и работают синергетически. Оптимизация Alt-текста и других текстовых сигналов необходима для того, чтобы изображение начало показываться в выдаче (первичный отбор). CTR становится решающим фактором после того, как изображение стало видимым. Согласно патенту, именно клики формируют сильную ассоциацию между изображением и концептом. Без показов не будет кликов, но без кликов не будет высоких позиций.

Как система определяет, какие изображения являются "существенно похожими" (substantially similar) для переноса ассоциаций?

Патент не детализирует алгоритмы работы Document Comparison Module. Он лишь указывает, что модуль сравнивает изображения, текст, форматирование и паттерны. На практике это могут быть различные технологии компьютерного зрения, такие как сравнение визуальных хэшей, анализ геометрических паттернов, цветовых схем или векторов признаков, извлеченных из изображений.

Может ли этот механизм привести к закреплению неверных ассоциаций?

Да, теоретически это возможно, если большое количество пользователей по ошибке или в результате манипуляций будут кликать на нерелевантное изображение. Однако агрегация данных от множества пользователей (plurality of associations) и использование других сигналов ранжирования (включая современное компьютерное зрение) обычно помогают сгладить такие аномалии и обеспечить самокоррекцию системы.

Как оптимизировать изображения для этого алгоритма, если сайт новый и трафика мало?

Для новых сайтов фокус должен быть на максимальной технической и контентной оптимизации (Alt-текст, контекст, Image Sitemap). Необходимо использовать уникальные, высококачественные изображения. Цель — обеспечить первичное попадание в выдачу и сделать изображение максимально привлекательным для тех немногих пользователей, которые его увидят, чтобы начать формировать положительную историю кликов.

Влияет ли скорость загрузки изображения на работу этого алгоритма?

Патент напрямую не упоминает скорость загрузки. Однако, если изображение загружается медленно или не отображается корректно в превью выдачи Google Images, пользователи не смогут его оценить и не кликнут на него. Это косвенно препятствует сбору положительных user performance criteria и негативно влияет на способность алгоритма формировать сильные ассоциации.

В чем разница между «Idea» и «Concept» в этом патенте?

Idea — это сырой ввод пользователя, то есть текст конкретного поискового запроса (например, "фото собаки в шляпе"). Concept — это более абстрактная или нормализованная смысловая единица, которую система выводит из множества похожих запросов, приведших к клику на изображение (например, "Собака в сомбреро"). Концепт используется как устойчивая метка для содержания изображения.

Как бороться с тем, что конкуренты используют мои уникальные изображения и ранжируются по ним?

Если конкурент использует ваше изображение, оно может быть признано похожим (Claim 10) и наследовать ассоциации вашего изображения. В этой ситуации решающими становятся другие факторы ранжирования, включая авторитетность домена и качество страницы, на которой размещено изображение. Необходимо работать над улучшением общих сигналов сайта и использовать механизмы каноникализации для указания первоисточника.

Влияет ли этот алгоритм на ранжирование рекламных изображений (Ads)?

Да. Патент упоминает использование этих ассоциаций в контексте рекламы (Claims 8, 9, 12). Система может использовать базу данных изображений, промаркированных пользователями, для предложения рекламодателям релевантных изображений при создании кампаний или для автоматического подбора ключевых слов для рекламы на основе загруженного изображения, опираясь на известные ассоциации.

Что делать, если мои изображения получают показы, но не клики в Image Search?

Это указывает на проблему с привлекательностью или кажущейся релевантностью изображения в выдаче. Необходимо проанализировать, какие изображения конкурентов получают клики по этим запросам, и соответствующим образом адаптировать свои визуальные материалы: улучшить качество, композицию, сделать изображение более информативным или привлекательным для целевой аудитории.

Похожие патенты

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует клики пользователей для генерации альтернативных запросов и автоматической разметки изображений
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.
  • US20150161175A1
  • 2015-06-11
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)
Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.
  • US8429173B1
  • 2013-04-23
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
  • US7308643B1
  • 2007-12-11
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

seohardcore