SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует клики пользователей для генерации альтернативных запросов и автоматической разметки изображений

ALTERNATIVE IMAGE QUERIES (Альтернативные запросы для изображений)
  • US20150161175A1
  • Google LLC
  • 2008-02-08
  • 2015-06-11
  • Индексация
  • Поведенческие сигналы
  • Семантика и интент
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.

Описание

Какую проблему решает

Патент решает проблему неоднозначности или неточности пользовательских запросов при поиске изображений. Часто результаты поиска могут быть слишком широкими или не соответствовать субъективному намерению пользователя. Изобретение предлагает механизм навигации и уточнения поиска без необходимости вручную вводить новые запросы, что особенно полезно для языков, не основанных на латинице (non-Roman based languages), где ввод текста может быть затруднен.

Что запатентовано

Запатентована система и метод предложения альтернативных запросов, специфичных для отдельных результатов поиска изображений. Когда пользователь взаимодействует (например, наводит курсор) с конкретным изображением в выдаче, система отображает список предлагаемых запросов (suggested second image queries). Эти предложения генерируются на основе исторических данных: это запросы, которые ранее вводили другие пользователи и которые привели к выбору (клику) именно этого изображения.

Как это работает

Система работает в двух режимах: офлайн и онлайн.

  • Офлайн (Индексация и Анализ): Система анализирует логи поисковых сессий и фиксирует, какие изображения были выбраны (clicked) для каких запросов. Для каждого изображения рассчитываются метрики number of selections (количество кликов) и selection fraction (доля кликов) по каждому связанному запросу. Эти данные фильтруются и сохраняются в репозитории.
  • Онлайн (Обработка запроса): Пользователь вводит запрос. Система возвращает результаты и для каждого результата извлекает связанные с ним альтернативные запросы из репозитория. Когда пользователь взаимодействует с изображением (например, через hotspot), система отображает эти альтернативные запросы. Выбор альтернативного запроса запускает новый поиск.

Актуальность для SEO

Высокая. Механизмы использования поведенческих данных для понимания контента (в данном случае, изображений) и уточнения поиска являются центральными для современных поисковых систем. Технологии, описанные в патенте, такие как генерация меток на основе кликов и перенос меток между похожими изображениями (с использованием simhash), активно используются в Google Images и системах визуального поиска.

Важность для SEO

Патент имеет высокое значение для стратегий Image SEO (85/100). Он раскрывает механизм, как Google может автоматически генерировать метки (labels) для изображений, основываясь исключительно на поведении пользователей, а не только на окружающем тексте или alt-атрибутах. Это подчеркивает критическую важность создания изображений, которые точно соответствуют интенту конкретных запросов и стимулируют клики, так как эти клики напрямую влияют на то, как система категоризирует изображение.

Детальный разбор

Термины и определения

Alternative Image Query / Suggested Second Image Query (Альтернативный / Предлагаемый второй запрос)
Запрос, предлагаемый пользователю при взаимодействии с конкретным результатом поиска. Генерируется на основе исторических данных о запросах, которые приводили к выбору этого изображения.
Byte Hash (Байтовый хеш)
Хеш, вычисленный по изображению. Используется для поиска точных дубликатов изображений.
First Image Query (Первый запрос)
Исходный запрос, введенный пользователем.
Genre (Жанр)
Категория изображения. Упоминаются семантические жанры (например, порнография, карикатура) и визуальные жанры (например, фотография, клипарт).
Hotspot (Активная область)
Область в интерфейсе (например, вокруг изображения), которая при взаимодействии (например, наведении курсора) запускает действие – отображение альтернативных запросов.
Label (Метка)
Текстовое описание изображения. Патент предлагает использовать альтернативные запросы (особенно с высокой selection fraction) в качестве автоматических меток для индексации.
Node Graph (Граф узлов)
Структура данных, где узлы представляют изображения, а связи (links) между ними представляют общие запросы, по которым были найдены оба изображения. Используется для определения семантической или визуальной схожести.
Number of Selections (Количество выборов/кликов)
Количество раз, когда конкретное изображение было выбрано пользователями при выдаче по определенному запросу за определенный период времени.
Selection Fraction (Доля выборов/кликов)
Ключевая метрика. Рассчитывается как отношение количества кликов на конкретное изображение по запросу к общему количеству кликов на все результаты по этому же запросу за тот же период.
Simhash
Техника создания отпечатков (fingerprinting) для поиска нечетких дубликатов (near-duplicates) изображений.

Ключевые утверждения (Анализ Claims)

ВАЖНО: Патент был подан в 2008 году. В ходе рассмотрения исходные пункты (Claims 1-71 в середине документа) были отменены и заменены новыми. Анализ основан на финальных принятых утверждениях (начиная с Claim 1 в конце документа).

Claim 1 (Независимый пункт): Описывает основной процесс взаимодействия с пользователем в реальном времени.

  1. Система предоставляет набор результатов поиска изображений в ответ на запрос.
  2. Система получает данные о взаимодействии пользователя с конкретным изображением из этого набора.
  3. Система получает два или более набора терминов (альтернативных запросов). Эти запросы (i) ранее отправлялись другими пользователями и (ii) привели к выбору (клику) этого конкретного изображения этими пользователями.
  4. В ответ на взаимодействие (шаг 2), система предоставляет эти альтернативные запросы (шаг 3) для выбора.
  5. Система получает ввод, представляющий выбор пользователем одного из этих альтернативных запросов.
  6. Генерируется дополнительный поисковый запрос.
  7. Система предоставляет дополнительный набор результатов поиска в ответ на этот новый запрос.

Ядро изобретения — использование исторических данных о кликах для генерации специфичных для изображения предложений и интерфейс для их отображения при взаимодействии.

Claim 79 (Зависимый): Детализирует, как определяются альтернативные запросы, вводя метрику selection fraction.

Запрос определяется как альтернативный частично на основе selection fraction для данного изображения. Selection fraction является функцией от количества выборов этого изображения другими пользователями, когда оно было показано в ответ на этот запрос.

Claim 80 (Зависимый): Определяет формулу для selection fraction.

Selection fraction вычисляется путем расчета отношения: (Количество случаев за период времени, когда изображение было выбрано в ответ на запрос) / (Общее количество случаев за период времени, когда любой результат был выбран в ответ на этот запрос).

Дополнительные механизмы (описанные в Description):

  • Офлайн-обработка: Описан метод офлайн-анализа логов для расчета number of selections и selection fraction и сохранения этих данных в репозитории.
  • Перенос меток: Описан метод использования byte hashes или simhashes для идентификации похожих изображений и предоставления для первого изображения меток (labels), принадлежащих похожим изображениям.
  • Определение жанра: Описано использование паттернов альтернативных запросов и распределения кликов для определения жанра (например, порнографии) и фильтрации результатов.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные на этапе анализа логов, и влияя на пользовательский интерфейс и индексацию.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основная офлайн-обработка. Система анализирует логи пользовательских сессий (поведенческие данные), чтобы установить связи между запросами и кликами по изображениям. Рассчитываются и индексируются метрики number of selections и selection fraction. Также вычисляются byte hash и simhash для идентификации дубликатов и переноса меток между ними.

QUNDERSTANDING – Понимание Запросов
Механизм участвует в уточнении запросов. Предлагая альтернативные запросы, основанные на коллективном поведении, система помогает пользователю сформулировать более точный интент, связанный с конкретным визуальным объектом.

RANKING – Ранжирование
Патент упоминает, что альтернативные запросы могут использоваться как labels для изображений в индексной базе данных. Эти автоматически сгенерированные метки могут влиять на релевантность изображения запросам на этапе ранжирования. Также упоминается возможность ранжирования на основе number of selections.

METASEARCH / Пользовательский Интерфейс
Основное применение патента происходит на уровне представления результатов. Система изменяет UI, добавляя hotspots к изображениям и отображая диалоговые окна (dialog box) с альтернативными запросами при взаимодействии.

Входные данные:

  • Исходный запрос пользователя (First Image Query).
  • Логи поисковых сессий (запросы и клики).
  • Индекс изображений.

Выходные данные:

  • Репозиторий связей между изображениями и альтернативными запросами с метриками (Selection Fraction).
  • Результаты поиска с интегрированными данными для отображения альтернативных запросов.
  • Автоматически сгенерированные метки (labels) для изображений.

На что влияет

  • Типы контента: В первую очередь влияет на поиск изображений (Google Images). Однако в патенте упоминается, что методы могут применяться и к другим корпусам (веб-страницы, продукты, книги, видео).
  • Специфические запросы: Наибольшее влияние на неоднозначные или широкие запросы (например, запрос "soccer" может быть уточнен до "soccer ball" или "soccer player").
  • Языковые особенности: Патент подчеркивает особую полезность для пользователей, вводящих запросы на нероманских языках (например, китайский, японский, корейский, русский), так как навигация кликами упрощает процесс по сравнению с вводом текста.

Когда применяется

  • Триггеры активации (Офлайн): Периодический анализ логов поисковых сессий за определенный период времени (time period).
  • Триггеры активации (Онлайн): Взаимодействие пользователя с результатом поиска изображения (например, наведение курсора на hotspot).
  • Пороговые значения: Система фильтрует предлагаемые запросы. Запрос удаляется из списка предложений, если:
    • Number of selections ниже порога (например, менее 50 кликов).
    • Selection fraction ниже порога (например, менее 0.001 или 0.01).
  • Исключения: Запросы удаляются, если они содержат ненормативную лексику (profanity), орфографические ошибки, не соответствуют языку исходного запроса или являются лексически слишком похожими (дубликатами, перестановками слов) на другие предложения.

Пошаговый алгоритм

Процесс А: Офлайн-генерация альтернативных запросов (Анализ логов)

  1. Выбор изображения: Система выбирает изображение из индекса.
  2. Идентификация связанных запросов: Для выбранного изображения система идентифицирует группу вторых (альтернативных) запросов, которые ранее приводили к клику на это изображение.
  3. Базовая фильтрация: Удаление запросов с нежелательными словами, ошибками или на неверном языке.
  4. Итерация по запросам и Расчет Метрик: Система перебирает каждый второй запрос в группе:
    1. Определяется number of selections (количество кликов) для этого изображения по этому запросу.
    2. Определяется selection fraction (доля кликов) для изображения по этому запросу.
  5. Фильтрация по порогам: Удаление запросов, не удовлетворяющих минимальным порогам по кликам и доле кликов.
  6. Ранжирование и Дедупликация: Ранжирование оставшихся кандидатов (например, по selection fraction) и последовательный выбор Топ-N, применяя критерии лексической схожести:
    1. Проверка на перестановку слов (permutation duplicate).
    2. Проверка расстояния редактирования (string edit distance).
    3. Проверка, не является ли запрос подстрокой (substring) уже выбранного.
  7. Сохранение данных: Система сохраняет в репозитории связь между изображением, группой отфильтрованных вторых запросов и их метриками.
  8. Перенос меток (Опционально): Использование Simhash/Byte hash для поиска похожих/дублирующихся изображений и переноса сгенерированных меток между ними.

Процесс Б: Обработка запроса в реальном времени

  1. Получение запроса: Система получает первый запрос от клиентского устройства.
  2. Генерация результатов: Поисковая система генерирует группу результатов поиска изображений.
  3. Идентификация альтернатив: Для каждого результата система извлекает из репозитория связанные с ним предлагаемые вторые запросы.
  4. Передача данных клиенту: Система передает результаты поиска и связанные с ними альтернативные запросы на клиентское устройство (включая скрипты для создания hotspots).
  5. Взаимодействие пользователя: Система получает ввод от пользователя, взаимодействующего с конкретным изображением (например, наведение курсора).
  6. Отображение альтернатив: В ответ на взаимодействие система отображает предлагаемые вторые запросы, связанные с этим изображением.
  7. Новый поиск (Опционально): При выборе альтернативного запроса система отображает новую группу результатов.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных и данных о самом изображении.

  • Поведенческие факторы: Критически важные данные. Используются логи поисковых сессий, фиксирующие, какие запросы были введены (image queries) и какие результаты были выбраны (selections/клики).
  • Мультимедиа факторы: Данные самого изображения используются для вычисления byte hash и simhash. Эти хеши применяются для поиска точных и нечетких дубликатов.
  • Контентные факторы: Текстовые данные самих запросов используются для фильтрации (проверка на ненормативную лексику, орфографию, язык) и дедупликации (лексическая схожесть, расстояние редактирования строк).

Какие метрики используются и как они считаются

  • Number of Selections (Количество кликов): Прямой подсчет кликов на изображение по запросу за период времени. Используется для определения популярности.
  • Selection Fraction (Доля кликов): Рассчитывается по формуле:

Выводы

  1. Поведение пользователей как источник меток (Labeling): Патент демонстрирует, как Google использует клики пользователей для понимания и маркировки изображений. Запросы, которые стабильно приводят к кликам на изображение, становятся его семантическими метками, даже если эти термины отсутствуют в контенте страницы.
  2. Значимость определяется долей кликов (Selection Fraction): Метрика selection fraction является ключевой. Она показывает не просто популярность изображения, а его значимость как ответа на конкретный запрос относительно других результатов. Высокая доля кликов может привести к тому, что запрос станет основной меткой изображения.
  3. Автоматическое определение жанра и фильтрация: Система может использовать паттерны в альтернативных запросах и распределение кликов для определения жанра изображения (например, карикатура, порнография). Это используется для классификации и фильтрации контента (например, удаления нежелательного контента из нейтральных запросов).
  4. Перенос меток между похожими изображениями: Использование byte hash (для точных дубликатов) и simhash (для похожих изображений) позволяет системе переносить сгенерированные метки между визуально схожими объектами. Это значительно расширяет покрытие и улучшает понимание изображений, по которым мало данных.
  5. Уточнение интента через визуальный контекст: Система предлагает механизм уточнения запроса, основанный на конкретном визуальном элементе, который заинтересовал пользователя, что является точным методом уточнения интента в поиске изображений.

Практика

Best practices (это мы делаем)

  • Оптимизация изображений под конкретные интенты и высокий CTR: Создавайте и оптимизируйте изображения так, чтобы они были лучшим ответом на конкретные запросы. Необходимо добиваться высокой selection fraction (доли кликов) в Google Images. Если пользователи кликают на ваше изображение по запросу X, этот запрос станет меткой вашего изображения.
  • Анализ кликов в Google Search Console: Регулярно анализируйте отчет по поиску изображений в GSC. Определяйте, какие запросы приводят к кликам на ваши изображения. Эти данные напрямую отражают метки, которые Google ассоциирует с вашим контентом согласно патенту.
  • Создание уникальных изображений: Поскольку система использует simhash для поиска похожих изображений и переноса меток, создание уникальных изображений поможет им выделиться и собрать чистые сигналы кликов, не размытые контекстом других сайтов, использующих то же изображение.
  • Обеспечение сильного текстового контекста: Обеспечьте четкий текстовый контекст (alt-текст, подписи, окружающий текст). Это помогает изображению попасть в первичную выдачу по разнообразным запросам, что является необходимым условием для начала сбора данных о кликах.

Worst practices (это делать не надо)

  • Использование кликбейтных изображений: Попытки привлечь клики по нерелевантным запросам с помощью вводящих в заблуждение изображений контрпродуктивны. Система начнет ассоциировать ваше изображение с этими нерелевантными запросами, что ухудшит его ранжирование по целевым запросам.
  • Игнорирование Image SEO и фокус только на тексте: Полагаться только на alt-текст и окружающий контент недостаточно. Патент показывает, что поведенческие сигналы (клики) являются прямым источником данных для понимания изображения системой.
  • Массовое использование стоковых или неуникальных изображений: Использование изображений, которые идентичны (byte hash) или очень похожи (simhash) на тысячи других в интернете. Они будут наследовать метки друг друга, собранные со всех источников, что может привести к размыванию релевантности.

Стратегическое значение

Патент подтверждает стратегическую важность поведенческих факторов в поиске изображений. Он показывает, что Google активно использует "мудрость толпы" для автоматической классификации и маркировки визуального контента в масштабе. Для SEO-специалистов это означает, что оптимизация изображений — это не только техническая задача, но и задача соответствия интенту пользователя. Стратегия должна включать создание визуального контента, который пользователи активно ищут и выбирают в ответ на конкретные запросы.

Практические примеры

Сценарий: Оптимизация изображения товара в интернет-магазине

  1. Задача: Улучшить ранжирование изображения нового смартфона модели "Phone X Blue 128GB".
  2. Действия по патенту:
    • Создать высококачественное, уникальное изображение смартфона в синем цвете.
    • Разместить его на странице с релевантным контентом, оптимизированным под целевые запросы, чтобы обеспечить первичное ранжирование в Image Search.
  3. Механизм работы: Пользователи ищут "Phone X Blue 128GB" и кликают на это изображение в Google Images. Система фиксирует эти клики.
  4. Расчет метрик: Система вычисляет высокую selection fraction для этого изображения по запросу "Phone X Blue 128GB".
  5. Результат: Система использует "Phone X Blue 128GB" как основную метку (label) для этого изображения. Когда другие пользователи будут взаимодействовать с этим изображением (даже если найдут его по более широкому запросу "Phone X"), система может предложить им уточняющий запрос "Phone X Blue 128GB".

Вопросы и ответы

Как именно система определяет, какие альтернативные запросы предложить для изображения?

Система анализирует исторические данные поисковых сессий. Она ищет запросы, по которым данное изображение ранее показывалось в выдаче и получало клики от пользователей. Затем эти запросы фильтруются на основе метрик популярности (number of selections) и значимости (selection fraction), а также проходят лексическую и языковую проверку перед тем, как быть предложенными.

Что такое Selection Fraction и почему это важно для SEO?

Selection Fraction — это доля кликов, которую получает конкретное изображение от общего числа кликов по всем результатам для данного запроса. Это ключевой показатель релевантности и качества изображения как ответа на запрос. Высокая selection fraction указывает системе, что изображение очень релевантно запросу, и этот запрос, вероятно, будет использоваться как основная метка (label) для изображения, что критически важно для его ранжирования.

Может ли Google понять содержание изображения, если на странице нет alt-текста и окружающего текста?

Да. Согласно патенту, система может генерировать метки для изображения на основе запросов, которые привели к кликам по нему. Кроме того, патент описывает механизм переноса меток: если изображение визуально похоже (по simhash) на другое изображение, у которого уже есть метки (текстовые или сгенерированные кликами), оно может унаследовать эти метки.

Что такое simhash и как он используется в этом патенте?

Simhash — это техника для определения нечетких дубликатов (похожих, но не идентичных изображений). В патенте он используется для идентификации визуально схожих изображений в индексе. Это позволяет системе переносить альтернативные запросы и метки между ними, обогащая данные для изображений, по которым недостаточно собственной статистики кликов.

Как этот патент влияет на использование стоковых фотографий?

Использование стоковых фото усложняет дифференциацию. Поскольку одно и то же изображение используется на разных сайтах в разном контексте, система агрегирует клики со всех источников. Если другие сайты используют его в нерелевантном контексте и собирают клики по другим запросам, это может "загрязнить" набор меток для этого изображения, что повлияет и на вашу видимость.

Как система защищается от манипуляций кликами для генерации ложных меток?

Патент не описывает конкретных механизмов защиты от накруток. Однако использование метрики selection fraction (доли кликов) вместо абсолютного числа кликов частично нивелирует эффект от спам-атак, так как требует не просто много кликов на изображение, но и высокую долю относительно других результатов. Также применяются пороги (thresholds) для минимального количества кликов.

Может ли этот механизм использоваться для определения языка или перевода терминов?

Да, патент упоминает, что анализ альтернативных запросов может использоваться для машинного перевода. Если одно и то же изображение стабильно получает клики по запросу "flower" на английском и "fleur" на французском, система может использовать это как обучающие данные для связи этих терминов. Также система фильтрует предложения, если их язык отличается от языка исходного запроса.

Как система определяет жанр изображения (например, карикатура или порнография)?

Система анализирует семантику альтернативных запросов, связанных с изображением. Если значительная часть запросов содержит определенные термины (например, "funny" для карикатур), изображение может быть классифицировано соответствующим образом. Также для определения порнографии могут использоваться паттерны кликов (например, очень большое количество кликов и специфическое распределение выборов).

Применяется ли этот механизм только в Google Images?

Патент в первую очередь описывает применение в поиске изображений. Однако в тексте указано, что описанные методы могут быть использованы для предложения альтернативных запросов и в других корпусах, таких как поиск веб-страниц, продуктов, книг или видео.

Заменяет ли этот механизм необходимость прописывать alt-тексты?

Нет, не заменяет. Alt-тексты остаются важными для доступности и как базовый сигнал релевантности. Однако этот патент показывает, что Google в значительной степени полагается на поведенческие данные (клики) для валидации и обогащения понимания изображения. Можно сказать, что alt-текст помогает получить первичные показы, а клики определяют, закрепится ли изображение в выдаче по этим запросам.

Похожие патенты

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя
Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.
  • US8504547B1
  • 2013-08-06
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Популярные патенты

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы
Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.
  • US20150261858A1
  • 2015-09-17
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок
Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.
  • US7509344B1
  • 2009-03-24
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов
Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.
  • US8495483B1
  • 2013-07-23
  • Индексация

  • Ссылки

  • SERP

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

seohardcore