Как Google использует механизм внимания для выбора ключевых визуальных элементов на изображениях для улучшения поиска по картинкам

IMAGE RETRIEVAL WITH DEEP LOCAL FEATURE DESCRIPTORS AND ATTENTION-BASED KEYPOINT DESCRIPTORS (Поиск изображений с использованием глубоких локальных дескрипторов признаков и дескрипторов ключевых точек на основе внимания)

US10402448B2
Google LLC
2017-06-28
2019-09-03

Google использует модель глубокого обучения для анализа изображений, которая не только извлекает визуальные признаки (дескрипторы), но и оценивает их важность с помощью механизма внимания. Это позволяет системе фокусироваться на самых значимых элементах (например, объектах или ориентирах) и игнорировать визуальный шум, повышая точность и эффективность поиска похожих изображений.

Какую проблему решает

Патент решает проблему точности и эффективности крупномасштабного поиска изображений (large-scale image retrieval). Традиционные методы часто извлекают все доступные локальные признаки из изображения, многие из которых нерелевантны для задачи распознавания (например, фон, визуальный шум, отвлекающие объекты). Обработка этих нерелевантных признаков добавляет "шум" в процесс поиска, снижает точность и увеличивает вычислительные затраты. Также патент устраняет необходимость в разработке сложных, созданных вручную (hand-crafted) алгоритмов для определения ключевых точек.

Что запатентовано

Запатентована система и метод использования обученной модели дескрипторов изображений (machine-learned image descriptor model), основанной на глубоком обучении (например, CNN). Ключевое нововведение — интеграция механизма внимания (attention mechanism) непосредственно в процесс извлечения признаков. Модель одновременно извлекает локальные дескрипторы и оценивает их значимость (attention score), позволяя системе выбрать только наиболее важные признаки (keypoint descriptors) для последующего индексирования и поиска.

Как это работает

Модель (обычно глубокая сверточная нейронная сеть) обрабатывает входное изображение. В процессе обработки система выполняет две задачи, часто используя общие слои сети (shared layers):

Извлечение признаков: Генерируется плотная сетка локальных дескрипторов (local feature descriptors).
Оценка внимания: Механизм внимания присваивает оценку (attention score) каждому дескриптору, определяя его релевантность для задачи поиска.

Затем система выбирает подмножество дескрипторов с наивысшими оценками внимания. Это подмножество (set of keypoint descriptors) используется для представления изображения в индексе. При поиске дескрипторы запроса сравниваются с индексом (например, методом ближайших соседей), а результаты проходят геометрическую верификацию.

Актуальность для SEO

Высокая. Глубокое обучение и механизмы внимания являются фундаментальными компонентами современных систем компьютерного зрения. Описанный подход к эффективному извлечению и взвешиванию визуальных признаков крайне актуален для работы таких сервисов, как Google Images и Google Lens, особенно в контексте распознавания объектов, товаров и ориентиров.

Важность для SEO

Влияние на SEO оценивается как среднее-высокое, но специфичное для визуального поиска. Патент не описывает ранжирование веб-страниц, но критически важен для понимания того, как Google "видит" и индексирует визуальный контент. Он напрямую влияет на то, будет ли изображение найдено через поиск по картинкам или Google Lens. Понимание того, какие элементы изображения привлекают "внимание" модели, позволяет оптимизировать композицию изображений для лучшей обнаруживаемости.

Термины и определения

Attention Score (Оценка внимания): Числовое значение, присваиваемое моделью каждому local feature descriptor. Отражает значимость или релевантность данного признака для задачи поиска изображений. Используется для отбора keypoint descriptors.
Deep Local Feature Descriptor (Глубокий локальный дескриптор признака): Local feature descriptor, извлеченный с помощью модели глубокого обучения (например, глубокой нейронной сети).
Dimensionality Reduction (Снижение размерности): Процесс уменьшения количества переменных (размерности) в наборе данных. В патенте используется для сжатия keypoint descriptors с целью повышения эффективности поиска. Упоминаются методы PCA (метод главных компонент) и L2 normalization.
Geometric Verification (Геометрическая верификация): Этап постобработки в поиске изображений. Проверяет пространственное соответствие между найденными признаками на изображении запроса и изображении из базы данных для отсеивания ложных совпадений.
Image Pyramid (Пирамида изображений): Набор версий одного и того же изображения в разных масштабах. Используется для обеспечения инвариантности к масштабу, позволяя обнаруживать объекты разного размера.
Keypoint Descriptor (Дескриптор ключевой точки): Выбранное подмножество local feature descriptors, которые получили наивысшие Attention Scores. Используются для финального представления изображения в индексе.
Local Feature Descriptor (Локальный дескриптор признака): Векторное представление, описывающее локальную область (патч) изображения. Модель обычно генерирует плотную сетку таких дескрипторов.
Machine-learned Image Descriptor Model (Обученная модель дескрипторов изображений): Модель машинного обучения (в патенте подразумевается нейронная сеть, например, CNN), обученная извлекать дескрипторы из изображений и оценивать их важность.
Nearest Neighbor Search (Поиск ближайших соседей): Алгоритм, используемый для нахождения в индексе дескрипторов, наиболее близких (похожих) к дескрипторам изображения запроса.
Receptive Field (Рецептивное поле): Область входного изображения, которая влияет на активацию определенного нейрона или на вычисление определенного дескриптора. Используется для локализации признака на изображении.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод поиска изображений.

Система получает изображение запроса (query image).
Определяется множество локальных дескрипторов признаков (local feature descriptors).
Для каждого локального дескриптора определяется оценка внимания (attention score).
Определяется набор дескрипторов ключевых точек (set of keypoint descriptors). Это подмножество локальных дескрипторов, выбранное на основе оценок внимания.
Снижается пространственная размерность (spatial dimensionality) набора дескрипторов ключевых точек.
Выполняется поиск одного или нескольких изображений, соответствующих запросу, на основе этого набора дескрипторов.

Ядро изобретения — использование Attention Score для фильтрации локальных дескрипторов перед этапом поиска.

Claim 8 (Независимый пункт): Описывает применение обученной модели.

Система получает доступ к обученной модели (machine-learned image descriptor model). Модель обучена определять локальные дескрипторы, вычислять для них attention score и выводить набор keypoint descriptors на основе этих оценок.
Изображение запроса вводится в модель.
На выходе модели получается набор keypoint descriptors, каждый из которых был выбран на основе соответствующей оценки внимания, сгенерированной моделью.
Этот набор предоставляется приложению для обработки изображений (например, системе поиска).

Этот пункт защищает использование специализированной модели, которая интегрирует механизм внимания для выбора ключевых точек.

Claim 15 (Зависимый от 8): Уточняет архитектуру модели.

Модель включает множество общих слоев (plurality of shared layers), которые используются как минимум частично и для определения локальных дескрипторов, и для определения оценки внимания для каждого из них. Это указывает на высокую эффективность архитектуры, где обе задачи решаются совместно.

Claim 19 (Независимый пункт): Описывает архитектуру системы поиска изображений.

Система включает:

Обученную модель, настроенную на прием изображения, определение локальных дескрипторов, вычисление attention scores и вывод набора keypoint descriptors (выбранного подмножества на основе оценок).
Индекс keypoint descriptors, полученный путем обработки множества изображений базы данных этой моделью.
Процессор и память, выполняющие операции: прием запроса, ввод его в модель, получение keypoint descriptors запроса, определение совпадающих признаков путем сравнения с индексом и поиск как минимум одного совпадающего изображения.

Где и как применяется

Изобретение применяется в системах визуального поиска (Image Retrieval) и затрагивает этапы индексирования и ранжирования (поиска).

INDEXING – Индексирование и извлечение признаков
Это основная область применения для построения базы данных. Система обрабатывает большой корпус изображений (database images) в офлайн-режиме. Для каждого изображения применяется Machine-learned Image Descriptor Model для извлечения Deep Local Feature Descriptors, вычисления Attention Scores и выбора финального набора Keypoint Descriptors. Эти дескрипторы сохраняются в крупномасштабном индексе.

RANKING – Ранжирование (в контексте поиска изображений)
При получении изображения запроса (query image) система в реальном времени применяет ту же модель для извлечения его Keypoint Descriptors. Затем выполняется поиск этих дескрипторов в индексе (например, с помощью Nearest Neighbor Search) для нахождения совпадающих признаков (matching features).

RERANKING – Переранжирование (в контексте поиска изображений)
Найденные совпадения проходят этап Geometric Verification для подтверждения пространственного соответствия между запросом и изображениями-кандидатами, что позволяет отфильтровать ложные срабатывания и уточнить ранжирование.

Входные данные:

Изображения (пиксельные данные) — как для индексации, так и для запросов.
Обученная модель дескрипторов изображений.

Выходные данные:

Для индексации: Индекс, содержащий сжатые (с пониженной размерностью) Keypoint Descriptors для корпуса изображений.
Для поиска: Список совпадающих изображений, отсортированных по релевантности (количеству и качеству верифицированных совпадений).

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на контент, где требуется точное визуальное сопоставление: изображения товаров (e-commerce), достопримечательности (landmarks), логотипы, произведения искусства.
Специфические запросы: Влияет на визуальные запросы (поиск по изображению, Google Lens), а не на текстовые запросы в обычном веб-поиске.
Конкретные ниши или тематики: E-commerce (распознавание продуктов), Локальный поиск (распознавание мест и ориентиров).

Когда применяется

При каких условиях работает алгоритм: Алгоритм применяется при каждом индексировании нового изображения и при каждом выполнении визуального поискового запроса.
Триггеры активации: Механизм внимания интегрирован в модель и активируется всегда при обработке изображения (во время прямого прохода через нейронную сеть). Он не является отдельным модулем, который включается при определенных условиях.

Пошаговый алгоритм

Процесс А: Извлечение дескрипторов (Индексирование и Обработка запроса)

Получение изображения: Система получает входное изображение.
Построение пирамиды изображений (Опционально): Создается Image Pyramid — несколько версий изображения в разных масштабах для обеспечения устойчивости к изменению размера объектов. Каждая версия обрабатывается независимо.
Извлечение локальных признаков: Изображение подается на вход Machine-learned Image Descriptor Model (например, CNN). Модель генерирует плотную сетку Local Feature Descriptors.
Вычисление оценок внимания: Одновременно с извлечением признаков (используя shared layers) модель вычисляет Attention Score для каждого локального дескриптора.
Выбор ключевых точек: Система отбирает подмножество локальных дескрипторов, основываясь на их Attention Scores. Например, выбирается фиксированное количество дескрипторов с наивысшими оценками. Они становятся Keypoint Descriptors.
Снижение размерности: К выбранным Keypoint Descriptors применяются методы Dimensionality Reduction (например, L2 normalization, затем PCA, затем снова L2 normalization) для сжатия представления.
Индексирование / Передача для поиска: Полученные дескрипторы либо сохраняются в индексе (при индексации), либо передаются в систему поиска (при обработке запроса).

Процесс Б: Поиск изображений (Retrieval)

Получение дескрипторов запроса: Система получает Keypoint Descriptors запроса (результат Процесса А).
Поиск в индексе: Выполняется Nearest Neighbor Search для поиска похожих дескрипторов в индексе базы данных.
Определение совпадений: Идентифицируются совпадающие дескрипторы (matching descriptors) между запросом и изображениями из базы.
Геометрическая верификация: Выполняется Geometric Verification для проверки пространственного соответствия совпадений и отсеивания ложных результатов.
Ранжирование и выдача: Изображения ранжируются на основе верифицированных совпадений и предоставляются в качестве результата поиска.

Какие данные и как использует

Данные на входе

Патент фокусируется исключительно на обработке визуальных данных.

Мультимедиа факторы: Пиксельные данные изображений. Это единственный тип входных данных, который обрабатывает описанная модель.

Патент не упоминает использование контентных (текстовых), ссылочных, поведенческих или иных традиционных SEO-факторов в рамках этого конкретного механизма извлечения дескрипторов.

Какие метрики используются и как они считаются

Attention Score: Вычисляется внутренними слоями нейронной сети для оценки значимости каждого локального признака. Конкретная формула не приводится, но она является результатом обучения модели.
Методы снижения размерности:
- L2 Normalization: Нормализация векторов дескрипторов.
- PCA (Principal Component Analysis): Метод главных компонент, используемый для сжатия дескрипторов.
Алгоритмы машинного обучения: Используются нейронные сети, в частности, сверточные нейронные сети (Convolutional Neural Networks, CNN).
Функции потерь (Loss Functions) при обучении: Патент упоминает обучение модели с использованием функций потерь, которые сравнивают выход модели с эталонными данными (ground-truth data). В описании упоминается возможность использования cross-entropy loss function для первого этапа обучения (извлечение признаков) и второй функции потерь для обучения механизма внимания.

Приоритет значимости над количеством признаков: Google стремится не просто извлечь как можно больше визуальных признаков, а идентифицировать наиболее важные (salient) из них. Механизм внимания (Attention Mechanism) является ключевым инструментом для этой фильтрации.
Игнорирование визуального шума: Система спроектирована так, чтобы игнорировать фон, помехи и отвлекающие объекты (clutter). Этим элементам присваиваются низкие Attention Scores, и они исключаются из финального набора Keypoint Descriptors.
Эффективность за счет интеграции: Извлечение признаков и оценка их важности происходят одновременно (в рамках одного прохода через нейронную сеть) и используют общие слои (shared layers). Это значительно повышает скорость обработки по сравнению с последовательными методами.
Обучение на крупномасштабных данных: Модель обучается на больших наборах данных (например, достопримечательностей) с использованием только меток на уровне изображения (image-level labels), без необходимости детальной разметки объектов внутри изображений.
Инфраструктура визуального поиска: Патент описывает базовую инфраструктуру для систем компьютерного зрения Google (Images, Lens). Он не имеет прямого отношения к ранжированию текстового контента или веб-страниц, но критичен для Image SEO.

Best practices (это мы делаем)

Хотя патент описывает внутренние механизмы компьютерного зрения Google, он дает важные ориентиры для оптимизации изображений (Image SEO и Visual Search Optimization).

Оптимизация композиции изображения: Размещайте главный объект так, чтобы он был визуально доминирующим. Механизм внимания сфокусируется на четких, контрастных и узнаваемых объектах. Убедитесь, что объект хорошо освещен и находится в фокусе.
Минимизация визуального шума (Clutter): Избегайте перегруженных фонов и большого количества отвлекающих объектов. Чем чище фон, тем выше вероятность, что Attention Mechanism присвоит высокие оценки признакам основного объекта.
Использование высококачественных изображений: Используйте четкие изображения с высоким разрешением. Это позволяет модели извлекать более точные Deep Local Feature Descriptors.
Стратегия для E-commerce: Предоставляйте чистые фотографии продукта на нейтральном фоне. Это гарантирует, что извлеченные Keypoint Descriptors будут относиться именно к продукту, что критично для поиска через Google Lens или поиска похожих товаров.
Стратегия для Локального SEO: Используйте качественные фотографии фасадов и интерьеров. Система обучена на распознавании ориентиров (landmarks), и четкие изображения помогут Google идентифицировать местоположение.

Worst practices (это делать не надо)

Использование перегруженных изображений: Размещение важных объектов на сложном, пестром фоне или среди множества других объектов. Это может привести к тому, что механизм внимания "отвлечется" и не выделит нужный объект как ключевой.
Сокрытие или перекрытие объекта (Occlusion): Использование изображений, где главный объект частично скрыт или перекрыт другими элементами (например, водяными знаками, текстом). Это затрудняет извлечение качественных дескрипторов.
Использование некачественных, размытых изображений: Низкое качество затрудняет извлечение надежных визуальных признаков.
Игнорирование визуальной составляющей: Фокусироваться только на атрибутах ALT и окружающем тексте, игнорируя композицию и качество самого изображения.

Стратегическое значение

Патент подтверждает высокий уровень развития технологий компьютерного зрения Google. Система не просто классифицирует изображение целиком, а проводит детальный анализ локальных признаков и их значимости. Это подчеркивает стратегическую важность визуального поиска как самостоятельного канала трафика, особенно для e-commerce и контента, ориентированного на объекты. SEO-стратегия должна учитывать, что для успешного ранжирования в Google Images или обнаружения через Google Lens изображение должно быть понятным для механизма внимания.

Практические примеры

Сценарий: Оптимизация карточки товара для поиска через Google Lens

Задача: Увеличить вероятность того, что пользователи, фотографирующие товар в офлайне, найдут его на нашем сайте через Google Lens.
Действие (на основе патента): Разместить на сайте фотографию товара крупным планом на белом или нейтральном фоне, без аксессуаров и отвлекающих элементов.
Обоснование: Machine-learned Image Descriptor Model проанализирует это изображение. Благодаря отсутствию шума, Attention Mechanism присвоит максимальные Attention Scores признакам самого товара. Эти чистые Keypoint Descriptors попадут в индекс.
Ожидаемый результат: Когда пользователь сделает фото товара (даже в более сложных условиях), модель Google Lens извлечет дескрипторы товара. Вероятность успешного сопоставления (Nearest Neighbor Search) с чистыми дескрипторами в индексе будет выше, что приведет пользователя на наш сайт.

Что такое механизм внимания (Attention Mechanism) в контексте этого патента?

Это компонент нейронной сети, который оценивает важность различных локальных признаков (Local Feature Descriptors), извлеченных из изображения. Он присваивает каждому признаку оценку (Attention Score). Это позволяет системе сосредоточиться на наиболее значимых частях изображения (например, основном объекте) и игнорировать нерелевантные (например, фон или шум).

В чем разница между Local Feature Descriptor и Keypoint Descriptor?

Local Feature Descriptor — это векторное представление любого локального участка изображения; модель извлекает их в большом количестве (плотная сетка). Keypoint Descriptor — это отфильтрованное подмножество локальных дескрипторов, которые получили наивысшие оценки внимания (Attention Scores). Только они используются для финального представления изображения в индексе и для поиска.

Влияет ли этот патент на ранжирование обычных веб-страниц в поиске Google?

Нет, патент напрямую не описывает алгоритмы ранжирования веб-страниц или анализа текста. Он посвящен исключительно системам поиска изображений (Image Retrieval), таким как Google Images или Google Lens. Его влияние на веб-поиск может быть только косвенным, например, если качество и релевантность изображений на странице учитываются как один из факторов ранжирования всей страницы.

Как этот механизм помогает улучшить Image SEO?

Он определяет, как именно Google "видит" и интерпретирует содержание изображения. Понимая, что система ищет четкие, значимые объекты и игнорирует шум, SEO-специалисты должны оптимизировать композицию изображений. Четкое представление основного объекта без отвлекающих факторов повышает вероятность того, что его признаки получат высокие Attention Scores и будут эффективно использоваться в поиске.

Что такое "общие слои" (Shared Layers) и почему они важны?

Это слои нейронной сети, которые используются одновременно для выполнения двух задач: извлечения локальных дескрипторов и вычисления оценок внимания. Это значительно повышает эффективность системы, поскольку обе операции выполняются за один проход данных через модель, вместо того чтобы использовать два отдельных последовательных процесса.

Что такое Пирамида Изображений (Image Pyramid) и зачем она нужна?

Это набор копий одного и того же изображения в разных масштабах (разрешениях). Система обрабатывает каждую копию независимо. Это необходимо для того, чтобы система могла распознавать объекты независимо от их размера на фотографии (инвариантность к масштабу). Например, объект, снятый крупным планом, и тот же объект, снятый издалека, будут успешно распознаны.

Что происходит на этапе снижения размерности (Dimensionality Reduction)?

На этом этапе извлеченные Keypoint Descriptors (которые являются многомерными векторами) сжимаются для более эффективного хранения в индексе и ускорения поиска. В патенте упоминается использование методов нормализации (L2 Normalization) и метода главных компонент (PCA). Это позволяет уменьшить объем данных без существенной потери точности.

Как система определяет, какие части изображения важны, при обучении?

Модель обучается на больших наборах данных (например, фотографиях достопримечательностей) с метками на уровне изображения. В процессе обучения (например, с использованием двухэтапной процедуры с разными функциями потерь) модель учится присваивать более высокие Attention Scores тем признакам, которые наиболее полезны для различения и сопоставления изображений с одинаковыми метками.

Что такое Геометрическая Верификация (Geometric Verification)?

Это финальный этап проверки при поиске. После того как система нашла похожие дескрипторы, она проверяет, сохраняется ли их взаимное пространственное расположение на изображении запроса и на изображении из базы данных. Если дескрипторы совпадают, но их расположение хаотично, совпадение считается ложным и отклоняется.

Может ли текст или водяной знак на изображении помешать работе этого алгоритма?

Да, может. Если текст или водяной знак перекрывает важную часть объекта, это может помешать извлечению качественных дескрипторов этого объекта. Кроме того, если текст сам по себе является ярким и контрастным, механизм внимания может ошибочно присвоить ему высокие Attention Scores, отвлекаясь от основного содержания изображения.

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени

Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.

US10311096B2
2019-06-04

Мультимедиа
SERP
Поведенческие сигналы

Как Google комбинирует визуальное сходство и семантические метки для улучшения поиска по картинке (Visual Search)

Google использует систему поиска по изображению, которая сочетает анализ визуальных характеристик и семантических меток. Система генерирует высокоточные метки (High Confidence Labels) для изображения, анализируя текст, связанный с визуально похожими картинками в интернете. Затем она ранжирует кандидатов, используя модель визуального сходства, обученную на основе человеческих оценок, и применяет правила фильтрации для обеспечения однородности результатов.

US8429173B1
2013-04-23

Семантика и интент
Мультимедиа
SERP

Как Google использует компактные дескрипторы и пространственное кодирование для выявления и удаления почти дубликатов изображений из поиска

Google использует систему для эффективного обнаружения изображений-почти дубликатов (измененный размер, обрезка, сжатие). Система анализирует локальные особенности контента ("визуальные слова") и их точное пространственное расположение ("тайлы"), чтобы создать компактные дескрипторы. Сравнивая эти дескрипторы, Google быстро идентифицирует и удаляет дубликаты из результатов поиска для повышения разнообразия выдачи.

US9063954B2
2015-06-23

Мультимедиа
SERP

Как Google использует машинное обучение для распознавания разных смыслов запроса и ранжирования изображений в Image Search

Google использует модель машинного обучения для улучшения ранжирования в поиске по картинкам. Система определяет различные смыслы (senses) неоднозначного запроса (например, "Jaguar" как автомобиль и как животное), проецирует изображения в многомерное пространство признаков и строит гиперплоскости (hyperplanes) для разделения этих смыслов. Итоговый ранг изображения определяется его близостью к любому из релевантных смыслов.

US8923655B1
2014-12-30

Семантика и интент
Мультимедиа
SERP

Как Google оптимизирует поиск по картинкам, обучаясь, какие визуальные атрибуты наиболее важны для конкретного изображения

Google использует механизм для повышения эффективности и релевантности поиска похожих изображений. Система анализирует изображение-запрос и создает эталонный набор высококачественных результатов (используя ресурсоемкую кластеризацию). Затем она тестирует различные визуальные атрибуты (измерения), чтобы определить, какой из них лучше всего воспроизводит этот эталонный набор. Найденный ключевой атрибут сохраняется и используется для быстрого ранжирования в будущем, минуя дорогие вычисления.

US8949253B1
2015-02-03

Мультимедиа

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске

Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.

US10853432B2
2020-12-01

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений

Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.

US20200159765A1
2020-05-21

Семантика и интент
Мультимедиа
Персонализация

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)

Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.

US7797316B2
2010-09-14

Свежесть контента
Ссылки
Техническое SEO

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News

Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.

US8375073B1
2013-02-12

EEAT и качество
SERP
Ссылки

Как Google использует клики пользователей для определения составных фраз (N-грамм) в запросах

Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие эту последовательность как неразрывную фразу, система определяет ее как составную (Compound) и использует это знание для улучшения ранжирования и понимания запроса.

US8086599B1
2011-12-27

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям

Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.

US9342600B1
2016-05-17

Поведенческие сигналы
Семантика и интент
SERP

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента

Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.

US9449095B1
2016-09-20

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.

US8903812B1
2014-12-02

Поведенческие сигналы
SERP
Антиспам

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации

Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.

US7565358B2
2009-07-21

EEAT и качество
Ссылки