
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
Патент решает проблему эффективного сбора и структурирования поведенческих данных, специфичных для Поиска по картинкам. Сырые логи запросов (Query Logs) содержат огромный объем зашумленных данных. Задача изобретения — извлечь события, относящиеся именно к поиску изображений, и учесть особенности его интерфейса: двухмерную структуру выдачи (2D-сетка) и уникальные типы взаимодействий, такие как наведение курсора (hover), которые сложно интерпретировать из общих логов.
Запатентована система и метод преобразования сырых логов в структурированные данные для анализа поведения в поиске изображений. Система создает промежуточные Объекты данных сеанса поиска изображений (Image Search Session Data Objects) для каждого пользователя, а затем агрегирует их в Модель запросов изображений (Image Query Model). Ключевой особенностью является сбор гранулярных данных: ховеров, длительности взаимодействия (time duration value) и точной 2D-позиции изображения в момент взаимодействия.
Система работает как конвейер обработки данных:
Query Logs.Image Search Session Data Object, содержащий хронологическую последовательность запросов и взаимодействий. Фиксируется точное расположение (строка/столбец) и длительность.Image Query Model. Эта модель содержит статистику (показы, клики, ховеры) для каждой пары запрос-изображение, учитывая контекст 2D-позиции показа.Высокая. Анализ поведения пользователей (relevance feedback) остается критически важным компонентом для обучения систем ранжирования. Интерфейсы поиска изображений по-прежнему используют двухмерную раскладку и взаимодействия типа ховер/превью. Описанная инфраструктура необходима для сбора чистых поведенческих сигналов и оценки вовлеченности в визуальный контент.
Патент имеет значительное влияние (7.5/10) на стратегии Image SEO. Хотя он описывает инфраструктуру сбора данных, а не алгоритм ранжирования, он подтверждает техническую возможность и намерение Google детально отслеживать и использовать поведенческие сигналы, специфичные для изображений. Он доказывает, что Google учитывает не только факт клика, но и ховеры (как признак интереса), длительность взаимодействия (как признак удовлетворенности) и анализирует позиционный бас в контексте 2D-раскладки.
quasi-two dimensional model).Query data items.Query data item, описывающая конкретное взаимодействие (клик или ховер). Включает тип, длительность (time duration value) и позицию результата.Search Event Data Items).row number) и номер столбца (column number).Claim 1 (Независимый пункт): Описывает основной метод преобразования данных от логов к модели.
image search).Image Search Session Data Objects.Image Query Model на основе этих объектов сессий. Эта модель указывает: (a) какие изображения получили взаимодействие и (b) какова была two-dimensional display position (двухмерная позиция отображения) изображения на странице результатов в момент взаимодействия.Ядром изобретения является структурирование данных таким образом, чтобы анализировать взаимодействие в контексте 2D-интерфейса поиска картинок.
Claim 2 (Зависимый): Уточняет типы взаимодействий и длительность.
Взаимодействие включает выбор (клик) ИЛИ наведение курсора (hover). Также фиксируется time duration value (значение длительности) этого взаимодействия.
Это прямое подтверждение логирования ховеров и длительности взаимодействия (Dwell Time для кликов, время наведения для ховеров).
Claim 3 (Зависимый): Описывает структуру сессии.
Image Search Session Data Object представляет собой упорядоченный по времени список Query Data Items.
Claims 9, 10 (Зависимые): Детализируют данные о позиции.
Каждый Query Data Item включает viewport location для каждого результата. Это может быть указано как номер страницы, номер столбца и номер строки.
Claims 11, 12 (Зависимые): Уточняют факт показа.
Система фиксирует, был ли результат фактически показан пользователю. Это определяется на основе viewport location (например, находился ли результат в видимой области экрана).
Claim 13 (Зависимый): Уточняет данные о курсоре.
Query Data Item включает информацию о местоположении pointer element (курсора) в момент первоначального предоставления результатов поиска.
Это важно для фильтрации случайных ховеров, когда курсор уже находился в определенной точке экрана до загрузки результатов.
Изобретение является инфраструктурным и затрагивает этапы сбора и обработки данных для ранжирования.
CRAWLING – Сбор данных (Data Acquisition)
На этом этапе происходит сбор «сырья». Все взаимодействия пользователей (клики, ховеры, движение курсора, изменение размера окна) фиксируются в реальном времени и сохраняются в Query Logs.
INDEXING – Извлечение признаков (Feature Extraction)
Основное применение патента. Описанный механизм (Query Information Subsystem) обрабатывает Query Logs офлайн:
Image Search Session Data Objects (очистка и организация данных по пользователям и сессиям).Image Query Model. Эта модель является набором извлеченных поведенческих признаков (например, CTR, Hover Rate) для пар запрос-изображение.RANKING – Ранжирование
Алгоритмы ранжирования используют Image Query Model как один из входных сигналов (например, для расчета relevance feedback score) для определения релевантности и ранжирования изображений при будущих запросах.
Входные данные:
Query Logs (search event data items).Выходные данные:
Image Search Session Data Objects (промежуточный результат).Image Query Model (конечный результат для ранжирования).Image Search Session Data Objects и Image Query Model происходит офлайн в пакетном режиме, обрабатывая логи за определенные периоды (например, 24 часа, неделя).Фаза 1: Сбор данных и Логирование (Реальное время)
Search Events (получение запроса, предоставление результатов, взаимодействие пользователя).Query Log. Запись включает идентификатор, временную метку, тип события. Time Duration Value).Фаза 2: Генерация объектов сессий (Офлайн/Пакетный режим)
Query Logs.Query Data Item для каждого уникального запроса, включая показанные результаты и их позиции.Interaction Data Item внутри соответствующего Query Data Item (тип, длительность, позиция).Query Data Items в хронологическом порядке.Фаза 3: Генерация модели запросов (Офлайн/Пакетный режим)
Image Search Session Data Objects для множества пользователей.Query Data Items. Рассчитываются суммарные счетчики: Impression Count, Selection Count (клики), Hover Count.Система использует исключительно данные из логов поисковых событий.
Selection / Клик).Hover).Time duration value): время наведения для ховеров (в миллисекундах), время пребывания на целевой странице для кликов (Dwell Time).Location of a pointer element) в момент загрузки страницы.resizing).Viewport location / Presentation position): номер страницы, строка, столбец (2D-позиция).whether the search result was presented).Identifier), обычно анонимизированный.Патент фокусируется на генерации структурированных агрегированных метрик в Image Query Model:
Selection Count и Hover Count.Методы анализа и агрегации:
two-dimensional display position. Это позволяет анализировать влияние позиции на взаимодействие (Position Bias).Time duration value для фильтрации шума. В описании патента упоминается возможность исключения коротких ховеров (например, менее 1 секунды) или коротких кликов (например, менее 10 секунд).hover) отслеживается и логируется наравне с кликами (selection). Это рассматривается как сигнал интереса пользователя к изображению.Dwell Time). Эти данные используются для оценки качества взаимодействия и фильтрации шума (например, случайных движений курсора).Image Query Model структурирована так, чтобы учитывать эту позицию при анализе взаимодействий, что позволяет нормализовать поведенческие метрики (CTR, Hover Rate).Image Query Model служит основой для расчета relevance feedback score — оценки релевантности изображения на основе агрегированного поведения пользователей.hover), а в идеале — кликнуть. Поскольку ховеры и их длительность отслеживаются, визуальная привлекательность напрямую влияет на собираемые поведенческие сигналы.Dwell Time после клика. Если пользователь разочарован после перехода, короткая длительность взаимодействия (short click) будет зафиксирована.Image Query Model.Dwell Time), что будет зафиксировано системой как негативный сигнал или отфильтровано как шум.Патент подтверждает, что ранжирование в Google Images в значительной степени опирается на анализ поведения пользователей. Для долгосрочного успеха в Image SEO необходимо фокусироваться не только на технических аспектах (alt-тексты, скорость загрузки), но и на визуальной оптимизации и качестве самих изображений. Система сбора данных Google настроена на выявление изображений, которые наиболее интересны пользователям в визуальном плане, и способна отфильтровывать манипуляции и случайный шум.
Сценарий: Оптимизация миниатюр для E-commerce в Image Search
Hover Count), и как долго они изучают превью (Hover Duration) или остаются на сайте после клика (Dwell Time).Image Query Model, что приводит к улучшению relevance feedback score и повышению позиций изображения в Image Search.Являются ли ховеры (наведение курсора) фактором ранжирования в Google Images?
Патент не описывает алгоритмы ранжирования, но он явно подтверждает (Claim 2), что Google собирает данные о ховерах (hover) и их длительности наравне с кликами. Эти данные включаются в Image Query Model, которая используется для оценки релевантности. Следовательно, ховеры являются отслеживаемым сигналом взаимодействия, который с высокой вероятностью используется при ранжировании.
Что такое "двухмерная позиция отображения" (two-dimensional display position) и почему она важна?
Это точное расположение изображения в интерфейсе поиска картинок, определяемое строкой и столбцом (Claim 1, 10). Google логирует эту позицию в момент взаимодействия. Это критически важно для корректного анализа поведения и нормализации позиционного баса (position bias), так как в 2D-галерее позиция сильно влияет на вероятность клика или ховера.
Как Google обрабатывает случайные наведения курсора?
Патент описывает два механизма. Во-первых, логируется длительность ховера (в миллисекундах); очень короткие ховеры (упоминается пример менее 1 секунды) могут быть отфильтрованы как шум. Во-вторых, система записывает начальное положение курсора при загрузке страницы (Claim 13), что позволяет идентифицировать ховеры, произошедшие без намеренного действия пользователя.
Что такое Image Query Model?
Это агрегированная база данных, которая содержит статистику взаимодействий пользователей для пар запрос-изображение, собранную по множеству пользователей. Она включает счетчики показов, кликов и ховеров, часто с разбивкой по позиции показа. Эта модель является ключевым источником данных для систем машинного обучения, оценивающих релевантность изображений.
Отслеживает ли Google Dwell Time для поиска по картинкам?
Да. В патенте (Claim 2) указано, что система собирает time duration value (значение длительности) для взаимодействий, включая клики (selection). Это время, которое пользователь проводит на целевой странице. Короткие клики (упоминается пример менее 10 секунд) могут фильтроваться или считаться негативным сигналом.
Влияет ли поведение пользователей в обычном веб-поиске на Image Search согласно этому патенту?
Нет. Ключевая задача этого изобретения — отфильтровать сырые логи и выделить события, относящиеся *только* к поиску изображений (Claim 1). Для Image Search создается отдельная модель (Image Query Model), основанная на взаимодействиях, произошедших именно в этом интерфейсе.
Что такое Image Search Session Data Object?
Это промежуточный этап обработки логов. Он представляет собой структурированную запись всех действий одного пользователя в поиске картинок за определенный период (например, день). Он содержит хронологию запросов, показанных картинок, их позиций и всех взаимодействий. Эти объекты затем используются для построения агрегированной модели.
Учитывает ли система, видел ли пользователь изображение, находившееся "ниже линии сгиба"?
Да. Патент (Claims 11, 12) указывает, что система определяет, был ли результат фактически показан пользователю, основываясь на его положении в области просмотра (viewport location) и действиях пользователя (например, скроллинг). Это позволяет корректно рассчитывать показы (Impressions).
Каков главный вывод для SEO-специалиста из этого патента?
Главный вывод — визуальная привлекательность и качество изображений критически важны для Image SEO. Необходимо оптимизировать миниатюры так, чтобы они стимулировали положительные взаимодействия (длительные ховеры и длительные клики), так как Google детально отслеживает эти сигналы и использует их для оценки релевантности.
Влияет ли размер окна браузера на сбор данных?
Да, в описании патента упоминается, что изменение размера окна (resizing) является отслеживаемым событием. Логируется оригинальный и новый размер окна, а также то, как изменилось расположение (строки/колонки) результатов. Это помогает корректно интерпретировать данные о позициях и видимости результатов.

Поведенческие сигналы
Семантика и интент
SERP

Индексация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

Индексация
Local SEO
Поведенческие сигналы

Мультимедиа
SERP
Поведенческие сигналы

Поведенческие сигналы
SERP

Поведенческие сигналы

EEAT и качество
SERP
Поведенческие сигналы

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
EEAT и качество
Свежесть контента

Мультиязычность
Семантика и интент
Ссылки

Knowledge Graph
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Антиспам
Ссылки
SERP
