Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)

COLLECTING IMAGE SEARCH EVENT INFORMATION (Сбор информации о событиях поиска изображений)

US8898150B1
Google LLC
2012-09-10
2014-11-25

Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.

Какую проблему решает

Патент решает проблему эффективного сбора и структурирования поведенческих данных, специфичных для Поиска по картинкам. Сырые логи запросов (Query Logs) содержат огромный объем зашумленных данных. Задача изобретения — извлечь события, относящиеся именно к поиску изображений, и учесть особенности его интерфейса: двухмерную структуру выдачи (2D-сетка) и уникальные типы взаимодействий, такие как наведение курсора (hover), которые сложно интерпретировать из общих логов.

Что запатентовано

Запатентована система и метод преобразования сырых логов в структурированные данные для анализа поведения в поиске изображений. Система создает промежуточные Объекты данных сеанса поиска изображений (Image Search Session Data Objects) для каждого пользователя, а затем агрегирует их в Модель запросов изображений (Image Query Model). Ключевой особенностью является сбор гранулярных данных: ховеров, длительности взаимодействия (time duration value) и точной 2D-позиции изображения в момент взаимодействия.

Как это работает

Система работает как конвейер обработки данных:

Сбор данных: Все поисковые события (запросы, показы, клики, ховеры) логируются с метками времени и идентификаторами в Query Logs.
Фильтрация и Структурирование: Из общего потока выделяются события поиска изображений. Для каждого пользователя создается Image Search Session Data Object, содержащий хронологическую последовательность запросов и взаимодействий. Фиксируется точное расположение (строка/столбец) и длительность.
Агрегация: Данные сессий агрегируются в Image Query Model. Эта модель содержит статистику (показы, клики, ховеры) для каждой пары запрос-изображение, учитывая контекст 2D-позиции показа.

Актуальность для SEO

Высокая. Анализ поведения пользователей (relevance feedback) остается критически важным компонентом для обучения систем ранжирования. Интерфейсы поиска изображений по-прежнему используют двухмерную раскладку и взаимодействия типа ховер/превью. Описанная инфраструктура необходима для сбора чистых поведенческих сигналов и оценки вовлеченности в визуальный контент.

Важность для SEO

Патент имеет значительное влияние (7.5/10) на стратегии Image SEO. Хотя он описывает инфраструктуру сбора данных, а не алгоритм ранжирования, он подтверждает техническую возможность и намерение Google детально отслеживать и использовать поведенческие сигналы, специфичные для изображений. Он доказывает, что Google учитывает не только факт клика, но и ховеры (как признак интереса), длительность взаимодействия (как признак удовлетворенности) и анализирует позиционный бас в контексте 2D-раскладки.

Термины и определения

Hover (Наведение курсора): Взаимодействие, при котором указатель (курсор) находится над результатом поиска. Отслеживается как сигнал интереса.
Image Query Model (Модель запросов изображений): Агрегированная структура данных, содержащая статистику событий поиска изображений по множеству пользователей. Включает счетчики взаимодействий (клики, ховеры) для пар запрос-изображение, часто с учетом их 2D-позиции (quasi-two dimensional model).
Image Search Session Data Object (Объект данных сеанса поиска изображений): Промежуточная структура данных, содержащая информацию о событиях поиска изображений для конкретного идентификатора пользователя за определенный период. Включает упорядоченный список Query data items.
Interaction data item (Элемент данных о взаимодействии): Часть Query data item, описывающая конкретное взаимодействие (клик или ховер). Включает тип, длительность (time duration value) и позицию результата.
Pointer element (Указывающий элемент): Курсор мыши, стилус или палец на сенсорном экране.
Query data item (Элемент данных запроса): Структура внутри сессионного объекта, содержащая всю информацию, относящуюся к одному конкретному запросу (показанные результаты, их позиции и взаимодействия).
Query Log (Лог запросов): База данных, хранящая сырые данные обо всех поисковых событиях (Search Event Data Items).
Search Event (Поисковое событие): Любое действие, связанное с поиском: получение запроса, предоставление результатов, взаимодействие пользователя с результатом или интерфейсом (например, изменение размера окна браузера).
Two-dimensional display position / Viewport location (Двухмерная позиция отображения / Положение в области просмотра): Точное местоположение результата в интерфейсе, определяемое как номер страницы, номер строки (row number) и номер столбца (column number).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод преобразования данных от логов к модели.

Система идентифицирует поисковые события (с метками времени и идентификаторами).
Выделяется подмножество событий, относящихся именно к поиску изображений (image search).
Для идентификаторов, участвовавших в поиске изображений, генерируются Image Search Session Data Objects.
Ключевой шаг: Генерируется Image Query Model на основе этих объектов сессий. Эта модель указывает: (a) какие изображения получили взаимодействие и (b) какова была two-dimensional display position (двухмерная позиция отображения) изображения на странице результатов в момент взаимодействия.

Ядром изобретения является структурирование данных таким образом, чтобы анализировать взаимодействие в контексте 2D-интерфейса поиска картинок.

Claim 2 (Зависимый): Уточняет типы взаимодействий и длительность.

Взаимодействие включает выбор (клик) ИЛИ наведение курсора (hover). Также фиксируется time duration value (значение длительности) этого взаимодействия.

Это прямое подтверждение логирования ховеров и длительности взаимодействия (Dwell Time для кликов, время наведения для ховеров).

Claim 3 (Зависимый): Описывает структуру сессии.

Image Search Session Data Object представляет собой упорядоченный по времени список Query Data Items.

Claims 9, 10 (Зависимые): Детализируют данные о позиции.

Каждый Query Data Item включает viewport location для каждого результата. Это может быть указано как номер страницы, номер столбца и номер строки.

Claims 11, 12 (Зависимые): Уточняют факт показа.

Система фиксирует, был ли результат фактически показан пользователю. Это определяется на основе viewport location (например, находился ли результат в видимой области экрана).

Claim 13 (Зависимый): Уточняет данные о курсоре.

Query Data Item включает информацию о местоположении pointer element (курсора) в момент первоначального предоставления результатов поиска.

Это важно для фильтрации случайных ховеров, когда курсор уже находился в определенной точке экрана до загрузки результатов.

Где и как применяется

Изобретение является инфраструктурным и затрагивает этапы сбора и обработки данных для ранжирования.

CRAWLING – Сбор данных (Data Acquisition)
На этом этапе происходит сбор «сырья». Все взаимодействия пользователей (клики, ховеры, движение курсора, изменение размера окна) фиксируются в реальном времени и сохраняются в Query Logs.

INDEXING – Извлечение признаков (Feature Extraction)
Основное применение патента. Описанный механизм (Query Information Subsystem) обрабатывает Query Logs офлайн:

Фильтрация и структурирование: Преобразует сырые логи в Image Search Session Data Objects (очистка и организация данных по пользователям и сессиям).
Агрегация и генерация признаков: Преобразует объекты сессий в Image Query Model. Эта модель является набором извлеченных поведенческих признаков (например, CTR, Hover Rate) для пар запрос-изображение.

RANKING – Ранжирование
Алгоритмы ранжирования используют Image Query Model как один из входных сигналов (например, для расчета relevance feedback score) для определения релевантности и ранжирования изображений при будущих запросах.

Входные данные:

Сырые Query Logs (search event data items).
Идентификаторы пользователей (анонимизированные).
Временные метки, данные о взаимодействиях (тип, длительность, позиция).

Выходные данные:

Image Search Session Data Objects (промежуточный результат).
Image Query Model (конечный результат для ранжирования).

На что влияет

Конкретные типы контента: Влияет исключительно на результаты поиска изображений (Image Search Vertical).
Специфические запросы: Влияет на все типы запросов, по которым ищут изображения.
Форматы контента: Влияет на результаты, представленные в виде миниатюр (thumbnails) в двумерной сетке.

Когда применяется

Сбор логов: Происходит непрерывно в реальном времени при каждом взаимодействии пользователя с поиском.
Обработка логов: Генерация Image Search Session Data Objects и Image Query Model происходит офлайн в пакетном режиме, обрабатывая логи за определенные периоды (например, 24 часа, неделя).
Фильтрация шума: При генерации модели могут применяться пороги длительности для фильтрации коротких ховеров или кликов.

Пошаговый алгоритм

Фаза 1: Сбор данных и Логирование (Реальное время)

Мониторинг событий: Система отслеживает Search Events (получение запроса, предоставление результатов, взаимодействие пользователя).
Логирование: Информация о событии сохраняется в Query Log. Запись включает идентификатор, временную метку, тип события.
- Для показов: Фиксируется 2D-позиция (строка/столбец) результата и начальное положение курсора.
- Для взаимодействий: Фиксируется тип (клик/ховер) и длительность (Time Duration Value).

Фаза 2: Генерация объектов сессий (Офлайн/Пакетный режим)

Доступ к логам: Система получает доступ к Query Logs.
Фильтрация событий: Выделение событий, связанных с поиском изображений.
Группировка: Информация группируется по идентификаторам пользователей и временным периодам.
Генерация Image Search Session Data Object:
1. Идентификация уникальных запросов пользователя за период.
2. Генерация Query Data Item для каждого уникального запроса, включая показанные результаты и их позиции.
3. Идентификация взаимодействий (клики, ховеры).
4. Генерация Interaction Data Item внутри соответствующего Query Data Item (тип, длительность, позиция).
5. Организация Query Data Items в хронологическом порядке.
Сохранение объекта сессии.

Фаза 3: Генерация модели запросов (Офлайн/Пакетный режим)

Получение объектов сессий: Загрузка сгенерированных Image Search Session Data Objects для множества пользователей.
Идентификация уникальных запросов: Составление списка всех уникальных запросов.
Агрегация данных: Для каждого уникального запроса агрегируется информация из всех соответствующих Query Data Items. Рассчитываются суммарные счетчики: Impression Count, Selection Count (клики), Hover Count.
Фильтрация взаимодействий (Опционально): Система может отфильтровать взаимодействия с короткой длительностью (например, короткие ховеры или клики), считая их шумом.
Генерация Image Query Model: Создается итоговая модель (например, квази-двухмерная), содержащая агрегированную статистику для пар запрос-изображение, возможно с учетом позиции показа.
Сохранение модели.

Какие данные и как использует

Данные на входе

Система использует исключительно данные из логов поисковых событий.

Поведенческие факторы:
- Выбор результата (Selection / Клик).
- Наведение курсора на результат (Hover).
- Длительность взаимодействия (Time duration value): время наведения для ховеров (в миллисекундах), время пребывания на целевой странице для кликов (Dwell Time).
- Местоположение курсора (Location of a pointer element) в момент загрузки страницы.
- Взаимодействие с интерфейсом (запрос следующей страницы, изменение размера окна браузера - resizing).
Структурные факторы (Интерфейс):
- Позиция показа результата (Viewport location / Presentation position): номер страницы, строка, столбец (2D-позиция).
- Информация о том, был ли результат фактически виден пользователю (whether the search result was presented).
Пользовательские факторы:
- Идентификатор пользователя (Identifier), обычно анонимизированный.
- Географическое положение устройства.
- Тип пользовательского агента (браузера).

Какие метрики используются и как они считаются

Патент фокусируется на генерации структурированных агрегированных метрик в Image Query Model:

Impression Count (Счетчик показов): Количество раз, когда изображение было показано в ответ на запрос.
Selection Count (Счетчик кликов): Количество кликов по изображению.
Hover Count (Счетчик ховеров): Количество наведений курсора на изображение.
Interaction Count (Счетчик взаимодействий): Сумма Selection Count и Hover Count.

Методы анализа и агрегации:

Агрегация по позиции: Все счетчики могут рассчитываться с учетом two-dimensional display position. Это позволяет анализировать влияние позиции на взаимодействие (Position Bias).
Фильтрация по длительности (Thresholds): При генерации модели система может применять пороговые значения к Time duration value для фильтрации шума. В описании патента упоминается возможность исключения коротких ховеров (например, менее 1 секунды) или коротких кликов (например, менее 10 секунд).

Инфраструктура для гранулярного трекинга в Image Search: Google обладает специализированной инфраструктурой для сбора и обработки поведенческих данных именно для Поиска по картинкам, отделяя их от общего веб-поиска.
Ховеры как значимый сигнал взаимодействия: Патент явно указывает (Claim 2), что наведение курсора (hover) отслеживается и логируется наравне с кликами (selection). Это рассматривается как сигнал интереса пользователя к изображению.
Критичность длительности взаимодействия (Duration): Система измеряет длительность как ховеров (в миллисекундах), так и кликов (Dwell Time). Эти данные используются для оценки качества взаимодействия и фильтрации шума (например, случайных движений курсора).
Учет 2D-позиции и позиционного баса: Google детально фиксирует двухмерное расположение (строка и столбец) каждого изображения (Claim 1, 10). Image Query Model структурирована так, чтобы учитывать эту позицию при анализе взаимодействий, что позволяет нормализовать поведенческие метрики (CTR, Hover Rate).
Фильтрация случайных взаимодействий: Система логирует начальное положение курсора при загрузке страницы (Claim 13), что позволяет идентифицировать и дисконтировать ховеры, произошедшие случайно, без намерения пользователя.
Подтверждение Relevance Feedback: Собранная Image Query Model служит основой для расчета relevance feedback score — оценки релевантности изображения на основе агрегированного поведения пользователей.

Best practices (это мы делаем)

Оптимизация привлекательности миниатюр (Thumbnails): Миниатюры должны быть максимально привлекательными и четкими, чтобы стимулировать пользователя как минимум навести курсор (hover), а в идеале — кликнуть. Поскольку ховеры и их длительность отслеживаются, визуальная привлекательность напрямую влияет на собираемые поведенческие сигналы.
Обеспечение соответствия миниатюры и целевой страницы: Миниатюра должна точно отражать содержание полного изображения и целевой страницы. Это критично для максимизации Dwell Time после клика. Если пользователь разочарован после перехода, короткая длительность взаимодействия (short click) будет зафиксирована.
Использование высококачественных и уникальных изображений: Качественные изображения с большей вероятностью привлекут внимание и получат положительные взаимодействия (длительные ховеры и клики), что улучшит их показатели в Image Query Model.
Анализ выдачи Image Search как 2D-пространства: При анализе конкурентов следует учитывать, что Google оценивает взаимодействие в контексте двухмерной сетки. Важно создавать изображения, которые выделяются на фоне соседей по строкам и столбцам.

Worst practices (это делать не надо)

Использование кликбейтных миниатюр: Использование изображений, вводящих в заблуждение для генерации клика. Это приведет к коротким кликам (низкий Dwell Time), что будет зафиксировано системой как негативный сигнал или отфильтровано как шум.
Низкое визуальное качество и "слепые зоны": Использование нечетких, темных или визуально непривлекательных миниатюр. Такие изображения будут игнорироваться пользователями, не получая ни кликов, ни ховеров.
Игнорирование Image SEO: Рассчитывать только на текстовую релевантность страницы. Патент подтверждает, что для ранжирования изображений критически важны поведенческие факторы, собранные непосредственно в интерфейсе Image Search.

Стратегическое значение

Патент подтверждает, что ранжирование в Google Images в значительной степени опирается на анализ поведения пользователей. Для долгосрочного успеха в Image SEO необходимо фокусироваться не только на технических аспектах (alt-тексты, скорость загрузки), но и на визуальной оптимизации и качестве самих изображений. Система сбора данных Google настроена на выявление изображений, которые наиболее интересны пользователям в визуальном плане, и способна отфильтровывать манипуляции и случайный шум.

Практические примеры

Сценарий: Оптимизация миниатюр для E-commerce в Image Search

Задача: Улучшить ранжирование изображений товара "красное вечернее платье" в Google Images.
Анализ (с учетом патента): Понимаем, что Google отслеживает, как часто пользователи наводят курсор на наше изображение по сравнению с конкурентами в 2D-сетке (Hover Count), и как долго они изучают превью (Hover Duration) или остаются на сайте после клика (Dwell Time).
Действия:
- Тестируем разные варианты миниатюр: платье на модели, платье на белом фоне, крупный план текстуры ткани.
- Выбираем вариант с наилучшей визуальной четкостью и цветопередачей, который выделяется на фоне конкурентов.
- Убеждаемся, что страница товара быстро загружается и сразу предоставляет детальную информацию о платье.
Ожидаемый результат: Выбранная миниатюра генерирует больше длительных ховеров и кликов. Эти данные агрегируются в Image Query Model, что приводит к улучшению relevance feedback score и повышению позиций изображения в Image Search.

Являются ли ховеры (наведение курсора) фактором ранжирования в Google Images?

Патент не описывает алгоритмы ранжирования, но он явно подтверждает (Claim 2), что Google собирает данные о ховерах (hover) и их длительности наравне с кликами. Эти данные включаются в Image Query Model, которая используется для оценки релевантности. Следовательно, ховеры являются отслеживаемым сигналом взаимодействия, который с высокой вероятностью используется при ранжировании.

Что такое "двухмерная позиция отображения" (two-dimensional display position) и почему она важна?

Это точное расположение изображения в интерфейсе поиска картинок, определяемое строкой и столбцом (Claim 1, 10). Google логирует эту позицию в момент взаимодействия. Это критически важно для корректного анализа поведения и нормализации позиционного баса (position bias), так как в 2D-галерее позиция сильно влияет на вероятность клика или ховера.

Как Google обрабатывает случайные наведения курсора?

Патент описывает два механизма. Во-первых, логируется длительность ховера (в миллисекундах); очень короткие ховеры (упоминается пример менее 1 секунды) могут быть отфильтрованы как шум. Во-вторых, система записывает начальное положение курсора при загрузке страницы (Claim 13), что позволяет идентифицировать ховеры, произошедшие без намеренного действия пользователя.

Что такое Image Query Model?

Это агрегированная база данных, которая содержит статистику взаимодействий пользователей для пар запрос-изображение, собранную по множеству пользователей. Она включает счетчики показов, кликов и ховеров, часто с разбивкой по позиции показа. Эта модель является ключевым источником данных для систем машинного обучения, оценивающих релевантность изображений.

Отслеживает ли Google Dwell Time для поиска по картинкам?

Да. В патенте (Claim 2) указано, что система собирает time duration value (значение длительности) для взаимодействий, включая клики (selection). Это время, которое пользователь проводит на целевой странице. Короткие клики (упоминается пример менее 10 секунд) могут фильтроваться или считаться негативным сигналом.

Влияет ли поведение пользователей в обычном веб-поиске на Image Search согласно этому патенту?

Нет. Ключевая задача этого изобретения — отфильтровать сырые логи и выделить события, относящиеся *только* к поиску изображений (Claim 1). Для Image Search создается отдельная модель (Image Query Model), основанная на взаимодействиях, произошедших именно в этом интерфейсе.

Что такое Image Search Session Data Object?

Это промежуточный этап обработки логов. Он представляет собой структурированную запись всех действий одного пользователя в поиске картинок за определенный период (например, день). Он содержит хронологию запросов, показанных картинок, их позиций и всех взаимодействий. Эти объекты затем используются для построения агрегированной модели.

Учитывает ли система, видел ли пользователь изображение, находившееся "ниже линии сгиба"?

Да. Патент (Claims 11, 12) указывает, что система определяет, был ли результат фактически показан пользователю, основываясь на его положении в области просмотра (viewport location) и действиях пользователя (например, скроллинг). Это позволяет корректно рассчитывать показы (Impressions).

Каков главный вывод для SEO-специалиста из этого патента?

Главный вывод — визуальная привлекательность и качество изображений критически важны для Image SEO. Необходимо оптимизировать миниатюры так, чтобы они стимулировали положительные взаимодействия (длительные ховеры и длительные клики), так как Google детально отслеживает эти сигналы и использует их для оценки релевантности.

Влияет ли размер окна браузера на сбор данных?

Да, в описании патента упоминается, что изменение размера окна (resizing) является отслеживаемым событием. Логируется оригинальный и новый размер окна, а также то, как изменилось расположение (строки/колонки) результатов. Это помогает корректно интерпретировать данные о позициях и видимости результатов.

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга

Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.

US11409812B1
2022-08-09

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует клики пользователей для генерации альтернативных запросов и автоматической разметки изображений

Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.

US20150161175A1
2015-06-11

Индексация
Поведенческие сигналы
Семантика и интент

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений

Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.

US8065611B1
2011-11-22

Поведенческие сигналы
Семантика и интент
Мультимедиа

Как Google выборочно индексирует действия пользователя на локальном устройстве, основываясь на поведении и частоте событий

Анализ патента Google, описывающего инфраструктуру для клиентского поиска (например, Google Desktop). Система фиксирует действия пользователя (события) с контентом (статьями) и решает, индексировать ли их, используя критерии, основанные на частоте событий, доступных ресурсах и предполагаемых интересах пользователя (имплицитно выведенных из его поведения).

US8346777B1
2013-01-01

Индексация
Local SEO
Поведенческие сигналы

Как Google использует query-specific модели для переранжирования изображений на основе их визуальных характеристик в реальном времени

Google использует систему для корректировки ранжирования изображений непосредственно в момент запроса (онлайн). Для популярных запросов система заранее обучает индивидуальные модели релевантности на основе исторических данных о кликах. При получении нового запроса система активирует наиболее подходящую модель и использует визуальные характеристики (цвет, текстура) для переоценки и переранжирования результатов, обеспечивая точное соответствие визуального контента интенту пользователя.

US10311096B2
2019-06-04

Мультимедиа
SERP
Поведенческие сигналы

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов

Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.

US7925657B1
2011-04-12

Поведенческие сигналы

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента

Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.

US8799107B1
2014-08-05

EEAT и качество
SERP
Поведенческие сигналы

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

US10922326B2
2021-02-16

Knowledge Graph
SERP
Семантика и интент

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса

Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.

US9454621B2
2016-09-27

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний

Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.

US8656266B2
2014-02-18

Ссылки
EEAT и качество
Свежесть контента

Как Google использует анализ параллельных анкорных текстов и кликов пользователей для перевода запросов и кросс-язычного поиска

Google использует механизм для автоматического перевода запросов с одного языка или набора символов на другой. Система создает вероятностный словарь, анализируя, как анкорные тексты на разных языках ссылаются на одни и те же страницы (параллельные анкоры). Вероятности перевода затем уточняются на основе того, на какие результаты кликают пользователи. Это позволяет осуществлять кросс-язычный поиск (CLIR).

US8706747B2
2014-04-22

Мультиязычность
Семантика и интент
Ссылки

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов

Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.

US9268820B2
2016-02-23

Knowledge Graph
SERP
Семантика и интент

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов

Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).

US8060405B1
2011-11-15

Антиспам
Ссылки
SERP