Как Яндекс автоматически уточняет запрос на основе взаимодействия пользователя с элементами сниппетов на SERP

Яндекс патентует механизм динамического уточнения поисковой выдачи в реальном времени. Система отслеживает гранулярные взаимодействия пользователя (выделение текста, скорость прокрутки, остановки) с конкретными элементами (словами, фразами) внутри сниппетов. На основе агрегированного интереса к этим элементам по всей странице, система автоматически переформулирует исходный запрос и обновляет SERP, чтобы лучше соответствовать уточненному интенту пользователя.

Описание

Какую задачу решает

Патент решает задачу уточнения намерений пользователя (интента) в рамках текущей поисковой сессии без необходимости ручного ввода уточняющего запроса. Он направлен на улучшение пользовательского опыта путем интерпретации имплицитных сигналов обратной связи (implicit feedback), которые пользователь дает при изучении страницы результатов поиска (SERP). Это позволяет системе динамически адаптировать выдачу, если первоначальные результаты не полностью удовлетворяют информационную потребность.

Что запатентовано

Запатентована система и метод уточнения результатов поиска на основе гранулярного анализа поведения пользователя на SERP. Суть изобретения заключается в отслеживании взаимодействий пользователя с конкретными Search Result Elements (словами, фразами, ссылками) внутри результатов поиска, вычислении агрегированного User Interest Parameter (UIP) для каждого элемента и использовании этих данных для автоматической переформулировки исходного запроса и генерации уточненной выдачи (Refined SERP).

Как это работает

Ключевой механизм — это взвешенное накопление (weighted accumulation) сигналов интереса. Когда пользователь взаимодействует с элементом (например, выделяет фразу) в одном результате, система присваивает этому взаимодействию вес. Если пользователь взаимодействует с этим же элементом в другом результате, вес добавляется. Итоговый UIP — это сумма весов всех взаимодействий с данным элементом на всей SERP. Взаимодействия включают не только клики, но и выделение текста, остановки, медленную или быструю прокрутку. Затем система генерирует новый запрос, включающий исходный запрос, элемент, вызвавший интерес, и его UIP (вес), и формирует уточненную выдачу.

Актуальность для SEO

Средне-высокая. Понимание поведения пользователя на SERP и персонализация в рамках сессии являются ключевыми направлениями развития поиска. Концепция интерпретации имплицитных сигналов для уточнения запроса крайне актуальна. Однако реализация столь гранулярного отслеживания (например, скорость прокрутки мимо конкретного слова) в масштабах всей системы может быть ресурсоемкой и сложной для кросс-платформенной реализации.

Важность для SEO

Влияние на SEO значительно (7/10). Этот патент подчеркивает, что SERP рассматривается как интерактивный интерфейс, а не просто список ссылок. Он напрямую влияет на важность оптимизации сниппетов. Если контент сниппета (и заголовка) вовлекает пользователя и содержит релевантные элементы, которые захватывают внимание, это может привести к автоматическому уточнению запроса в пользу тематики этого элемента, меняя ход всей поисковой сессии.

Детальный разбор

Термины и определения

Refined SERP (Уточненная страница результатов поиска): Новая SERP, сгенерированная в ответ на автоматически переформулированный запрос, который учитывает интересы пользователя, выявленные на предыдущей SERP.
Search Result Element (Элемент результата поиска): Часть результата поиска (сниппета, заголовка и т.д.), указывающая на определенный контент или имеющая определенное значение. Это может быть слово, фраза, ссылка (URL) или изображение.
User Interaction (Взаимодействие пользователя): Поведение пользователя в отношении элементов поиска на SERP. Патент определяет гранулярные взаимодействия: пропуск элемента (skipping), быстрая прокрутка мимо (fast scrolling past), медленная прокрутка мимо (slow scrolling past), остановка на элементе (stopping at), выделение элемента (highlighting) и клик по элементу (clicking on).
User Interest Parameter (UIP) (Параметр интереса пользователя): Метрика, указывающая на интерес пользователя к конкретному элементу поиска. Рассчитывается путем суммирования весов всех взаимодействий с этим элементом во всех его вхождениях на SERP.
Weighted Accumulation (Взвешенное накопление): Процесс агрегации весов взаимодействий пользователя с определенным элементом по всей странице SERP (и потенциально на разных итерациях выдачи) для расчета итогового UIP.
Weight (Вес): Числовое значение, присваиваемое конкретному взаимодействию пользователя с элементом. Отражает уровень интереса (положительный, например +1/+2, или отрицательный, например -1).

Ключевые утверждения (Анализ Claims)

Патент описывает механизм динамического уточнения выдачи на основе имплицитной обратной связи пользователя при изучении сниппетов.

Claim 1 (Независимый пункт): Описывает основной процесс уточнения SERP.

Система получает первый запрос (Q1) и генерирует первую выдачу (SERP1).
Обязательное условие: SERP1 содержит как минимум два результата (R1 и R2), и оба они содержат один и тот же элемент (E1) (например, фразу).
Система генерирует User Interest Parameter (UIP1) для элемента E1 на основе взаимодействий пользователя.
Критически важно: UIP1 является взвешенным накоплением взаимодействий с E1 в R1 И с E1 в R2.
Процесс расчета UIP1 включает:
- Получение индикации первого взаимодействия с E1 в R1 и определение первого веса (W1).
- Получение индикации второго взаимодействия с E1 в R2 и определение второго веса (W2).
- Генерация UIP1 на основе суммирования W1 и W2.
Генерация второго запроса (Q2). Q2 включает Q1, элемент E1 и параметр UIP1. Это переформулировка Q1, указывающая на значимость (significance) E1.
Генерация и отображение второй выдачи (Refined SERP) на основе Q2.

Claim 2 (Зависимый пункт): Расширяет механизм на несколько элементов.

Система может одновременно идентифицировать второй Элемент (E2) в других результатах (R3 и R4), рассчитать для него свой UIP и включить E2 и его UIP во второй запрос наряду с E1.

Claim 3 (Зависимый пункт): Описывает итеративный процесс уточнения.

После генерации уточненной SERP (SERP2), система продолжает мониторинг.
Если SERP2 содержит пятый результат (R5), который также включает элемент E1, система фиксирует новое взаимодействие и вес (W5).
Система уточняет (Refining) параметр UIP1. Новый UIP1 рассчитывается как сумма W1 + W2 + W5.
Генерация третьего запроса (Q3), включающего Q2, E1 и обновленный UIP1.
Генерация и отображение второй уточненной SERP (SERP3).

Claim 8 (Зависимый пункт): Уточняет формат UIP.

Параметр интереса пользователя может быть представлен в виде вектора $V_{1}(E_{1}, W_{1})$ , где $E_{1}$ — это элемент, а $W_{1}$ — суммарный вес.

Где и как применяется

Изобретение применяется на стыке фронтенда (сбор данных о поведении) и бэкенда (анализ и переранжирование).

Генерация SERP (Клиентская сторона / Фронтенд)
На этом этапе происходит мониторинг поведения пользователя. Система (вероятно, с помощью JavaScript, работающего в браузере) отслеживает гранулярные взаимодействия пользователя с отображаемыми Search Result Elements. Отслеживаются курсор, выделение текста, скорость и паттерны скроллинга относительно расположения элементов на странице.

QUERY PROCESSING (Серверная сторона)
Данные о взаимодействиях передаются на сервер (например, в SERP Refinement Module). Здесь происходит:

Агрегация данных: Присвоение весов взаимодействиям и расчет User Interest Parameter (UIP) путем суммирования весов для каждого элемента по всей SERP.
Переформулировка запроса: Происходит автоматическая переформулировка запроса. Новый запрос включает исходный запрос, идентифицированный элемент и его UIP (вес). Это позволяет системе понять, какой аспект исходного запроса наиболее интересен пользователю в данный момент.

RANKING – Ранжирование (Серверная сторона)
Система ранжирования получает на вход переформулированный запрос. UIP используется как весовой коэффициент, указывающий на значимость добавленного элемента при ранжировании новой выдачи (Refined SERP). Документы, более релевантные уточненному запросу, поднимаются выше.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на широкие или неоднозначные запросы (например, информационный или исследовательский поиск), где у пользователя может быть несколько потенциальных интентов. Система помогает быстро сузить фокус.
Все типы контента и ниши: Механизм не зависит от тематики или типа контента, так как анализирует поведение пользователя на SERP.
Форматы контента (Сниппеты): Влияет на важность сниппетов. Контент, генерирующий информативные и вовлекающие сниппеты, получает преимущество, так как именно в них происходят отслеживаемые взаимодействия.

Когда применяется

Алгоритм применяется в реальном времени во время поисковой сессии пользователя.

Условия работы: Наличие на SERP повторяющихся Search Result Elements (слов, фраз, сущностей), с которыми пользователь может взаимодействовать.
Триггеры активации: Накопление достаточного количества взаимодействий пользователя с одним и тем же элементом в разных результатах (согласно Claim 1, минимум в двух), что позволяет рассчитать значимый User Interest Parameter. Уточнение может произойти после явного интереса (выделение текста) или накопления слабых сигналов (медленная прокрутка).

Пошаговый алгоритм

Получение и отображение исходной выдачи: Система получает запрос Q1 и отображает SERP1. Система идентифицирует ключевые элементы (E1, E2…) и их расположение в результатах (R1, R2…).
Мониторинг взаимодействий (Client-Side): Отслеживание действий пользователя на SERP1. Фиксируются тип взаимодействия (например, выделение, медленный скролл) и элемент, с которым оно произошло.
Присвоение весов (Server-Side): Каждому взаимодействию присваивается вес. Например, выделение текста может иметь вес +1 или +2, быстрая прокрутка мимо -1.
Агрегация и расчет UIP: Система суммирует веса для каждого элемента по всем его вхождениям на SERP. Например, если E1 встретился в R1 (вес +1) и R2 (вес +1), то UIP для E1 = +2.
Переформулировка запроса: Система генерирует новый запрос Q2, который является комбинацией Q1, E1 и UIP1. В патенте предлагается формат вектора для UIP: $V_{1}(E_{1},W_{1})$ .
Генерация уточненной выдачи: Система генерирует и отображает Refined SERP на основе Q2. Результаты, более релевантные уточненному интенту (с учетом E1), ранжируются выше.
Итеративное уточнение: Процесс мониторинга продолжается на Refined SERP. Если пользователь взаимодействует с E1 снова, UIP обновляется (сумма весов с SERP1 + веса с Refined SERP), и может быть сгенерирован третий запрос Q3 для дальнейшего уточнения.

Какие данные и как использует

Данные на входе

Поведенческие факторы (на SERP): Это основные данные для работы алгоритма. Используются высоко гранулярные данные о поведении на SERP:
- Выделение элемента (Highlighting).
- Скорость скроллинга (Fast/Slow scrolling past) мимо элемента.
- Остановка (Stopping at) на элементе.
- Пропуск (Skipping) элемента.
- Клик (Clicking on) по элементу.
Контентные факторы: Тексты, изображения или ссылки, которые составляют Search Result Elements. Система должна знать содержание и точное расположение этих элементов на SERP.

Какие метрики используются и как они считаются

Weight (Вес взаимодействия): Численное значение, присваиваемое каждому взаимодействию в зависимости от его типа. Конкретные значения весов в патенте не указаны, но приводятся примеры (+1 или +2 за выделение, -1 за пропуск). Упоминается, что вес может зависеть от расположения элемента (например, выбор элемента в удаленном месте может указывать на более высокий интерес и получить больший вес).
User Interest Parameter (UIP): Основная метрика, рассчитываемая для каждого элемента. Это сумма весов всех взаимодействий с этим элементом на текущей SERP (и, в итеративном процессе, на предыдущих SERP этой сессии).
Формула расчета UIP для элемента E1:
$UIP(E1) = \sum_{i=1}^{n} W_{1,i}$
Где $W_{1,i}$ — вес i-го взаимодействия с элементом E1.

Выводы

Имплицитное уточнение запроса: Яндекс разработал механизм для понимания того, как пользователь уточняет свой интент, просто изучая выдачу. Система стремится автоматически сузить или сместить фокус поиска без ручного ввода нового запроса.
Гранулярные поведенческие сигналы на SERP: Патент делает сильный акцент на взаимодействиях, выходящих за рамки кликов. Выделение текста, скорость прокрутки и остановки рассматриваются как значимые сигналы интереса (положительный вес) или его отсутствия (отрицательный вес).
Агрегация интереса по всей странице (Weighted Accumulation): Ключевой особенностью является не реакция на одно взаимодействие, а накопление интереса к элементу во всех его вхождениях на SERP. Это позволяет более надежно определить фокус внимания пользователя.
Сниппеты как инструмент управления сессией: Механизм подчеркивает критическую важность содержания сниппетов. Элементы (слова, фразы) внутри сниппета напрямую влияют на то, как система интерпретирует интерес пользователя и куда направит поисковую сессию дальше.
Итеративное уточнение: Система предназначена для непрерывного уточнения в рамках одной сессии, обновляя User Interest Parameter на каждой последующей странице выдачи, позволяя пользователю углубляться в тему.

Практика

Best practices (это мы делаем)

Оптимизация сниппетов для вовлечения и ясности: Создавайте информативные заголовки (Title) и описания (Meta Description), которые естественно включают ключевые сущности, QBST фразы и потенциальные направления для уточнения запроса. Цель — сделать так, чтобы пользователь задержал внимание (медленный скролл, остановка) на ваших сниппетах.
Структурирование контента для генерации качественных сниппетов: Используйте четкую структуру документа, чтобы поисковая система могла автоматически генерировать сниппеты, содержащие релевантные Search Result Elements. Убедитесь, что ключевые аспекты темы видны в первых абзацах или выделены структурно.
Использование микроразметки (Schema.org): Помогает поисковой системе лучше понимать контент и формировать расширенные сниппеты, которые могут содержать больше элементов для взаимодействия (например, цены, характеристики, изображения), увеличивая вероятность захвата внимания пользователя.
Согласованность терминологии в нише: Используйте общепринятую терминологию. Если ваш сайт и другие авторитетные сайты в выдаче используют одни и те же ключевые фразы, это увеличивает вероятность того, что пользователь будет взаимодействовать с этим элементом в нескольких результатах, активируя механизм уточнения.

Worst practices (это делать не надо)

Кликбейтные заголовки при слабых сниппетах: Если заголовок привлекает внимание, но сниппет не содержит полезной информации или релевантных элементов, пользователь быстро прокрутит его (Fast Scrolling). Это может генерировать отрицательный вес взаимодействия, снижая интерес к документу или теме в рамках сессии.
Водянистые или неинформативные описания: Использование общих фраз в Meta Description, которые не несут смысловой нагрузки, уменьшает вероятность того, что пользователь заинтересуется конкретным элементом в сниппете.
Игнорирование внешнего вида SERP: Не анализировать, как выглядят сниппеты вашего сайта в реальной выдаче и какие элементы в них попадают.

Стратегическое значение

Патент подтверждает стратегический приоритет Яндекса на понимание семантики и интента пользователя через анализ поведения на SERP в реальном времени. Он показывает, как имплицитная обратная связь может напрямую влиять на ход поисковой сессии. Для SEO это означает, что оптимизация не заканчивается на получении высокой позиции; управление вниманием пользователя на самой странице выдачи через качество и информативность сниппета становится критически важным этапом воронки.

Практические примеры

Сценарий 1: Позитивное уточнение широкого запроса

Исходный запрос (Q1): «Ягуар». SERP1 показывает смешанные результаты: автомобили, животное, напиток.
Действия пользователя: Пользователь просматривает выдачу. В результате R1 (про автомобиль) он медленно прокручивает мимо фразы «расход топлива». В результате R4 (тоже про автомобиль) он выделяет текст «расход топлива».
Действие системы:
- Элемент (E1): «расход топлива».
- Взаимодействие 1 (медленный скролл): Вес +0.5.
- Взаимодействие 2 (выделение): Вес +1.0.
- UIP(E1) = +1.5.
Переформулировка: Система генерирует Q2: «Ягуар» + («расход топлива», Вес 1.5).
Результат: Отображается Refined SERP, где результаты сфокусированы на расходе топлива автомобилей Ягуар, а результаты про животное пессимизированы.

Сценарий 2: Негативная обратная связь (Фильтрация)

Исходный запрос (Q1): «Лечение простуды». SERP1 показывает много результатов с разными методами.
Действия пользователя: Пользователь видит слово «гомеопатия» в результатах R2 и R5 и очень быстро прокручивает эти результаты (Fast Scrolling) или пропускает их (Skipping).
Действие системы:
- Элемент (E1): «гомеопатия».
- Взаимодействие 1 (быстрый скролл/пропуск): Вес -1.0.
- Взаимодействие 2 (быстрый скролл/пропуск): Вес -1.0.
- UIP(E1) = -2.0.
Переформулировка: Система генерирует Q2: «Лечение простуды» + («гомеопатия», Вес -2.0).
Результат: Отображается Refined SERP, где результаты, содержащие «гомеопатия», пессимизируются, а предпочтение отдается другим методам лечения.

Вопросы и ответы

Насколько гранулярные взаимодействия отслеживает эта система?

Патент описывает очень высокую степень гранулярности. Отслеживаются не просто клики по ссылке, а взаимодействия с конкретными элементами (слова, фразы, ссылки, изображения) внутри сниппета. К ним относятся: выделение текста пользователем, остановка на элементе, а также скорость прокрутки (медленная или быстрая) мимо этого элемента и пропуск элемента. Это гораздо более детальный анализ поведения, чем стандартные поведенческие метрики.

Что такое «Weighted Accumulation» (Взвешенное накопление) в контексте этого патента?

Это ключевой механизм агрегации интереса. Он означает, что интерес к определенному элементу (например, фразе) не оценивается по одному взаимодействию. Вместо этого система суммирует веса всех взаимодействий с этим элементом во всех его вхождениях на странице SERP. Если пользователь выделил фразу в первом и третьем сниппете, веса суммируются, что дает более сильный сигнал интереса, чем однократное взаимодействие.

Как именно происходит переформулировка запроса?

Система создает новый запрос, который включает исходный запрос, элемент, вызвавший наибольший интерес, и его агрегированный вес (User Interest Parameter). Патент предлагает использовать векторный формат $V(E, W)$. Эта информация передается в систему ранжирования, указывая ей на необходимость повысить (если вес положительный) или понизить (если вес отрицательный) значимость данного элемента при формировании новой выдачи.

Это форма персонализации?

Да, это форма краткосрочной персонализации в рамках текущей сессии (внутрисессионная персонализация). Система адаптирует выдачу в реальном времени на основе действий конкретного пользователя в данный момент, чтобы лучше соответствовать его уточняющемуся информационному намерению. Она фокусируется на немедленной обратной связи, а не на долгосрочной истории поиска.

Какое взаимодействие пользователя наиболее ценно согласно патенту?

Патент не устанавливает четкую иерархию весов, но приводит примеры, где активные действия, такие как выделение текста (highlighting), получают положительный вес (+1 или +2). При этом вес может быть выше, если элемент находится в менее заметном месте. Быстрая прокрутка или пропуск элемента (skipping) в примерах получают отрицательный вес (-1), сигнализируя об отсутствии интереса.

Как это влияет на оптимизацию сниппетов (Title и Description)?

Это значительно повышает важность сниппетов. Они становятся не просто текстом для привлечения клика, а интерактивным элементом, который направляет поисковую сессию. Необходимо убедиться, что сниппеты информативны, содержат ключевые сущности и фразы (Search Result Elements), которые могут заинтересовать пользователя и стимулировать положительное взаимодействие (остановку, медленное изучение).

Может ли этот механизм понизить мой сайт в выдаче?

Да, в рамках текущей сессии пользователя. Если сниппет вашего сайта содержит элементы, которые систематически не интересуют пользователя (например, он быстро прокручивает их), система может накопить отрицательный User Interest Parameter для этих элементов. Это приведет к переформулировке запроса, которая пессимизирует контент, связанный с этими элементами, в уточненной выдаче.

Что такое итеративное уточнение, описанное в патенте (Claim 3)?

Это означает, что процесс не является одноразовым. После того как система уточнила выдачу (Refined SERP), она продолжает мониторинг взаимодействий на новой странице. Веса интереса обновляются путем суммирования весов с первой SERP и весов с уточненной SERP. Это позволяет системе непрерывно адаптироваться и «углубляться» в тему вместе с пользователем на протяжении всей сессии.

Достаточно ли одного взаимодействия с элементом для активации механизма?

Нет. Согласно Claim 1, для активации механизма уточнения необходимо, чтобы пользователь взаимодействовал с одним и тем же элементом как минимум в двух разных результатах поиска на текущей SERP. Это условие позволяет отсеять случайные действия и подтвердить реальный интерес к элементу.

Насколько реально отслеживать такие вещи, как выделение текста или скорость скроллинга?

Технически это абсолютно реально с помощью JavaScript, работающего в браузере пользователя. Многие системы веб-аналитики (например, Вебвизор Яндекса) уже используют подобные технологии для записи сессий. Вопрос заключается в масштабируемости, кросс-платформенной совместимости и ресурсоемкости обработки этих данных в реальном времени для мгновенного уточнения запросов в основной поисковой системе.