Как Яндекс использует двойное ранжирование (популярность и «скрытый интерес») для формирования визуальных поисковых подсказок

Яндекс патентует метод генерации визуальных подсказок (image-based suggestions). Система использует два параллельных ранжирования: одно основано на частотности (популярности) запросов, а второе — на «скрытом интересе» (высокая релевантность независимо от частоты). Финальный список смешивает результаты из обоих списков, чтобы предложить пользователю не только очевидные, но и неочевидные, релевантные темы для дальнейшего изучения.

Описание

Какую задачу решает

Патент решает проблему ограниченности стандартных поисковых подсказок, которые обычно основаны исключительно на частотности (популярности) и часто предлагают только самые очевидные продолжения запроса. Это ограничивает пользователя и не помогает выявить «скрытые интересы» (hidden interest) — темы, которые очень релевантны, но имеют низкую частотность или неочевидную связь. Изобретение направлено на улучшение пользовательского опыта исследования темы (Exploration/Serendipity) путем предложения разнообразных и неочевидных связанных тем в визуальном формате.

Что запатентовано

Запатентована система генерации и ранжирования визуальных поисковых подсказок (image-based search suggestions). Суть изобретения заключается в подходе двойного ранжирования (Dual Ranking). Подсказки ранжируются параллельно с использованием двух разных наборов параметров: первый основан на параметре частотности (Frequency Parameter), а второй — на параметре скрытого интереса (Hidden Interest Parameter), который определяется как высокая релевантность независимо от частоты.

Как это работает

Система получает запрос и генерирует кандидатов для визуальных подсказок на основе прошлых связанных запросов. Далее происходит ключевой этап: кандидаты ранжируются дважды. Первый список формируется моделью, обученной на частотных характеристиках (популярности). Второй список формируется моделью, обученной на данных о «скрытом интересе» (часто на основе оценок асессоров). Финальный список создается путем смешивания (Blending) результатов из обоих списков. В одном из вариантов реализации, перед смешиванием, из частотного списка могут быть удалены «прямо связанные» (directly-linked), то есть слишком очевидные, подсказки.

Актуальность для SEO

Средне-высокая. Визуальные подсказки и блоки связанных запросов с картинками являются стандартным элементом современных поисковых выдач. Концепция диверсификации подсказок за пределами чистой популярности и использование данных асессоров для выявления нюансированной релевантности («скрытого интереса») остаются актуальными для улучшения пользовательского опыта.

Важность для SEO

Влияние на SEO умеренное (5/10). Патент не описывает алгоритмы ранжирования основного поиска. Он описывает, как Яндекс отбирает и ранжирует *связанные запросы* или *поисковые подсказки*, отображаемые на SERP в виде визуальных блоков. Это влияет на обнаруживаемость контента (discoverability) и путь пользователя (user journey). Патент подчеркивает стратегическую важность создания контента, покрывающего не только очевидные темы, но и «скрытые интересы», а также важность оптимизации изображений.

Детальный разбор

Термины и определения

Assessment Parameter (Параметр оценки): Параметр, определяющий пропорции смешивания (blending) между списком частотности и списком скрытого интереса при формировании финального набора подсказок.
Assessor (Асессор): Человек-оценщик (или группа), который размечает обучающие данные. Асессоры играют ключевую роль в определении Hidden Interest Parameter и классификации связей.
Directly-linked image-based search suggestions (Прямо связанные визуальные подсказки): Подсказки, которые очевидно связаны с исходным запросом (например, семантически близкие варианты, простые добавления слов, очень популярные смежные темы).
Frequency Parameter (Параметр частотности): Метрика, показывающая, как часто подсказка ассоциировалась с прошлым поисковым поведением пользователей (популярность, клики, данные сессий).
Hidden Interest Parameter (Параметр скрытого интереса): Метрика, указывающая на высокую релевантность или интерес для пользователя, независимо от параметра частотности. Используется для выявления релевантных, но менее очевидных или менее популярных тем.
Image-based search suggestions (Визуальные поисковые подсказки): Поисковые подсказки, представленные в визуальном формате с сопровождающими изображениями (например, блок над результатами поиска).
Indirectly-linked image-based search suggestions (Косвенно связанные визуальные подсказки): Подсказки, которые неявно или отдаленно связаны с исходным запросом. Их связь может быть не очевидна, но они представляют интерес (например, имя бывшей жены актера при поиске самого актера).
Three Thumbs Up Algorithm (Алгоритм «Три пальца вверх»): Метод асессорской разметки, упомянутый в описании для определения скрытого интереса. Высшая оценка («Triple thumbs up») дается релевантным, но не очевидно связанным подсказкам.

Ключевые утверждения (Анализ Claims)

Патент защищает метод формирования списка подсказок путем смешивания результатов двух разных моделей ранжирования.

Claim 1 (Независимый пункт): Описывает основной механизм двойного ранжирования и смешивания.

Получение первого поискового запроса.
Генерация множества визуальных поисковых подсказок на основе прошлых связанных запросов.
Двойное ранжирование:
- Формирование Первого списка с использованием параметров, обученных на Frequency Parameter (частотность/популярность).
- Формирование Второго списка с использованием параметров, обученных на Hidden Interest Parameter (релевантность независимо от частоты).
Генерация финального списка путем выбора первой части из Первого списка и второй части из Второго списка (Смешивание).

Claim 2 (Зависит от 1): Описывает критически важную модификацию — фильтрацию очевидных подсказок.

Перед этапом смешивания из Первого списка (частотность) выбирается подмножество.
Это подмножество включает *только* indirectly-linked (косвенно связанные) подсказки. Очевидные (directly-linked) подсказки отфильтровываются.
Финальное смешивание использует это отфильтрованное подмножество вместо оригинального Первого списка.

Это означает, что система может целенаправленно удалять популярные, но тривиальные подсказки.

Claim 3 (Зависит от 2): Уточняет, как происходит фильтрация.

Выбор подмножества (фильтрация) осуществляется с помощью модели машинного обучения (Machine-Learned Model), основанной на суждениях асессоров.

Claim 8 и Claim 10 (Зависят от 1): Описывают способы определения Hidden Interest Parameter.

Claim 8: Параметр определяется асессором.
Claim 10: Параметр определяется с помощью модели машинного обучения.

Claim 16 (Зависит от 1): Описывает механизм контроля смешивания.

Финальный список генерируется с использованием Assessment Parameter, который определяет пропорции смешивания. Claim 17 и 18 указывают, что доля скрытого интереса может быть больше доли частотности (например, 80% Hidden Interest и 20% Frequency).

Где и как применяется

Изобретение применяется на нескольких этапах поискового процесса, связанных с обработкой запроса и генерацией выдачи.

QUERY PROCESSING – Понимание Запросов
На этом этапе анализируется входящий запрос и инициируется работа Модуля подсказок (Suggest Module) для генерации кандидатов.

RANKING – Ранжирование (Слой подсказок)
Ядро патента находится здесь. Происходит двойное ранжирование самих подсказок с использованием двух разных моделей (частотность и скрытый интерес). Модуль подсказок взаимодействует с Модулем вертикального поиска (Vertical Search Module, например, Поиск по картинкам) для получения изображений.

BLENDER – Метапоиск и Смешивание (Генерация SERP)
На этом этапе происходит смешивание (Blending) двух ранжированных списков и интеграция финального блока визуальных подсказок в интерфейс поисковой выдачи (SERP), обычно вверху страницы.

Офлайн-процессы
Значительная часть работы происходит офлайн:

Анализ поведенческих логов для расчета Frequency Parameter.
Асессорская разметка для определения Hidden Interest Parameter. В описании патента упоминается конкретный метод разметки — «Three Thumbs Up» Algorithm.
Обучение ML-моделей для ранжирования и классификации связей (прямые/косвенные).

На что влияет

Типы запросов и Ниши: Наибольшее влияние на запросы, где визуальное исследование полезно (люди, продукты, дизайн, путешествия, хобби).
Видимость тем: Влияет на видимость смежных тем, особенно нишевых или неочевидных, которые еще не накопили высокую частотность, но представляют «скрытый интерес».
Путь пользователя (User Journey): Алгоритм направляет пользователя, предлагая неочевидные пути для продолжения поисковой сессии.

Когда применяется

Условия активации: Алгоритм активируется, когда пользователь вводит запрос и система определяет, что для него целесообразно показать блок визуальных подсказок.
Триггеры: Применение зависит от наличия достаточного количества прошлых связанных запросов и данных (исторических или асессорских) для расчета параметров.

Пошаговый алгоритм

Получение запроса: Система получает поисковый запрос от пользователя.
Генерация кандидатов: Модуль подсказок генерирует набор потенциальных визуальных подсказок (image-based search suggestions) на основе прошлых связанных запросов.
Параллельное ранжирование (Dual Ranking):
- Ветка 1 (Частотность): Кандидаты ранжируются по Frequency Parameter (статистика прошлого поведения). Формируется Список 1.
- Ветка 2 (Скрытый интерес): Кандидаты ранжируются по Hidden Interest Parameter (неочевидная релевантность). Формируется Список 2.
Фильтрация (Опционально, согласно Claim 2): Из Списка 1 могут быть удалены «слишком очевидные» (directly-linked) подсказки, оставляя только indirectly-linked. Этот шаг выполняется ML-моделью (Claim 3).
Смешивание (Blending): Система генерирует финальный список, выбирая часть подсказок из (возможно, отфильтрованного) Списка 1 и часть из Списка 2. Пропорции определяются Assessment Parameter.
Отображение: Топ-N подсказок из финального списка отображаются на SERP.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Критически важны для расчета Frequency Parameter. Упоминаются: история кликов (click history — частота и/или длительность), популярность прошлых запросов, количество и размер прошлых сессий, среднее время между запросами.
Данные Асессоров (Assessor Data): Используются для определения Hidden Interest Parameter и обучения ML-моделей. Асессоры оценивают: связь между подсказкой и запросом, интерес для пользователя, привлекательность результатов (attractiveness of the results) и привлекательность SERP.
Мультимедиа факторы (Изображения): Изображения из вертикального поиска используются для визуализации. Их привлекательность может учитываться асессорами.

Какие метрики используются и как они считаются

Frequency Parameter: Метрика популярности, основанная на агрегированных исторических поведенческих данных.
Hidden Interest Parameter: Метрика неочевидной релевантности. В патенте упоминается конкретный метод оценки асессорами — алгоритм «three thumbs up»:
- «Single thumb up»: Релевантно, но слишком очевидно (малая ценность).
- «Double thumbs up»: Релевантно, связь не так очевидна (средняя ценность).
- «Triple thumbs up»: Релевантно, но не очевидно связано (скрытый интерес, высокая ценность).
Классификатор Directly/Indirectly-linked: ML-модель, обученная на суждениях асессоров, для фильтрации очевидных связей (Claim 3).
Assessment Parameter: Параметр, определяющий пропорции смешивания. Может определяться асессорами (Claim 20) или ML-моделью (Claim 22).

Выводы

Приоритет разнообразия и неочевидности: Яндекс активно стремится диверсифицировать поисковые подсказки, не полагаясь только на популярность. Цель — показать пользователю не только то, что ищут все, но и то, что полезно для глубокого исследования темы (Serendipity).
Концепция «Скрытого интереса» (Hidden Interest): Внедрена метрика для выявления высокорелевантных, но низкочастотных или неочевидных связанных тем. Это ключевой механизм для продвижения нишевого контента в подсказках.
Фундаментальная роль асессоров: Оценки асессоров (в частности, методика «Three Thumbs Up») формируют эталон (Ground Truth) для определения «скрытого интереса» и «очевидности связи». Эти оценки используются для обучения всех задействованных ML-моделей.
Двойное ранжирование и контролируемое смешивание: Система использует сложный механизм параллельного ранжирования по разным критериям с последующим смешиванием, где пропорции могут отдавать приоритет скрытому интересу (например, 80/20).
Фильтрация очевидного: Система может намеренно скрывать популярные, но слишком очевидные подсказки (directly-linked), чтобы освободить место для более полезных, исследовательских (indirectly-linked) вариантов.

Практика

Best practices (это мы делаем)

Хотя патент описывает ранжирование подсказок, а не сайтов, он дает стратегические инсайты для контент-стратегии и оптимизации.

Развитие Topical Authority через смежные темы: Создавайте контент, охватывающий не только основные (очевидные), но и смежные, нишевые или развивающиеся темы в вашей области. Это увеличивает вероятность того, что ваши темы будут идентифицированы как «скрытый интерес».
Фокус на косвенно связанных сущностях (Indirectly-linked topics): Активно ищите и прорабатывайте темы и сущности, которые связаны с вашей основной тематикой неочевидным образом. В патенте приведен пример: при поиске актера «Macaulay Culkin» подсказка «Rachel Miner» (его бывшая жена) является косвенно связанной и представляет скрытый интерес.
Критическая важность оптимизации изображений: Поскольку подсказки являются визуальными (image-based), наличие качественных, релевантных и привлекательных изображений критически важно. Патент упоминает, что привлекательность (attractiveness) учитывается асессорами при оценке подсказок.
Анализ блока визуальных подсказок: Изучайте, какие подсказки Яндекс показывает по вашим целевым запросам. Это прямой сигнал о том, какие темы система считает связанными и потенциально относящимися к «скрытому интересу».

Worst practices (это делать не надо)

Исключительный фокус на ВЧ и очевидные запросы: Концентрация только на самых частотных темах. Система может решить, что эти темы слишком тривиальны (directly-linked) для подсказок, и отфильтровать их.
Игнорирование визуального контента и его качества: Пренебрежение качеством и оптимизацией изображений, особенно для страниц, покрывающих нишевые темы. Использование непривлекательных стоковых фото снижает шансы на попадание в этот блок.
Поверхностное покрытие темы: Создание контента, который не исследует глубинные связи и нишевые аспекты, не позволит охватить «скрытые интересы».

Стратегическое значение

Патент подтверждает стремление Яндекса помогать пользователю в исследовании темы (Exploration), предлагая неочевидные пути и повышая вовлеченность. Для SEO это означает, что понимание всего ландшафта пользовательских интересов, включая «скрытые» и косвенные, критически важно. Долгосрочная стратегия должна строиться на создании глубоких семантических кластеров, которые покрывают как directly-linked, так и indirectly-linked интенты, подтверждая экспертность ресурса во всей тематике.

Практические примеры

Сценарий: Оптимизация сайта о путешествиях по запросу «Отдых в Париже».

Анализ системы: Яндекс генерирует подсказки.
- Список 1 (Frequency/Популярность): «Эйфелева башня», «Лувр», «Погода в Париже».
- Список 2 (Hidden Interest/Скрытый интерес): «Кладбище Пер-Лашез», «Парижские катакомбы».
Действие системы (Фильтрация): Система классифицирует «Эйфелева башня» и «Лувр» как directly-linked (очевидные) и может удалить их из Списка 1 (согласно Claim 2).
Действие системы (Смешивание): Система смешивает оставшиеся подсказки. Финальный блок может включать: «Погода в Париже» (из Списка 1) и «Кладбище Пер-Лашез», «Парижские катакомбы» (из Списка 2).
Действие SEO-специалиста: Убедиться, что на сайте есть не только статьи про Лувр, но и высококачественный контент с уникальными, привлекательными фотографиями про Пер-Лашез и катакомбы. Это позволит претендовать на трафик из блока Hidden Interest.

Вопросы и ответы

Что такое «Параметр скрытого интереса» (Hidden Interest Parameter) и чем он отличается от популярности?

Параметр скрытого интереса указывает на высокую релевантность подсказки независимо от ее популярности (частотности). Популярность (Frequency Parameter) основана на статистике прошлого поведения (клики, сессии). Скрытый интерес фокусируется на неочевидных, но ценных связях. Подсказка может быть редкой, но очень полезной для глубокого изучения темы.

Как Яндекс определяет этот «Скрытый интерес»? Использует ли он нейросети?

Патент указывает, что этот параметр определяется с помощью асессоров или моделей машинного обучения (ML), обученных на асессорских данных. Конкретно упоминается методика разметки «Three Thumbs Up». Современные нейросети (например, YATI) могут использоваться в рамках этих ML-моделей для лучшего понимания семантической релевантности, но базой для обучения, согласно патенту, являются человеческие оценки.

Что такое алгоритм «Three Thumbs Up», упомянутый в патенте?

Это метод асессорской разметки. Асессор присваивает метки: «1 палец» — релевантно, но связь очевидна (малая ценность как подсказки); «2 пальца» — релевантно, связь менее очевидна (средняя ценность); «3 пальца» (Triple thumbs up) — релевантно, но связь не очевидна (это и есть скрытый интерес, высокая ценность). Система стремится максимизировать показ подсказок с оценкой «3 пальца».

В чем разница между Directly-linked и Indirectly-linked подсказками?

Directly-linked — это очевидные подсказки (например, добавление слов к запросу, популярные уточнения). Indirectly-linked — это подсказки с неявной или отдаленной связью (например, связанные сущности, о которых пользователь может не знать). В патенте описан механизм (Claim 2), который может полностью отфильтровать Directly-linked подсказки из списка популярных, чтобы повысить новизну.

Как происходит смешивание (Blending) популярных подсказок и подсказок скрытого интереса?

Система создает два ранжированных списка. Затем она использует «Assessment Parameter», чтобы определить пропорцию смешивания. Пропорция может быть разной, в патенте (Claim 17, 18) упоминается возможность смешивания 20% популярных подсказок и 80% подсказок скрытого интереса, что указывает на потенциальный приоритет неочевидных вариантов.

Влияет ли этот патент на основное ранжирование веб-документов?

Нет, напрямую не влияет. Патент описывает исключительно механизм ранжирования блока поисковых подсказок (Suggest/Related Queries), а не результатов поиска. Однако он влияет на распределение трафика и путь пользователя. Если ваш сайт хорошо отвечает на эти связанные запросы (особенно Hidden Interest), вы получите дополнительный трафик.

Какое значение имеет оптимизация изображений в связи с этим патентом?

Очень высокое. Патент описывает «Image-based suggestions». Система должна выбрать изображение для визуализации подсказки. Наличие качественных и привлекательных изображений критически важно. В патенте указано, что асессоры могут учитывать «привлекательность» (attractiveness) результатов при оценке скрытого интереса.

Как SEO-специалисту найти «скрытые интересы» для своей тематики?

Это требует глубокого исследования темы за рамками Wordstat. Анализируйте блок визуальных подсказок в выдаче Яндекса по вашим основным запросам. Ищите неочевидные связи между сущностями (людьми, местами, продуктами), изучайте форумы и экспертные блоги. Это поможет выявить темы, которые могут быть интересны аудитории, но еще не имеют высокой частотности.

Может ли система полностью исключить популярные подсказки из финального списка?

Да, если все популярные подсказки будут классифицированы как «Directly-linked» (очевидные) и активирован режим фильтрации (Claim 2). В этом случае финальный список будет состоять преимущественно из подсказок скрытого интереса и косвенно связанных популярных подсказок, максимизируя исследовательскую ценность блока.

Как этот патент связан с Topical Authority?

Он подчеркивает важность широкого и глубокого охвата темы. Ресурсы, которые покрывают не только основные ВЧ аспекты, но и детально прорабатывают нишевые, менее очевидные («скрытые») интересы, демонстрируют экспертность и имеют больше шансов стать источником для этих разнообразных подсказок, укрепляя тематический авторитет.