Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс ранжирует визуальные поисковые подсказки, смешивая популярность и «скрытый интерес»

    СПОСОБ И СЕРВЕР ОБРАБОТКИ ПОИСКОВОГО ПРЕДЛОЖЕНИЯ (METHOD AND SERVER FOR PROCESSING A SEARCH SUGGESTION)
    • RU2609079C2
    • Yandex LLC
    • 2017-01-30
    • 2015-02-27
    2017 Вертикальный поиск Патенты Яндекс Поисковые подсказки Ранжирование

    Яндекс использует метод двойного ранжирования для генерации поисковых подсказок на основе изображений. Система формирует два списка: один оптимизирован по частоте (популярности), а второй — по «скрытому параметру интереса» (высокой релевантности, не зависящей от частоты). Финальный список подсказок создается путем смешивания этих двух списков в динамической пропорции, чтобы предложить пользователю как очевидные, так и неожиданно полезные варианты продолжения поиска.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему однообразия и предсказуемости поисковых подсказок (саджестов). Традиционные системы часто опираются преимущественно на частотность прошлых запросов, что приводит к показу только самых популярных вариантов и игнорированию менее частых, но потенциально высокорелевантных запросов. Изобретение направлено на диверсификацию подсказок путем интеграции «скрытого интереса» и улучшение пользовательского опыта за счет визуализации (поисковые предложения на основе изображений).

    Что запатентовано

    Запатентован способ и сервер для обработки поисковых предложений на основе изображений с использованием двойной стратегии ранжирования. Суть изобретения заключается в параллельном ранжировании кандидатов двумя независимыми методами: один основан на параметре частоты (популярности), а второй — на скрытом параметре интереса (высокой релевантности, не зависящей от частоты). Финальный список формируется путем смешивания (блендинга) результатов этих двух ранжирований.

    Как это работает

    Система получает исходный запрос и генерирует кандидатов для визуальных подсказок на основе прошлых связанных запросов. Эти кандидаты ранжируются параллельно. Первый список оптимизирован по частоте использования в прошлом. Второй список оптимизирован по скрытому интересу, который определяется с помощью моделей машинного обучения или экспертных оценок (асессоров), учитывая такие факторы, как привлекательность результатов. Затем система определяет оптимальную пропорцию смешивания (например, 80% интереса и 20% частоты) и формирует итоговый комбинированный список подсказок.

    Актуальность для SEO

    Средняя. Патент подан в 2015 году. Концепция диверсификации подсказок и использование визуальных элементов остаются крайне актуальными в интерфейсах Яндекса (особенно в Яндекс Картинках и E-commerce вертикалях). Принцип баланса между популярностью и интересом/новизной является фундаментальным. Однако конкретные модели машинного обучения и сигналы, используемые для определения «скрытого интереса», вероятно, эволюционировали с момента подачи заявки.

    Важность для SEO

    Влияние на SEO умеренное (5/10). Патент не описывает алгоритмы ранжирования основного поиска. Он сфокусирован исключительно на механизме генерации и ранжирования поисковых подсказок. Однако этот механизм напрямую влияет на путь пользователя (User Journey) и уточнение запросов (Query Refinement), особенно в визуально-ориентированных нишах. Понимание того, как Яндекс балансирует популярность и скрытый интерес, критично для оптимизации контента и изображений с целью попадания в эти влиятельные интерфейсные элементы.

    Детальный разбор

    Термины и определения

    Поисковое предложение на основе изображений (Image-based search suggestion)
    Поисковая подсказка (саджест), сопровождаемая визуальным элементом (изображением). Является основным объектом патента.
    Параметр частоты (Frequency parameter)
    Метрика, указывающая на частоту связи предложения с прошлым поисковым поведением пользователя. Отражает популярность подсказки.
    Скрытый параметр интереса (Latent interest parameter)
    Метрика, указывающая на высокую релевантность предложения для пользователя, не зависящую от параметра частоты. Отражает нишевой, неочевидный или потенциально высокий интерес.
    Параметр оценки (Evaluation parameter)
    Параметр, определяющий пропорцию смешивания первой (частотной) и второй (интересной) частей в финальном ранжированном списке.
    Эксперт (Expert) / Асессор
    В контексте патента — человек (асессор) или модель машинного обучения, имитирующая его. Упоминаются Первый, Второй и Третий эксперты для выполнения разных задач оценки.
    Неявно связанные поисковые предложения (Implicitly related suggestions)
    Предложения, связь которых с исходным запросом не является очевидной (Claim 2).
    Явно связанные поисковые предложения (Explicitly related suggestions)
    Предложения, которые очевидно связаны с исходным запросом, например, запросы с добавочным словом, популярные связанные темы, очевидные дополнения темы (Claim 4).

    Ключевые утверждения (Анализ Claims)

    Патент защищает метод генерации разнообразных визуальных поисковых подсказок за счет использования двух разных моделей ранжирования и последующего смешивания.

    Claim 1 (Независимый пункт): Описывает основной процесс двойного ранжирования.

    1. Получение первого поискового запроса.
    2. Формирование множества поисковых предложений на основе изображений, основанных на прошлых связанных запросах.
    3. Параллельное ранжирование этого множества:
      • Формирование Первого списка с использованием Первого набора параметров, обученного на Параметре частоты (оптимизация по популярности).
      • Формирование Второго списка с использованием Второго набора параметров, обученного на Скрытом параметре интереса (оптимизация по релевантности независимо от частоты).
    4. Формирование финального ранжированного списка посредством выбора первой части из Первого списка и второй части из Второго списка (Смешивание).

    Claims 2, 3 и 4 (Зависимые пункты): Описывают дополнительную фильтрацию Первого (частотного) списка. Здесь присутствует внутреннее противоречие в тексте патента.

    • Claim 2 утверждает, что перед смешиванием из Первого списка выбирается первая подгруппа, которая включает только неявно связанные поисковые предложения.
    • Claim 3 уточняет, что этот выбор осуществляется с использованием первой модели машинного обучения на основе оценок первого эксперта.
    • Противоречие: Claim 4 утверждает, что указанная первая подгруппа включает в себя явно связанные поисковые предложения, и приводит их примеры (запросы с добавочным словом, популярные связанные темы и т.д.). Это прямо противоречит утверждению Claim 2 о включении «только неявно связанных» предложений.

    Claims 8-11 (Зависимые пункты): Детализируют способы расчета Скрытого параметра интереса.

    • Он может определяться вторым экспертом (асессором) (Claim 8) или второй моделью машинного обучения (Claim 10).
    • Факторы для экспертной оценки (Claim 9) включают: привлекательность результатов поиска, привлекательность SERP, отношения между предложением и запросом, интерес для пользователя.
    • Факторы для ML-модели (Claim 11) включают поведенческие данные: число прошлых запросов/сеансов, длительность сеансов, среднее время между запросами, история кликов.

    Claims 15-22 (Зависимые пункты): Описывают механизм смешивания.

    • Пропорция смешивания определяется с помощью Параметра оценки (Claim 15).
    • Пропорции могут отдавать приоритет Второй части (Интерес). Примеры: 80% второй части и 20% первой части (Claim 17); или 50/50 (Claim 18).
    • Параметр оценки определяется третьим экспертом (Claim 19) или третьей моделью машинного обучения (Claim 21), используя аналогичные факторы, что и для определения скрытого интереса.

    Claims 5-7 (Зависимые пункты): Описывают пользовательский интерфейс (UX).

    Предложения отображаются до выполнения поиска (например, в блоке саджестов). Если пользователь не выбирает подсказку и выполняет исходный поиск, эти высоко оцененные предложения отображаются вместе сверху на странице поисковых результатов (SERP) (Claim 5, 7). Это механизм «настойчивости» подсказок.

    Где и как применяется

    Изобретение применяется на этапах обработки запроса и формирования интерфейса пользователя.

    QUERY PROCESSING – Понимание Запросов
    На этом этапе система получает исходный запрос (возможно, предварительно, по мере ввода – Claim 14) и инициирует процесс генерации кандидатов для подсказок на основе истории поиска.

    RANKING (Специализированное ранжирование подсказок)
    Патент описывает специализированный конвейер ранжирования именно для поисковых предложений на основе изображений. Он не относится к основному ранжированию веб-документов. Процесс включает два параллельных механизма ранжирования (по частоте и по интересу).

    BLENDER – Метапоиск и Смешивание
    Ключевой этап, на котором система выполняет функцию блендера для двух ранжированных списков. Она определяет пропорцию смешивания (используя Параметр оценки) и формирует финальный комбинированный список.

    Генерация SERP (UI/UX)
    Результаты отображаются пользователю либо в интерфейсе автодополнения (до выполнения поиска), либо в виде специального блока сверху на странице результатов поиска (SERP).

    На что влияет

    • Конкретные ниши и типы контента: Наибольшее влияние оказывается в тематиках, где визуальное представление критично, так как патент сфокусирован на предложениях на основе изображений. Это E-commerce (одежда, мебель, товары), дизайн, рецепты, путешествия, авто.
    • Специфические запросы: Влияет на обработку общих или неоднозначных запросов, предлагая разнообразные варианты уточнения (как популярные, так и нишевые).
    • Путь пользователя (Query Refinement): Система активно направляет поисковую сессию, предлагая пользователю менее очевидные, но потенциально интересные направления.

    Когда применяется

    • Триггеры активации: Ввод символов в поисковую строку (генерация саджестов) или отправка запроса (генерация блока уточнений на SERP).
    • Условия применения: Наличие достаточного количества исторических данных (прошлых связанных запросов) и ассоциированных изображений для генерации кандидатов.

    Пошаговый алгоритм

    1. Получение запроса: Система получает первый поисковый запрос от пользователя.
    2. Генерация кандидатов: Формируется множество потенциальных поисковых предложений на основе изображений, базируясь на прошлых связанных запросах.
    3. Параллельное ранжирование:
      • Фаза 1 (Частота): Кандидаты ранжируются для максимизации Параметра частоты. Формируется Первый список.
      • Фаза 2 (Интерес): Кандидаты ранжируются для максимизации Скрытого параметра интереса (определяется Второй ML-моделью/экспертом). Формируется Второй список.
    4. Фильтрация (Опционально): Из Первого списка может быть выбрана подгруппа. (Согласно Claim 2, это подгруппа только неявно связанных предложений, выбор производится Первой ML-моделью/экспертом. Существует противоречие с Claim 4).
    5. Определение пропорции смешивания: Система определяет пропорцию (например, 20/80) с помощью Параметра оценки (определяется Третьей ML-моделью/экспертом).
    6. Смешивание (Blending): Формируется финальный список путем выбора первой части из (возможно отфильтрованного) Первого списка и второй части из Второго списка согласно заданной пропорции.
    7. Отображение: Финальный список отображается пользователю (в саджестах или сверху на SERP).

    Какие данные и как использует

    Данные на входе

    Система полагается в основном на поведенческие данные и экспертные оценки.

    • Поведенческие факторы: Являются основой для генерации кандидатов и обучения всех моделей.
      • Прошлое поисковое поведение пользователя (для расчета Параметра частоты).
      • Данные для ML-моделей (Claims 11, 22): число прошлых поисковых запросов, число и длительность прошлых сеансов, среднее время между запросами, среднее расстояние между положениями между запросами, история щелчков мышью (кликов).
    • Асессорские (Экспертные) данные: Оценки используются для обучения моделей или прямого определения параметров (Первый, Второй, Третий эксперты).
      • Факторы оценки (Claims 9, 20): привлекательность результатов из поиска, привлекательность страницы поисковых результатов (SERP), отношения между предложениями и запросом, интерес для пользователя.
    • Мультимедиа факторы: Изображения, ассоциированные с поисковыми предложениями (являются частью определения «поисковых предложений на основе изображений»).
    • Пользовательские факторы: Факторы могут быть как связанными с конкретным пользователем (персонализированными), так и статистическими (агрегированными) (Claims 12, 13, 23, 24).

    Какие метрики используются и как они считаются

    • Параметр частоты (Frequency parameter): Метрика популярности, основанная на анализе истории поискового поведения.
    • Скрытый параметр интереса (Latent interest parameter): Метрика высокой релевантности, независимая от частоты. Рассчитывается Второй ML моделью или Вторым экспертом. Ключевым фактором является «привлекательность» (Attractiveness) и сложные поведенческие паттерны.
    • Параметр оценки (Evaluation parameter): Метрика, определяющая оптимальную пропорцию смешивания. Рассчитывается Третьей ML моделью или Третьим экспертом.
    • Алгоритмы машинного обучения: В патенте упоминается использование как минимум трех моделей ML для выполнения ключевых задач оценки и ранжирования.

    Выводы

    1. Двойное ранжирование подсказок: Яндекс явно разделяет цели ранжирования подсказок на популярность (частоту) и релевантность/привлекательность (скрытый интерес). Система не полагается исключительно на частотность.
    2. Приоритет разнообразия и «Интереса»: Ключевая цель — диверсификация подсказок. Механизм смешивания позволяет активно добавлять неочевидные варианты. Примеры пропорций (80% интереса / 20% частоты) указывают на стремление системы отдавать больший вес потенциально полезным, хотя и редким, подсказкам.
    3. Сложная инфраструктура оценки (ML и Асессоры): Реализация механизма опирается на сложную систему из трех различных компонентов оценки (ML-модели или группы экспертов/асессоров), что указывает на высокую степень настройки алгоритма.
    4. «Привлекательность» как фактор ранжирования подсказок: Для определения скрытого интереса используются оценки «привлекательности» результатов и SERP. Это подчеркивает важность визуального качества и UX.
    5. Фокус на визуальный опыт: Изобретение специфично для «поисковых предложений на основе изображений», что демонстрирует важность визуального контента в управлении поисковой сессией.
    6. Внутренние противоречия в патенте: В тексте патента присутствует противоречие между Claim 2 и Claim 4 относительно фильтрации явно/неявно связанных предложений, что затрудняет точную интерпретацию этого этапа.

    Практика

    Best practices (это мы делаем)

    • Максимизация визуальной привлекательности (Attractiveness): Критически важно использовать высококачественные, уникальные и привлекательные изображения для товаров и контента. Поскольку «привлекательность» является фактором для оценки Скрытого интереса (Claim 9), визуальное качество напрямую влияет на вероятность попадания в эти подсказки.
    • Охват нишевых и трендовых запросов (Скрытый интерес): Оптимизируйте контент не только под ВЧ запросы, но и под менее очевидные, НЧ и трендовые тематики. Поскольку система может отдавать приоритет (до 80%) скрытому интересу, это увеличивает шансы на получение видимости по неочевидным, но релевантным подсказкам.
    • Улучшение поведенческих факторов и UX: Скрытый интерес рассчитывается на основе сложных ПФ (длительность сессий, история кликов) и оценок асессоров. Высокая вовлеченность пользователей и качественный UX на сайте формируют позитивные сигналы, интерпретируемые как «интерес».
    • Анализ визуальных подсказок в нише: Регулярно изучайте подсказки в Яндекс Картинках и основном поиске по вашим запросам. Анализируйте, какие изображения и формулировки использует Яндекс, чтобы понять, что система считает «привлекательным» и «интересным» в вашей тематике.

    Worst practices (это делать не надо)

    • Использование стоковых или низкокачественных изображений: Это снижает оценку «привлекательности» и уменьшает вероятность того, что предложение будет высоко оценено по параметру «скрытого интереса».
    • Фокус исключительно на ВЧ (Head Terms): Стратегия, ориентированная только на самые популярные запросы, игнорирует механизм «скрытого интереса», который может составлять значительную часть подсказок.
    • Кликбейт в изображениях: Использование привлекательных, но нерелевантных изображений может привести к негативным поведенческим сигналам (быстрые отказы) и низким оценкам асессоров, что негативно скажется на обучении ML-моделей, определяющих интерес.

    Стратегическое значение

    Патент подтверждает стратегию Яндекса по уходу от простых моделей, основанных на популярности, к более сложным системам, учитывающим разнообразие и неочевидные потребности пользователей. Он подчеркивает, что борьба за внимание пользователя начинается еще до формирования SERP. Для SEO в визуально-ориентированных нишах (E-commerce, дизайн) это означает, что качество визуального контента и способность удовлетворить нишевые интенты становятся ключевыми факторами успеха.

    Практические примеры

    Сценарий: Оптимизация интернет-магазина декора

    1. Исходный запрос пользователя: «Ваза».
    2. Работа системы (Дуальное ранжирование):
      • Список 1 (Частота): «ваза для цветов», «ваза стеклянная», «купить вазу».
      • Список 2 (Скрытый интерес): «ваза в скандинавском стиле», «напольная ваза из керамики ручной работы», «ваза для сухоцветов бохо». (Определены как привлекательные и релевантные, но менее частые).
    3. Смешивание (Пропорция 30/70): Финальные визуальные подсказки могут включать 1-2 варианта из Списка 1 и 3-4 варианта из Списка 2.
    4. Действия SEO-специалиста:
      1. Создать и оптимизировать отдельные страницы для нишевых категорий (Скандинавский стиль, Бохо, Ручная работа).
      2. Обеспечить наличие высококачественных, стильных фотографий для этих категорий. Изображения должны быть максимально привлекательными, чтобы получить высокую оценку от асессоров или ML-модели по фактору «привлекательности».
      3. Работать над улучшением UX на этих страницах для повышения поведенческих метрик.

    Вопросы и ответы

    В чем ключевое отличие между «Параметром частоты» и «Скрытым параметром интереса»?

    «Параметр частоты» отражает популярность подсказки — как часто пользователи использовали ее в прошлом. «Скрытый параметр интереса» отражает высокую релевантность и привлекательность подсказки, независимо от ее популярности. Это позволяет системе предлагать нишевые, новые или неочевидные варианты, которые могут быть очень полезны пользователю, но не являются массовыми.

    Как Яндекс определяет «Скрытый параметр интереса»?

    Патент описывает два метода: с помощью экспертов (асессоров) или с помощью второй модели машинного обучения. Асессоры оценивают «привлекательность» результатов и SERP, а также релевантность. Модель ML анализирует сложные поведенческие сигналы, такие как длительность сессий, история кликов, время между запросами, чтобы выявить паттерны высокой вовлеченности.

    Насколько важна «привлекательность» (Attractiveness) изображений для этого алгоритма?

    Она критически важна. Патент явно указывает (Claim 9), что «привлекательность результатов из поиска» является одним из факторов, на основе которых эксперты (асессоры) определяют Скрытый параметр интереса. Поскольку речь идет о подсказках на основе изображений, высокое качество и визуальная привлекательность напрямую влияют на ранжирование в списке «интересных» подсказок.

    Влияет ли этот патент на основное ранжирование сайтов?

    Нет, напрямую не влияет. Патент описывает исключительно механизм ранжирования поисковых подсказок (саджестов), а не результатов органической выдачи. Однако он влияет на то, как пользователи уточняют свои запросы и куда направляется трафик, что косвенно влияет на общую SEO-стратегию, особенно в E-commerce и визуальных нишах.

    Какая пропорция смешивания используется между популярными и интересными подсказками?

    Пропорция определяется динамически с помощью «Параметра оценки» (рассчитывается третьей ML моделью или экспертами). Патент приводит примеры, где приоритет может отдаваться интересу: 80% скрытого интереса и 20% частоты (Claim 17), но также упоминает и 50/50 (Claim 18). Это указывает на гибкость системы в балансировке новизны и популярности.

    Как SEO-специалист может оптимизировать контент под «скрытый интерес»?

    Необходимо фокусироваться на глубокой проработке тематики, охватывая низкочастотные, нишевые и трендовые запросы. Создавайте качественный контент с привлекательными изображениями, отвечающий на эти узкие потребности. Убедитесь, что этот контент генерирует сильные поведенческие сигналы (вовлеченность, время на сайте), что повысит его оценку интереса в моделях Яндекса.

    Что происходит, если пользователь игнорирует эти визуальные подсказки?

    Патент описывает механизм «настойчивости» (Claim 5). Если пользователь отправляет исходный запрос, не выбрав подсказку, эти высоко оцененные предложения отображаются вместе в виде блока сверху на странице результатов поиска (SERP). Это дает пользователю второй шанс воспользоваться ими для уточнения поиска.

    В патенте есть противоречие между Claim 2 и Claim 4. Как это интерпретировать?

    Да, противоречие существует. Claim 2 говорит о фильтрации частотного списка, чтобы оставить «только неявно связанные» предложения. Claim 4 говорит, что эта же подгруппа включает «явно связанные» предложения. С точки зрения SEO, важно понимать, что система имеет механизм фильтрации популярных подсказок (возможно, для удаления слишком очевидных вариантов), но точная логика его работы описана в патенте противоречиво.

    Используется ли персонализация в этом механизме?

    Да, патент допускает это. Указано (Claims 12, 13, 23, 24), что факторы, используемые для расчета скрытого интереса и пропорций смешивания, могут быть как «связанными с пользователем» (персонализированными), так и «статистическими» (агрегированными). Система может адаптировать баланс подсказок под конкретного пользователя.

    В каких вертикалях поиска этот механизм применяется?

    Хотя патент не ограничивает вертикали, его фокус на «поисковых предложениях на основе изображений» предполагает, что он наиболее активно используется в Яндекс Картинках, товарном поиске и основном поиске для запросов с сильным визуальным интентом (например, дизайн, мода, рецепты).

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.