Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс определяет и предлагает интерактивные уточнения запросов на основе кластеризации поведения пользователей

    METHOD OF AND SYSTEM FOR DISPLAYING A PLURALITY OF USER-SELECTABLE REFINEMENTS TO A SEARCH QUERY (Метод и система отображения множества выбираемых пользователем уточнений к поисковому запросу)
    • US9449079B2
    • Yandex LLC
    • 2016-09-20
    • 2014-04-02
    2016 SERP Интент пользователя Патенты Яндекс Поведенческие факторы

    Яндекс патентует метод динамического определения и отображения уточнений запроса (SSQRs) на SERP. Система анализирует историю успешных («значимых») запросов и группирует их по схожести последующего поведения пользователей (клики по одним и тем же ссылкам). Для каждой поведенческой группы выбирается наиболее популярный запрос, из которого извлекается уникальный термин, предлагаемый пользователю как интерактивное уточнение для фильтрации выдачи.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему обработки широких или неоднозначных поисковых запросов (vague search queries), которые возвращают слишком разнородные результаты. Вместо того чтобы заставлять пользователя самостоятельно придумывать уточняющие слова, система предлагает готовые, проверенные историей поиска направления для сужения тематики. Это улучшает пользовательский опыт и повышает релевантность выдачи, направляя пользователя к нужному кластеру результатов.

    Что запатентовано

    Запатентованы метод и система для динамического определения и отображения предлагаемых уточнений поискового запроса (Suggested Search Query Refinements, SSQRs). Изобретение включает два ключевых аспекта: (1) Сложный алгоритм генерации уточнений, основанный на поведенческой кластеризации успешных (meaningful) исторических запросов. (2) Интерфейс для отображения этих уточнений в виде интерактивных графических объектов (например, кнопок) на SERP, отдельно от строки поиска, с визуализацией истории выбора.

    Как это работает

    При получении широкого запроса система анализирует связанные исторические запросы. Она отбирает только «значимые» (meaningful) запросы — те, которые привели к удовлетворению пользователя. Эти запросы группируются на основе того, переходили ли пользователи после них на одни и те же интернет-ресурсы. Для каждой группы определяется самый популярный запрос. Из него извлекается уникальный термин (путем вычитания слов исходного запроса), который становится уточнением (SSQR) и отображается на SERP в виде кнопки. Клик по кнопке запускает уточненный поиск.

    Актуальность для SEO

    Высокая. Использование поведенческих данных для кластеризации и понимания интентов является фундаментальной частью современного поиска. Интерфейсы для интерактивного уточнения выдачи (фильтры, табы, связанные поиски) активно используются. Описанный механизм поведенческой кластеризации по общим кликам крайне актуален.

    Важность для SEO

    Влияние на SEO значительно (7/10). Хотя патент частично описывает UI/UX, механизм генерации уточнений критически важен для SEO. Он детально раскрывает, как Яндекс сегментирует интент по широким запросам, основываясь не на тексте, а на поведении и успешности поиска. SEO-специалистам необходимо понимать эти поведенческие кластеры и гарантировать, что их контент соответствует доминирующим интентам и ведет к успешному завершению сессии.

    Детальный разбор

    Термины и определения

    Graphical Object (Графический объект)
    Элемент интерфейса (кнопка, список и т.д.), используемый для выбора SSQR. Отображается отдельно от строки поиска.
    Marker Terms (Маркерные термины)
    Слова в запросе, явно указывающие на конкретный интент (например, «купить», «фильм», «фото»). Если они присутствуют, система может не генерировать SSQRs.
    Meaningful Search Queries (Значимые поисковые запросы)
    Исторические связанные запросы, которые были идентифицированы как успешные (предоставили пользователю искомую информацию). Определение основано на анализе поведения пользователя на SERP (клики, время).
    SSQR (Suggested Search Query Refinement) (Предлагаемое уточнение поискового запроса)
    Один или несколько терминов, предлагаемых системой для сужения поиска и таргетинга на конкретный кластер результатов.
    Visual Representation of a Refinement Relationship (Визуальное представление отношения уточнения)
    Визуальная индикация того, что текущий запрос является уточненной версией предыдущего (например, выделение цветом выбранных кнопок-фильтров).

    Ключевые утверждения (Анализ Claims)

    Патент защищает как интерфейс взаимодействия, так и сложный алгоритм генерации уточнений на основе поведенческих данных.

    Claim 1 (Независимый пункт, со стороны клиентского приложения) и Claim 14 (Независимый пункт, со стороны поисковой системы): Описывают полный цикл взаимодействия и детально раскрывают механизм генерации SSQRs.

    Интерфейсная часть:

    1. Система отображает результаты поиска и SSQRs.
    2. Критически важно: SSQRs отображаются отдельно от строки поиска (apart from a search bar) через графические объекты.
    3. После выбора пользователем SSQR отображаются уточненные результаты.
    4. Отображается визуальное представление отношения уточнения.

    Алгоритмическая часть (Генерация SSQRs):

    SSQRs определяются динамически на основе анализа групп связанных запросов. Этот анализ включает (согласно тексту Claims 1 и 14):

    1. Определение связанных запросов как «значимых» (Meaningful): Фильтрация связанных запросов на основе прошлого поведения пользователей, оставляя только те, которые предоставили пользователю искомую информацию (успешные поиски).
    2. Группировка (Поведенческая кластеризация): Группировка значимых запросов на основе последующего поведения пользователей. Конкретно: идентификация общих интернет-ресурсов (common Internet resources), которые посещали пользователи после получения результатов.
    3. Определение SSQR: Определение уточнения для каждой группы на основе сравнения исходного запроса и связанных запросов группы. Уточнение извлекается из наиболее популярного (most popular) запроса в группе.
    4. Выбор уникального термина: Извлеченный термин должен быть определен как «наиболее уникальный» (most unique) по сравнению с ранее идентифицированными уточнениями (для других групп).

    Где и как применяется

    Изобретение затрагивает несколько слоев поиска, объединяя офлайн-аналитику поведения и онлайн-генерацию SERP.

    QUERY PROCESSING – Понимание Запросов
    На этом этапе система анализирует входящий запрос на наличие Marker Terms. Если маркеры отсутствуют и запрос широк, активируется механизм генерации или извлечения предопределенных SSQRs.

    Офлайн-процессы и обработка данных (Search Quality Component)
    Основная работа по определению SSQRs происходит здесь:

    • Анализ логов запросов и кликов.
    • Расчет удовлетворенности пользователя для идентификации Meaningful Queries.
    • Поведенческая кластеризация запросов на основе общих посещенных ресурсов.
    • Расчет популярности запросов и уникальности терминов.

    BLENDER / Генерация SERP
    На этапе формирования выдачи система интегрирует блок с графическими объектами SSQR наряду с основными результатами поиска. Также здесь реализуется UI-логика для отображения истории уточнений.

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на широкие, неоднозначные запросы, по которым существует несколько различных кластеров интентов (например, имена собственные, названия объектов, общие категории). Не влияет на узкие запросы или запросы с четкими Marker Terms.

    Когда применяется

    • Условия активации: Алгоритм активируется, когда исходный запрос не содержит достаточного количества Marker Terms для четкого определения интента.
    • Пороговые значения: Требуется наличие достаточного объема исторических данных для идентификации связанных запросов, определения их «значимости» и выявления устойчивых поведенческих групп.

    Пошаговый алгоритм

    Детальный процесс генерации SSQRs:

    1. Анализ запроса: Получение запроса (например, «Хоббит»). Проверка на наличие Marker Terms. Если их нет, процесс продолжается.
    2. Идентификация связанных запросов: Извлечение исторических данных о запросах, связанных с исходным (по тексту или по сессии).
    3. Фильтрация «Значимых» запросов (Meaningful Queries): Анализ поведения пользователей для фильтрации. Остаются только те запросы, которые привели к успешному решению задачи пользователя (удовлетворенности).
    4. Поведенческая кластеризация: Значимые запросы группируются. Критерий: пользователи, задавшие эти запросы, впоследствии посещали одни и те же интернет-ресурсы (общие ссылки).
    5. Ранжирование групп и запросов:
      1. Группы ранжируются по популярности (суммарная частотность запросов). Выбираются Топ-N групп.
      2. Внутри каждой группы определяется самый популярный запрос.
    6. Генерация SSQR (Извлечение уникального термина):
      1. Из самого популярного запроса удаляются (cropping) термины исходного запроса и стоп-слова.
      2. Из оставшихся терминов выбирается тот, который является «наиболее уникальным» по сравнению с SSQRs, идентифицированными для других групп. Этот термин становится SSQR.
    7. Передача и отображение: Сгенерированные SSQRs передаются клиенту для отображения в виде интерактивных графических объектов.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Критически важные данные. Используются для определения Meaningful Queries (анализ кликов на SERP, время сессии) и для группировки запросов (идентификация общих посещенных интернет-ресурсов после поиска).
    • Контентные факторы (Текстовые): Тексты исторических и текущего запросов. Используются для поиска связанных запросов и извлечения уникальных терминов (cropping).
    • Системные данные: Логи поисковых запросов (Query Logs), статистика популярности запросов.

    Какие метрики используются и как они считаются

    • Значимость запроса (Meaningful Query Score): Вероятностная оценка успешности поиска, основанная на анализе поведения на SERP.
    • Поведенческая схожесть запросов: Метрика, основанная на пересечении интернет-ресурсов, которые пользователи посещали после ввода этих запросов. Используется для кластеризации.
    • Популярность запроса/группы: Частотность запросов в логах.
    • Уникальность термина (Term Uniqueness): Метрика, используемая для выбора одного термина, который лучше всего дифференцирует данную поведенческую группу от остальных.

    Выводы

    1. Поведение определяет кластеризацию интента: Ключевой вывод — Яндекс использует сложный поведенческий анализ для сегментации выдачи по широким запросам. Схожесть определяется не текстом запросов, а тем, куда пользователи переходят после поиска (общие целевые URL).
    2. Важность успешности поиска («Meaningful Queries»): Система строит уточнения только на основе тех исторических запросов, которые привели к удовлетворению пользователя. Неудачные поисковые сессии отфильтровываются.
    3. Уточнения основаны на доминирующем поведении и уникальности: SSQRs извлекаются из самых популярных запросов в самых популярных группах, при этом система ищет наиболее уникальный термин для идентификации кластера.
    4. Интерактивный UX для навигации: Патент уделяет большое внимание интерфейсу (кнопки отдельно от строки поиска, визуальная история), подчеркивая важность управляемого пользователем процесса уточнения поиска.

    Практика

    Best practices (это мы делаем)

    • Анализ SERP Similarity для понимания поведенческих групп: Используйте инструменты анализа схожести выдачи. Если по двум разным запросам пользователи часто кликают на одни и те же сайты (как описано в механизме группировки), Яндекс считает эти запросы поведенчески связанными. Это помогает понять структуру интента и реконструировать кластеры, которые видит система.
    • Оптимизация под удовлетворенность пользователя (Satisfaction): Критически важно, чтобы ваш сайт решал задачу пользователя. Это увеличивает вероятность того, что запросы, по которым он был найден, будут классифицированы как Meaningful, и ваш сайт будет участвовать в формировании поведенческих кластеров.
    • Анализ предлагаемых уточнений на SERP: Регулярно анализируйте, какие уточнения (фильтры, табы) предлагает Яндекс по вашим широким запросам. Это прямое указание на доминирующие поведенческие кластеры и те уникальные термины, которые система выбрала для их идентификации.
    • Стратегия Topical Authority и покрытие кластеров интента: Создавайте контент, который четко таргетирует идентифицированные поведенческие кластеры. Убедитесь, что у вас есть качественный контент, оптимизированный под самые популярные формулировки внутри каждого кластера.

    Worst practices (это делать не надо)

    • Игнорирование сегментации интента: Попытка ранжироваться по широкому запросу с помощью одной общей страницы без учета различных поведенческих кластеров.
    • Фокус только на текстовой релевантности: Оптимизация текста без учета того, как пользователи ведут себя на сайте. Если поиск не будет «значимым», он не повлияет на формирование кластеров.
    • Использование непопулярных или неуникальных формулировок: Фокусировка на редких синонимах, когда система явно предпочитает наиболее популярные и уникальные термины для идентификации кластера.

    Стратегическое значение

    Этот патент подтверждает стратегический приоритет Яндекса на понимание и кластеризацию интента через анализ больших данных о поведении. Он детально описывает механизм, как именно поведенческие данные (успешность поиска и последующие клики) превращаются в конкретные термины для уточнения запроса. Для SEO это означает, что понимание структуры спроса должно основываться на анализе реального поведения пользователей и тех сегментов, которые выделяет сама поисковая система.

    Практические примеры

    Сценарий: Оптимизация сайта по запросу «Кредит наличными»

    1. Анализ (Действие SEO): SEO-специалист вводит запрос «Кредит наличными» и видит, что Яндекс предлагает уточнения (SSQRs) в виде кнопок: «Без справок», «С плохой историей», «Пенсионерам».
    2. Интерпретация (Понимание алгоритма): Это означает, что Яндекс идентифицировал три доминирующие поведенческие группы. Например, Группа 1: пользователи после разных запросов (например, «кредит быстро», «кредит без работы») в итоге кликали на одни и те же сайты (общие ресурсы), предлагающие кредиты без справок. Самым популярным запросом в этой группе оказался тот, из которого был извлечен уникальный термин «Без справок».
    3. Применение (Действие SEO): Специалист должен создать отдельные, высококачественные страницы под каждый кластер. Страница «Кредит без справок» должна обеспечивать высокий уровень удовлетворенности пользователя, чтобы запросы, ведущие на нее, классифицировались как Meaningful.
    4. Ожидаемый результат: Улучшение ранжирования по уточненным запросам и повышение общей релевантности ресурса за счет соответствия доминирующим поведенческим кластерам.

    Вопросы и ответы

    Что такое «Meaningful Search Queries» (Значимые поисковые запросы) в контексте этого патента?

    Это исторические запросы, которые, по оценке поисковой системы, успешно решили задачу пользователя (поиск был успешным). Оценка основывается на анализе поведения пользователя на SERP (клики, время на сайте, отсутствие быстрых возвратов). Только такие успешные запросы используются для генерации предлагаемых уточнений (SSQRs).

    Как именно система группирует запросы? Это текстовая кластеризация?

    Нет, это поведенческая кластеризация. Патент описывает группировку, основанную на последующем поведении пользователей. Если пользователи, вводившие разные «значимые» запросы, впоследствии переходили на одни и те же интернет-ресурсы (общие ссылки), эти запросы объединяются в одну поведенческую группу, независимо от их текстовой схожести.

    Как система выбирает, какой именно термин показать в качестве уточнения (SSQR)?

    Система выбирает самый популярный запрос внутри поведенческой группы. Из этого запроса удаляются слова исходного запроса. Из оставшихся слов выбирается «наиболее уникальный» термин по сравнению с уточнениями, выбранными для других групп. Это гарантирует, что уточнение хорошо характеризует и дифференцирует данный кластер.

    Что это значит для моей контент-стратегии по широким запросам?

    Вы должны понимать, как Яндекс сегментирует интент по вашим широким запросам. Анализируйте предлагаемые уточнения (фильтры, табы на SERP) — это и есть доминирующие поведенческие кластеры. Ваша стратегия должна включать создание качественного контента, таргетированного на каждый из этих кластеров, а не пытаться охватить все на одной общей странице.

    Как я могу повлиять на то, чтобы мои запросы считались «Meaningful»?

    Единственный способ — максимизировать удовлетворенность пользователя. Ваш контент должен точно отвечать на запрос и помогать пользователю решить его задачу эффективно. Это приведет к позитивным поведенческим сигналам (например, длинные клики), которые используются для оценки «значимости».

    В патенте много говорится о кнопках и интерфейсе. Это патент про UI или про ранжирование?

    Это гибридный патент. Он защищает конкретные UI-решения (отображение уточнений вне строки поиска, визуализация истории выбора). Однако он также защищает и сложный алгоритм генерации этих уточнений, основанный на поведенческом анализе. Этот алгоритм напрямую связан с пониманием запросов и кластеризацией интентов, что является частью логики поиска.

    Что такое «Marker Terms» и как они влияют на этот алгоритм?

    Marker Terms — это слова в запросе, которые четко указывают на интент (например, «купить», «скачать», «отзывы»). Патент указывает, что если в запросе достаточно таких маркеров, механизм генерации дополнительных уточнений (SSQRs) может не активироваться, так как интент пользователя уже достаточно ясен.

    Как использовать информацию из этого патента для анализа конкурентов и семантики?

    Используйте инструменты анализа SERP Similarity. Если по разным запросам выдача сильно пересекается (много общих URL), это сильный сигнал, что Яндекс считает их поведенчески схожими. Это позволяет реконструировать поведенческие кластеры и понять структуру интентов в нише, а также определить, какие конкуренты успешно таргетируют эти кластеры.

    Применяется ли этот алгоритм ко всем типам запросов?

    Нет. Он применяется преимущественно к широким и неоднозначным запросам, где отсутствуют четкие маркеры интента, и где существует достаточно исторических данных для выявления устойчивых поведенческих кластеров. Для узких или очень редких запросов этот механизм не будет активирован.

    Может ли система предложить несколько уровней уточнений?

    Да, патент это предусматривает. После выбора первого уточнения (например, «Дженнифер Лопес» -> «Музыка») система может предложить второй уровень уточнений для нового запроса (например, «Скачать», «Слушать», «Купить»). Логика генерации последующих уровней аналогична первому.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.