Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс группирует поисковые подсказки по вертикалям (Картинки, Видео, Товары) в реальном времени

    METHOD AND APPARATUS FOR CLUSTERING SEARCH QUERY SUGGESTIONS (Метод и устройство для кластеризации подсказок поисковых запросов)
    • US20170091343A1
    • Yandex LLC
    • 2017-03-30
    • 2016-09-13
    2017 Вертикальный поиск Интент пользователя Патенты Яндекс Поисковые подсказки

    Яндекс патентует метод кластеризации поисковых подсказок (саджеста). Система анализирует, насколько подсказка релевантна определенному вертикальному поиску (например, Картинкам или Видео), основываясь на прошлом поведении пользователей. Если связь сильная, подсказки группируются под заголовком этой вертикали. Клик по такой подсказке ведет пользователя сразу в соответствующий вертикальный поиск.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу улучшения пользовательского опыта при взаимодействии с поисковыми подсказками (Search Suggestions). Когда система генерирует большой набор потенциальных подсказок, пользователю может быть сложно быстро найти нужную информацию. Изобретение улучшает навигацию, организуя подсказки в осмысленные кластеры, связанные с конкретными вертикальными поисками (например, Картинки, Видео, Новости), что ускоряет доступ к специфическим типам информации и снижает когнитивную нагрузку.

    Что запатентовано

    Запатентована система и метод для кластеризации (Clustering) поисковых подсказок на основе их связи с конкретными источниками поиска (Search Sources), которые в основном представляют собой вертикальные домены (Vertical Domains). Суть изобретения заключается в использовании Параметра Ассоциации (Association Parameter), рассчитанного на основе исторических данных о поведении пользователей, для определения релевантности подсказки конкретной вертикали и последующего формирования Групп Подсказок (Suggestion Groups).

    Как это работает

    Когда пользователь вводит часть запроса, система генерирует ранжированный список подсказок. Затем для каждой подсказки проверяется Association Parameter, определяющий степень ее релевантности различным вертикалям (Картинки, Фильмы, Еда и т.д.). Если параметр превышает заданный порог для конкретной вертикали, подсказка ассоциируется с ней. Ассоциированные подсказки группируются и отображаются отдельно, часто под заголовком, указывающим на вертикаль. Важная особенность: при выборе пользователем подсказки из такой группы поиск выполняется непосредственно в соответствующем вертикальном домене (например, сразу в Яндекс.Картинках).

    Актуальность для SEO

    Высокая. Кластеризация и структурирование поисковых подсказок являются стандартной функцией в современных поисковых системах. Это критически важно для направления интента пользователя и улучшения навигации, особенно на мобильных устройствах. Описанный механизм, основанный на поведении пользователей для определения связи с вертикалями, остается актуальным.

    Важность для SEO

    Влияние на SEO (4/10). Патент не описывает алгоритмы ранжирования веб-документов в основной выдаче. Влияние на традиционное SEO низкое. Однако он имеет среднее значение для общей видимости в экосистеме Яндекса, особенно в вертикальных сервисах (Картинки, Видео, Товары, Карты). Патент показывает, как Яндекс идентифицирует сильный вертикальный интент на самом раннем этапе (вводе запроса) и может направлять трафик напрямую в вертикали, минуя основную веб-выдачу.

    Детальный разбор

    Термины и определения

    Association Parameter (Параметр Ассоциации)
    Метрика, определяющая степень релевантности поисковой подсказки конкретному источнику поиска (Search Source). Используется для принятия решения о кластеризации подсказки. Параметр рассчитывается заранее на основе анализа прошлых взаимодействий пользователей (Training Set).
    Search Source (Источник Поиска)
    Информационный домен, содержащий специализированный контент, или поисковый сервис для поиска исключительно в этом домене. В контексте патента это, как правило, вертикальный домен (Vertical Domain), такой как Новости, Картинки, Видео, Карты, Фильмы, Рецепты и т.д.
    Suggestion Group (Группа Подсказок)
    Кластер поисковых подсказок, отображаемый отдельно в интерфейсе. Группа содержит только те подсказки, которые сильно ассоциированы (на основе Association Parameter) с одним и тем же источником поиска (Search Source).
    Training Set (Обучающая выборка)
    Набор исторических данных о поведении пользователей, используемый для расчета Association Parameter. Включает данные о прошлых запросах, выбранных подсказках и последующих взаимодействиях пользователей с результатами в общих и вертикальных поисках.
    Vertical Domain (Вертикальный домен)
    Специализированный информационный домен, содержащий контент одного типа (например, только изображения или только новости). Является основным типом Search Source в патенте.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод генерации списка поисковых подсказок.

    1. Получение как минимум части поискового запроса от пользователя.
    2. Генерация ранжированного множества поисковых подсказок для этой части запроса.
    3. Определение того, связана ли каждая подсказка с соответствующим источником поиска (Search Source). Это определение основывается на Association Parameter, который задает степень релевантности подсказки источнику поиска.
    4. В ответ на определение ассоциации создается Suggestion Group для каждого источника поиска. Каждая группа предназначена для представления подмножества подсказок, включающего ТОЛЬКО подсказки, связанные с этим конкретным источником.
    5. Генерация финального списка подсказок, в котором каждое подмножество сгруппировано в соответствующую Suggestion Group, и каждая группа отображается отдельно.

    Claim 4 (Зависимый от Claim 1): Уточняет действие пользователя.

    После отображения списка подсказок, в ответ на выбор пользователем подсказки, представленной в определенной Suggestion Group, система выполняет поиск непосредственно в том Search Source, который ассоциирован с этой группой.

    Claim 6 (Зависимый от Claim 1): Уточняет происхождение Association Parameter.

    Association Parameter рассчитывается заранее (predetermined) на основе обучающей выборки (Training Set) данных о прошлых взаимодействиях пользователей с поисковой подсказкой и соответствующим Search Source.

    Где и как применяется

    Изобретение применяется на этапе взаимодействия пользователя с поисковой строкой, до выполнения основного ранжирования и формирования SERP.

    QUERY PROCESSING – Понимание Запросов
    Это основной слой применения патента. Система работает в реальном времени по мере ввода запроса пользователем. Процесс включает:

    • Генерацию кандидатов в подсказки (Suggestion Module).
    • Кластеризацию этих кандидатов на лету. Система проверяет предварительно рассчитанные Association Parameters для каждой подсказки и сравнивает их с порогами для различных вертикалей.
    • Формирование структурированного списка для отображения в интерфейсе автодополнения.

    Взаимодействие с компонентами:

    • Suggestion Module: Отвечает за генерацию и ранжирование подсказок, а также за выполнение логики кластеризации.
    • Vertical Search Modules: Являются целевыми источниками поиска (Search Sources). Система должна знать доступные вертикали (Картинки, Видео и т.д.) для кластеризации и для последующего выполнения поиска в них при клике пользователя.
    • База данных логов/Training Set: Используется в офлайн-режиме для расчета Association Parameters.

    Входные данные: Частичный поисковый запрос; список сгенерированных подсказок; предварительно рассчитанные Association Parameters для пар (подсказка, вертикаль).

    Выходные данные: Структурированный список подсказок, включающий некластеризованные подсказки и Suggestion Groups с заголовками вертикалей.

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на запросы с сильным вертикальным интентом. Например, для запроса «Маколей Калкин» система может определить сильный интент в «Фильмы» и «Картинки».
    • Конкретные типы контента: Влияет на видимость контента, хорошо представленного в вертикальных поисках (товары, изображения, видео, рецепты, карты, новости).
    • Пользовательский опыт: Напрямую влияет на то, как пользователи формулируют свои запросы и куда они переходят из поисковой строки. Система может направить пользователя в вертикальный поиск, минуя стандартную веб-выдачу.

    Когда применяется

    Алгоритм применяется в реальном времени, когда пользователь вводит запрос в поисковую строку. Подсказки могут обновляться по мере ввода каждой буквы.

    Триггеры активации кластеризации:

    • Система сгенерировала подсказки, для которых существуют предварительно рассчитанные Association Parameters.
    • Значение Association Parameter для пары (подсказка, Search Source) превышает предопределенный порог (predetermined threshold). Это указывает на сильную связь.

    Пошаговый алгоритм

    Процесс А: Обработка ввода пользователя в реальном времени

    1. Получение ввода: Сервер получает часть поискового запроса, введенного пользователем.
    2. Генерация подсказок: Модуль подсказок генерирует ранжированное множество поисковых подсказок, основываясь на популярности, истории пользователя и т.д.
    3. Проверка ассоциаций: Для каждой сгенерированной подсказки система проверяет Association Parameter, определяющий степень ее релевантности различным доступным источникам поиска (Search Sources / Вертикалям).
    4. Принятие решения о кластеризации: Если Association Parameter превышает установленный порог для определенной вертикали, подсказка помечается как ассоциированная с этой вертикалью.
    5. Формирование групп: Система создает Suggestion Group для каждой вертикали, по которой были найдены ассоциированные подсказки. В группу включаются только те подсказки, которые связаны именно с этим источником.
    6. Генерация финального списка: Формируется итоговый список для отображения пользователю. Он может включать неассоциированные подсказки и созданные Suggestion Groups. Каждая группа отображается отдельно, часто с заголовком, указывающим на вертикаль (например, «Картинки», «Фильмы»).
    7. Обработка клика: Если пользователь выбирает подсказку из группы, система инициирует поиск непосредственно в ассоциированном вертикальном домене.

    Процесс Б: Офлайн-расчет Association Parameter

    1. Сбор данных (Training Set): Анализ исторических логов поисковых сессий.
    2. Анализ поведения: Определение того, как часто пользователи, вводившие определенный запрос (или выбравшие подсказку), в итоге взаимодействовали с результатами из конкретной вертикали. Например, как часто после запроса «home alone» пользователи переходили в вертикаль «Фильмы».
    3. Расчет метрики: На основе собранных поведенческих данных (клики, переходы между вертикалями) рассчитывается Association Parameter для пар (запрос/подсказка, вертикаль).

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Являются основой для расчета Association Parameter. Патент упоминает использование:
      • Истории кликов (Click history), включая частоту и продолжительность кликов.
      • Популярности прошлых подсказок и/или результатов поиска.
      • Прошлого поискового поведения (Past searching behavior).
      • Данных о сессиях (количество, размер сессий, среднее время между запросами).
      • Истории переходов (Transition history) между результатами поиска и источником поиска.
    • Контентные факторы: Текст введенного пользователем частичного запроса и текст сгенерированных подсказок.
    • Пользовательские факторы: Патент указывает, что обучающая выборка может включать как общие исторические данные поиска, так и данные, специфичные для конкретного пользователя (user-specific search data), что позволяет персонализировать кластеризацию.

    Какие метрики используются и как они считаются

    • Association Parameter (Параметр Ассоциации): Ключевая метрика патента. Она определяет степень релевантности (degree of relevancy) между подсказкой и источником поиска. Рассчитывается офлайн на основе Training Set (см. Процесс Б выше). Конкретная формула расчета в патенте не приводится, но указано, что она базируется на анализе поведенческих факторов.
    • Predetermined Threshold (Предопределенный порог): Пороговое значение, которое должен превысить Association Parameter, чтобы система признала связь между подсказкой и вертикалью достаточно сильной для создания группы.
    • Ранжирование подсказок: Метрики для первичного ранжирования сгенерированных подсказок (до кластеризации). Патент упоминает стандартные методы, такие как статистическая популярность, пользовательская популярность, частота совместного поиска.

    Выводы

    1. Раннее определение вертикального интента: Яндекс стремится определить намерение пользователя искать в конкретной вертикали (Картинки, Видео, Товары и т.д.) уже на этапе ввода запроса в поисковую строку.
    2. Кластеризация основана на поведении: Решение о том, к какой вертикали относится подсказка, принимается на основе Association Parameter, который агрегирует прошлое поведение пользователей (куда они переходили, вводя этот запрос ранее).
    3. Прямой доступ к вертикалям: Ключевой функцией системы является возможность направить пользователя непосредственно в вертикальный поиск при клике на сгруппированную подсказку. Это может приводить к тому, что пользователь минует основную веб-выдачу (SERP).
    4. Персонализация кластеризации: Система может использовать как общие исторические данные, так и данные конкретного пользователя для расчета Association Parameter, что делает группировку подсказок потенциально персонализированной.
    5. Фокус на экосистеме Яндекса: Патент подчеркивает важность вертикальных поисков в стратегии Яндекса и стремление эффективнее распределять трафик внутри своей экосистемы.

    Практика

    Best practices (это мы делаем)

    • Оптимизация активов для вертикальных поисков: Убедитесь, что ваш контент хорошо оптимизирован и представлен в релевантных вертикалях Яндекса (Яндекс.Картинки, Яндекс.Видео, Яндекс.Товары/Маркет, Яндекс.Карты). Поскольку система может направить пользователя туда напрямую, присутствие в вертикалях критически важно.
    • Анализ поисковых подсказок для выявления интентов: Регулярно изучайте подсказки по вашим ключевым запросам, чтобы понять, с какими вертикалями Яндекс ассоциирует вашу тематику. Если вы видите кластеры (например, «Картинки» или «Видео»), это сигнал о сильном вертикальном интенте аудитории.
    • Стимулирование позитивных поведенческих сигналов в вертикалях: Качество вашего контента в вертикалях имеет значение. Высокий CTR и вовлеченность пользователей при взаимодействии с вашими картинками или видео в вертикальных поисках могут усиливать Association Parameter для связанных запросов, так как эти данные используются для обучения системы.
    • Оптимизация сниппетов и метаданных для вертикалей: Для товаров, видео и изображений используйте максимально релевантные заголовки, описания и микроразметку, чтобы повысить их привлекательность и CTR в вертикальных поисках.

    Worst practices (это делать не надо)

    • Игнорирование вертикального поиска: Стратегия, сфокусированная только на попадании в ТОП-10 веб-выдачи, становится менее эффективной, если значительная часть трафика по запросам с вертикальным интентом уходит напрямую в специализированные сервисы Яндекса.
    • Низкое качество медиа-контента: Размещение некачественных, неуникальных или плохо оптимизированных изображений и видео снижает шансы на получение трафика из вертикалей и ухудшает поведенческие сигналы, используемые для обучения Association Parameter.

    Стратегическое значение

    Патент подтверждает стратегию Яндекса как экосистемы сервисов, а не просто поисковика. Он демонстрирует механизм, который идентифицирует интент и направляет пользователя в наиболее подходящий сервис для решения задачи. Для SEO это означает, что долгосрочная стратегия должна включать оптимизацию под всю экосистему Яндекса. Необходимо признать, что для запросов с сильным вертикальным интентом основная веб-выдача может терять свою значимость как точка входа трафика.

    Практические примеры

    Сценарий 1: Оптимизация интернет-магазина (E-commerce)

    1. Задача: Увеличить видимость по запросам, связанным с конкретной моделью кроссовок.
    2. Применение патента: Пользователь вводит «Nike Air Max 90». Система Яндекса, основываясь на Association Parameter (исторически пользователи часто искали картинки и товары), формирует кластеры подсказок «Картинки» и «Товары».
    3. Действия SEO-специалиста:
      • Обеспечить наличие качественных, уникальных фотографий товара с разных ракурсов, оптимизировать их alt-тексты и заголовки для Яндекс.Картинок.
      • Настроить выгрузку фида в Яндекс.Маркет/Товары с конкурентными ценами и полными характеристиками.
    4. Ожидаемый результат: При клике пользователя на подсказку из кластера «Товары» он попадает в соответствующую вертикаль, где оптимизированное предложение магазина имеет высокие шансы на показ и конверсию, даже если сайт не занимает ТОП-3 в основной веб-выдаче.

    Сценарий 2: Оптимизация контентного проекта (Рецепты)

    1. Задача: Получить трафик по запросам о приготовлении блюд.
    2. Применение патента: Пользователь вводит «макароны». Система идентифицирует сильную связь с вертикалью «Еда» (или «Рецепты») и формирует кластер подсказок: «Еда: макароны с сыром», «Еда: салат с макаронами».
    3. Действия SEO-специалиста:
      • Оптимизировать страницы с рецептами под требования вертикального поиска (микроразметка Recipe, качественные фото, пошаговая структура).
      • Работать над повышением CTR этих страниц в поиске, чтобы улучшить поведенческие сигналы для Training Set.
    4. Ожидаемый результат: Пользователь напрямую из строки поиска переходит в вертикаль рецептов, где оптимизированный контент получает приоритет.

    Вопросы и ответы

    Влияет ли этот патент на алгоритмы ранжирования в основной веб-выдаче?

    Нет, напрямую не влияет. Патент описывает исключительно механизм работы поисковых подсказок (саджеста) — как они генерируются, кластеризуются и отображаются пользователю до формирования SERP. Он не затрагивает факторы, определяющие позицию сайта в результатах поиска.

    Что такое «Association Parameter» и как он рассчитывается?

    Association Parameter (Параметр Ассоциации) — это метрика, которая количественно определяет степень релевантности между конкретной поисковой подсказкой и конкретным вертикальным поиском (например, Картинками). Он рассчитывается офлайн на основе анализа исторических данных о поведении пользователей (Training Set): как часто пользователи, вводившие этот запрос ранее, в итоге переходили в эту вертикаль и взаимодействовали с ее контентом.

    Что происходит, когда пользователь кликает на подсказку внутри кластера (например, под заголовком «Видео»)?

    Согласно патенту, клик по такой подсказке инициирует поиск непосредственно в ассоциированном вертикальном домене. Если пользователь кликнул на подсказку в группе «Видео», он сразу попадет в результаты поиска Яндекс.Видео по этому запросу, минуя основную веб-выдачу.

    Могу ли я как SEO-специалист повлиять на то, будут ли подсказки по моим запросам кластеризованы?

    Напрямую повлиять сложно, так как это зависит от агрегированного поведения всех пользователей. Однако косвенно можно повлиять, создавая качественный контент в вертикалях и стимулируя взаимодействие с ним. Если пользователи будут активно кликать на ваши изображения в Яндекс.Картинках по определенному запросу, это улучшит поведенческие данные в Training Set и может повысить Association Parameter для этого запроса и вертикали «Картинки».

    Что такое «Search Source» в контексте этого патента?

    Search Source (Источник Поиска) — это практически синоним вертикального домена (Vertical Domain). Это специализированная база данных или поисковый сервис, содержащий контент определенного типа. Примеры, приведенные в патенте: Новости, Картинки, Видео, Карты, Фильмы, Еда, Рецепты, Товары.

    Является ли кластеризация подсказок персонализированной?

    Патент предусматривает такую возможность. Указано, что Association Parameter может рассчитываться на основе как общих исторических данных, так и данных, специфичных для конкретного пользователя (user-specific search data). Если пользователь часто ищет видео по определенной теме, система может чаще предлагать ему кластер «Видео» для связанных запросов.

    Что происходит с подсказками, которые не связаны ни с одной вертикалью?

    Такие подсказки отображаются в общем списке отдельно от сформированных групп (Suggestion Groups). Патент отмечает, что финальный список может представлять собой смесь неассоциированных подсказок и кластеризованных групп.

    Как система решает, показывать ли группу? Должно быть много связанных подсказок?

    Система создает группу, если хотя бы одна подсказка имеет Association Parameter выше установленного порога для данной вертикали. Патент указывает, что группа может содержать как одну, так и несколько подсказок.

    Каково стратегическое значение этого патента для E-commerce проектов?

    Стратегическое значение высоко. Это подчеркивает необходимость обязательной оптимизации под Яндекс.Маркет/Товары и Яндекс.Картинки. Для многих коммерческих запросов интент сильно смещен в сторону выбора товара или просмотра изображений. Система может уводить значительную часть трафика напрямую в эти вертикали, поэтому игнорировать их оптимизацию нельзя.

    Используется ли машинное обучение в этом процессе?

    Да, используется. Расчет Association Parameter на основе анализа большого объема исторических данных (Training Set) для выявления закономерностей в поведении пользователей — это задача машинного обучения. Система учится предсказывать, какая вертикаль будет наиболее полезна для конкретного запроса.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.