Яндекс патентует метод определения конкретной задачи пользователя («сценария») на основе запроса и его истории поиска. Система выбирает подходящие вертикальные источники (например, Маркет, Картинки) и автоматически генерирует уточненную переформулировку запроса. Это уточнение уникально для комбинации сценария и источника, позволяя показывать высокорелевантные результаты, часто в виде виджетов или вкладок на SERP.
Описание
Какую задачу решает
Патент решает проблему неоднозначности поисковых запросов и повышения релевантности выдачи, особенно в ситуациях, когда стандартный веб-поиск менее эффективен, чем специализированные базы данных. Он направлен на улучшение понимания истинного намерения (интента) пользователя, когда текст запроса слишком общий. Система использует контекст (историю пользователя) для определения конкретного сценария запроса и адаптации поиска под специализированные вертикальные источники.
Что запатентовано
Запатентован способ и сервер для контекстной обработки запросов, основанный на многоступенчатой интерпретации интента и переформулировании запроса. Суть изобретения заключается в определении Сценария запроса, используя как сам запрос, так и Пользовательскую историю. Далее система генерирует Переформулировку запроса, добавляя Уточнение запроса. Ключевым элементом является то, что это уточнение создается на основе уникальной комбинации трех факторов: исходного запроса, параметров сценария и параметров выбранного вертикального источника.
Как это работает
Система работает следующим образом:
- Анализ: Сервер анализирует входящий запрос вместе с Пользовательской историей.
- Определение Сценария: На основе анализа определяется один или несколько вероятных Сценариев запроса (например, «покупка», «обзор», «поиск адреса»).
- Выбор Вертикалей: Для каждого сценария определяются релевантные Вертикальные источники (например, Маркет, Карты, Видео).
- Генерация Уточнения: Система создает специфическое Уточнение запроса. Это уточнение зависит от конкретной комбинации запроса, сценария и вертикали (например, добавление слова «цена» для сценария «покупка» и вертикали «Маркет»).
- Переформулировка и Поиск: Создается Переформулировка запроса (исходный запрос + уточнение), которая отправляется в соответствующий вертикальный источник.
- Отображение: Полученные результаты отображаются на SERP, при этом результаты для разных сценариев могут быть разделены (например, по вкладкам).
Актуальность для SEO
Высокая. Понимание интента пользователя (сценария), глубокая персонализация на основе истории поиска и интеграция результатов из вертикальных сервисов (Метапоиск и Blending) являются фундаментальными аспектами современных поисковых систем. Описанный механизм контекстной переформулировки запросов для улучшения качества метапоиска остается крайне актуальным.
Важность для SEO
Влияние на SEO значительно (7.5/10). Патент не описывает ранжирование основного веб-индекса, но он критически важен для понимания того, как формируется SERP (Blender). Он демонстрирует механизм, с помощью которого Яндекс интерпретирует интент (часто с учетом персонализации) и агрессивно подмешивает результаты из своих вертикальных сервисов. Это подчеркивает необходимость оптимизации не только для веб-поиска, но и для специфических вертикалей (Маркет, Картинки, Видео и т.д.), так как они могут вытеснять органические результаты.
Детальный разбор
Термины и определения
- Вертикальный источник (Vertical Source)
- Специализированная база данных или поисковый сервис Яндекса, сфокусированный на определенной тематике или типе контента (например, Яндекс.Маркет, Яндекс.Картинки, Яндекс.Карты).
- Параметр вертикального источника
- Идентификатор или атрибут, связанный с конкретным вертикальным источником. Используется как один из компонентов для генерации уточнения запроса.
- Сценарий запроса (Query Scenario)
- Интерпретация намерения (интента) или задачи пользователя. Определяется на основе запроса и пользовательской истории.
- Параметр сценария запроса
- Идентификатор или атрибут, связанный с определенным сценарием запроса. Используется для выбора вертикального источника и генерации уточнения запроса.
- Пользовательская история (User History)
- Данные, связанные с пользователем (предыдущие запросы, клики), которые используются для определения Сценария запроса (персонализация интента).
- Переформулировка запроса (Query Reformulation)
- Новый запрос, созданный системой для отправки в вертикальный источник. Состоит из двух частей: первая часть — исходный запрос пользователя, вторая часть — Уточнение запроса.
- Уточнение запроса (Query Refinement)
- Дополнение к исходному запросу, созданное сервером на основе конкретной комбинации запроса, параметра вертикального источника и параметра сценария запроса.
- Виджет (Widget) / Вкладка (Tab)
- Элементы интерфейса на SERP. Виджеты используются для отображения результатов из разных вертикальных источников. Вкладки используются для группировки результатов по разным Сценариям запроса.
Ключевые утверждения (Анализ Claims)
Патент фокусируется на методе контекстуальной интерпретации интента и специфической переформулировки запросов для метапоиска.
Claim 1 (Независимый пункт): Описывает базовый механизм работы.
- Определение Сценария запроса (и его Параметра) на основании запроса И Пользовательской истории.
- Определение Вертикального источника (и его Параметра) на основании Параметра сценария.
- Создание Переформулировки запроса (Запрос + Уточнение).
- Критически важно: Уточнение запроса создается на основе конкретной комбинации трех элементов: (i) Запроса, (ii) Параметра вертикального источника, и (iii) Параметра сценария запроса.
- Извлечение результата из Вертикального источника с использованием Переформулировки.
Claim 2 (Зависимый от п. 1): Уточняет, что для одного сценария может быть определено несколько вертикальных источников (например, Первый и Второй). Для каждого из них генерируется своя уникальная переформулировка, так как параметры вертикальных источников различаются.
Claim 3 (Зависимый от п. 2): Описывает обработку множественных сценариев и множественных вертикалей. Если определены Первый и Второй Сценарии, и Первый и Второй Вертикальные Источники, система генерирует переформулировки для всех возможных комбинаций (матрица переформулировок): (Сценарий 1 + Вертикаль 1), (Сценарий 1 + Вертикаль 2), (Сценарий 2 + Вертикаль 1), (Сценарий 2 + Вертикаль 2).
Claims 4, 5, 6 (Зависимые от п. 1): Описывают методы реализации.
- Определение Сценария запроса может выполняться алгоритмом машинного обучения (Claim 4).
- Создание Уточнения запроса может выполняться другим алгоритмом машинного обучения (Claim 5).
- Альтернативно, Уточнение запроса может извлекаться из Словаря (Claim 6) на основе комбинации Запроса, параметров вертикали и сценария.
Claims 8-11 (Зависимые): Описывают логику отображения на SERP.
- Результаты из разных вертикалей могут отображаться в разных виджетах (Claim 8).
- Результаты, связанные с разными сценариями (как в Claim 3), группируются (Claim 9) и могут отображаться на разных вкладках в пределах SERP (Claim 10). Некоторые вкладки могут быть частично скрыты (Claim 11).
Где и как применяется
Изобретение затрагивает этапы понимания запроса и формирования выдачи, являясь ключевой частью системы Метапоиска.
QUERY PROCESSING – Понимание Запросов
На этом этапе происходит анализ текста запроса и Пользовательской истории. Система классифицирует интент пользователя, определяя один или несколько Сценариев запроса. Это этап персонализированной классификации интента, который может использовать ML (Claim 4).
METASEARCH & BLENDING – Метапоиск и Смешивание
Это основная область применения патента. Слой Метапоиска использует определенные Сценарии для управления поиском по вертикалям:
- Выбор Вертикалей: Определяет, какие Вертикальные источники релевантны для данных сценариев.
- Генерация Запросов к Вертикалям: Ключевой механизм. Вместо отправки исходного запроса система генерирует специфические Переформулировки для каждой пары Сценарий/Вертикаль, используя Уточнения (сгенерированные ML или извлеченные из Словаря).
- Смешивание (Blender) и Отображение: Компонент Blender получает ответы и определяет логику их интеграции в SERP. Патент описывает использование виджетов (Колдунщиков) или вкладок для разделения результатов по сценариям.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на широкие, неоднозначные или многозначные запросы (например, названия объектов, брендов), где интент не ясен без контекста.
- Персонализация: Система напрямую использует историю пользователя, что значительно усиливает персонализацию выдачи на уровне интерпретации интента.
- Конкретные типы контента и Ниши: Влияет на видимость контента в Вертикальных источниках Яндекса (E-commerce/Маркет, Картинки, Видео, Карты и т.д.).
- Структура SERP: Алгоритм напрямую влияет на внешний вид выдачи, добавляя виджеты и потенциально реорганизуя результаты с помощью вкладок.
Когда применяется
- Триггеры активации: Алгоритм активируется, когда система может идентифицировать один или несколько конкретных Сценариев запроса, для которых существуют релевантные Вертикальные источники.
- Условия неоднозначности: Особенно активно применяется, когда запрос неоднозначен, и система идентифицирует несколько вероятных сценариев (Claim 3), или когда Пользовательская история дает четкий контекст для разрешения неоднозначности.
Пошаговый алгоритм
- Получение Данных: Сервер получает Запрос и извлекает связанную Пользовательскую Историю.
- Идентификация Сценариев (Классификация Интента): Система (возможно, с помощью ML) определяет один или несколько Сценариев Запроса (например, Сценарий А, Сценарий Б). Для каждого идентифицируется Параметр Сценария.
- Выбор Вертикалей: Для каждого Параметра Сценария определяются релевантные Вертикальные Источники (например, Вертикаль 1, Вертикаль 2). Для каждого идентифицируется Параметр Вертикального Источника.
- Генерация Уточнений: Для каждой уникальной комбинации {Запрос + Параметр Сценария + Параметр Вертикали} сервер создает Уточнение Запроса (с помощью ML или Словаря).
Пример: Комбинация может сгенерировать Уточнение «рядом».
- Создание Переформулировок: Исходный запрос объединяется с Уточнениями (например, «Пицца рядом»).
- Извлечение Результатов: Переформулировки отправляются в соответствующие Вертикальные Источники.
- Формирование SERP: Сервер агрегирует результаты. Если сценариев несколько, результаты группируются и могут быть отображены на разных вкладках. Если вертикалей несколько, результаты могут быть показаны в виджетах.
Какие данные и как использует
Данные на входе
- Поведенческие факторы / Пользовательские факторы (User History): История поиска, клики и другие данные пользователя. Критически важны для определения Сценария Запроса (Claim 1).
- Контентные факторы (Текст Запроса): Текст исходного запроса. Используется для определения Сценария и как основа для Переформулировки.
- Системные данные (Словарь): В одном из вариантов реализации (Claim 6) используется предварительно составленный словарь, содержащий готовые Уточнения для различных комбинаций Запрос/Сценарий/Вертикаль.
Какие метрики используются и как они считаются
Патент не детализирует конкретные метрики или формулы, но явно указывает на использование алгоритмов машинного обучения для двух задач:
- Алгоритм Машинного Обучения 1 (Claim 4): Используется для определения Сценария запроса на основе входных данных (Запрос + История). Вероятно, это задача классификации интента.
- Алгоритм Машинного Обучения 2 (Claim 5): Используется для генерации Уточнения запроса на основе комбинации Запроса, Параметра сценария и Параметра вертикали. Это может быть задача генерации текста или предсказания наиболее релевантного уточняющего термина.
Выводы
- Приоритет Интента и Сценариев: Яндекс фокусируется на понимании задачи пользователя («Сценария»), а не только на буквальном тексте запроса. Классификация сценария управляет дальнейшим процессом поиска.
- Персонализация как Ключ к Интенту: Пользовательская история является явным и прямым фактором для определения текущего Сценария (Claim 1). Выдача по одному и тому же запросу будет сильно различаться у разных пользователей в зависимости от их контекста.
- Сложный Механизм Переформулировки для Метапоиска: Ключевая инновация — генерация уточнений, которые зависят от уникальной комбинации Сценария И Вертикального источника. Яндекс не просто отправляет исходный запрос в вертикали, а целенаправленно адаптирует его для повышения точности в конкретном контексте.
- Интеграция Вертикальных Сервисов: Система нацелена на эффективное использование собственных специализированных сервисов (Вертикалей) для удовлетворения конкретных сценариев, что стратегически важно для экосистемы Яндекса.
- Динамическая Структура SERP: Структура выдачи адаптивна. При наличии нескольких сценариев система может использовать вкладки и виджеты для разделения результатов по интентам.
Практика
Best practices (это мы делаем)
- Оптимизация присутствия в Вертикалях Яндекса: Критически важно обеспечить максимальное присутствие и качественную оптимизацию контента внутри релевантных сервисов (Маркет, Карты, Услуги, Видео, Кью). Система активно извлекает данные из них для показа в виджетах на основной SERP.
- Анализ и Покрытие Пользовательских Сценариев: Определите основные сценарии (задачи) в вашей нише. Создавайте контент, который четко ориентирован на конкретный сценарий. Понимайте, какие задачи решает пользователь и какие вертикали могут быть задействованы.
- Использование Лексики, Соответствующей Уточнениям: Анализируйте типичные уточнения, которые Яндекс может генерировать для ваших сценариев (например, «цена», «купить», «фото», «отзывы», «рядом»). Интеграция этих QBST фраз в контент (на сайте и в вертикалях) может улучшить его релевантность для переформулированных запросов.
- Мониторинг Структуры Выдачи: Обращайте внимание на появление вкладок и виджетов по вашим запросам. Это явно указывает на то, какие сценарии система считает основными и под какие из них нужно оптимизировать контент.
Worst practices (это делать не надо)
- Фокус только на основном веб-поиске: Концентрация усилий исключительно на органическом ранжировании в основном индексе и игнорирование Вертикальных сервисов. Данный патент показывает, что вертикали являются приоритетным источником ответов для определенных сценариев.
- Создание контента смешанного интента: Попытка оптимизировать одну страницу под несколько разных сценариев одновременно (например, смешивание обзора и продажи). Это может привести к тому, что страница не будет высоко релевантна ни одному из сценариев.
- Игнорирование Персонализации: Разработка SEO-стратегии без учета того, что определение сценария сильно зависит от Пользовательской истории. Выдача динамична и контекстуальна.
Стратегическое значение
Патент подтверждает стратегию Яндекса по развитию Метапоисковой архитектуры и глубокой интеграции своих сервисов. Он демонстрирует, что Яндекс стремится предоставить готовое решение задачи (Сценария), используя для этого персонализацию и данные из наиболее подходящего источника. Для SEO это означает, что долгосрочная стратегия должна быть комплексной, охватывая не только классическое продвижение сайта, но и работу по интеграции с экосистемой сервисов Яндекса и четкое позиционирование контента под конкретные пользовательские сценарии.
Практические примеры
Сценарий 1: Влияние персонализации на определение Сценария
- Запрос пользователя: «Ягуар».
- Пользователь А (История): Недавно искал «купить авто бу», «тест драйв ленд ровер».
- Действие системы для А: Определяется Сценарий = «Автомобиль». Выбираются Вертикали (Авто.ру, Маркет). Генерируется Уточнение (например, «цена комплектации»).
- Пользователь Б (История): Недавно искал «животные африки», «смотреть national geographic».
- Действие системы для Б: Определяется Сценарий = «Животное». Выбираются Вертикали (Картинки, Видео). Генерируется Уточнение (например, «фото в природе»).
- Результат: Пользователи А и Б видят кардинально разную выдачу, адаптированную под их персональный Сценарий, с приоритетом соответствующих виджетов.
Сценарий 2: Обработка нескольких сценариев (Вкладки)
- Запрос: «Кофемашина Delonghi X». (История нейтральная).
- Определение Сценариев: Система определяет два сильных сценария: Сценарий А («Покупка») и Сценарий Б («Обзор/Отзывы»).
- Определение Вертикалей и Переформулировки:
- Сценарий А + Вертикаль Маркет: Уточнение «купить цена».
- Сценарий Б + Вертикаль Видео: Уточнение «видео обзор».
- Сценарий Б + Вертикаль Маркет: Уточнение «отзывы».
- Результат на SERP: Система может отобразить SERP с двумя вкладками (Claim 10). Вкладка 1 («Купить») содержит результаты для Сценария А. Вкладка 2 («Обзоры и Отзывы») содержит результаты для Сценария Б.
Вопросы и ответы
Что такое «Сценарий запроса» (Query Scenario) в контексте этого патента?
Сценарий запроса — это интерпретация Яндексом конкретной задачи или намерения пользователя. Это не просто классификация запроса, а понимание цели (например, «покупка товара», «поиск адреса», «просмотр видео»). Ключевой момент в том, что сценарий определяется не только по тексту запроса, но и с обязательным учетом Пользовательской истории.
Насколько сильно история пользователя влияет на выдачу согласно этому патенту?
Влияние критическое. В основном пункте формулы (Claim 1) указано, что определение Сценария основано на запросе И пользовательской истории. Это механизм персонализации интента. Для одного и того же запроса у разных пользователей могут быть определены разные сценарии, что приведет к разному набору виджетов, вкладок и переформулировок.
Что такое «Вертикальные источники» и почему они важны?
Вертикальные источники — это специализированные сервисы Яндекса (Маркет, Картинки, Видео, Карты, Авто.ру и т.д.). Они важны, потому что описанный механизм направлен на извлечение информации именно из них. Для многих сценариев (особенно коммерческих и транзакционных) Яндекс предпочитает показать ответ из своей вертикали, а не из основного веб-индекса.
В чем ключевая особенность механизма переформулирования запроса?
Ключевая особенность в том, что Уточнение Запроса генерируется на основе уникальной комбинации трех элементов: исходного запроса, определенного Сценария и целевого Вертикального Источника. Это позволяет создавать очень точные уточнения. Например, уточнение для сценария «покупка» будет разным для вертикали «Маркет» (+цена) и вертикали «Карты» (+рядом).
Как генерируется «Уточнение запроса» — автоматически или вручную?
Патент предусматривает оба варианта. Уточнение может быть сгенерировано алгоритмом машинного обучения на лету (Claim 5). Альтернативно, оно может быть извлечено из заранее подготовленного Словаря (базы данных предопределенных правил) по той же комбинации параметров (Claim 6). Вероятно, используется гибридный подход.
Как этот патент влияет на традиционные органические результаты (синие ссылки)?
Он оказывает сильное косвенное влияние. Механизм генерирует высокорелевантные ответы из Вертикалей, которые отображаются в виде виджетов (Колдунщиков). Эти виджеты часто занимают верхние позиции на SERP, вытесняя органические результаты вниз и снижая их CTR. Если система считает, что вертикаль лучше отвечает на сценарий, органика будет пессимизирована.
Что означают «Вкладки» (Tabs) на SERP, упомянутые в патенте (Claim 10)?
Если система идентифицирует несколько разных Сценариев для одного запроса (например, «покупка» и «обзор»), она может сгруппировать результаты для каждого сценария и отобразить их на отдельных вкладках в пределах одной SERP. Это механизм динамической организации выдачи для удовлетворения различных интентов пользователя.
Как SEO-специалисту адаптировать стратегию под этот алгоритм?
Ключевая стратегия — обеспечить сильное присутствие в релевантных Вертикальных источниках Яндекса (оптимизация фидов для Маркета, профиля на Картах, загрузка видео/картинок). Также необходимо анализировать, какие сценарии Яндекс выделяет для вашей тематики (по наличию вкладок и виджетов), и создавать контент, четко отвечающий этим сценариям и содержащий лексику ожидаемых уточнений.
Связан ли этот механизм с Колдунщиками (Wizards)?
Да, напрямую. Патент описывает, как система определяет, какой Колдунщик (виджет из вертикального источника) нужно показать и, что более важно, как именно извлекается контент для этого Колдунщика. Описанный процесс определения сценария и генерации переформулировки является механизмом снабжения Колдунщиков данными.
Может ли система работать, если у пользователя нет истории поиска?
Формулировка Claim 1 указывает на использование истории. Если истории нет или она отключена, система, вероятно, будет опираться только на текст запроса и общую статистику популярности сценариев для этого запроса. В этом случае могут быть определены наиболее вероятные сценарии или несколько сценариев одновременно (что может привести к использованию вкладок для неоднозначных запросов).