Яндекс патентует механизм показа расширенных подсказок (например, карточек объектов или навигационных ссылок) в выпадающем списке автодополнения. Система анализирует вводимый префикс и определяет доминирующий ресурс на основе агрегированной вероятности кликов (Суммарного веса). Если один ресурс явно доминирует над другими вариантами, Яндекс покажет его контент в виде расширенной подсказки еще до перехода на выдачу.
Описание
Какую задачу решает
Патент решает задачу ускорения доступа пользователя к информации и повышения интерактивности интерфейса поисковых подсказок (саджеста). Он описывает механизм, позволяющий не просто предлагать варианты завершения запроса, но и предоставлять прямой ответ или интерактивный элемент (например, карточку объекта или навигационную ссылку) непосредственно в выпадающем списке, до того как пользователь отправит полный запрос. Это сокращает время поиска (Time-to-Result), особенно для навигационных и фактоидных запросов.
Что запатентовано
Запатентован способ и система для выборочного отображения расширенных предложений (Rich Suggestions) в интерфейсе поисковых подсказок. Суть изобретения заключается в алгоритме определения доминирующего ресурса для введенного пользователем префикса. Это определение основано на сравнении суммарных весов (Summary Weights) различных ресурсов, связанных с предложенными подсказками, где вес отражает вероятность посещения ресурса пользователем.
Как это работает
Когда пользователь вводит префикс (минимум два символа), система идентифицирует список предложенных поисковых запросов (подсказок), ранжированных по вероятности выбора. Система вычисляет суммарный вес для ресурсов, связанных с этими подсказками, основываясь на исторических данных о кликах (вероятности посещения). Если ресурс, связанный с самой вероятной подсказкой, имеет суммарный вес не меньше, чем у любого другого ресурса (т.е. доминирует), система извлекает данные отображения (например, карточку объекта) для этого ресурса и показывает их в саджесте как расширенное предложение.
Актуальность для SEO
Высокая. Механизмы интерактивных и расширенных подсказок активно используются Яндексом и являются ключевым элементом современного интерфейса поиска, направленным на мгновенное удовлетворение интента пользователя.
Важность для SEO
Влияние на SEO значительно (7.5/10). Патент не описывает ранжирование основной выдачи, но критически важен для Brand SEO и навигационного трафика. Получение расширенного предложения в саджесте позволяет перехватить трафик еще до попадания пользователя на SERP, увеличивая видимость доминирующего бренда. Однако это также может привести к сценариям Zero-Click, если расширенное предложение содержит исчерпывающий ответ.
Детальный разбор
Термины и определения
- Префикс (Prefix)
- Частичный пользовательский ввод в поисковую строку (минимум два символа), определяющий часть потенциального поискового запроса.
- Предложенный поисковый запрос (Suggested Search Query)
- Поисковая подсказка (саджест). Список таких запросов генерируется в ответ на префикс и упорядочен по вероятности выбора пользователем.
- Ресурс (Resource)
- Веб-сайт, документ или объект (сущность), который связан с предложенным поисковым запросом.
- Взаимоотношение (Relationship)
- Связь между предложенным поисковым запросом и ресурсом. Количественно выражается как вероятность выбора пользователем данного ресурса в результате использования данной подсказки (Claim 12).
- Суммарный вес ресурса (Summary Weight / Total Weight)
- Ключевая метрика патента. Агрегированная оценка, показывающая общую вероятность посещения конкретного ресурса. Рассчитывается на основе взаимоотношений этого ресурса со всеми релевантными предложенными поисковыми запросами для данного префикса. Основана на числе кликов или просмотров (Claims 6, 7).
- Данные отображения (Display Data)
- Контент, который отображается в расширенном предложении. Может включать текст, извлеченный из ресурса, или графическое представление.
- Расширенное предложение (Expanded Suggestion)
- Блок с информацией (данными отображения), который отображается в списке предложений, часто между поисковой строкой и первой подсказкой (Claims 17-19).
- Карточка объекта (Object Card)
- Структурированный элемент контента, который может использоваться в качестве данных отображения (Claims 32, 33).
- Навигационный запрос / ресурс (Navigational Query / Resource)
- Запрос, целью которого является переход на конкретный, заранее известный сайт. Система может проверять навигационность запроса или ресурса (Claim 21).
Ключевые утверждения (Анализ Claims)
Ядром изобретения является механизм принятия решения о том, когда показывать расширенное предложение, основанный на сравнении агрегированных весов.
Claim 1 (Независимый пункт): Описывает основной способ работы системы.
- Получение префикса (минимум 2 символа).
- Идентификация списка предложенных поисковых запросов. Список включает Первый запрос (Q1) и Второй запрос (Q2). Q1 более вероятен для выбора, чем Q2.
- Проверка критического условия для показа расширенного предложения:
- (i) Q1 связан с Первым ресурсом (R1).
- (ii) Первый суммарный вес (W1), основанный на взаимоотношении Q1 и R1, НЕ МЕНЬШЕ, чем Второй суммарный вес (W2), основанный на взаимоотношении Q2 и Второго ресурса (R2).
- Если условия выполнены (R1 доминирует): Идентификация и передача данных отображения, связанных с R1, вместе со списком подсказок ДО ввода полного запроса.
Система не просто показывает сниппет для самой популярной подсказки. Она сравнивает вероятность того, что пользователь хочет попасть на ресурс, связанный с топовой подсказкой, с вероятностью того, что он хочет попасть на ресурсы, связанные с другими подсказками. Это механизм обеспечения доминирования интента.
Claims 3, 4, 5, 8 (Зависимые пункты): Уточняют механизм агрегации Суммарного веса. Это критически важная часть.
Если в списке есть Третий предложенный запрос (Q3), который также связан с Первым ресурсом (R1), то Первый суммарный вес (W1) основывается на агрегированном взаимоотношении (Q1+Q3) с R1. Вероятности посещения ресурса R1 по разным подсказкам суммируются для определения общей силы этого ресурса для данного префикса.
Claims 6, 7, 12, 13 (Зависимые пункты): Определяют природу весов и взаимоотношений.
Взаимоотношение — это вероятность выбора ресурса пользователем. Суммарный вес основан на этой вероятности, которая рассчитывается из поведенческих данных: числе щелчков (кликов) или числе просмотров.
Claim 22 (Зависимый пункт): Описывает резервный вариант.
Если условия Claim 1 не выполнены (например, нет явного доминирующего ресурса или W1 < W2), система передает список подсказок БЕЗ данных отображения (стандартный вид саджеста).
Claims 26, 28, 29 (Зависимые пункты): Описывают источники данных и методы.
Подсказки генерируются на основе анализа предыдущих поисковых сессий. Веса (параметры вероятности) хранятся в базе данных, связывающей Запрос, Ресурс и Параметр. Эта связь может устанавливаться с помощью алгоритма машинного обучения.
Где и как применяется
Изобретение применяется на самых ранних этапах взаимодействия пользователя с поиском, до этапа основного ранжирования.
QUERY PROCESSING – Понимание Запросов (Подсистема Autocomplete/Suggest)
Основное место применения. Система работает в реальном времени по мере ввода пользователем префикса.
- На входе: Пользовательский ввод (префикс).
- Процесс: Генерация списка подсказок, оценка вероятности их выбора, идентификация связанных ресурсов, вычисление и сравнение Суммарных весов, принятие решения о показе расширенного предложения.
- На выходе: Список предложенных поисковых запросов, опционально дополненный Расширенным предложением.
Взаимодействие с компонентами и Офлайн-процессы:
Система опирается на значительные офлайн-вычисления и взаимодействие с несколькими базами данных (Claims 24, 28, 30):
- БД 1 (БД Подсказок): Хранит связи «Префикс -> Предложенные запросы». Создается на основе анализа логов поисковых сессий.
- БД 2 (БД Весов/Взаимоотношений): Хранит связи. Веса рассчитываются на основе поведенческих логов (кликов/просмотров), вероятно, с использованием ML-моделей (Claim 29) для предсказания вероятности клика (pClick).
- БД 3 (БД Контента Расширенных Предложений): Хранит готовые Элементы контента и Данные отображения (например, карточки объектов), сформированные из веб-контента ресурсов (Claim 31). Вероятно, связана с инфраструктурой Колдунщиков (Wizards) или Графом Знаний.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на Навигационные запросы (брендовые, витальные) (Claim 21) и Фактоидные/Объектные запросы, для которых существует карточка объекта (Claim 32).
- Конкретные типы контента: Влияет на видимость ресурсов, которые являются однозначным и доминирующим ответом на популярные подсказки.
- Пользовательский опыт: Ускоряет навигацию и может приводить к сценариям Zero-Click или прямым переходам, минуя SERP.
Когда применяется
- Условие активации: Ввод пользователем префикса, состоящего по меньшей мере из двух символов (Claim 1).
- Триггеры показа расширенного предложения: Система должна быть уверена в доминировании одного ресурса. Это происходит, когда: 1. Первая подсказка (Q1) является наиболее вероятной. 2. Q1 связана с ресурсом (R1). 3. Суммарный вес R1 (возможно, агрегированный по нескольким подсказкам) не меньше, чем суммарный вес любого другого ресурса (R2).
Пошаговый алгоритм
- Получение ввода: Система получает префикс (>= 2 символов) от пользователя.
- Генерация и Ранжирование подсказок: Обращение к БД 1 для получения списка предложенных запросов. Сортировка по вероятности выбора. Определение Q1, Q2, Q3…
- Идентификация ресурсов и весов: Обращение к БД 2 для определения ресурсов (R1, R2…) и извлечения параметров (весов/вероятностей) для каждой пары.
- Расчет Суммарных Весов (Агрегация):
- Вычисление Первого суммарного веса (W1) для R1. Он включает вес от Q1 и агрегирует веса от других подсказок (например, Q3), которые также связаны с R1.
- Вычисление Второго суммарного веса (W2) для R2.
- Сравнение и Принятие Решения: Система проверяет условие доминирования: W1 >= W2 (и W1 >= W3 и т.д.).
- Генерация Вывода:
- Если Условие Выполнено (Доминирование есть): Система извлекает Данные отображения для R1 из БД 3. Формируется ответ, включающий список подсказок И расширенное предложение.
- Если Условие НЕ Выполнено (Доминирования нет): Формируется ответ, включающий только стандартный список подсказок (Claim 22).
- Передача данных: Ответ передается на устройство пользователя для отображения в интерфейсе саджеста.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Критически важные данные, основа системы. Используются для:
- Определения вероятности выбора предложенных запросов (на основе анализа предыдущих поисковых сессий — Claim 26).
- Расчета Суммарного веса ресурса. В патенте явно указаны число щелчков (кликов) и число просмотров как основа для расчета вероятности посещения (Claims 7, 13).
- Контентные факторы: Веб-контент, извлеченный из ресурсов офлайн, используется для формирования Данных отображения или Карточек объектов, хранящихся в БД 3 (Claim 30).
- Пользовательские факторы: Текущий ввод пользователя (префикс).
Какие метрики используются и как они считаются
- Вероятность выбора подсказки: Метрика для ранжирования подсказок. Рассчитывается офлайн на основе частотности выбора в логах.
- Вероятность посещения ресурса (Параметр/Взаимоотношение): Метрика, связывающая Запрос и Ресурс. Рассчитывается офлайн на основе поведенческих данных (вероятно, аналог CTR или доля кликов на ресурс по данному запросу). Может рассчитываться с помощью ML-модели (Claim 29).
- Суммарный вес ресурса (Summary Weight): Агрегированная метрика. Сумма вероятностей посещения одного ресурса по нескольким разным предложенным запросам, связанным с этим ресурсом.
Например: $W_{R1} = P(R1|Q1) + P(R1|Q3)$
- Пороговые значения: Система использует условие сравнения весов (W1 >= W2) как порог для принятия решения о показе расширенного предложения.
Выводы
- Яндекс стремится дать ответ до клика (Pre-SERP): Патент подтверждает стратегию Яндекса на предоставление ответов и навигации непосредственно в интерфейсе поисковых подсказок, минуя страницу выдачи.
- Доминирование ресурса – ключевое условие: Чтобы получить расширенное предложение, ресурс должен быть не просто релевантным самой популярной подсказке, но и иметь доминирующий Суммарный вес по сравнению с альтернативными ресурсами для того же префикса.
- Агрегация весов по кластеру запросов: Система агрегирует веса по нескольким подсказкам, ведущим на один ресурс. Это позволяет справедливо оценить общую популярность ресурса, учитывая разные формулировки одного интента.
- Поведенческие факторы определяют Вес: Суммарный вес напрямую основан на вероятности клика (исторических данных о кликах/просмотрах). Сильные поведенческие сигналы критически важны для активации этого механизма.
- Фокус на навигационных и объектных запросах: Механизм в первую очередь предназначен для запросов с четким интентом – навигационных запросов и запросов, для которых можно сформировать карточку объекта.
- Инфраструктурная зависимость: Работа системы зависит от предварительной офлайн-обработки данных: расчета весов и формирования базы данных готовых расширенных предложений (БД 3).
Практика
Best practices (это мы делаем)
- Укрепление связи Бренд-Ресурс (Витальность): Необходимо добиваться того, чтобы по всем вариациям брендовых и навигационных запросов ваш сайт имел максимально высокий CTR. Это напрямую увеличивает Суммарный вес и вероятность получения расширенного предложения.
- Консолидация брендового трафика: Убедитесь, что трафик по различным брендовым запросам (например, «Бренд» и «Бренд официальный сайт») ведет на основной домен. Это позволяет системе агрегировать веса по этим запросам.
- Оптимизация под Карточки Объектов (Entity Optimization): Предоставляйте структурированную информацию (Schema.org, Яндекс Бизнес), которая поможет Яндексу сформировать карточку объекта для БД 3. Если ваш ресурс станет основным источником данных для карточки, он может появиться в расширенном предложении.
- Анализ поисковых подсказок для бренда (SERM): Регулярно отслеживайте подсказки при вводе названия вашего бренда. Убедитесь, что ваш сайт является лучшим ответом для большинства из них и работайте над вытеснением негатива, который может перехватить Суммарный вес.
Worst practices (это делать не надо)
- Размытие бренда и каннибализация: Создание множества сайтов или лендингов под один и тот же брендовый запрос приводит к размытию Суммарного веса между разными ресурсами, из-за чего ни один из них не достигнет порога доминирования.
- Игнорирование поведенческих факторов: Низкий CTR или плохой пользовательский опыт по навигационным запросам снизит рассчитываемый вес взаимоотношения, что может лишить сайт расширенного предложения.
- Накрутка ПФ в саджесте: Попытки манипулировать вероятностями выбора подсказок или Суммарным весом через накрутку кликов рискованны и могут привести к санкциям, так как система опирается на естественное поведение масс пользователей и ML-алгоритмы для расчета весов.
Стратегическое значение
Патент подчеркивает важность этапа Autocomplete (саджеста) как полноценного поля боя за трафик. Для Яндекса приоритетом является скорость удовлетворения интента. Если система уверена в доминирующем ответе на этапе ввода префикса, она его покажет. Стратегически это подтверждает тренд на переход от оптимизации страниц к оптимизации сущностей (Entity SEO) и укреплению авторитетности ресурса как единственно верного ответа на ключевые запросы.
Практические примеры
Сценарий 1: Навигационный запрос и доминирование бренда (Агрегация весов)
- Пользователь вводит префикс: «Сбер».
- Подсказки: Q1: «Сбербанк онлайн» (самая вероятная), Q2: «Сбербанк курс валют», Q3: «Сбермаркет».
- Анализ ресурсов: R1 (sberbank.ru) связан с Q1 и Q2. R2 (sbermarket.ru) связан с Q3.
- Расчет весов: Система считает Суммарный вес W1 для R1 (агрегация весов от Q1 и Q2) и W2 для R2 (вес от Q3). Предположим, W1 значительно больше W2.
- Результат (W1 >= W2): Система показывает расширенное предложение для R1 (sberbank.ru) – например, форму быстрого входа или быструю ссылку на курс валют, прямо в саджесте.
Сценарий 2: Неоднозначный префикс (Отсутствие доминирования)
- Пользователь вводит префикс: «марс».
- Подсказки: Q1: «марс планета», Q2: «марс шоколад», Q3: «марс фильм».
- Анализ ресурсов: Q1 связан с R1 (Википедия), Q2 с R2 (mars.com), Q3 с R3 (Кинопоиск).
- Расчет весов: Рассчитываются W1, W2, W3. Предположим, W1 и W2 сопоставимы, явного доминирования нет.
- Результат: Условие доминирования не выполняется. Яндекс показывает стандартный список текстовых подсказок без расширенного предложения.
Вопросы и ответы
Что такое «Суммарный вес ресурса» и как он рассчитывается?
Суммарный вес ресурса (Summary Weight) — это ключевая метрика в патенте, определяющая общую вероятность того, что пользователь посетит данный ресурс после ввода префикса. Он рассчитывается на основе исторических поведенческих данных (кликов или просмотров). Важно, что вес агрегируется: если ресурс релевантен сразу нескольким подсказкам (например, «ВК» и «Вконтакте»), то вероятности клика по этим подсказкам суммируются для этого ресурса.
В чем основное условие для показа расширенного предложения в саджесте?
Основное условие — это доминирование одного ресурса. Система должна определить, что Суммарный вес ресурса, связанного с самой популярной подсказкой (и, возможно, другими), НЕ МЕНЬШЕ (W1 >= W2), чем суммарный вес любого другого ресурса, связанного с остальными подсказками. Система должна быть уверена, что этот ресурс является наиболее вероятным назначением пользователя.
Влияет ли этот патент на ранжирование в основном поиске (SERP)?
Нет, напрямую не влияет. Патент описывает исключительно работу системы поисковых подсказок (Suggest/Autocomplete) ДО того, как пользователь увидит SERP. Однако он влияет на распределение трафика: если пользователь кликает на расширенное предложение, он минует этап просмотра SERP, что может снизить трафик конкурентов в выдаче.
На какие типы запросов этот патент влияет больше всего?
Патент явно указывает на Навигационные запросы (Claim 21), когда пользователь ищет конкретный сайт (брендовый трафик, витальные запросы). Также он влияет на Объектные запросы, для которых может быть сформирована Карточка Объекта (Claim 32) – запросы о товарах, организациях, персонах.
Как SEO-специалист может повлиять на Суммарный вес своего сайта?
Прямое влияние осуществляется через максимизацию естественных поведенческих сигналов. Необходимо обеспечить, чтобы ваш сайт был наиболее полным и удобным ответом на соответствующие поисковые подсказки и имел максимально высокий CTR по ним в основной выдаче. Чем чаще пользователи выбирают ваш сайт, тем выше будет его Суммарный вес в системе Яндекса.
Что такое «Расширенное предложение» и что оно может содержать?
Это блок с информацией, который отображается в выпадающем списке саджеста. В патенте указано, что он может содержать контент, извлеченный из доминирующего ресурса, или Карточку Объекта. На практике это могут быть быстрые ссылки (sitelinks), контактная информация, форма входа или краткий фактический ответ.
Может ли этот механизм привести к росту Zero-Click поисков?
Да, это вполне вероятно. Если расширенное предложение содержит исчерпывающую информацию (например, номер телефона или краткий факт), пользователь может получить ответ прямо в саджесте и не перейти на сайт. Это нужно учитывать при разработке контентной стратегии и оптимизации под сущности.
Что происходит, если для префикса нет явного доминирующего ресурса?
Если система не может идентифицировать доминирующий ресурс (например, веса распределены равномерно между несколькими сайтами или W1 < W2), то, согласно патенту (Claim 22), система покажет стандартный список текстовых поисковых подсказок без расширенного предложения.
Используется ли машинное обучение в этой системе?
Да, в патенте упоминается (Claim 29), что алгоритм машинного обучения используется для установления связи между запросом, ресурсом и параметром вероятности (весом). Вероятно, это модель, которая обучается на логах поведения пользователей для предсказания вероятности клика (pClick).
Как система определяет, какой контент показать в расширенном предложении?
Контент (Данные отображения) извлекается из Третьей базы данных – Базы данных контента расширенных предложений (Claim 30, 31). Это означает, что Яндекс предварительно обрабатывает контент ресурсов, извлекает ключевую информацию или формирует Карточки Объектов и сохраняет их в готовом для показа виде. Система не парсит сайт в реальном времени.