Яндекс патентует метод генерации поисковых подсказок (саджеста), который учитывает точное положение курсора в строке ввода. В зависимости от того, где находится курсор (в начале, конце запроса или внутри слова), система предлагает разные действия: вставку, замену или удаление термина. Это позволяет пользователям быстрее модифицировать запрос, основываясь на популярных исторических данных поиска.
Описание
Какую задачу решает
Патент решает задачу повышения скорости и эффективности взаимодействия пользователя с поисковой системой на этапе формулирования и модификации запроса. Он устраняет ограничения традиционных систем поисковых подсказок (саджеста), которые обычно предлагают только завершение запроса (добавление слов в конец). Изобретение улучшает этот процесс, позволяя системе предлагать контекстно-зависимые модификации (вставка в начало/середину, замена или удаление терминов) в зависимости от того, где именно пользователь редактирует запрос.
Что запатентовано
Запатентована система генерации контекстно-зависимых поисковых подсказок, основанная на точном положении курсора в строке поиска. Суть изобретения заключается в маппинге конкретных положений курсора (например, «внутри термина») на предопределенные действия (Предложенные действия) — Вставка, Удаление, Замещение. Для каждого действия разработан соответствующий алгоритм, который генерирует подсказки, используя базу предыдущих поисковых запросов.
Как это работает
Система получает текущий текст запроса и положение курсора. Она определяет, соответствует ли это положение одному из предопределенных сценариев (например, «курсор внутри термина»). Если да, активируются связанные действия (например, Замещение и Удаление). Затем выполняются соответствующие Алгоритмы предложений. Например, Алгоритм замещения ищет в базе исторических запросов популярные запросы, совпадающие по структуре с текущим, но с другим термином на месте курсора. Результаты предлагаются пользователю как подсказки.
Актуальность для SEO
Высокая. Контекстно-зависимые интерфейсы и интеллектуальные подсказки критически важны для современных поисковых систем, особенно на мобильных устройствах, где набор и модификация текста затруднены. Описанный механизм представляет собой сложный и эффективный подход к улучшению пользовательского опыта (UX) на этапе формулирования запроса.
Важность для SEO
Влияние на SEO низкое (3/10). Это патент, описывающий механику пользовательского интерфейса (UI) поисковых подсказок (Саджест), а не алгоритмы ранжирования. Он не влияет напрямую на то, как сайт сканируется, индексируется или ранжируется. Однако он оказывает косвенное влияние, так как определяет, какие именно запросы пользователи в конечном итоге будут задавать. Понимание этого механизма подчеркивает важность анализа популярных шаблонов запросов и того, как пользователи модифицируют свои поиски.
Детальный разбор
Термины и определения
- Алгоритм предложений (Suggestion Algorithm)
- Логика, используемая для генерации подсказок для конкретного предложенного действия. Включает Алгоритм предложенной вставки, Алгоритм предложенного удаления и Алгоритм предложенного замещения.
- Полученный поисковый запрос (Received Search Query)
- Текущий текст, введенный пользователем в строку поиска.
- Предварительно определенные положения курсора (Predefined Cursor Positions)
- Набор конкретных позиций курсора, которые система распознает как триггеры. Включают: начало/конец запроса, начало/конец термина, внутри термина.
- Предложенное действие (Suggested Action)
- Тип модификации, предлагаемый пользователю. Включает: Вставку (Insertion), Удаление (Deletion) и Замещение (Substitution/Replacement).
- Предложенный поисковый запрос (Suggested Search Query)
- Сгенерированная поисковая подсказка (саджест).
- Предыдущие поисковые запросы (Previous Search Queries)
- Исторические данные (логи) о запросах, ранее введенных пользователями. Являются источником данных для генерации подсказок.
- Текущее положение курсора (Current Cursor Position)
- Точное местоположение курсора ввода относительно полученного поискового запроса.
- Указанный курсором термин (Cursor-indicated term)
- Термин в поисковом запросе, на который указывает курсор (находится сразу перед, сразу после или внутри него). Этот термин является объектом для действий Замещения или Удаления.
Ключевые утверждения (Анализ Claims)
Патент защищает метод генерации поисковых подсказок, который динамически меняет логику в зависимости от положения курсора.
Claim 1 (Независимый пункт): Описывает базовый механизм системы.
- Система получает поисковый запрос и текущее положение курсора относительно этого запроса.
- Система проверяет, является ли текущее положение одним из множества предварительно определенных положений курсора.
- Если да, то выполняется алгоритм предложения.
- Выбор алгоритма зависит от предварительно определенного предложенного действия (например, Вставка, Удаление, Замена), которое связано с этим конкретным положением курсора.
Система активно отслеживает местоположение курсора и использует предопределенное сопоставление (Положение → Действие → Алгоритм), чтобы генерировать контекстно-зависимые подсказки, соответствующие намерению пользователя редактировать запрос.
Claim 4 (Зависимый от 1 и 3): Детализирует маппинг (сопоставление) положений курсора и действий. Это ядро изобретения.
Определяются конкретные связи:
- Положение в начале запроса → Действие Вставки.
- Положение в конце запроса → Действия Вставки и Удаления.
- Положение в начале термина → Действие Вставки.
- Положение в конце термина → Действия Замещения и Удаления.
- Положение внутри термина → Действия Замещения и Удаления.
Эта матрица определяет логику системы. Например, если курсор внутри слова, система предполагает, что пользователь хочет либо заменить это слово, либо удалить его.
Claim 8 (Зависимый, детализация Алгоритма Вставки): Описывает логику генерации подсказок для вставки.
- Подсказка выбирается из множества предыдущих поисковых запросов.
- Критерий выбора: предыдущий запрос должен включать все термины текущего запроса ПЛЮС по меньшей мере один дополнительный термин.
Система использует исторические данные для поиска популярных способов, которыми пользователи расширяли текущий запрос.
Claim 9 (Зависимый, детализация Алгоритма Замещения): Описывает логику генерации подсказок для замены термина.
- Определяется «указанный курсором термин», а также части запроса до него («первая часть») и после него («вторая часть»).
- Подсказка выбирается из предыдущих запросов.
- Критерий выбора: предыдущий запрос должен содержать «первую часть» и «вторую часть», но между ними должен находиться термин, ОТЛИЧАЮЩИЙСЯ от «указанного курсором термина».
Система находит исторические запросы, где контекст (префикс и суффикс) такой же, но целевое слово отличается. Это выявляет синонимы или альтернативы, использованные другими пользователями.
Claim 10 (Зависимый, детализация Алгоритма Удаления): Описывает логику генерации подсказок для удаления термина.
- Определяется «указанный курсором термин», «первая часть» и «вторая часть».
- Указанный курсором термин удаляется для формирования предложенного запроса.
- Условие активации: это действие предлагается, только если в базе исторических запросов существует запрос, состоящий из «первой части», за которой сразу следует «вторая часть» (без указанного термина между ними).
Система предлагает удалить слово, только если пользователи исторически задавали тот же вопрос без этого слова.
Где и как применяется
Этот патент не применяется к основным слоям архитектуры поиска (CRAWLING, INDEXING, RANKING, BLENDER). Он функционирует на стыке пользовательского интерфейса и начального этапа обработки запроса.
QUERY PROCESSING – Понимание Запросов (Уровень UI/Suggest)
Основное место применения — система поисковых подсказок (Autocomplete/Suggest), которая активируется при взаимодействии пользователя со строкой поиска.
Взаимодействие компонентов:
- Поисковое приложение (Клиент/Браузер): Отслеживает ввод пользователя и положение курсора в реальном времени. Отправляет эти данные на сервер. Отображает полученные подсказки.
- Сервер (Модуль предложений 126): Получает данные от клиента. Анализирует положение курсора, определяет действие и выполняет соответствующий алгоритм.
- База данных предыдущих запросов (128): Источник данных для алгоритмов предложений. Хранит исторические логи запросов.
Входные данные: Текущий поисковый запрос (строка текста) и точное положение курсора в этой строке.
Выходные данные: Список предложенных поисковых запросов или их представлений (например, только вставляемые или заменяемые слова).
На что влияет
- Пользовательский опыт (UX): Основное влияние оказывается на удобство и скорость ввода/модификации запросов.
- Специфические запросы: Наиболее заметно влияние на многословные запросы и на процесс уточнения (refinement) запроса, когда пользователь возвращается к строке поиска для модификации.
- Типы контента и Ниши: Патент не содержит ограничений по тематикам, типам контента или географии. Механизм универсален и зависит только от наличия исторических данных о запросах в конкретной нише.
Когда применяется
Алгоритм активируется при взаимодействии пользователя со строкой поиска.
- Триггеры активации: Ввод символа или перемещение курсора в интерфейсе поисковых запросов.
- Условия работы: Алгоритм выполняется, только если текущее положение курсора соответствует одному из предварительно определенных положений (начало/конец запроса, начало/конец/середина термина).
- Частота применения: В реальном времени, потенциально после каждого изменения в строке поиска или положения курсора.
Пошаговый алгоритм
- Получение данных (420, 430): Пользователь взаимодействует со строкой поиска. Клиент отправляет на сервер текущий текст запроса и положение курсора.
- Анализ положения курсора: Сервер определяет, соответствует ли положение курсора одному из предопределенных (например, «Внутри термина»).
- Идентификация Действия: На основе положения курсора система определяет связанные с ним предложенные действия. Например, для «Внутри термина» это Замещение и Удаление (Claim 4).
- Идентификация Термина (если применимо): Определяется «Указанный курсором термин» (370), а также части запроса до («Первая часть» 372) и после («Вторая часть» 374) него.
- Выполнение Алгоритмов (440): Система выполняет алгоритмы для всех идентифицированных действий (Claims 5-7).
- Пример для Замещения (Claim 9): Поиск в базе исторических запросов шаблона + +.
- Пример для Удаления (Claim 10): Поиск в базе исторических запросов шаблона +.
- Фильтрация и Ранжирование Подсказок: Кандидаты, найденные на шаге 5, оцениваются. Выбор может основываться на частотности, истории пользователя, контексте, географии или семантической близости.
- Формирование Ответа: Система определяет формат представления подсказок (полный запрос или только модифицируемая часть).
- Отображение: Подсказки отправляются клиенту и отображаются в интерфейсе.
Какие данные и как использует
Данные на входе
- Контентные факторы (Текстовые): Текст текущего поискового запроса, введенного пользователем.
- Пользовательские факторы (Интерфейсные): Точное положение курсора относительно текста запроса. Это используется как сигнал о намерении пользователя редактировать запрос.
- Исторические данные (Ключевое): База данных Предыдущих поисковых запросов (логи поисковых запросов). Это основной источник для генерации контента подсказок.
- Дополнительные данные для ранжирования подсказок (Упомянуты в,): История поиска конкретного пользователя, история текущей поисковой сессии, географический регион поиска.
Какие метрики используются и как они считаются
Патент фокусируется на структурном анализе и сопоставлении шаблонов, а не на вычислении сложных метрик релевантности для основной логики.
- Структурный анализ запроса: Разбиение запроса на термины, определение «Указанного курсором термина», «Первой части» (Префикс) и «Второй части» (Суффикс) запроса.
- Сопоставление шаблонов (Pattern Matching): Ключевой механизм работы алгоритмов. Система ищет точные совпадения структурных шаблонов в базе исторических данных.
- Вставка: + (или другие паттерны вставки).
- Замена: + +.
- Удаление: +.
- Критерии отбора подсказок: Хотя формулы не приведены, в описании указано, что выбор финальных подсказок из найденных кандидатов может основываться на семантическом или контекстуальном сходстве, а также на исторических и географических факторах,. Вероятно, частотность запроса в логах является основным фактором.
Выводы
- Фокус на UI/UX, а не на ранжировании: Это патент исключительно об улучшении интерфейса поисковых подсказок (саджеста). Он не содержит информации об алгоритмах ранжирования сайтов в основной выдаче.
- Курсор как сигнал интента редактирования: Ключевая идея — использование положения курсора как сильного сигнала о намерении пользователя модифицировать запрос (вставить, удалить или заменить термин).
- Детерминированная логика действий: Система использует предопределенную матрицу (Claim 4), которая жестко сопоставляет положения курсора с конкретными действиями (Вставка, Замена, Удаление).
- Подсказки строго основаны на исторических данных: Все предложения берутся непосредственно из исторических логов поиска (Предыдущие поисковые запросы). Система не генерирует новые формулировки, а предлагает те, что уже использовались ранее.
- Анализ паттернов переформулировок: Механизмы замещения и удаления основаны на анализе того, как пользователи исторически переформулировали похожие запросы. Это дает косвенное понимание того, какие термины Яндекс считает взаимозаменяемыми (Замена) или опциональными (Удаление) в контексте запроса.
Практика
Best practices (это мы делаем)
Поскольку патент описывает UI/UX механику саджеста, а не ранжирование, прямых действий по оптимизации сайта из него не следует. Однако он дает важные инсайты для анализа семантики и поведения пользователей.
- Систематический анализ поисковых подсказок (Саджест): Необходимо признать, что Яндекс активно направляет пользователей к исторически популярным запросам. SEO-специалисты должны анализировать подсказки как надежный источник для сбора семантического ядра, отражающий реальный спрос.
- Изучение контекстных модификаций запросов: Используйте описанный в патенте механизм для исследования семантики. Вводите целевой запрос и перемещайте курсор в разные позиции (начало, середина, конец слов), чтобы увидеть, какие вставки, замены и удаления предлагает Яндекс. Это помогает выявить QBST фразы, синонимы и частые уточнения, которые необходимо учесть в контенте.
- Анализ префиксов и суффиксов (Алгоритм Вставки): Обращайте внимание на то, какие слова добавляются к вашим основным запросам в подсказках. Это указывает на ключевые уточнения и интенты (например, коммерческие добавки, характеристики, локации), которые необходимо покрыть.
Worst practices (это делать не надо)
- Игнорирование Саджеста при сборе семантики: Фокусироваться только на данных из Вордстата и игнорировать экосистему подсказок приведет к потере понимания реальных пользовательских путей и популярных формулировок.
- Фокус на редких или неестественных запросах: Продвижение по запросам, которые не встречаются в исторических данных (и, следовательно, не появятся в подсказках), становится менее приоритетным, так как система не будет направлять к ним пользователей.
Стратегическое значение
Патент демонстрирует, что Яндекс уделяет значительное внимание управлению путешествием пользователя еще до формирования финальной выдачи (SERP). Стратегически это подтверждает, что исторические данные о поведении (логи запросов) являются фундаментом для работы вспомогательных сервисов поиска. Для SEO это означает, что понимание реального спроса и популярных формулировок, отраженных в подсказках, является обязательным элементом долгосрочной стратегии и построения полной карты интентов.
Практические примеры
Сценарий: Исследование семантики для запроса «Купить квартиру Москва» с использованием механики патента
SEO-специалист имитирует поведение пользователя для анализа того, как Яндекс предлагает модифицировать запрос:
- Действие 1 (Вставка в начало):
- Что делать: Поставить курсор перед словом «Купить»: «|Купить квартиру Москва».
- Наблюдение (Логика патента): Активируется Алгоритм Вставки. Могут появиться подсказки вроде «Срочно», «Недорого».
- SEO-вывод: Это частые префиксы, указывающие на важные характеристики спроса, которые нужно учитывать при кластеризации.
- Действие 2 (Замена термина):
- Что делать: Поставить курсор внутри или в конце слова «квартиру»: «Купить квартиру| Москва».
- Наблюдение (Логика патента): Активируется Алгоритм Замены. Могут появиться подсказки «апартаменты», «студию», «вторичку».
- SEO-вывод: Это близкие сущности или синонимы в данном контексте. Необходимо рассмотреть создание отдельных страниц или упоминание этих терминов.
- Действие 3 (Удаление/Замена термина):
- Что делать: Поставить курсор в конце слова «Москва»: «Купить квартиру Москва|».
- Наблюдение (Логика патента): Активируются Алгоритмы Вставки, Удаления и (потенциально) Замены. Может появиться подсказка с удалением слова «Москва» (если запрос «Купить квартиру» популярен), заменой на «Подмосковье» или добавлением «ЦАО».
- SEO-вывод: Понимание географической широты и частых уточнений интента.
Вопросы и ответы
Влияет ли этот патент на алгоритмы ранжирования Яндекса?
Нет, напрямую не влияет. Патент описывает исключительно пользовательский интерфейс (UI) и опыт взаимодействия (UX) с поисковыми подсказками (саджестом). Он не содержит информации об алгоритмах ранжирования, индексации или оценки качества сайтов. Он влияет на то, как пользователи формируют свои запросы, но не на то, как эти запросы обрабатываются для ранжирования документов.
В чем основное отличие описанного метода от стандартных поисковых подсказок?
Стандартные подсказки обычно предлагают только завершение запроса (добавление слов в конец). Описанный метод является контекстно-зависимым: он анализирует положение курсора и предлагает разные типы действий. Например, если курсор в середине запроса, система предложит вставить слово, заменить текущее слово или удалить его, а не просто дописать что-то в конец.
Откуда система берет варианты для этих подсказок?
Согласно патенту, источником данных является исключительно база данных «Предыдущих поисковых запросов» (исторические логи поиска). Система не генерирует новые формулировки на лету, а ищет совпадения по шаблонам (префикс, суффикс, наличие/отсутствие термина) в истории поиска других пользователей.
Что такое «Предложенные действия» (Вставка, Удаление, Замена)?
Это три типа модификаций, которые система может предложить. Вставка предлагает добавить новый термин в позицию курсора. Удаление предлагает убрать термин, на который указывает курсор. Замена предлагает заменить термин, на который указывает курсор, альтернативным термином из исторических данных. Выбор действия строго зависит от положения курсора (Claim 4).
Какова практическая польза этого патента для SEO-специалиста?
Основная польза — это понимание того, как Яндекс направляет пользователей при уточнении запросов. Анализируя подсказки, которые появляются при разных положениях курсора (как описано в патенте), можно выявить, какие термины Яндекс считает взаимозаменяемыми (предложения Замены), какие являются частыми уточнениями (предложения Вставки). Это помогает лучше понять интент и построить более полные семантические кластеры.
Может ли этот механизм помочь в понимании семантических связей между терминами?
Да, косвенно. Механизм Замещения (Claim 9) основан на поиске исторических запросов, где один термин был заменен другим при сохранении остального контекста запроса. Если система часто предлагает замену Термина А на Термин Б, это свидетельствует о сильной исторической связи или взаимозаменяемости этих терминов в глазах пользователей.
Как система решает, какую именно подсказку показать, если найдено много вариантов в истории?
Патент не детализирует формулу ранжирования подсказок, но упоминает факторы, которые могут использоваться для выбора,. К ним относятся история поиска конкретного пользователя, история текущей поисковой сессии, географический регион, а также семантическое или контекстуальное сходство. Вероятно, частотность запроса в логах является доминирующим фактором.
Может ли система предложить удалить слово, если такой запрос никогда не задавался?
Нет. Согласно Claim 10, действие Удаления активируется только при условии, что в базе исторических данных существует хотя бы один запрос, который соответствует текущему запросу без удаляемого термина. Если пользователи никогда не пропускали этот термин в данном контексте, система его удаление не предложит.
Связан ли этот механизм с семантическими технологиями Яндекса (например, YATI)?
Нет, в патенте не описано использование тяжелых языковых моделей или векторных представлений для основной логики генерации этих подсказок. Описанный механизм основан на детерминированном сопоставлении шаблонов в исторических логах и анализе положения курсора. Это скорее инфраструктурное и интерфейсное решение.
Применяется ли этот механизм в мобильном поиске?
Да, и он особенно важен для мобильного поиска. В патенте упоминается, что система может отображать подсказки в сокращенном виде для экономии места на экранах портативных устройств. Такие контекстные подсказки значительно упрощают редактирование запроса на мобильных устройствах.