Как Google использует сущности из текущей поисковой сессии для формирования подсказок (Auto-Complete)

Google отслеживает сущности (люди, места, медиа), упомянутые в недавних запросах пользователя в рамках одной сессии. При вводе нового запроса система предлагает подсказки, комбинируя стандартные шаблоны запросов (например, «погода в $городе») с этими контекстными сущностями. Это позволяет персонализировать автодополнение на основе текущего интереса пользователя.

Описание

Какую задачу решает

Патент решает задачу повышения релевантности и полезности поисковых подсказок (Auto-Complete или Suggested Search Query). Стандартные системы подсказок часто базируются на глобальной популярности запросов. Данное изобретение улучшает этот механизм за счет использования краткосрочного контекста — текущей поисковой сессии (search session). Цель — предсказать наиболее вероятный следующий запрос пользователя, основываясь на его недавних действиях и интересах.

Что запатентовано

Запатентована система генерации контекстно-зависимых поисковых подсказок. Система идентифицирует сущности (entities) из запросов, введенных пользователем в течение текущей сессии. Эти сущности сохраняются вместе с оценками релевантности (Relevance Scores). При получении нового запроса на подсказку система выбирает шаблоны запросов (Query Patterns) и заполняет их плейсхолдеры (например, $city, $song) наиболее релевантными сущностями из контекста сессии.

Как это работает

Система функционирует в реальном времени во время поисковой сессии:

Сбор контекста: При получении запроса система идентифицирует упомянутые в нем сущности и связанные с ними сущности (например, для группы — ее участников и песни).
Хранение: Эти сущности сохраняются в базе данных сессии (Intra-session database или buffer) с присвоением Relevance Score, который отражает их актуальность для текущего контекста.
Генерация подсказок: Когда пользователь начинает новый запрос (даже кликнув в пустую строку), система получает запрос на автодополнение.
Выбор шаблона и сущности: Система выбирает Query Pattern (например, «погода в $city«) и ищет в буфере сущность соответствующего типа ($city) с наивысшим Relevance Score.
Entity Extrapolation: Система также может определить, что пользователь выполняет серию запросов по списку (например, ищет песни из альбома подряд), и предложить следующий элемент из этого списка.

Актуальность для SEO

Высокая. Понимание контекста сессии (Session-based search) и краткосрочная персонализация являются ключевыми направлениями развития поисковых систем. Предсказание намерений пользователя на основе его непосредственных действий для улучшения пользовательского опыта активно используется Google.

Важность для SEO

Патент имеет среднее стратегическое значение для SEO (65/100). Он не описывает алгоритмы ранжирования веб-документов. Однако он критически важен для понимания того, как Google интерпретирует связи между сущностями и как формируется поисковый спрос. Поисковые подсказки напрямую влияют на поведение пользователей и формулировки запросов. Понимание этого механизма помогает оптимизировать контент под реальные паттерны поиска и улучшать видимость бренда в Auto-Complete.

Детальный разбор

Термины и определения

Auto-completion Generator (Генератор автодополнения): Компонент системы, отвечающий за генерацию подсказок на основе контекста сессии, базы шаблонов и базы сущностей.
Entity (Сущность): Идентифицируемый объект (человек, место, организация, медиа-контент и т.д.), который система извлекает из поисковых запросов.
Entity Database (База данных сущностей): Хранилище известных сущностей, их типов и взаимосвязей.
Entity-Based Biasing (Смещение на основе сущностей): Механизм предпочтения поисковых подсказок, которые включают сущности, недавно извлеченные из истории поиска сессии.
Entity Extrapolation (Экстраполяция сущностей): Механизм предсказания следующего запроса путем определения того, что предыдущие запросы относятся к элементам из определенного списка (predetermined list of entities), и предложения следующего элемента из этого списка.
Intra-session database / Buffer (База данных сессии / Буфер): Временное хранилище, содержащее набор сущностей (включая связанные сущности), извлеченных из текущей сессии, их типы и Relevance Scores.
Pattern Database (База данных шаблонов): Хранилище Query Patterns, извлеченных из логов поисковых запросов.
Placeholder Type / Entity Type (Тип плейсхолдера / Тип сущности): Категория сущности (например, $city, $song, $band, $singer), используемая в шаблонах запросов.
Query Pattern (Шаблон запроса): Структура запроса с плейсхолдерами для сущностей (например, «weather in $city» или «$song lyrics»).
Relevance Score (Оценка релевантности): Метрика, присваиваемая сущности в буфере сессии, указывающая на ее значимость в текущем контексте. Используется для выбора наилучшей сущности для подстановки в шаблон.
Search Session (Поисковая сессия): Последовательность запросов пользователя за короткий промежуток времени, используемая как источник контекста.
Suggested Search Query (Предложенный поисковый запрос): Поисковая подсказка или автодополнение (Auto-Complete).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод генерации подсказок на основе контекста сессии.

Система получает запрос на подсказку во время поисковой сессии.
В ответ на это:

Выбирается шаблон запроса (Query Pattern) из базы данных.
Идентифицируется сущность (Entity), связанная с одним или несколькими предыдущими запросами этой сессии.
Генерируется подсказка путем объединения выбранного шаблона и идентифицированной сущности.
Предоставляются данные для отображения этой подсказки в интерфейсе.

Claim 2 (Зависимый от 1): Детализирует процесс формирования контекста (расширение набора сущностей).

Идентифицируется набор сущностей, упомянутых в запросах сессии.
Для каждой сущности идентифицируются одна или несколько *связанных* с ней сущностей.
Набор расширяется за счет включения этих связанных сущностей.
Расширенный набор сохраняется в буфере (buffer). Сущность для подсказки выбирается из этого буфера.

Claim 3 (Зависимый от 2): Указывает на использование оценок.

Каждой сущности в расширенном наборе присваивается оценка релевантности (Relevance Score).

Claim 4 и 5 (Зависимые от 2): Описывают механизм сопоставления шаблона и сущности (Entity-Based Biasing).

Идентифицируется тип сущности, соответствующий типу плейсхолдера в выбранном шаблоне запроса.
Из буфера выбираются сущности, имеющие этот тип.
Из этого подмножества выбирается конкретная сущность на основе их Relevance Scores (выбирается наивысшая оценка).

Claim 9 (Зависимый от 1): Описывает механизм выбора шаблона на основе экстраполяции (Entity Extrapolation).

Идентифицируются недавние шаблоны запросов, введенные во время сессии.
Определяется, что эти шаблоны связаны с предопределенным списком сущностей (predetermined list of entities).
Выбирается шаблон запроса, который связан с этим списком.

Claim 10-12 (Зависимые от 9): Детализируют работу с упорядоченными списками.

Если список сущностей упорядочен (ordered list).
И определяется, что недавние шаблоны связаны с последовательными элементами (sequential items) в этом списке.
То идентификация сущности для подсказки заключается в идентификации следующего элемента (next entity) в этом списке.

Где и как применяется

Изобретение применяется исключительно на этапе взаимодействия с пользователем и понимания его намерений.

QUNDERSTANDING – Понимание Запросов

Интерпретация контекста: Система анализирует предыдущие запросы в рамках сессии для определения текущего контекста пользователя. Это включает извлечение сущностей и определение их взаимосвязей.
Генерация подсказок (Auto-Complete): Основное применение патента. Происходит в реальном времени, когда пользователь взаимодействует с поисковой строкой (Query Engine Front-End). Auto-completion Generator использует данные из Intra-session database для формирования персонализированных подсказок.

Взаимодействие компонентов:

Query Engine Front-End принимает запросы и запросы на автодополнение.
Intra-session database взаимодействует с Entity Database для идентификации сущностей и их связей, а также хранит контекст сессии.
Auto-completion Generator запрашивает данные из Intra-session database, Pattern Database и Entity Database для генерации финальных подсказок.

Входные данные:

История запросов текущей сессии.
Запрос на автодополнение (может быть пустым или содержать частичный запрос).
Данные из Entity Database и Pattern Database.

Выходные данные:

Список сгенерированных поисковых подсказок, отсортированных по релевантности контексту сессии.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на исследовательские сессии, где пользователь вводит серию связанных запросов (например, планирование путешествия, изучение творчества группы, сравнение продуктов).
Конкретные ниши или тематики: Влияет на тематики с хорошо определенными сущностями и связями: Медиа (музыка, фильмы), Путешествия (города, достопримечательности), Персоналии, E-commerce (бренды, продукты).

Когда применяется

Условия работы: Алгоритм работает во время активной поисковой сессии.
Триггеры активации: Запрос на автодополнение (клик в поисковую строку или ввод символов).
Условия срабатывания: Механизм применяется, если в Intra-session database есть релевантные сущности, которые можно сопоставить с доступными Query Patterns, или если обнаружена последовательность запросов, соответствующая списку (для экстраполяции).

Пошаговый алгоритм

Этап 1: Сбор и обработка контекста сессии (происходит непрерывно)

Получение запроса: Система получает запрос от пользователя (например, «Band-A»).
Идентификация сущностей: Система идентифицирует сущности в запросе (Entity: «Band-A», Type: $band).
Расширение набора сущностей: Система запрашивает Entity Database для поиска связанных сущностей (например, Entity: «Member#1», Type: $singer; Entity: «Dancing King», Type: $song).
Скоринг: Каждой сущности (исходной и связанной) присваивается Relevance Score на основе ее связи с текущим запросом, частоты упоминания в сессии и других факторов.
Хранение: Расширенный набор сущностей сохраняется в Intra-session database (буфере).

Этап 2: Генерация подсказок (при активации Auto-Complete)

Получение запроса на подсказку: Пользователь начинает новый запрос (например, вводит «D» или кликает в пустую строку).
Выбор механизма генерации: Система определяет, какой механизм использовать: Entity-Based Biasing или Entity Extrapolation.

Механизм A: Entity-Based Biasing

Выбор шаблонов: Система выбирает кандидатов Query Patterns из Pattern Database. Если введен частичный запрос, выбираются шаблоны, соответствующие началу ввода (например, «D» соответствует «$song lyrics»).
Сопоставление типов: Для плейсхолдеров в шаблонах (например, $song) система ищет сущности соответствующего типа в буфере сессии.
Выбор сущности: Из найденных сущностей выбираются те, у которых наивысший Relevance Score (например, «Dancing King»).
Генерация: Сущность подставляется в шаблон (например, «Dancing King lyrics»).

Механизм B: Entity Extrapolation

Анализ последовательности: Система анализирует недавние запросы и определяет, соответствуют ли они шаблону, связанному со списком (например, пользователь искал «A-Song lyrics», затем «B-Song lyrics»).
Идентификация списка: Определяется, что запросы относятся к упорядоченному списку (например, треклист альбома).
Предсказание следующего элемента: Система идентифицирует следующий элемент в списке («C-Song»).
Генерация: Генерируется подсказка с использованием того же шаблона и следующего элемента («C-Song lyrics»).

Этап 3: Предоставление результатов

Объединение и ранжирование: Сгенерированные подсказки ранжируются.
Отображение: Список подсказок отправляется в пользовательский интерфейс.

Какие данные и как использует

Данные на входе

Поведенческие факторы: История запросов в рамках текущей поисковой сессии (search history during a search session). Это основной источник контекста.
Системные данные (не зависящие от пользователя):
- Entity Database: Данные о сущностях, их типах ($city, $song и т.д.) и взаимосвязях между ними.
- Pattern Database: Шаблоны запросов (Query Patterns). Патент указывает, что эти шаблоны извлекаются офлайн из логов поисковых запросов (search query logs).

Какие метрики используются и как они считаются

Relevance Score: Ключевая метрика для оценки важности сущности в контексте сессии. Патент упоминает факторы, влияющие на эту оценку:
- Свежесть (Recency): Как недавно сущность была включена в запрос.
- Частота (Frequency): Как часто сущность упоминалась в течение сессии.
- Важность (Importance): Общая значимость сущности (например, на основе количества просмотров или кликов, полученных ресурсом, связанным с сущностью).
Оценки шаблонов (Pattern based scoring): Хотя явно не детализировано, система использует скоринг шаблонов для выбора наиболее подходящих Query Patterns.

Выводы

Краткосрочная персонализация Auto-Complete: Google активно использует контекст текущей поисковой сессии для персонализации поисковых подсказок. Система пытается предсказать следующий шаг пользователя, основываясь на его недавних действиях, а не только на глобальной популярности запросов.
Сущности как основа контекста: Контекст сессии определяется в первую очередь через извлеченные сущности (Entities) и их связи. Система не просто запоминает ключевые слова, а понимает, о каких объектах идет речь.
Расширение контекста через связи: Контекст включает не только сущности, явно упомянутые пользователем, но и связанные с ними (например, поиск группы добавляет в контекст ее песни). Это подчеркивает важность сильных и понятных связей в Графе Знаний.
Два режима генерации подсказок:
- Entity-Based Biasing: Подстановка релевантной контекстной сущности в популярный шаблон запроса.
- Entity Extrapolation: Предсказание следующего элемента в серии, если пользователь выполняет запросы по списку (особенно упорядоченному).
Важность структурированных списков: Механизм экстраполяции напрямую зависит от способности Google распознавать упорядоченные (ordered) и неупорядоченные (unordered) списки сущностей (например, треклисты альбомов, актеры фильма).
Зависимость от Query Patterns: Эффективность системы зависит от базы данных шаблонов, извлеченных из реальных логов запросов. Это показывает, как пользователи естественно формулируют запросы, связанные с разными типами сущностей.

Практика

Best practices (это мы делаем)

Оптимизация под Сущности (Entity Optimization): Ключевая задача — гарантировать, что ваш бренд, продукты, авторы и контент распознаются как сущности (попадание в Knowledge Graph). Это необходимое условие для того, чтобы система могла использовать их в качестве контекста сессии.
Укрепление связей между сущностями: Необходимо обеспечить четкие и понятные связи между связанными сущностями на сайте и вне его. Например, страница артиста должна явно ссылаться на альбомы, страница бренда — на категории продуктов. Это поможет Google включать связанные сущности в буфер сессии (Intra-session database).
Оптимизация под стандартные Query Patterns: Анализируйте, какие шаблоны запросов характерны для ваших сущностей (например, «[Бренд] отзывы», «[Фильм] актеры», «[Город] погода»). Создавайте контент, отвечающий на эти запросы, чтобы повысить вероятность ассоциации вашего сайта с этими паттернами.
Использование структурированных данных для списков: Для контента, представляющего собой списки (особенно упорядоченные), критически важно использовать микроразметку (например, ItemList с указанием position, MusicAlbum/MusicPlaylist). Это напрямую помогает механизму Entity Extrapolation распознавать последовательности (треки в альбоме, эпизоды в сезоне) и предлагать ваш контент в подсказках при серийном поиске.

Worst practices (это делать не надо)

Изолированный контент: Создание страниц, которые слабо связаны с основными сущностями сайта. Это затрудняет системе построение связей и включение контента в расширенный контекст сессии.
Нечеткая структура сайта: Запутанная навигация и перелинковка, которая не позволяет поисковым системам четко определить иерархию и взаимосвязи между сущностями (например, непонятно, какие продукты относятся к какому бренду).
Игнорирование микроразметки списков: Публикация упорядоченного контента (например, курсов, альбомов) в виде простого текста без структурной разметки снижает вероятность активации механизма Entity Extrapolation.

Стратегическое значение

Патент подтверждает стратегию Google «Entity-First». Понимание того, как Google идентифицирует сущности, определяет их типы и отслеживает связи между ними, критически важно не только для ранжирования, но и для управления видимостью в поисковых подсказках. Этот механизм показывает, что подсказки — это не просто список популярных ключевых слов, а результат сложного процесса интерпретации контекста и предсказания намерений пользователя, основанного на Графе Знаний.

Практические примеры

Сценарий: Оптимизация музыкального портала для Entity Extrapolation

Задача: Пользователи часто ищут тексты песен одного альбома подряд. Нужно добиться, чтобы Google предлагал следующий трек в подсказках.

Анализ (Как работает Google): Механизм Entity Extrapolation (Claims 9-12) определяет, что пользователь ищет элементы упорядоченного списка (ordered list) по шаблону (например, «$song lyrics $band«).
Действия SEO-специалиста:
- Убедиться, что группа, альбом и песни распознаются как сущности.
- На странице альбома реализовать разметку MusicAlbum.
- Внутри MusicAlbum использовать свойство track с разметкой ItemList.
- Для каждого элемента в ItemList (песни) обязательно указать свойство position (номер трека) и ссылку на страницу песни.
Ожидаемый результат: Когда пользователь ищет «Трек 1 текст [Группа]», а затем «Трек 2 текст [Группа]», при начале ввода следующего запроса Google с высокой вероятностью предложит в Auto-Complete «Трек 3 текст [Группа]», используя механизм экстраполяции.

Вопросы и ответы

Влияет ли этот патент на ранжирование сайтов в поисковой выдаче?

Нет, напрямую этот патент не описывает алгоритмы ранжирования (Ranking). Он описывает исключительно механизм генерации поисковых подсказок (Auto-Complete). Однако он оказывает косвенное влияние, так как подсказки формируют запросы пользователей и направляют трафик.

Что такое «Entity-Based Biasing» простыми словами?

Это механизм, который делает подсказки «умнее» за счет учета того, что вы искали только что. Если вы искали «Авиабилеты в Рим», а затем начинаете вводить «Погода в», система подставит «Рим» в подсказку, потому что сущность «Рим» (тип $city) сейчас наиболее актуальна для вас, даже если «Погода в Лондоне» глобально популярнее.

Что такое «Entity Extrapolation» и как это использовать в SEO?

Это предсказание следующего элемента в серии. Если пользователь ищет подряд элементы из списка (например, эпизоды сериала, уроки курса), система предложит следующий элемент. В SEO это используется путем четкого структурирования списочного контента, особенно с помощью микроразметки упорядоченных списков (ItemList с position), чтобы помочь Google распознать последовательность.

Как система определяет, какие сущности связаны с моим запросом?

Система использует Entity Database (вероятно, Knowledge Graph), где хранятся данные о сущностях и их взаимосвязях. Если вы ищете музыкальную группу, система знает ее участников и альбомы. Эти связанные сущности также загружаются в контекст сессии (Intra-session database) как потенциально релевантные для следующих запросов.

Что такое Relevance Score в контексте этого патента?

Это оценка того, насколько сущность важна для текущей сессии. Она зависит от того, как недавно и как часто пользователь упоминал эту сущность, а также от ее общей популярности. При генерации подсказки система выберет сущность с наивысшим Relevance Score, которая подходит под шаблон запроса.

Как SEO-специалисту повлиять на Query Patterns?

Напрямую повлиять на базу шаблонов Google нельзя, так как она формируется из анализа глобальных логов запросов. Однако можно анализировать существующие подсказки для ваших сущностей, чтобы понять, какие шаблоны уже использует Google (например, «[бренд] + отзывы», «[продукт] + купить»), и убедиться, что ваш контент оптимизирован под эти паттерны.

Работает ли этот механизм, если пользователь не ввел ни одного символа в строку поиска?

Да. Патент указывает (Claim 8), что запрос на подсказку может не содержать введенных символов (например, при клике в пустую строку поиска). В этом случае система все равно сгенерирует подсказки, основанные на контексте сессии, используя наиболее вероятные шаблоны и сущности с высоким Relevance Score.

Чем отличается упорядоченный список от неупорядоченного для этой системы?

Для неупорядоченного списка (например, актеры фильма) система может предложить любую еще не упомянутую сущность из списка. Для упорядоченного списка (например, треки альбома), если система обнаружила последовательный поиск, она предложит строго следующий элемент (next entity). Это критически важно для механизма экстраполяции.

Насколько долговременным является этот вид персонализации?

Описанная в патенте персонализация является краткосрочной. Она основана на данных, хранящихся в Intra-session database, которая отслеживает только текущую поисковую сессию. Она отличается от долговременной персонализации, основанной на общей истории аккаунта пользователя.

Какова главная рекомендация для SEO, исходя из этого патента?

Главная рекомендация — сосредоточиться на Entity Optimization. Необходимо добиться того, чтобы ваши ключевые объекты (бренд, продукты, контент) были четко распознаны как сущности и имели сильные, структурированные связи между собой (включая упорядоченные списки). Это фундамент для работы подобных контекстных механизмов.