Google генерирует поисковые подсказки, используя шаблоны, полученные из общих паттернов запросов (например, «рестораны в [городе]»). Этот патент подробно описывает, как Google выбирает, какую сущность (например, конкретный город или бренд) вставить в шаблон, отдавая приоритет персонализации на основе текущего местоположения пользователя, истории поиска и личных документов, а также общей популярности сущности.
Описание
Какую задачу решает
Патент решает задачу генерации релевантных и персонализированных поисковых подсказок (Query Suggestions) для пользователей по мере ввода ими частичного запроса (Partial Query). Система стремится предсказать намерение пользователя, предлагая завершенные запросы, которые не только синтаксически соответствуют вводу, но и семантически и контекстуально релевантны для конкретного пользователя в данный момент времени и в данном месте.
Что запатентовано
Запатентована система использования шаблонов запросов (Query Templates) для генерации поисковых подсказок, с акцентом на методы выбора сущностей (Entities) для заполнения этих шаблонов. Ядром изобретения является персонализация выбора сущности на основе контекста пользователя, в частности, его текущего местоположения (Current Location) и информации из его личных документов (User Documents) или истории.
Как это работает
Система работает в двух режимах: офлайн и онлайн.
Офлайн (Генерация шаблонов): Система анализирует логи прошлых запросов, чтобы найти общие паттерны, где меняется только сущность определенной категории (Entity Category). Например, «bike shops in Los Angeles» и «bike shops in San Diego» приводят к шаблону «bike shops in [city]». Эти шаблоны затем ранжируются (Ranking) на основе их частотности, разнообразия используемых сущностей и других критериев качества.
Онлайн (Генерация подсказок): Когда пользователь вводит частичный запрос, система идентифицирует подходящие шаблоны. Затем она выбирает, какие сущности подставить в шаблон. Этот выбор критически зависит от популярности сущности, совпадения префикса (если пользователь начал вводить сущность) и, что ключевое в этом патенте, от персонализации: предпочтение отдается сущностям, близким к текущему местоположению пользователя или упомянутым в его истории/документах.
Актуальность для SEO
Высокая. Поисковые подсказки (Google Autocomplete) являются фундаментальной частью пользовательского опыта. Персонализация и локализация результатов и подсказок остаются ключевыми направлениями развития поиска. Механизмы, основанные на сущностях и Knowledge Graph, активно используются для понимания запросов, что делает этот патент крайне актуальным для понимания работы современных поисковых систем.
Важность для SEO
Патент имеет высокое значение для SEO, особенно в области оптимизации сущностей (Entity Optimization) и локального поиска. Он раскрывает механизмы, влияющие на видимость бренда, продукта или локации в поисковых подсказках. Понимание того, что местоположение и персонализация (наряду с популярностью) определяют выбор сущности для подсказки, дает четкие направления для стратегий по увеличению охвата через Google Suggest.
Детальный разбор
Термины и определения
- Entity (Сущность)
- Объект реального мира (человек, место, концепция, вещь), который система может идентифицировать и различить. Хранится в базе данных сущностей (например, Knowledge Graph).
- Entity Category (Категория сущностей)
- Группа сущностей, имеющих общие признаки (например, [city], [film], [animal]).
- Entity Alias (Псевдоним сущности)
- Текстовое представление сущности. Одна сущность может иметь несколько псевдонимов (например, «Los Angeles», «LA», «City of Angels»).
- Partial Query (Частичный запрос)
- Запрос, введенный пользователем до того, как он указал на его завершенность (например, нажал Enter).
- Query Suggestion (Поисковая подсказка)
- Предложение завершенного запроса, предоставляемое пользователю в ответ на частичный запрос.
- Query Template (Шаблон запроса)
- Структура, включающая фиксированные термины и идентификатор категории сущностей (например, «restaurants in [city]»). Генерируется на основе анализа прошлых запросов.
- Template Generator (Генератор шаблонов)
- Компонент системы, отвечающий за офлайн-создание и ранжирование шаблонов запросов на основе логов.
- Query Suggestion Engine (Движок поисковых подсказок)
- Компонент системы, отвечающий за генерацию подсказок в реальном времени на основе частичного запроса и шаблонов.
- Cohesiveness (Связность/Когезивность)
- Метрика, используемая при ранжировании шаблонов, отражающая степень сходства между сущностями внутри одной категории. Высокая связность предпочтительна.
- Distributional Similarity (Распределительное сходство)
- Метрика для ранжирования шаблонов. Сравнивает распределение частот сущностей в запросах, соответствующих шаблону, с их распределением в более широком наборе запросов.
Ключевые утверждения (Анализ Claims)
Патент US10635717B2 является продолжением (continuation) более ранних заявок. Его формула изобретения фокусируется на персонализации при выборе сущности для заполнения шаблона.
Claim 1 (Независимый пункт): Описывает метод генерации подсказок с учетом местоположения пользователя.
- Система идентифицирует частичный запрос пользователя.
- Система идентифицирует Current Location пользователя в момент ввода запроса.
- Идентифицируется подходящий Query Template (состоящий из терминов и Entity Category).
- Генерируется подсказка:
- Определяются несколько псевдонимов (Entity Aliases) из этой категории.
- Из них выбирается конкретный псевдоним сущности на основе Current Location пользователя.
- Подсказка формируется путем объединения терминов шаблона и выбранного псевдонима.
- Подсказка предоставляется пользователю.
Claim 6 (Независимый пункт): Описывает метод генерации подсказок с учетом персональных данных пользователя.
- Система идентифицирует частичный запрос.
- Идентифицируется подходящий Query Template (на основе совпадения терминов частичного запроса с терминами шаблона).
- Генерируется подсказка:
- Определяются несколько псевдонимов из соответствующей категории.
- Из них выбирается конкретный псевдоним на основе информации из одного или нескольких User Documents, связанных с пользователем (в описании патента упоминаются электронные письма, история навигации, данные приложений).
- Подсказка формируется путем объединения терминов шаблона и выбранного псевдонима.
- Подсказка предоставляется пользователю.
Claim 13 (Независимый пункт): Описывает систему (System Claim), аналогичную Claim 1, но добавляет дополнительный критерий выбора псевдонима.
Система генерирует подсказку, выбирая Entity Alias на основе двух факторов: Current Location пользователя И одного или нескольких символов частичного запроса (т.е. префикса сущности, который пользователь начал вводить).
Где и как применяется
Изобретение затрагивает несколько этапов работы поисковой системы, тесно интегрируясь с инфраструктурой обработки сущностей.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит извлечение и категоризация сущностей (Knowledge Graph). Для работы системы необходимо хранить данные о сущностях: их категории, псевдонимы, географические координаты (для локализации) и показатели популярности (Popularity Measure).
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента, который включает два процесса:
- Офлайн-процесс (Template Generation): Template Generator анализирует логи запросов (Content Database), идентифицирует паттерны, связывает их с Entity Categories и рассчитывает ранжирование (Ranking) для созданных шаблонов.
- Онлайн-процесс (Query Suggestion Generation): Query Suggestion Engine в реальном времени обрабатывает Partial Query, находит соответствующие шаблоны и выбирает наиболее релевантные сущности для заполнения шаблонов, используя контекстные сигналы (местоположение, история пользователя).
Входные данные (Онлайн):
- Частичный запрос (Partial Query).
- Текущее местоположение пользователя (Current Location).
- Данные пользователя (история поиска, User Documents).
- База данных шаблонов запросов с их ранжированием.
- База данных сущностей (категории, псевдонимы, популярность).
Выходные данные (Онлайн):
- Список ранжированных поисковых подсказок (Query Suggestions).
На что влияет
- Конкретные типы контента и ниши: Наибольшее влияние оказывается на запросы, связанные с четко определенными сущностями: локальный бизнес (рестораны, магазины), медиа (фильмы, книги), бренды, продукты, персоналии.
- Специфические запросы: Влияет на запросы, имеющие четкую структуру, которую можно шаблонизировать (например, «[продукт] отзывы», «[бренд] часы работы», «рестораны в [городе]»).
- Локальные страницы: Критически влияет на локальный поиск, так как местоположение пользователя напрямую определяет выбор сущности в подсказках.
Когда применяется
- Триггеры активации: Активируется в момент ввода пользователем Partial Query в строку поиска.
- Условия работы: Применяется, когда система может сопоставить частичный запрос с одним или несколькими предварительно сгенерированными Query Templates высокого ранга, ИЛИ когда система распознает сущность в запросе и находит шаблоны, связанные с категорией этой сущности.
Пошаговый алгоритм
Процесс А: Генерация и ранжирование шаблонов (Офлайн)
- Идентификация категории сущностей: Система определяет категорию (например, [city]).
- Идентификация псевдонимов: Составляется список псевдонимов для сущностей этой категории.
- Анализ логов запросов: Идентифицируется группа прошлых запросов, которые содержат один из псевдонимов И общие совпадающие термины (допускается мягкое совпадение, игнорирование стоп-слов, каноникализация).
- Определение шаблона: Формируется Query Template, включающий совпадающие термины и идентификатор категории (например, «bike shops in [city]»).
- Ранжирование шаблона: Рассчитывается оценка качества шаблона на основе нескольких критериев:
- Количество прошлых запросов, соответствующих шаблону.
- Количество уникальных сущностей категории, которые встречались в этих запросах.
- Связность (Cohesiveness) категории сущностей.
- Распределительное сходство (Distributional Similarity) частот сущностей в шаблоне по сравнению с общим корпусом запросов.
- Валидация и сохранение: Если ранжирование превышает порог, шаблон сохраняется как валидный.
Процесс Б: Генерация поисковых подсказок (Онлайн)
- Получение данных: Система получает Partial Query, Current Location пользователя и доступ к его данным (User Documents/History).
- Идентификация шаблона: Система ищет подходящие Query Templates. Это может происходить двумя путями:
- Сопоставление терминов частичного запроса с терминами шаблона (например, «restaurants i» соответствует «restaurants in [city]»).
- Идентификация сущности в частичном запросе, определение ее категории и поиск шаблонов для этой категории (например, в «snow white actors» распознается [film] и ищется шаблон «[film] actors»).
- Идентификация кандидатов сущностей: Определяется список сущностей из соответствующей категории.
- Фильтрация кандидатов (Необязательно): Если частичный запрос содержит префикс сущности (например, «restaurants in s»), список фильтруется по этому префиксу.
- Выбор и ранжирование сущностей: Сущности ранжируются для заполнения шаблона. Приоритет определяется на основе:
- Персонализации по местоположению: Сущностям, близким к Current Location пользователя, дается повышение (Claim 1, 13).
- Персонализации по данным: Сущностям, упомянутым в User Documents или истории поиска, дается повышение (Claim 6).
- Популярности: Более популярным сущностям дается повышение.
- Формирование подсказок: Выбранные сущности (их псевдонимы) подставляются в шаблон для формирования Query Suggestions.
- Финальное ранжирование подсказок: Подсказки ранжируются на основе ранга шаблона и ранга выбранной сущности.
- Предоставление результатов: Список подсказок отправляется пользователю.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Логи прошлых запросов (past queries) используются для офлайн-генерации и ранжирования шаблонов. История поиска пользователя и данные из User Documents (электронная почта, история навигации) используются для персонализации подсказок в реальном времени.
- Географические факторы: Текущее местоположение пользователя (Current Location) используется как ключевой сигнал для выбора локальных сущностей при генерации подсказок.
- Данные о сущностях (Системные): База данных сущностей (Knowledge Graph), включающая Entity Categories, Entity Aliases, показатели популярности сущностей и их географические координаты.
Какие метрики используются и как они считаются
Для ранжирования шаблонов (Офлайн):
- Count of occurrences (Частотность): Количество прошлых запросов, соответствующих шаблону.
- Number of unique entities (Разнообразие сущностей): Количество уникальных сущностей из категории, которые использовались в запросах, соответствующих шаблону. Может использоваться как абсолютное число или процент от общего числа сущностей в категории.
- Cohesiveness (Связность категории): Метрика сходства между сущностями в категории. Методы расчета не детализированы, но указывается, что более схожие сущности дают более высокий балл.
- Distributional Similarity (Распределительное сходство): Сравнение распределения частот сущностей в рамках шаблона с их распределением в общем корпусе запросов. Используются статистические методы, такие как тест согласия (goodness-of-fit test), хи-квадрат (chi-squared analysis) или методы на основе энтропии (entropy-based methods).
Для ранжирования подсказок (Онлайн):
- Template Ranking (Ранг шаблона): Предварительно рассчитанная оценка качества шаблона.
- Entity Popularity (Популярность сущности): Мера общей популярности сущности (например, на основе частоты в запросах).
- Location Proximity (Близость местоположения): Оценка близости сущности к Current Location пользователя.
- User Affinity (Аффинити пользователя): Оценка связи пользователя с сущностью на основе его истории и документов.
Выводы
- Подсказки основаны на шаблонах и сущностях: Google активно использует структурированный подход к генерации подсказок, опираясь на предварительно созданные шаблоны, связанные с категориями сущностей (Knowledge Graph). Это не простое сопоставление текста, а семантический процесс.
- Персонализация является ключевым фактором выбора сущности: Патент четко определяет, что при заполнении шаблона (например, выборе города для «рестораны в [городе]») система отдает приоритет персонализации. Текущее местоположение пользователя и его личные данные (история, документы) являются определяющими сигналами.
- Важность офлайн-оценки качества шаблонов: Система использует сложные метрики для оценки качества шаблонов (Template Ranking), включая частотность, разнообразие сущностей и распределительное сходство. Это гарантирует, что используются только полезные и репрезентативные шаблоны.
- Популярность сущности как базовый сигнал: Помимо персонализации, общая популярность (Entity Popularity) сущности влияет на вероятность ее появления в подсказках.
- Значение псевдонимов (Aliases): Система использует Entity Aliases для сопоставления с прошлыми запросами и для формирования текста подсказки. Наличие разнообразных и популярных псевдонимов важно для распознавания сущности.
Практика
Best practices (это мы делаем)
- Оптимизация сущностей (Entity Optimization) и интеграция с Knowledge Graph: Убедитесь, что ваш бренд, продукты, ключевые персоны и локации четко определены как сущности в понимании Google. Используйте согласованные данные (NAP), микроразметку Schema.org и поддерживайте актуальность профилей (например, Google Business Profile), чтобы система корректно определяла Entity Category и Entity Aliases.
- Усиление локальных сигналов (для локального SEO): Поскольку Current Location является ключевым фактором (Claim 1, 13), необходимо максимизировать связь сущности с ее географическим положением. Это подтверждает важность стандартных практик локального SEO: локальный контент, локальные ссылки, гео-тегирование и работа с GBP.
- Повышение популярности и узнаваемости сущности: Entity Popularity влияет на выбор сущности для подсказки. Работайте над повышением общей известности бренда и частоты его упоминаний в сети и в запросах пользователей. Это комплексная задача, включающая PR, контент-маркетинг и традиционное SEO.
- Управление псевдонимами (Alias Management): Идентифицируйте все релевантные псевдонимы вашей сущности и последовательно используйте наиболее популярные из них. Это повышает вероятность того, что система свяжет различные варианты написания с вашей сущностью при генерации шаблонов и подсказок.
- Анализ шаблонов запросов в нише: Изучайте поисковые подсказки, чтобы выявить распространенные Query Templates в вашей тематике (например, «[бренд] vs», «[продукт] цена»). Оптимизируйте контент под эти шаблоны, чтобы повысить релевантность вашего сайта для этих структур запросов.
Worst practices (это делать не надо)
- Игнорирование оптимизации сущностей: Фокус только на ключевых словах без работы над представлением компании как сущности снижает видимость в системах, основанных на шаблонах и Knowledge Graph.
- Манипуляции с поисковыми подсказками: Попытки искусственно накрутить частотность запросов с целью повлиять на генерацию шаблонов или повысить популярность сущности могут быть неэффективны из-за сложных механизмов ранжирования шаблонов (например, Distributional Similarity) и могут привести к санкциям.
- Несогласованные данные о сущности (NAP): Расхождение в адресах, названиях и других атрибутах затрудняет идентификацию сущности и ее псевдонимов, что негативно сказывается на ее использовании в шаблонах, особенно локальных.
Стратегическое значение
Этот патент подтверждает стратегический переход Google от текстового анализа к семантическому пониманию, основанному на сущностях и их взаимосвязях. Для SEO это означает, что управление репутацией и представлением сущности (Entity Management) становится не менее важным, чем традиционная оптимизация страниц. Кроме того, патент подчеркивает неизбежность персонализации и локализации поиска: выдача и подсказки для двух разных пользователей по одному и тому же запросу могут кардинально отличаться в зависимости от их контекста.
Практические примеры
Сценарий 1: Локальная кофейня (Использование Location)
- Задача: Повысить видимость новой кофейни «Bean Scene» в Сан-Диего в поисковых подсказках.
- Механизм (Claim 1): Пользователь вводит «кофейни рядом». Система использует шаблон «[business type] [location/near me]».
- Действие SEO: Кофейня максимально оптимизирует свой Google Business Profile, получает локальные цитирования и упоминания, связывая сущность «Bean Scene» с локацией «Сан-Диего».
- Результат: Когда пользователь, находящийся в Сан-Диего (Current Location), вводит «кофейни рядом», система использует локацию пользователя для выбора релевантной сущности. Благодаря сильным локальным сигналам и близости к пользователю, подсказка «Bean Scene кофейня» имеет больше шансов появиться, чем подсказка о более популярной, но далекой кофейне.
Сценарий 2: Бренд электроники (Использование Popularity и Aliases)
- Задача: Убедиться, что при поиске отзывов пользователи видят подсказки, связанные с брендом «ElectroX».
- Механизм: Система использует популярный шаблон «[brand] reviews». Выбор бренда зависит от Entity Popularity и совпадения префикса.
- Действие SEO: Компания проводит PR-кампанию для повышения узнаваемости бренда «ElectroX» и активно использует этот псевдоним (Alias) на сайте и во внешних материалах.
- Результат: По мере роста популярности бренда, когда пользователи вводят «Electro», система с большей вероятностью предложит подсказку «ElectroX reviews», а не общий запрос «electronics».
Вопросы и ответы
Как система генерирует шаблоны запросов (Query Templates)?
Шаблоны генерируются офлайн путем анализа логов прошлых запросов. Система ищет группы запросов, которые имеют общие термины и различаются только сущностью из определенной категории (Entity Category). Например, «погода в Москве» и «погода в Париже» приводят к созданию шаблона «погода в [городе]».
Насколько важен ранг шаблона (Template Ranking) и как он рассчитывается?
Ранг шаблона критически важен; он определяет, будет ли шаблон использоваться для генерации подсказок. Он рассчитывается на основе нескольких факторов: общей частотности запросов, соответствующих шаблону, количества уникальных сущностей, которые использовались в этих запросах, связности (Cohesiveness) категории сущностей и распределительного сходства (Distributional Similarity) частот сущностей.
Что такое «Связность категории» (Cohesiveness) и почему она важна?
Связность измеряет, насколько похожи сущности внутри одной категории. Например, категория [Президенты США] имеет высокую связность, а категория [Темы фильмов] – низкую. Система предпочитает шаблоны с категориями высокой связности, так как они с большей вероятностью генерируют полезные и предсказуемые подсказки.
Как именно патент предлагает персонализировать подсказки?
Патент описывает два основных метода персонализации при выборе сущности для заполнения шаблона. Первый – на основе текущего местоположения пользователя (Current Location) (Claim 1, 13). Второй – на основе информации из личных документов пользователя (User Documents), таких как электронная почта или история браузера (Claim 6).
Как это влияет на локальное SEO?
Влияние очень велико. Поскольку текущее местоположение пользователя является приоритетным сигналом для выбора сущности, система будет активно предлагать локальные бизнесы и места, близкие к пользователю. Это подчеркивает необходимость сильных локальных сигналов и оптимизации Google Business Profile для появления в локализованных подсказках.
Влияет ли популярность бренда на его появление в подсказках?
Да, влияет. При выборе сущности для заполнения шаблона система учитывает общую популярность сущности (Entity Popularity). Более известные и часто запрашиваемые бренды, продукты или места имеют больше шансов быть выбранными, при прочих равных условиях.
Какова роль псевдонимов (Entity Aliases) в этом процессе?
Псевдонимы критически важны. Они используются для идентификации сущностей в логах запросов при генерации шаблонов и для формирования текста самой подсказки. Наличие у сущности четких, популярных и разнообразных псевдонимов увеличивает ее шансы быть распознанной и использованной системой подсказок.
Может ли система создать шаблон на основе одного запроса?
Да, в патенте упоминается возможность определения шаблона на основе одного запроса. Например, система может проанализировать запрос «bike shops in san diego», определить, что «san diego» относится к категории [city], и сгенерировать шаблон «bike shops in [city]». Однако для валидации и получения высокого ранга шаблона обычно требуется анализ множества запросов.
Как SEO-специалист может повлиять на этот процесс?
Ключевое направление – это оптимизация сущностей (Entity Optimization). Необходимо обеспечить четкое представление вашего бренда/бизнеса в Knowledge Graph, управлять псевдонимами, повышать общую популярность сущности и усиливать локальные сигналы. Это гарантирует, что система распознает вашу сущность и будет считать ее релевантным кандидатом для заполнения шаблонов.
Учитывает ли система мягкое совпадение (soft matching) при анализе запросов?
Да. При идентификации запросов, соответствующих шаблону, система может использовать мягкое совпадение. Это включает игнорирование стоп-слов (например, «a», «of», «in»), каноникализацию (приведение к стандартной форме или числу) и игнорирование порядка слов в некоторых случаях.