Как Google использует граф сущностей для генерации расширенных географических подсказок в реальном времени

Google использует механизм для генерации расширенных поисковых подсказок (Expanded Query Suggestions), особенно в географическом поиске. Система идентифицирует сущности, соответствующие введенному префиксу, а затем обходит граф связанных сущностей (Entity Graph), чтобы предложить релевантные подсказки, которые не начинаются с этого префикса. Это позволяет предлагать конкретные места или бизнесы (например, «MoMA New York» на запрос «new y»), основываясь на географических, категорийных и популярных связях между сущностями.

Описание

Какую задачу решает

Патент решает задачу улучшения качества и релевантности поисковых подсказок в системах интерактивного картографирования (например, Google Maps). Стандартные системы автодополнения предлагают только те запросы, которые начинаются с префикса, введенного пользователем. Данное изобретение позволяет системе предлагать Expanded Query Suggestions (расширенные предложения запросов), которые семантически или географически связаны с тем, что ищет пользователь, но не обязательно содержат введенный префикс. Это улучшает пользовательский опыт, сокращает время поиска и помогает обнаруживать релевантные географические объекты и бизнесы.

Что запатентовано

Запатентована система генерации расширенных географических поисковых подсказок в реальном времени. Система использует две ключевые структуры данных: Trie (префиксное дерево) для быстрого поиска сущностей, соответствующих введенному тексту, и Graph (граф сущностей), который моделирует отношения между географическими объектами, бизнесами и категориями. Суть изобретения заключается в обходе этого графа для идентификации связанных сущностей (например, популярного места в городе), даже если название этой сущности не начинается с введенного пользователем текста.

Как это работает

Система работает следующим образом:

Индексация: Все префиксы названий сущностей индексируются в Trie. Каждый узел Trie связан с соответствующими узлами в Graph сущностей.
Ввод запроса: По мере ввода символов система перемещается по Trie.
Идентификация сущностей: Система находит все сущности (узлы графа), соответствующие текущему префиксу.
Расширение (Expansion): Система обходит связи в графе от найденных сущностей к связанным сущностям (кандидатам). Эти связи могут быть основаны на географическом вложении (containment), близости (proximity) или категории (category relationship).
Фильтрация: Кандидаты фильтруются. Например, отбрасываются те, которые не сужают область поиска (например, предложение «США» для запроса «Mountain View») или находятся слишком далеко от текущей области просмотра карты (viewport).
Ранжирование и показ: Оставшиеся кандидаты оцениваются (скоринг), и лучшие из них предлагаются пользователю как Expanded Query Suggestions.

Актуальность для SEO

Высокая. Механизмы автодополнения являются критически важной частью пользовательского интерфейса поиска, особенно в мобильных и картографических сервисах. Генерация подсказок на основе сущностей и их взаимосвязей (Knowledge Graph) активно используется и развивается Google для обеспечения более точного и быстрого доступа к информации. Описанные принципы лежат в основе современного локального поиска и систем рекомендаций.

Важность для SEO

Патент имеет высокое значение (8/10), особенно для Локального SEO и оптимизации сущностей (Entity Optimization). Хотя он напрямую не описывает алгоритмы ранжирования органической выдачи, он раскрывает механизмы, с помощью которых Google интерпретирует и связывает географические сущности, бизнесы и категории. Понимание того, как работает этот граф и как формируются связи (в том числе на основе логов запросов), критически важно для обеспечения видимости бизнеса в поисковых подсказках, что напрямую влияет на трафик и поведение пользователей.

Детальный разбор

Термины и определения

Client Device (Клиентское устройство): Устройство (компьютер, смартфон, планшет), используемое пользователем для взаимодействия с интерактивной картографической системой.
Containment Relationship (Отношение вложенности): Связь между двумя сущностями в графе, указывающая, что одна сущность географически содержится внутри другой (например, город внутри страны).
Entity (Сущность): Объект, представленный узлом в графе. Может включать географические объекты (страны, города, улицы), конкретные места (бизнесы, достопримечательности, остановки транспорта), а также категории и подкатегории (отели, рестораны).
Expanded Query Suggestion (Расширенное предложение запроса): Поисковая подсказка, предложенная системой, которая релевантна запросу пользователя, но не обязательно начинается с введенного пользователем префикса.
Graph (Граф): Структура данных, состоящая из узлов (Nodes), представляющих сущности, и связей (Links), представляющих отношения между ними (например, containment, proximity, category).
Interactive Mapping System (Интерактивная картографическая система): Система (например, Google Maps), предоставляющая картографические данные и функциональность поиска по ним.
Node (Узел): Элемент в структуре данных Graph или Trie.
Prefix (Префикс): Начальная последовательность символов строки. Например, «new y» является префиксом «New York».
Proximity Relationship (Отношение близости): Связь между двумя сущностями в графе, указывающая на их физическую близость в пределах определенного порога расстояния.
Query Logs (Логи запросов): Хранилище ранее выполненных поисковых запросов. Используется для определения популярных запросов и выявления связей между сущностями.
Trie (Префиксное дерево): Древовидная структура данных для хранения строк, где узлы-потомки содержат строки, начинающиеся со строки, хранящейся в родительском узле. Используется для быстрого индексирования и поиска префиксов.
Viewport (Область просмотра): Текущая географическая область, отображаемая на карте в интерфейсе пользователя.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления расширенных подсказок.

Система получает один или несколько символов, введенных в интерфейс.
Идентифицируется узел в графе (identified node) на основе введенных символов. Этот узел представляет сущность, название которой содержит префикс, соответствующий введенным символам. Граф содержит узлы (сущности) и связи (отношения между узлами).
Идентифицируется узел-кандидат (candidate node) в графе, который связан с идентифицированным узлом на основе одной или нескольких связей в графе. Узел-кандидат представляет сущность, название которой имеет префикс, НЕ содержащий введенные символы.
Название сущности, представленной узлом-кандидатом, предоставляется как Expanded Query Suggestion.

Ядро изобретения — использование связей в графе сущностей для поиска релевантных подсказок, которые текстово не соответствуют введенному префиксу.

Claim 2 (Зависимый от 1): Детализирует процесс ранжирования нескольких кандидатов.

Идентификация включает определение множества узлов-кандидатов.
Для каждого кандидата рассчитывается оценка предложения (suggestion score).
Кандидаты ранжируются на основе этой оценки.
Ранжированный список названий сущностей, представленных одним или несколькими кандидатами с наивысшим рейтингом, предоставляется как Expanded Query Suggestions.

Claim 3 (Зависимый от 2): Описывает фильтрацию на основе географической близости к Viewport.

Множество кандидатов фильтруется путем расчета географической близости конкретного кандидата к географическому региону, представленному в Viewport.
Кандидат удаляется, если его географическая близость превышает пороговое значение (т.е. он слишком далеко).

Claim 4 (Зависимый от 2): Описывает фильтрацию на основе размера географического объекта (сужение поиска).

Множество кандидатов фильтруется путем удаления кандидата, если связанный с ним географический объект больше, чем географический объект, связанный с идентифицированным узлом.

Это гарантирует, что подсказки сужают область поиска, а не расширяют ее (например, не предлагать «Калифорния» для запроса «Mountain View»).

Claims 5-8 (Зависимые от 1): Уточняют типы отношений в графе, используемые для поиска кандидатов.

Claim 5: Отношение вложенности (containment relationship).
Claim 6: Отношение близости (proximity relationship).
Claim 7: Отношение категория/сущность (category/entity relationship).
Claim 8: Отношение категория/подкатегория (category/subcategory relationship).

Claim 9 (Зависимый от 1): Описывает использование Trie для идентификации узла.

Идентификация узла в графе включает идентификацию узла в структуре Trie, соответствующего введенным символам, при этом узел в Trie связан с узлом в графе.

Где и как применяется

Изобретение применяется на этапах индексирования и понимания запросов для обеспечения работы системы поисковых подсказок (Autocomplete).

INDEXING – Индексирование и извлечение признаков

Построение Графа Сущностей: На этом этапе система анализирует картографические данные (Map Data) и строит Graph. Устанавливаются связи между сущностями на основе географических данных (containment, proximity) и классификации (category).
Анализ Логов Запросов: Query Logs анализируются для определения популярных запросов и выявления дополнительных связей между сущностями, которые могут не следовать из географических данных (например, связь «Париж» и «Диснейленд» из-за популярности запроса «Диснейленд Париж»).
Построение Trie: Все префиксы названий сущностей индексируются в Trie. Узлы Trie ассоциируются с соответствующими узлами Graph.

QUNDERSTANDING – Понимание Запросов (в реальном времени)

Основное применение патента происходит здесь, в момент ввода запроса пользователем.
Система использует Trie для быстрого поиска сущностей, соответствующих префиксу.
Система использует Graph для обхода связей и генерации Expanded Query Suggestions.
Применяются механизмы фильтрации и скоринга для выбора наилучших подсказок.

Входные данные:

Последовательность символов, введенных пользователем.
Текущая область просмотра карты (Viewport).
Граф сущностей (Graph).
Префиксное дерево (Trie).

Выходные данные:

Список ранжированных поисковых подсказок, включающий как стандартные автодополнения, так и Expanded Query Suggestions.

На что влияет

Конкретные типы контента: Наибольшее влияние на локальные страницы, страницы бизнесов, достопримечательности и географические объекты.
Специфические запросы: Влияет на информационные и транзакционные запросы, связанные с поиском мест, категорий бизнесов или маршрутов. Особенно актуально для запросов, указывающих на географическую область (например, название города), где система может предложить конкретные популярные места в этой области.
Конкретные ниши или тематики: Критически важно для Локального SEO, туризма, недвижимости, ритейла и любых бизнесов, привязанных к физическому местоположению.

Когда применяется

Условия работы: Алгоритм работает в реальном времени при вводе каждого символа в строку поиска интерактивной картографической системы.
Триггеры активации: Активируется, когда система идентифицирует в Trie узел, соответствующий введенному префиксу, и этот узел связан с сущностями в Graph, которые, в свою очередь, имеют связи с другими релевантными сущностями.
Ограничения: Эффективность зависит от качества и полноты Graph и Trie, а также от наличия данных в Query Logs для определения популярности и связей.

Пошаговый алгоритм

Процесс А: Предварительная обработка (Офлайн)

Индексация префиксов: Система индексирует префиксы всех названий географических объектов и сущностей в Trie.
Построение связей: Система строит Graph сущностей, устанавливая связи (containment, proximity, category, связи на основе Query Logs).
Ассоциация структур: Узлы графа ассоциируются с соответствующими узлами Trie, хранящими префиксы их названий.

Процесс Б: Обработка запроса (Реальное время)

Получение символа: Система получает очередной символ запроса от клиентского устройства.
Обход Trie: Система перемещается по Trie к узлу, соответствующему текущему полному префиксу.
Идентификация кандидатов: Для каждого узла графа, ассоциированного с текущим узлом Trie, система следует по связям в графе для идентификации связанных узлов-кандидатов (потенциальных Expanded Query Suggestions).
Фильтрация (Сужение поиска): Система отбрасывает узлы-кандидаты, если соответствующий географический объект не сужает запрос (т.е. если он больше, чем исходная сущность).
Фильтрация (Близость к Viewport): Система отбрасывает узлы-кандидаты, если соответствующий географический объект находится за пределами порогового расстояния от текущей области просмотра (Viewport). (Исключение: связи, основанные на сильных сигналах из Query Logs, могут игнорировать это ограничение).
Скоринг: Система оценивает оставшиеся узлы-кандидаты. Оценка может основываться на вероятности упоминания сущности в запросе (P(f)) или условной вероятности (P(f2|f1)), полученной из Query Logs.
Генерация подсказки: Система генерирует расширенный запрос с использованием названия сущности из узла-кандидата с наивысшей оценкой.
Предоставление подсказки: Система отправляет расширенный запрос клиентскому устройству для отображения пользователю.

Какие данные и как использует

Данные на входе

Географические факторы: Критически важные данные. Используются координаты сущностей, размеры географических областей, иерархия административных единиц. Эти данные необходимы для построения связей Containment и Proximity в графе, а также для фильтрации по Viewport.
Структурные факторы (Классификация): Данные о категориях и типах сущностей (бизнес, достопримечательность, город, отель, ресторан). Используются для построения связей Category/Entity и Category/Subcategory.
Поведенческие факторы (Query Logs): Анонимизированные логи запросов используются для:
- Определения популярности сущностей (для скоринга).
- Выявления связей между сущностями на основе частоты совместного упоминания в запросах (например, связь «Париж» и «Диснейленд»).
- Расчета условных вероятностей P(f2|f1) для скоринга.
Пользовательские факторы: Текущая область просмотра карты (Viewport) используется как контекст для фильтрации предложений по близости. Язык интерфейса может использоваться при скоринге.

Какие метрики используются и как они считаются

Proximity Threshold (Порог близости): Пороговое значение расстояния, используемое для установления связи Proximity между двумя сущностями в графе, а также для фильтрации кандидатов относительно Viewport. Порог может зависеть от типа сущностей.
Suggestion Score (Оценка предложения): Метрика для ранжирования кандидатов. Патент предлагает несколько вариантов расчета:
- На основе вероятности P(f), что сущность будет упомянута в запросе.
- На основе кумулятивной вероятности связанных сущностей (CPRF(f)). Формула для расширенной подсказки f2, связанной с f1:

Выводы

Сущностно-ориентированный подход к подсказкам: Патент демонстрирует переход от простого текстового сопоставления префиксов к использованию структурированного графа знаний (Entity Graph) для генерации подсказок. Система понимает, что пользователь ищет сущность, и предлагает связанные с ней сущности.
Важность связей в графе: Ключевым элементом системы является наличие и тип связей между сущностями. Патент явно выделяет географические (containment, proximity) и категорийные связи как основу для генерации расширенных подсказок.
Роль поведенческих данных (Query Logs): Логи запросов играют критическую роль не только в ранжировании подсказок (через расчет популярности и условных вероятностей), но и в создании новых связей в графе. Если пользователи часто ищут две сущности вместе, система может создать связь между ними, даже если они географически не связаны.
Контекстуальная фильтрация (Viewport): Система активно использует контекст пользователя, в частности текущую область просмотра карты, для фильтрации нерелевантных подсказок. Это подчеркивает важность локального контекста в географическом поиске.
Принцип сужения поиска: Важное правило фильтрации заключается в том, что расширенные подсказки должны сужать область поиска, а не расширять ее. Система стремится предложить более конкретную сущность (например, бизнес в городе), а не более общую (например, страну).

Практика

Best practices (это мы делаем)

Укрепление связи Бизнес-Локация (Containment): Необходимо обеспечить, чтобы ваша бизнес-сущность была четко и однозначно связана с соответствующими географическими сущностями (район, город, улица). Это достигается через точное заполнение профиля Google Business Profile (GBP), использование локальной микроразметки (LocalBusiness schema) на сайте и упоминание бизнеса в контексте его местоположения в авторитетных источниках (Local Citations). Это увеличивает вероятность того, что бизнес будет предложен как Expanded Query Suggestion при поиске по названию локации.
Укрепление связи Бизнес-Категория (Category Relationship): Выбирайте максимально точные и релевантные основные и дополнительные категории в GBP. Контент на сайте также должен подтверждать принадлежность бизнеса к этим категориям. Это позволяет системе предлагать ваш бизнес при поиске по категорийным запросам в определенной локации.
Стимулирование брендовых запросов с локацией: Поскольку Query Logs используются для выявления связей и определения популярности, полезно стимулировать запросы вида [Бренд + Локация] или [Бренд + Категория]. Это укрепляет ассоциации в графе и повышает вероятность показа бизнеса в подсказках.
Оптимизация под популярные сущности поблизости (Proximity): Если ваш бизнес находится рядом с известной достопримечательностью или объектом (например, «отель рядом с Эрмитажем»), убедитесь, что эта связь отражена в контенте сайта и отзывах. Система может использовать отношение Proximity для генерации подсказок.

Worst practices (это делать не надо)

Неточное указание местоположения или категорий: Ошибки в адресе или выбор слишком широких/нерелевантных категорий ослабляют связи в графе, что снижает вероятность попадания в Expanded Query Suggestions.
Манипуляции с географическими данными: Создание фейковых локаций или попытки ассоциировать бизнес с районом, где он физически не присутствует (например, Keyword Stuffing названия города в GBP), неэффективны, так как система опирается на фактические географические данные для построения связей Containment и Proximity.
Игнорирование локального контекста: Фокус только на общих запросах без учета географической привязки не позволит воспользоваться преимуществами этого механизма, так как он специально разработан для улучшения локального поиска.

Стратегическое значение

Этот патент подчеркивает стратегическую важность оптимизации сущностей (Entity Optimization) и управления репутацией в локальном поиске. Для Google бизнес — это не просто набор ключевых слов, а узел в графе, связанный с локациями, категориями и другими сущностями. Долгосрочная SEO-стратегия должна быть направлена на то, чтобы сделать бизнес значимым и популярным узлом в своей географической и тематической нише. Успех в локальном SEO напрямую зависит от того, насколько точно и полно представлена информация о бизнесе в экосистеме Google (GBP, Карты, Knowledge Graph) и насколько сильны его ассоциации с реальным миром и поведением пользователей.

Практические примеры

Сценарий: Улучшение видимости нового ресторана в туристическом районе

Задача: Обеспечить, чтобы новый ресторан «SeaBreeze» появлялся в поисковых подсказках, когда пользователи ищут информацию о районе «Half Moon Bay».

Действия на основе патента:

Установление Containment Relationship: Заполнить профиль GBP для «SeaBreeze» с точным адресом в Half Moon Bay. Убедиться, что Google Карты корректно индексируют его местоположение.
Установление Category Relationship: Выбрать основную категорию «Ресторан морепродуктов» и дополнительные релевантные категории.
Использование Proximity и Query Logs (Стратегия): Half Moon Bay популярен среди серферов. Необходимо создать контент на сайте и стимулировать отзывы, упоминающие ресторан в контексте серфинга (например, «Лучшее место для ужина после серфинга в HMB»). Это направлено на создание связи между сущностями «Surfing», «Half Moon Bay» и «SeaBreeze» на основе поведения пользователей (Query Logs).
Ожидаемый результат: Когда пользователь вводит «Half Moon B», система идентифицирует сущность «Half Moon Bay». Затем она обходит граф и находит связанные популярные сущности: «Surfing» и «SeaBreeze» (благодаря сильным связям Containment и Category, а также данным из Query Logs). Система предлагает Expanded Query Suggestions: «Surfing Half Moon Bay» и «SeaBreeze Restaurant Half Moon Bay».

Вопросы и ответы

Что такое Expanded Query Suggestion и чем он отличается от обычного автодополнения?

Обычное автодополнение предлагает варианты завершения запроса, которые начинаются с текста, введенного пользователем (префикса). Expanded Query Suggestion предлагает запросы, которые связаны с тем, что ищет пользователь (семантически или географически), но не обязательно начинаются с этого префикса. Например, на запрос «new y» обычная подсказка — «New York», а расширенная — «MoMA New York».

Какие типы связей использует Google для генерации этих расширенных подсказок?

Патент описывает несколько ключевых типов связей в графе сущностей. К ним относятся Containment (вложенность, например, бизнес внутри города), Proximity (близость, например, два соседних города или бизнес рядом с достопримечательностью), Category/Entity (например, отели в городе) и Category/Subcategory (например, дешевые отели как подкатегория отелей).

Как поведение пользователей влияет на эти подсказки?

Поведение пользователей, зафиксированное в Query Logs, играет критическую роль. Во-первых, оно используется для ранжирования подсказок: более популярные сущности будут показаны выше. Во-вторых, логи используются для выявления новых связей. Если пользователи часто ищут две сущности вместе (например, «Париж» и «Диснейленд»), система может создать связь между ними в графе, даже если они географически не связаны напрямую.

Как этот патент влияет на стратегию Локального SEO?

Он подчеркивает важность точного структурирования данных о бизнесе. Для попадания в расширенные подсказки критически важно, чтобы ваша бизнес-сущность имела сильные и правильные связи с географическими локациями (городом, районом) и категориями. Это достигается через тщательную оптимизацию Google Business Profile, локальные цитаты и микроразметку на сайте.

Может ли мой бизнес в Москве быть показан в подсказках, если пользователь ищет что-то в Нью-Йорке?

Согласно патенту, это маловероятно. Система применяет фильтрацию на основе Viewport (текущей области просмотра карты). Если кандидат находится слишком далеко от Viewport, он отбрасывается. Исключение может быть сделано, только если существует очень сильная связь на основе Query Logs, которая переопределяет географическую фильтрацию.

Почему система иногда предлагает более общие запросы, например, название страны?

Патент специально описывает механизм фильтрации, который должен предотвращать это. Система отбрасывает кандидатов, которые не сужают область поиска (т.е. географически больше, чем исходная сущность). Если система предлагает более общий запрос, это может быть результатом работы стандартного автодополнения или указывать на недостаток более конкретных релевантных сущностей в графе.

Что важнее для попадания в расширенные подсказки: оптимизация сайта или профиль в Google Business Profile?

Поскольку система работает с графом сущностей и географическими данными, Google Business Profile (GBP) является первичным источником данных для построения этого графа в контексте локального бизнеса. Точное заполнение адреса и категорий в GBP критически важно для формирования связей Containment и Category. Оптимизация сайта (микроразметка, контент) дополняет и подтверждает эти данные.

Как использовать знание об этом патенте для оптимизации под конкурентов?

Можно проанализировать, какие расширенные подсказки появляются при поиске по локациям или категориям, где работают конкуренты. Если конкурент появляется в подсказках, это означает, что его сущность имеет сильные связи в графе. Необходимо проанализировать его профиль GBP, цитаты и контент, чтобы понять, за счет чего эти связи сформированы, и реализовать аналогичную или лучшую стратегию для своего бизнеса.

Используется ли этот механизм только в Google Картах?

Патент описывает изобретение в контексте Interactive Mapping System. Однако технологии Google часто используются кросс-платформенно. Логично предположить, что механизмы генерации подсказок на основе графа сущностей применяются и в основном поиске Google, особенно когда запрос имеет локальный интент или связан с географическими объектами.

Как система определяет популярность сущности для ранжирования подсказок?

Популярность определяется на основе анализа Query Logs. Система рассчитывает вероятность того, что сущность будет упомянута в запросе (P(f)). Также может использоваться условная вероятность P(f2|f1), показывающая, как часто ищут сущность f2 после поиска сущности f1. Это напрямую связано с частотой поисковых запросов, связанных с данной сущностью.