Патент Google описывает архитектуру данных для картографических сервисов, позволяющую раздельно хранить объекты карты (сущности) и информацию об их достоверности (неопределенность). Это позволяет системе слияния (fusion) данных из множества источников (сенсоры, базовые карты, данные пользователей) обрабатывать противоречивые наблюдения и формировать наиболее точную и согласованную карту реального мира.
Описание
Какую задачу решает
Патент решает проблему интеграции и слияния (fusion) множественных, потенциально неполных (fractional maps) или противоречивых источников картографических данных и наблюдений (например, с сенсоров автомобилей, базовых карт) в единую согласованную карту. Он устраняет ограничения традиционных систем, где данные о достоверности встроены в объекты карты, позволяя схемам данных (Entity Schema) и схемам неопределенности (Uncertainty Schema) развиваться независимо и упрощая обработку данных для клиентов.
Что запатентовано
Запатентована архитектура данных для картографического сервиса (например, Vehicle Map Service), которая фундаментально разделяет модель карты (Vehicle Map Model) и модель неопределенности (Uncertainty Model). Модель карты определяет сущности (объекты и их свойства), а отдельная модель неопределенности определяет отношения неопределенности (Uncertainty Relations), которые ссылаются на эти сущности. Это обеспечивает гибкий механизм для статистического анализа и разрешения конфликтов данных.
Как это работает
Система определяет два раздельных адресных пространства. Первое, Entity Address Space, содержит объекты карты. Они классифицируются как Unique Entities (наилучшая оценка реального объекта) или Hypothesized Entities (альтернативные наблюдения или гипотезы). Второе, Uncertainty Address Space, содержит отношения неопределенности. Эти отношения (например, Clustering Relation, Pose Relation) ссылаются на сущности из первого пространства и описывают вероятности ошибок, ковариации или связи между разными гипотезами об одном и том же объекте. Механизмы слияния (fusion) используют эту информацию для формирования согласованной карты.
Актуальность для SEO
Высокая. Точность картографических данных и способность Google сливать информацию из множества источников (включая данные сенсоров, пользователей и партнеров) критически важны для функционирования Google Maps, Local Search и технологий автономного вождения. Описанные механизмы обработки неопределенности являются ключевыми для поддержания актуальности и точности карт.
Важность для SEO
(3/10). Патент имеет инфраструктурное значение и не влияет напрямую на алгоритмы ранжирования веб-поиска. Однако он критически важен для понимания того, как Google обрабатывает, верифицирует и объединяет данные о реальном мире для Google Maps и Local SEO. Он описывает фундаментальные механизмы, позволяющие Google разрешать конфликты между разными источниками данных о локациях (например, разные адреса бизнеса) и формировать достоверную картину мира (Ground Truth).
Детальный разбор
Термины и определения
- Vehicle Map Service (VMS)
- Картографический сервис (часто локальный, внутри транспортного средства), обеспечивающий обмен картографическими данными и наблюдениями сенсоров.
- Vehicle Map Model (Модель карты)
- Модель данных, предоставляющая картографическую информацию. Определяет схему сущностей.
- Uncertainty Model (Модель неопределенности)
- Модель данных, отделенная от Vehicle Map Model, предназначенная для представления неопределенностей, связанных с сущностями карты. Определяет схему неопределенности.
- Entity Schema (Схема сущностей)
- Структура данных в Vehicle Map Model, определяющая типы объектов карты и их свойства.
- Uncertainty Schema (Схема неопределенности)
- Структура данных в Uncertainty Model, определяющая типы отношений неопределенности.
- Entity Address Space (Адресное пространство сущностей)
- Первое адресное пространство, в котором представлены сущности карты.
- Uncertainty Address Space (Адресное пространство неопределенности)
- Второе адресное пространство, отделенное от первого, в котором представлены отношения неопределенности, ссылающиеся на сущности.
- Unique Entity (Уникальная сущность)
- Текущая наилучшая оценка (best estimate или best guess) существующего объекта, уникальная среди других уникальных сущностей.
- Hypothesized Entity (Гипотетическая сущность)
- Наблюдение или вариант объекта, который не гарантированно уникален. Может представлять одно из возможных состояний реального объекта или необработанное наблюдение.
- Pose Relation (Отношение Положения/Позы)
- Тип отношения неопределенности. Описывает неопределенность положения (pose) одной сущности (Relative Entity) относительно другой (Base Entity, например, Земли или транспортного средства). Часто использует Гауссову модель (Gaussian pose model).
- Clustering Relation (Отношение Кластеризации / Confidence Relation)
- Тип отношения неопределенности. Связывает две или более гипотетические сущности, предполагая, что они являются наблюдениями одного и того же реального объекта. Может включать веса (Weights) для оценки вероятности каждой гипотезы.
- Mutual Exclusion Relation (Отношение Взаимного Исключения)
- Тип отношения неопределенности. Указывает, что две или более гипотетические сущности НЕ являются одним и тем же реальным объектом (например, два разных знака на одном изображении).
- Context (Контекст)
- Идентификатор, связанный с отношением неопределенности, указывающий на источник отношения (например, конкретное изображение или скан сенсора).
Ключевые утверждения (Анализ Claims)
Анализ основан на Claims 21-40, так как Claims 1-20 отмечены как отмененные (canceled) в документе US20230385310A1.
Claim 21 (Независимый пункт): Описывает основную архитектуру и процесс системы.
- Система хранит Vehicle Map Model (VMM) с сущностями, определенными по Entity Schema.
- Система хранит отдельную Uncertainty Model (UM) с неопределенностями, определенными по Uncertainty Schema.
- Процессоры применяют меру неопределенности из UM к сущности из VMM на основе сопоставления (mapping) между моделями.
- Процессоры определяют информацию о картографических данных на основе этого применения.
Ядром изобретения является архитектурное разделение данных об объектах (VMM) и данных об их точности/достоверности (UM), а также процесс использования UM для уточнения VMM.
Claim 23 (Зависимый от 21): Детализирует состав сущностей.
Множество сущностей включает Unique Entities и Hypothesized Entities.
Claim 25 (Зависимый от 23): Определяет характеристики сущностей.
Каждая Unique Entity уникальна среди других уникальных сущностей. Каждая Hypothesized Entity может не обладать уникальностью как среди уникальных, так и среди гипотетических сущностей.
Система явно разделяет «наилучшую оценку» от сырых или конфликтующих наблюдений.
Claim 29 (Зависимый от 23): Определяет Clustering Relation.
Uncertainty Schema включает Clustering Relation, которое ссылается на две или более Hypothesized Entities, которые считаются одним и тем же реальным объектом.
Это механизм для группировки наблюдений одного объекта.
Claim 31 (Зависимый от 23): Определяет Mutual Exclusion Relation.
Uncertainty Schema включает Mutual Exclusion Relation, которое ссылается на две или более Hypothesized Entities, которые НЕ являются одним и тем же реальным объектом.
Claim 36 (Зависимый от 21): Определяет Pose Relation.
Uncertainty Schema включает Pose Relation. Оно содержит ссылку на базовую сущность (Base Entity) и ссылку на относительную сущность (Relative Entity), чье положение неопределенно относительно базовой сущности.
Это механизм для моделирования относительной точности.
Где и как применяется
Изобретение описывает базовую архитектуру обработки и хранения географических данных (GIS), затрагивая этапы сбора, обработки (fusion) и использования данных в картографических сервисах.
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Система функционирует как механизм сбора данных из различных источников. Она получает Map Data от удаленных сервисов (Remote Map Service System) и Sensor Data (наблюдения) от локальных систем (например, сенсоров транспортных средств: LIDAR, камеры, GPS), а также, предположительно, данные из веба и от пользователей.
INDEXING – Индексирование и извлечение признаков (Data Processing & Fusion)
Это основной этап применения патента. Система не индексирует веб-страницы, а обрабатывает и сливает (fusion) географические данные и наблюдения для формирования карты.
- Обработка наблюдений: Данные из разных источников обрабатываются для создания Hypothesized Entities (гипотез об объектах, например, разные адреса бизнеса в каталогах).
- Применение неопределенности: Для этих гипотез генерируются Uncertainty Relations (например, оценка достоверности источника).
- Слияние (Fusion): Система использует Clustering Relations для объединения гипотез, относящихся к одному объекту, и Mutual Exclusion Relations для разделения разных объектов. Происходит разрешение конфликтов (например, выбор основного адреса) и формирование Unique Entities (наилучшей оценки карты/объекта).
- Хранение: Данные сохраняются с использованием раздельных Vehicle Map Model и Uncertainty Model.
RANKING / RERANKING (Использование данных)
Результат работы системы — согласованная и точная карта с верифицированными Unique Entities — используется в продуктах (Google Maps, Local Search). Патент не описывает ранжирование, но описывает процесс формирования данных, на которых базируется ранжирование в локальном поиске.
Входные данные:
- Существующие картографические данные (Basemap Data).
- Данные сенсоров (Sensor Data): изображения (Street View), LIDAR, GPS.
- (Предположительно) Данные из веба, каталогов, GBP.
Выходные данные:
- Согласованный набор данных, включающий Unique Entities (верифицированные объекты), Hypothesized Entities и связанные с ними Uncertainty Data (отношения неопределенности).
На что влияет
- Конкретные типы контента: Влияет на географические данные и объекты реального мира (бизнесы, адреса, дороги, ориентиры), используемые в Google Maps и Local Search. Не влияет напрямую на текстовый контент веб-страниц.
- Специфические запросы: Влияет на точность и полноту данных, используемых для ответа на локальные (Local intent) и навигационные запросы.
- Конкретные ниши или тематики: Критическое влияние на Local SEO и любые сервисы, зависящие от точности и достоверности карт.
Когда применяется
- Триггеры активации: Процесс активируется при получении новых данных из любого источника (сенсоры, обновления от пользователей, данные из веба) или при обновлении базовых карт.
- Условия работы: Применяется, когда необходимо слить (fusion) информацию из разных источников и оценить достоверность результирующих данных. Особенно актуально при наличии противоречивых или неполных наблюдений (например, разные адреса для одного бизнеса).
Пошаговый алгоритм
Описание процесса генерации и слияния картографических данных:
- Получение исходных данных: Система получает существующие картографические данные и новые наблюдения (например, данные из каталога или сенсоров).
- Доступ к Модели Карты: Система обращается к Vehicle Map Model, содержащей Entity Schema и Entity Address Space.
- Генерация Сущностей: На основе полученных данных система генерирует сущности в Entity Address Space. Новые наблюдения формируют Hypothesized Entities.
- Доступ к Модели Неопределенности: Система обращается к Uncertainty Model, содержащей Uncertainty Schema и отдельное Uncertainty Address Space.
- Генерация Отношений Неопределенности: Для сгенерированных сущностей система создает Uncertainty Relations в Uncertainty Address Space. Примеры:
- Создание Pose Relation для описания погрешности локализации (например, для данных GPS или Street View).
- Создание Clustering Relation для связи нового наблюдения (например, адреса из нового каталога) с предыдущими наблюдениями того же объекта.
- Слияние и Разрешение Конфликтов (Fusion): Используя сгенерированные отношения неопределенности и веса (Weights), система выполняет статистический анализ для слияния гипотез, разрешения противоречий и обновления Unique Entities (формирование согласованной карты и верифицированных данных о бизнесе).
Какие данные и как использует
Данные на входе
Патент фокусируется на обработке географических и сенсорных данных.
- Географические факторы: Map Data, географические координаты (latitude, longitude, altitude), системы координат (ECEF coordinates, WGS84), данные о дорожном графе.
- Сенсорные данные: Sensor Data, получаемые с устройств, таких как LIDAR, камеры (images), GPS, радар, сонар.
- Данные о Положении: Vehicle Location Data (положение, скорость).
Патент не упоминает стандартные факторы веб-поиска (контентные, ссылочные, поведенческие), но описанная инфраструктура может применяться для обработки данных из этих источников применительно к локальным объектам.
Какие метрики используются и как они считаются
Система использует статистические метрики для моделирования неопределенности и слияния данных.
- Метрики Достоверности: Confidence (уверенность) или вероятность того, что гипотеза верна.
- Статистические Модели: Используются Joint probability model (модель совместной вероятности), Probability density function (функция плотности вероятности).
- Метрики Ошибок Позиционирования: Variances (дисперсии) и Covariances (ковариации). Используются для описания «области ошибок» (error envelope) вокруг местоположения объекта, часто в рамках Gaussian pose model.
- Весовые коэффициенты: Weights используются в Clustering Relations для определения относительной вероятности различных гипотез об одном и том же объекте (например, вес авторитетности источника данных).
- Методы анализа: Система применяет статистические выводы и комбинации (statistical inferences and combinations) для слияния фрагментарных карт и наблюдений.
Выводы
- Разделение Фактов и Достоверности: Google использует архитектуру данных, в которой информация об объекте (Entity) и уверенность системы в этой информации (Uncertainty) хранятся и обрабатываются раздельно. Это ключевой принцип для управления сложными и противоречивыми данными.
- Статистический подход к Истине (Ground Truth): Система не ищет абсолютную истину, а формирует наилучшую статистическую оценку (best guess или Unique Entity) на основе множества наблюдений (Hypothesized Entities).
- Механизмы разрешения противоречий: Патент детально описывает, как обрабатываются конфликтующие данные. Clustering Relation используется для объединения данных об одном объекте, а Mutual Exclusion Relation — для подтверждения, что наблюдения относятся к разным объектам.
- Важность Контекста Наблюдения: Система учитывает контекст (Context) — откуда и когда были получены данные. Это критически важно для корректной интерпретации и слияния наблюдений (например, данные из одного источника против данных из разных источников).
- Фундамент для Local SEO Data Verification: Хотя патент сфокусирован на GIS и автомобильных картах, описанные механизмы (слияние гипотез, оценка достоверности, разрешение конфликтов) являются фундаментом того, как Google верифицирует данные о локальных бизнесах, объединяя информацию из GBP, сайтов, каталогов и сенсорных данных (Street View).
Практика
Best practices (это мы делаем)
Хотя патент носит инфраструктурный характер, он подтверждает важность ключевых стратегий в Local SEO, связанных с консистентностью и достоверностью данных.
- Обеспечение абсолютной консистентности данных (NAP): Критически важно предоставлять согласованную информацию о бизнесе (Name, Address, Phone) во всех источниках (сайт, GBP, авторитетные каталоги, социальные сети). Система, подобная описанной, использует Clustering Relations для слияния упоминаний. Согласованные данные минимизируют количество конфликтующих Hypothesized Entities и помогают сформировать сильную Unique Entity с высокой степенью достоверности (confidence).
- Усиление сигналов локации и авторитетности: Используйте точные географические сигналы (микроразметка LocalBusiness с GeoCoordinates) и работайте с авторитетными локальными и отраслевыми каталогами. Это повышает вес (Weight) ваших данных в процессе слияния (fusion) по сравнению с данными из менее надежных источников.
- Активное управление данными в Google Maps и GBP: Регулярно проверяйте и обновляйте данные в Google Business Profile. Эти данные являются важным источником, который система будет сливать с другими наблюдениями. Обеспечьте соответствие физических вывесок данным в GBP, так как сенсорные данные (Street View) также участвуют в верификации.
Worst practices (это делать не надо)
- Публикация противоречивых данных: Размещение разных адресов, телефонов или названий для одного и того же физического бизнеса в разных источниках. Это напрямую создает конфликтующие Hypothesized Entities, усложняет процесс слияния и снижает общую достоверность данных о бизнесе в глазах системы.
- Игнорирование неконсистентности в экосистеме: Если данные о компании в сторонних источниках неверны, система будет учитывать их как альтернативные гипотезы. Если вес этих источников высок или их количество велико, они могут негативно повлиять на итоговую Unique Entity.
- Манипуляции с локацией (Виртуальные офисы): Попытки создать видимость присутствия там, где бизнеса нет, могут быть опровергнуты при слиянии данных из других источников (например, сенсорных данных Street View или наблюдений пользователей), если они противоречат заявленной локации.
Стратегическое значение
Патент подтверждает стратегический приоритет Google на построение точной и верифицированной модели реального мира (Ground Truth). Он показывает, насколько сложны механизмы, используемые для разрешения конфликтов между различными источниками данных. Для Local SEO это подчеркивает, что достоверность, консистентность и полнота данных о бизнесе являются фундаментом. Система стремится устранить неопределенность, и задача SEO-специалиста — предоставить максимально четкие, непротиворечивые и авторитетные сигналы.
Практические примеры
Сценарий: Разрешение конфликта адреса бизнеса (Local SEO)
Представим, что система Google пытается определить точный адрес ресторана.
- Сбор данных (Наблюдения): Система получает несколько сигналов:
- Наблюдение 1 (Сайт ресторана): Адрес А, Телефон 1.
- Наблюдение 2 (Крупный авторитетный каталог): Адрес А, Телефон 1.
- Наблюдение 3 (Мелкий спамный каталог): Адрес Б (ошибка), Телефон 1.
- Наблюдение 4 (Данные Street View/Сенсоры): Визуальное подтверждение вывески по Адресу А.
- Генерация Гипотез (Hypothesized Entities): Каждое наблюдение формирует гипотетическую сущность в Entity Address Space.
- Генерация Отношений Неопределенности (Uncertainty Relations):
- Для Наблюдения 4 создается Pose Relation с высокой точностью локализации.
- Система создает Clustering Relation, связывающий все 4 наблюдения как относящиеся к одному ресторану (на основе названия и телефона).
- Присвоение Весов (Weights): Внутри Clustering Relation система присваивает веса. Наблюдения 1, 2 (авторитетные источники) и 4 (точные сенсоры) получают высокие веса. Наблюдение 3 (спамный источник) получает низкий вес.
- Слияние (Fusion) и Создание Unique Entity: Система анализирует кластер и выбирает наиболее вероятную конфигурацию. Адрес А и Телефон 1 становятся атрибутами Unique Entity (наилучшей оценки) для этого ресторана в Google Maps.
Вопросы и ответы
Влияет ли этот патент на ранжирование сайтов в органическом веб-поиске?
Нет, напрямую не влияет. Патент описывает инфраструктуру для обработки и хранения географических данных и управления неопределенностью в картографических сервисах (Vehicle Map Service). Он не затрагивает алгоритмы ранжирования веб-страниц, анализ контента, ссылок или поведенческих факторов в традиционном поиске.
Как этот патент связан с Local SEO и Google Maps?
Он имеет критическое значение для понимания процессов верификации данных в Local SEO. Патент описывает механизмы, которые Google использует для слияния (fusion) данных о реальных объектах (включая бизнес-локации) из разных источников. Понимание того, как система обрабатывает противоречивые данные (NAP) и определяет достоверность, помогает строить эффективные стратегии локального продвижения.
Что такое «Unique Entity» и «Hypothesized Entity» в контексте данных о моем бизнесе?
Hypothesized Entity — это любое отдельное упоминание вашего бизнеса, найденное системой (например, запись в каталоге, упоминание на сайте, данные из GBP). Unique Entity — это итоговое, верифицированное представление вашего бизнеса в базе данных Google (например, пин на карте), сформированное путем слияния всех найденных гипотез и выбора наиболее достоверной информации.
Что произойдет, если разные источники (каталоги, мой сайт) указывают разный адрес моего бизнеса?
Система рассмотрит каждый адрес как отдельную Hypothesized Entity. Затем она использует Clustering Relation, чтобы связать их вместе (понимая, что это один бизнес), и присвоит веса (Weights) каждой гипотезе на основе авторитетности источника. В итоге будет выбрана наиболее вероятная версия, но наличие противоречий снижает общую уверенность (confidence) системы в данных.
Что такое «Clustering Relation» и как он используется для слияния данных?
Clustering Relation — это механизм, который группирует несколько гипотетических сущностей (Hypothesized Entities), предполагая, что они относятся к одному и тому же объекту реального мира. Он позволяет системе сравнивать атрибуты этих сущностей и определять наиболее вероятное состояние объекта, используя веса для каждой гипотезы.
Что такое «Mutual Exclusion Relation»?
Это отношение, которое явно указывает, что две сущности НЕ являются одним и тем же объектом. Например, если система видит две разные вывески на одном изображении Street View (в одном контексте), она создаст Mutual Exclusion Relation, чтобы гарантировать, что они будут обработаны как два разных бизнеса, даже если их данные похожи.
Описывает ли патент, как Google собирает данные для обновления карт?
Патент не детализирует методы сбора, но он явно указывает, что система предназначена для обработки данных из множества источников, включая Sensor Data (камеры, LIDAR, GPS) и данные от удаленных картографических сервисов. Это подтверждает использование агрегированных данных (включая сенсорные данные, такие как Street View) для обновления карт.
Что означает «Uncertainty Model» для точности данных в Google Business Profile?
Это означает, что Google не просто принимает данные из GBP как истину, а рассматривает их как один из источников данных (Hypothesized Entity), который имеет свою степень неопределенности. Uncertainty Model позволяет системе оценить вероятность того, что данные верны, и разрешить конфликты, если другие источники (каталоги, веб, сенсоры) противоречат GBP.
Как SEO-специалист может повлиять на то, чтобы Google считал его данные достоверными?
Ключевой фактор — это консистентность и авторитетность. Предоставляя идентичные, точные и полные данные (NAP, координаты, часы работы) в максимально возможном количестве авторитетных источников, вы увеличиваете совокупный вес (Weight) и достоверность (Confidence) этой информации в процессе слияния (fusion).
Почему важна относительная точность (Relative Accuracy), описанная в патенте?
Относительная точность (описываемая через Pose Relation) критична, потому что абсолютная точность (например, GPS) часто бывает недостаточной или подвержена ошибкам. Система может очень точно знать расстояние между двумя объектами (высокая относительная точность), даже если их точное положение на глобусе известно с погрешностью (низкая абсолютная точность). Это важно для навигации и верификации локаций.