Google использует автоматизированную систему для определения «истинной геометрии» (точных физических границ) точек интереса (POI). Если бизнес связан с несколькими конфликтующими контурами (например, контур магазина и контур всего ТЦ), система ранжирует их по ряду критериев, таких как тип связи, количество арендаторов и схожесть названий, чтобы выбрать наиболее точное описание физического пространства.
Описание
Какую задачу решает
Патент решает проблему неоднозначности геоданных, возникающую, когда одна точка интереса (Point of Interest, POI), например, магазин или организация, связана в базе данных с несколькими конфликтующими геометрическими описаниями (geometries). Например, магазин может быть ассоциирован как с геометрией всего торгового центра, так и с геометрией конкретного арендуемого помещения. Цель изобретения — автоматически и масштабируемо определить, какое из этих описаний является «истинной геометрией» (True Geometry) данного POI.
Что запатентовано
Запатентована система и метод для автоматического выбора наиболее подходящей геометрии для точки интереса из набора кандидатов. Система генерирует кандидатов на основе существующих связей в геоданных, а затем ранжирует их, используя иерархию эвристических критериев (ranking criteria). Это позволяет определить, какая геометрия с наибольшей вероятностью представляет фактические физические границы POI.
Как это работает
Система анализирует существующие геоданные:
- Сбор кандидатов: Для POI идентифицируются все связанные геометрии на основе отношений Occupies (занимает) и Is-contained-by (содержится в). Также учитывается собственная геометрия POI, если она указана (self-describing place).
- Ранжирование: Кандидаты сортируются по вероятности того, что они являются истинной геометрией.
- Ключевые критерии: Система отдает предпочтение явным данным (геометрия из самого POI или отношение Occupies), геометриям с высоким сходством названий (Name Similarity) и геометриям с низким «количеством занятости» (Global Occupancy Count — т.е. более специфичным).
- Выбор: Геометрия с наивысшим рейтингом выбирается как True Geometry, и эта однозначная связь сохраняется.
Актуальность для SEO
Высокая. Точное понимание физического мира является фундаментальной задачей для Google Maps и локального поиска. Автоматическое определение границ зданий и помещений критически важно для качества локальных данных и понимания взаимосвязей между физическими объектами (например, иерархия магазин-ТЦ). Этот механизм обработки геоданных остается актуальным.
Важность для SEO
Влияние на SEO оценивается как высокое (70/100), с сильным фокусом на Local SEO. Патент не описывает алгоритм ранжирования, но описывает критически важный процесс очистки геоданных, которые используются поисковыми системами. Точное определение True Geometry позволяет Google лучше понимать физическое расположение и контекст бизнеса, что является основой для корректного расчета сигналов близости (Proximity) и отображения информации в Local Pack.
Детальный разбор
Термины и определения
- Geometry (Геометрия)
- Физические границы или контур точки интереса (например, контур здания). Определяется набором координат.
- Global Occupancy Count (Глобальный счетчик занятости)
- Метрика, связанная с геометрией, указывающая, сколько различных POI ассоциировано с этой геометрией. Например, у геометрии ТЦ этот показатель равен количеству магазинов внутри.
- Is-contained-by Relationship (Отношение «содержится в»)
- Выводимое (inferred) отношение, означающее, что POI (или его координаты) находится внутри границ определенной геометрии. Менее строгое отношение.
- Occupies Relationship (Отношение «занимает»)
- Декларация (часто явная — explicit declaration) о том, что POI занимает определенное физическое пространство (например, целое здание или секцию). Более сильный индикатор истинной геометрии.
- POI (Point of Interest) / Place (Точка интереса / Место)
- Объект на карте или в наборе геоданных (например, магазин, организация, здание).
- Ranking Criteria (Критерии ранжирования)
- Набор правил или эвристик, используемых для сортировки кандидатов геометрии по вероятности того, что они являются истинной геометрией POI.
- Self-describing Place (Самоописывающее место)
- POI, который содержит в своих данных собственные координаты контура физического пространства, которое он занимает.
- True Geometry (Истинная геометрия)
- Фактическое, корректное физическое описание (контур) точки интереса, которое система стремится определить.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод определения истинной геометрии POI.
- Идентификация множества геометрий, связанных с одним или несколькими POI через определенные отношения.
- Генерация набора кандидатов (candidate set of geometries) для первого POI, включающего как минимум две связанные с ним геометрии.
- Ранжирование кандидатов в соответствии с ranking criteria. Ранжирование сортирует кандидатов по вероятности того, что они являются True Geometry.
- Выбор кандидата с наивысшим рейтингом в качестве True Geometry для первого POI.
- Сохранение связи между первым POI и выбранной геометрией.
Claims 2-6, 10 (Зависимые): Детализируют типы отношений и их приоритет.
- Отношения включают Occupies (POI занимает всю геометрию, Claim 2) и Is-contained-by (POI содержится внутри геометрии, Claim 4, 5).
- Occupies может быть явной декларацией (Claim 3), а Is-contained-by выводится из геоданных (Claim 6).
- Кандидат с отношением Occupies считается более вероятной истинной геометрией (Claim 10).
Claims 7, 8, 19 (Зависимые): Детализируют критерий Occupancy Count.
- Критерии ранжирования включают Occupancy Count, указывающий количество POI, связанных с геометрией (Claim 7).
- Геометрия считается более вероятной, если ее Occupancy Count меньше, чем у других кандидатов (Claim 8, 19). Это означает предпочтение более специфичных геометрий.
Claim 9 (Зависимый): Детализирует критерий схожести названий.
- Критерии включают name similarity. Большая схожесть названия геометрии с названием POI повышает вероятность того, что это истинная геометрия.
Claims 11, 12 (Зависимые): Детализируют обработку Self-describing Place.
- Если POI является self-describing, его координаты контура транслируются в геометрию и добавляются в набор кандидатов (Claim 11).
- Такая геометрия считается более вероятной истинной геометрией (Claim 12), что дает ей наивысший приоритет.
Где и как применяется
Изобретение является частью конвейера обработки данных, который создает и поддерживает базу знаний о физическом мире (используемую в Google Maps и Local Search).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система обрабатывает собранные геоданные для создания очищенного, структурированного и однозначного набора данных.
- Анализ данных: Определяются явные отношения (Occupies) и выводятся пространственные отношения (Is-contained-by). Рассчитываются метрики, например, Global Occupancy Count.
- Устранение неоднозначности (Disambiguation): Для каждого POI, имеющего несколько связанных геометрий, запускается описанный процесс ранжирования и выбора True Geometry.
- Сохранение в индексе: Однозначная связь между POI и его True Geometry сохраняется в индексе геоданных.
RANKING – Ранжирование (Локальное ранжирование)
Алгоритм не работает на этом этапе, но предоставляет критически важные данные для него. Точное знание True Geometry позволяет системам локального ранжирования более точно оценивать близость (Proximity) и релевантность POI.
Входные данные:
- Набор POI (названия, координаты, возможно, собственные контуры).
- Набор Геометрий (контуры, типы, возможно, названия).
- Отношения между ними (Occupies, Is-contained-by).
Выходные данные:
- Однозначное соответствие (mapping) между каждым POI и его True Geometry.
На что влияет
- Конкретные типы контента: Влияет на данные о физических объектах и организациях (POI).
- Специфические запросы: Влияет на локальные запросы (Local Search) и Google Maps, где требуется точное знание местоположения и границ объекта.
- Конкретные ниши или тематики: Наибольшее влияние в сферах с высокой плотностью объектов, особенно в ритейле (торговые центры, бизнес-комплексы), где часто возникает неоднозначность между геометрией отдельного магазина и геометрией всего комплекса.
Когда применяется
- Триггеры активации: Процесс активируется во время индексации или обновления геоданных, когда система обнаруживает, что один POI связан с более чем одной геометрией-кандидатом.
- Временные рамки: Применяется в рамках конвейера обновления индекса (офлайн-процесс), а не в реальном времени при запросе пользователя.
Пошаговый алгоритм
Процесс определения истинной геометрии для POI.
- Инициализация: Система идентифицирует набор геометрий, мест (POI) и отношений между ними.
- Выбор POI: Выбирается конкретный POI для обработки.
- Генерация кандидатов:
- Идентифицируются все геометрии, имеющие отношения Occupies или Is-contained-by с POI.
- Определяется, является ли POI self-describing. Если да, его собственные координаты транслируются в геометрию и добавляются в набор кандидатов.
- Ранжирование кандидатов (Сортировка): Система ранжирует кандидатов по вероятности того, что они являются True Geometry. Ранжирование осуществляется путем попарного сравнения кандидатов с использованием строгой иерархии критериев. Приоритет критериев (от высшего к низшему):
- Self-describing: Предпочтение геометрии, извлеченной из самого POI.
- Name Similarity: Сравнивается схожесть названий (например, с использованием расстояния Левенштейна). Предпочтение геометрии с более высоким сходством (при превышении порога).
- Relationship Type: Предпочтение Occupies по сравнению с Is-contained-by.
- Global Occupancy Count: Предпочтение геометрии с меньшим количеством связанных POI (более специфичной).
- Geometry Type: Предпочтение большему типу геометрии (например, Grounds > Building > Section).
- Distance: Предпочтение геометрии, координаты которой ближе к центру POI.
- Unique Identifier: Если все критерии равны, используется уникальный идентификатор для детерминированного выбора (например, алфавитная сортировка ID).
- Выбор True Geometry: Кандидат с наивысшим рангом выбирается как истинная геометрия.
- Сохранение: Однозначная связь между POI и выбранной истинной геометрией сохраняется в базе данных.
Какие данные и как использует
Данные на входе
Патент фокусируется на обработке геопространственных и атрибутивных данных.
- Географические факторы (Геоданные):
- Координаты (широта/долгота) центра POI.
- Координаты контуров (outlines) геометрий-кандидатов.
- Собственные координаты контура POI (для self-describing places).
- Атрибутивные данные:
- Названия POI и названия, связанные с геометриями.
- Типы геометрий (Geometry Type: например, section, building, grounds).
- Уникальные идентификаторы (Unique Identifier).
- Данные о связях:
- Типы отношений: Явные (Occupies) и выведенные (Is-contained-by).
Какие метрики используются и как они считаются
- Global Occupancy Count: Подсчет количества POI, связанных с конкретной геометрией.
- Name Similarity (Схожесть названий): Метрика схожести между названием POI и названием геометрии. В патенте упоминается использование расстояния Левенштейна (Levenshtein string edit distance) между нормализованными названиями. Результат масштабируется (например, от 0 до 1).
- Distance (Расстояние): Расстояние между координатами геометрии и местоположением POI.
- Приоритезация типов: Используется предопределенный приоритет для типов отношений (Occupies > Is-contained-by) и типов геометрий (по размеру, например, Grounds > Building > Section).
- Метод анализа: Используется эвристический алгоритм сортировки, основанный на строгой иерархии критериев (попарное сравнение), а не на взвешенной модели.
Выводы
- Фундамент качества локальных данных: Патент описывает инфраструктурный процесс очистки и структурирования геоданных. Это не алгоритм ранжирования, а механизм обеспечения точности данных, используемых в Google Maps и Local Search.
- Иерархия доверия к данным: Система имеет четкую иерархию доверия. Наивысший приоритет у данных, предоставленных самим объектом (Self-describing), затем у явных деклараций (Occupies), и наименьший — у автоматически выведенных связей (Is-contained-by).
- Предпочтение специфичности: Ключевым критерием для разрешения конфликтов в сложных объектах (например, ТЦ) является Global Occupancy Count. Система предпочитает более специфичные геометрии (с низким счетчиком) общим (с высоким счетчиком).
- Критичность консистентности NAP: Name Similarity является высокоприоритетным критерием. Это подтверждает важность согласованного и точного именования бизнеса (NAP Consistency) во всех источниках для корректной ассоциации POI с его физическими границами.
- Детерминированный выбор: Процесс использует строгую иерархию критериев и финальный тай-брейкер (Unique Identifier), что гарантирует последовательный и детерминированный выбор True Geometry.
Практика
Best practices (это мы делаем)
Понимание этого патента дает важные инсайты для стратегий Local SEO и управления данными о бизнесе (Location Data Management).
- Обеспечение абсолютной точности и консистентности NAP: Поскольку Name Similarity является одним из ключевых критериев, критически важно поддерживать идентичность названия бизнеса во всех источниках (GBP, сайт, каталоги). Любые расхождения могут помешать Google связать ваш POI с правильной геометрией.
- Предоставление детализированных адресных данных: Для бизнесов в ТЦ или БЦ всегда указывайте точный номер секции, офиса или этаж. Это помогает системе связать POI с более специфичной геометрией (например, «Section»), у которой низкий Global Occupancy Count, что предпочтительнее привязки ко всему зданию.
- Точное позиционирование маркера в GBP: Убедитесь, что пин на карте установлен максимально точно. Это влияет на критерий Distance и помогает системе корректно устанавливать отношения Is-contained-by.
- Использование явных данных (Indoor Maps): Владельцам крупных объектов (ТЦ, аэропорты) следует предоставлять Google точные данные о внутренней планировке через Google Indoor Maps. Это предоставляет системе данные типа Self-describing или сильные отношения Occupies, которые имеют наивысший приоритет.
Worst practices (это делать не надо)
- Манипуляции с названием (Keyword Stuffing в GBP): Добавление лишних ключевых слов в название может снизить Name Similarity между POI и его реальной геометрией, что приведет к ошибкам в определении физических границ.
- Указание общих или неточных адресов: Игнорирование номеров офисов или секций увеличивает вероятность того, что POI будет привязан к общей геометрии здания (высокий Occupancy Count), что размывает сигналы локального ранжирования.
- Игнорирование контекста местоположения: Не предоставлять информацию о том, что бизнес находится внутри другого объекта. Это усложняет системе корректное определение иерархии и выбор специфичной геометрии.
Стратегическое значение
Патент подтверждает, что Google стремится к максимально гранулярному и точному пониманию физического мира. Для Local SEO это означает, что предоставление точных, детализированных и согласованных геоданных является фундаментом успеха. Стратегия управления данными должна быть направлена на предоставление явных сигналов (Explicit Data), которые помогут системе Google корректно выполнить процесс дисамбигуации для вашего объекта, обеспечивая точность расчета факторов локального ранжирования (Proximity).
Практические примеры
Сценарий: Определение геометрии магазина в Торговом Центре
- Ситуация: Магазин «Best Shoes» открывается в ТЦ «Mega Mall». Google имеет геометрию ТЦ (Geometry A) и геометрию конкретного отдела из Indoor Maps (Geometry B).
- Генерация кандидатов: POI «Best Shoes» имеет отношение Is-contained-by с Geometry A и отношение Occupies с Geometry B.
- Анализ метрик:
- Geometry A (ТЦ): Global Occupancy Count = 150.
- Geometry B (Отдел): Global Occupancy Count = 1.
- Ранжирование (Попарное сравнение A и B):
- Relationship Type: Geometry B выигрывает (Occupies > Is-contained-by).
- Occupancy Count: Geometry B выигрывает (1 < 150).
- Результат: Geometry B выбирается как True Geometry для «Best Shoes». Google точно знает границы магазина внутри ТЦ, что улучшает точность локального поиска для этого магазина.
Вопросы и ответы
Что такое «Истинная геометрия» (True Geometry) в контексте этого патента?
Это наиболее точное описание физических границ (контура) точки интереса (POI), например, магазина или здания. Если в базе данных Google есть несколько конфликтующих вариантов границ объекта, система выбирает один, который наилучшим образом отражает реальность, и назначает его «истинной геометрией».
Что важнее для системы: отношение «Occupies» (занимает) или «Is-contained-by» (содержится в)?
Система отдает явное предпочтение отношению Occupies. Оно считается более надежным индикатором, так как часто является явной декларацией о занимаемом пространстве. Отношение Is-contained-by является выведенным (основанным на простом нахождении координат внутри контура) и имеет более низкий приоритет.
Что такое «Global Occupancy Count» и как он влияет на выбор геометрии?
Это количество различных POI, связанных с одной геометрией. Например, у геометрии ТЦ это значение высокое, а у отдельного магазина — низкое (обычно 1). Система предпочитает геометрии с низким Global Occupancy Count, так как они более специфичны и точнее определяют границы конкретного POI.
Как этот патент влияет на мою стратегию Local SEO?
Он подчеркивает критическую важность точности и согласованности ваших геоданных (NAP). Поскольку система использует схожесть названий (Name Similarity) и точные координаты для разрешения неоднозначностей, любая ошибка в GBP или других источниках может привести к неверному определению физических границ вашего бизнеса, что ухудшит качество данных для локального поиска.
Что такое «Self-describing Place» и почему это лучший вариант?
Это POI, который содержит в своих данных координаты собственного физического контура (например, через загрузку планов помещений). В патенте это считается самым надежным источником данных и имеет наивысший приоритет при выборе геометрии.
Использует ли Google этот алгоритм для ранжирования сайтов в веб-поиске?
Нет, этот патент не описывает алгоритм ранжирования. Он описывает процесс обработки и очистки геоданных на этапе Индексирования (Indexing). Он влияет на то, насколько точно Google понимает физическое расположение вашего бизнеса, что является основой для Local Search и Google Maps.
Что делать, если мой бизнес находится в бизнес-центре или торговом центре?
Необходимо предоставить максимально точные данные о расположении внутри комплекса (этаж, номер офиса/секции). Это поможет Google ассоциировать ваш POI с правильной, специфичной геометрией (с низким Occupancy Count), а не с геометрией всего здания.
Как система рассчитывает схожесть названий (Name Similarity)?
Патент упоминает нормализацию названий (приведение к нижнему регистру, сортировка слов, удаление пунктуации) и вычисление расстояния Левенштейна (Levenshtein distance) между названием POI и названием геометрии. Результат масштабируется от 0 до 1.
Может ли неверное расположение метки (Pin) на карте повлиять на этот процесс?
Да, может. Одним из критериев ранжирования является расстояние (Distance) от центра геометрии до местоположения POI. Если метка установлена неверно, система может предпочесть геометрию, которая находится ближе к ошибочной метке, выбрав неверную True Geometry.
Как система решает, если два кандидата одинаковы по всем критериям?
В патенте предусмотрен механизм «тай-брейкера» для обеспечения детерминированного выбора. Если все критерии ранжирования равны, система использует уникальный идентификатор (Unique Identifier) геометрии для выбора, например, путем алфавитной сортировки идентификаторов.