Google анализирует компании и объекты, расположенные близко друг к другу (кластеры). Если атрибуты или категория одной компании сильно отличаются от соседей (например, магазин заявляет о публичном доступе в закрытом жилом комплексе), система может автоматически исправить данные (например, пометить как «недоступно для посещения») или отметить компанию как подозрительную. Это повышает точность данных в локальном поиске и на картах.
Описание
Какую задачу решает
Патент решает проблему неточной, неполной или устаревшей информации в листингах (listings) на компьютерных географических картах (например, Google Maps). Основная задача — улучшить качество данных о локальных сущностях (entities), таких как бизнесы или резиденции, и предотвратить ситуации, когда заявленные характеристики сущности не соответствуют ее физическому расположению и окружению (например, бизнес утверждает, что открыт для посещения, но находится в частном доме).
Что запатентовано
Запатентована система для автоматической валидации и коррекции данных о локальных сущностях с использованием географического контекста. Система группирует географически близкие листинги в кластеры (clusters). Затем она анализирует атрибуты (attributes) и категории (categories) внутри кластера, чтобы выявить аномалии. Если листинг не соответствует своему окружению, система может автоматически скорректировать его данные или пометить для дальнейшей проверки.
Как это работает
Ключевой механизм основан на анализе географической близости:
- Кластеризация: Система определяет группу листингов, расположенных близко друг к другу (geographic proximity).
- Сравнение атрибутов: Атрибут выбранного листинга (например, visitability — возможность посещения) сравнивается с атрибутами соседей. Если есть несоответствие (например, все соседи недоступны для посещения), атрибут выбранного листинга может быть изменен.
- Анализ (Census) и Классификация: Система проводит «перепись» категорий в кластере и классифицирует весь кластер (например, «Жилой район» или «Торговый центр»).
- Валидация категорий: Категория отдельного листинга сравнивается с классификацией кластера или категориями соседей. Несоответствия помечаются как подозрительные (suspect listings).
- Определение взаимосвязей: Система может изменять взаимосвязи между листингами (inter-listing relationship), например, определяя, что один объект находится внутри другого (ATM внутри магазина).
Актуальность для SEO
Высокая. Точность и достоверность данных в локальном поиске (Google Maps, Local Pack) остается критически важной задачей для Google. Этот патент описывает масштабируемый метод валидации физических данных с использованием контекстуального окружения, что особенно актуально для борьбы со спамом в Google Business Profile (GBP) и повышения качества карт.
Важность для SEO
Патент имеет существенное значение для специалистов по локальному SEO (Local SEO). Он напрямую влияет на то, как бизнес категоризируется, отображается и считается ли он легитимным местом для посещения. Механизм направлен против спама в GBP, некорректной категоризации и попыток выдать непубличные локации (например, домашние адреса) за точки обслуживания клиентов.
Детальный разбор
Термины и определения
- Attribute (Атрибут)
- Характеристика листинга. Примеры, упомянутые в патенте: Visitability, часы работы, информация о парковке, информация о входе.
- Category (Категория)
- Тип сущности, заявленный в листинге (например, «жилой», «коммерческий», «розничная торговля», «медицинский», «общественный»).
- Census (Перепись, Анализ состава)
- Процесс определения категорий всех листингов внутри кластера для понимания его общего состава.
- Class (Класс)
- Классификация, присвоенная всему кластеру на основе Census (например, кластер классифицирован как «Коммерческий»).
- Cluster (Кластер)
- Группа листингов, объединенных по признаку географической близости (geographic proximity).
- Entity (Сущность)
- Объект реального мира, представленный листингом. Включает резиденции, коммерческие организации (бизнесы), общественные объекты (парки, остановки транспорта), а также географические объекты (озера, дороги).
- Inter-listing relationship (Взаимосвязь между листингами)
- Определенная связь между двумя листингами. Пример: физическое отношение, когда один объект находится внутри другого (банкомат внутри магазина).
- Listing (Листинг)
- Запись в базе данных географической карты, представляющая сущность.
- Suspect listing (Подозрительный листинг)
- Листинг, идентифицированный системой для дальнейшей проверки из-за несоответствия его категории окружающим листингам или классу кластера.
- Visitability (Возможность посещения)
- Ключевой атрибут, указывающий, открыто ли местоположение листинга для публичного посещения с целью коммерции.
Ключевые утверждения (Анализ Claims)
Патент описывает два основных метода улучшения данных.
Метод 1: Коррекция на основе сравнения с соседями (Claim 1, Независимый пункт)
- Система определяет кластер листингов на основе географической близости.
- Получает атрибут выбранного листинга в кластере.
- Сравнивает этот атрибут с атрибутами других листингов в кластере.
- Изменяет значение атрибута выбранного листинга на основе этого сравнения.
Система может принудительно изменить атрибут листинга, если он не соответствует атрибутам большинства его ближайших соседей.
Claim 2 (Зависимый от 1): Уточняет, что атрибутом может быть Visitability (открыто ли место для публики с целью коммерции). Это критически важно для различения публичных точек и частных резиденций или бизнесов без физического офиса (SAB).
Claim 4 (Зависимый от 1): Описывает сравнение Category (а не атрибута). Если категория листинга несовместима с категориями других листингов в кластере, он идентифицируется как Suspect listing. В отличие от Claim 1, здесь не говорится об автоматическом изменении, а о пометке для проверки.
Claim 6 и 7 (Зависимые): Описывают изменение inter-listing relationship на основе расстояния между двумя листингами в кластере или на основе плотности (density) кластера. Это используется для определения иерархических связей, например, «находится внутри».
Метод 2: Коррекция на основе классификации кластера (Claim 15, Независимый пункт)
- Система определяет кластер листингов.
- Проводит Census (анализ состава) листингов в кластере.
- Классифицирует весь кластер в определенный класс (Class) на основе Census.
- Сохраняет информацию о каждом листинге в кластере на основе класса этого кластера.
Система определяет общую природу территории (например, «Это торговый центр») и использует эту информацию для управления данными отдельных листингов внутри него.
Claim 17 (Зависимый от 15): Сравнивает категорию отдельного листинга с классом всего кластера. Если они несовместимы, листинг помечается для проверки (flagging for review).
Где и как применяется
Изобретение в первую очередь относится к этапу обработки и валидации данных для локального индекса (Local Index) и Карт (Maps).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система (Listing cluster evaluator) обрабатывает входящие данные о листингах (например, из GBP, от пользователей, от третьих сторон) и использует географический контекст (Map data) для их валидации и обогащения.
- Валидация данных: Проверка заявленных атрибутов (Visitability) и категорий на соответствие физическому окружению.
- Извлечение признаков: Определение inter-listing relationships (например, «находится внутри») и классификация кластеров (Class).
RANKING / RERANKING – Ранжирование / Переранжирование
Патент влияет на эти этапы косвенно. Если в результате работы алгоритма листинг был перекатегоризирован, признан «недоступным для посещения» или помечен как подозрительный, это изменит его возможность ранжироваться по определенным локальным запросам или может привести к пессимизации.
Входные данные:
- Listing data: Название, местоположение (координаты), заявленная категория, атрибуты (часы работы, Visitability).
- Map data: Географические координаты, информация о физических структурах.
Выходные данные:
- Модифицированные данные листингов (скорректированные атрибуты, новые категории).
- Определенные inter-listing relationships.
- Пометки (Flags) для suspect listings, требующих дополнительной проверки (автоматической или ручной).
На что влияет
- Конкретные типы контента: В первую очередь влияет на локальный поиск (Google Maps, Local Pack). Затрагивает листинги коммерческих, жилых и общественных сущностей.
- Специфические запросы: Локальные интенты (например, «ресторан рядом», «сантехник в [город]»).
- Конкретные ниши: Критически важно для ниш, подверженных спаму (сантехники, слесари, эвакуаторы), а также для различения бизнесов с физическим офисом (Brick-and-Mortar) и бизнесов, работающих на территории клиента (Service Area Businesses, SABs).
Когда применяется
- Условия работы: Алгоритм применяется, когда листинги расположены достаточно близко друг к другу, чтобы сформировать кластер на основе заданного порогового расстояния (distance threshold).
- Частота применения: Вероятно, применяется во время обработки и индексации новых листингов или при обновлении существующих. Также может запускаться периодически для поддержания гигиены индекса.
Пошаговый алгоритм
Этап 1: Определение кластеров
- Генерация графа: Каждый уникальный листинг в географической области представляется как узел (node) графа.
- Определение связей: Между каждой парой узлов, расстояние между которыми не превышает заданный порог (distance threshold), проводятся ребра (edges).
- Анализ компонентов: Выполняется анализ связных компонентов (connected component analysis) графа. Каждый связный компонент идентифицируется как кластер. (Альтернативно, кластер может определяться как листинги в радиусе от точки или внутри ячейки карты).
Этап 2: Обработка кластера (Вариант А — Сравнение с соседями)
- Сравнение атрибутов: Для выбранного листинга система сравнивает его атрибут (например, Visitability) с атрибутами других листингов в кластере.
- Модификация атрибута: Если атрибут не соответствует большинству соседей (например, листинг утверждает, что он доступен для посещения, а все остальные нет), система изменяет значение атрибута.
- Сравнение категорий: Система сравнивает категорию листинга с категориями соседей.
- Идентификация подозрительных листингов: Если категория отличается от заданного процента или числа других листингов, листинг помечается как suspect listing.
- Определение взаимосвязей: Анализируется плотность кластера и адреса листингов. Если несколько листингов имеют один адрес или очень высокую плотность, система может изменить inter-listing relationship (например, указать, что один находится внутри другого).
Этап 2: Обработка кластера (Вариант Б — Классификация кластера)
- Анализ состава (Census): Система определяет категории всех листингов в кластере.
- Классификация кластера: На основе Census система присваивает класс всему кластеру (например, если большинство листингов «Коммерческие», кластер классифицируется как «Коммерческий»).
- Применение классификации: Информация о листингах (например, параметры отображения, способ обработки в поиске) сохраняется на основе класса кластера.
- Валидация листинга: Атрибуты или категория отдельного листинга сравниваются с классом кластера.
- Пометка для проверки: Если данные листинга несовместимы с классом кластера, листинг помечается для дальнейшей проверки (review), по результатам которой он может быть модифицирован.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании контекстуальных данных, полученных из самих листингов и их расположения.
- Географические факторы: Местоположение листингов (координаты). Расстояние между листингами (proximity). Плотность расположения листингов (density).
- Контентные факторы (Данные листинга):
- Category: Заявленный тип сущности (жилой, коммерческий, розничный и т.д.).
- Attributes: Характеристики листинга. Ключевой упомянутый атрибут — Visitability. Также упоминаются часы работы, информация о входе и парковке.
- Адресная информация (используется для определения inter-listing relationships).
Какие метрики используются и как они считаются
- Distance Threshold (Порог расстояния): Метрика для определения того, достаточно ли близки два листинга, чтобы между ними была проведена связь (edge) при построении графа кластеров.
- Density (Плотность): Метрика, основанная на расстояниях между листингами в кластере. Используется для модификации inter-listing relationship.
- Census (Состав кластера): Подсчет или процентное соотношение различных категорий внутри кластера. Используется для классификации кластера.
- Пороги несоответствия: Заданное число или процент листингов в кластере, которым должен соответствовать выбранный листинг, чтобы его атрибут или категория считались валидными.
Выводы
- Географический контекст как сигнал валидации: Патент демонстрирует, как Google использует физическое окружение сущности для проверки достоверности заявленных ею данных. Местоположение и соседи являются важными факторами в локальном поиске.
- Приоритет консенсуса над индивидуальными заявлениями: Система отдает предпочтение консенсусу физической области над тем, что заявляет отдельный бизнес. Если данные бизнеса аномальны для его кластера, они могут быть автоматически изменены или отклонены.
- Критичность атрибута «Visitability»: Visitability (возможность посещения публикой) является ключевым атрибутом, который валидируется с помощью анализа близости. Это механизм для борьбы с попытками выдать домашние адреса или виртуальные офисы за публичные точки обслуживания.
- Автоматическое определение иерархических связей: Система способна автоматически определять сложные взаимосвязи, такие как «находится внутри» (например, кафе внутри книжного магазина), основываясь исключительно на близости, плотности и адресных данных.
- Борьба с локальным спамом: Механизм эффективно выявляет спам-листинги, категория или атрибуты которых несовместимы с их физическим окружением (например, фейковый офис в жилом доме или неверная категория бизнеса в офисном здании).
Практика
Best practices (это мы делаем)
- Точная категоризация, соответствующая локации: Убедитесь, что основная и дополнительные категории бизнеса точно отражают его деятельность и соответствуют окружению. Если бизнес находится в торговом центре, его категория должна быть релевантной для розничной торговли или услуг.
- Корректное определение типа бизнеса (SAB vs. Brick-and-Mortar): Для бизнесов, работающих из дома (Home-based businesses), критически важно правильно настроить профиль как Service Area Business (SAB) и скрыть адрес. Не заявляйте о возможности посещения (Visitability), если офис не предназначен для приема клиентов. Система, описанная в патенте, активно борется с этим нарушением.
- Управление листингами в многопользовательских зданиях: Для бизнесов в офисных центрах, коворкингах или торговых центрах необходимо указывать точные данные (например, номер офиса/павильона), чтобы система могла корректно определить кластер и взаимосвязи.
- Использование функционала «Расположен в» (Located Inside): Если ваш бизнес физически находится внутри другого объекта (например, банкомат в супермаркете), необходимо убедиться, что inter-listing relationship настроена корректно в GBP. Патент показывает, что Google стремится автоматизировать это определение.
Worst practices (это делать не надо)
- Выдавать домашний адрес за публичный офис: Заявление о том, что домашний адрес является публичной точкой обслуживания (Visitable). Система обнаружит, что кластер является жилым, и может автоматически изменить статус на «Недоступно для посещения» или пессимизировать листинг.
- Использование фейковых адресов или виртуальных офисов для спама: Размещение листинга в локации, где бизнес физически не присутствует. Система может выявить несоответствие категории бизнеса общему классу кластера (например, листинг эвакуатора в кластере медицинских учреждений).
- Некорректная категоризация (Category Spam): Выбор категорий, не соответствующих реальной деятельности или окружению, с целью манипуляции ранжированием. Такие листинги будут идентифицированы как suspect listings.
Стратегическое значение
Патент подтверждает стратегическую важность физической реальности и точности данных в локальном SEO. Google использует масштабируемые алгоритмические методы для верификации информации о бизнесе, не полагаясь только на ручную модерацию или жалобы пользователей. Для долгосрочной стратегии в Local SEO критически важно обеспечить максимальное соответствие данных в Google Business Profile реальному физическому присутствию и контексту местоположения бизнеса.
Практические примеры
Сценарий 1: Борьба со спамом SAB (Service Area Business)
- Ситуация: Сантехник регистрирует свой домашний адрес в GBP и указывает, что офис открыт для посещения.
- Действие системы: Система анализирует географическую область и определяет кластер, состоящий из дома сантехника и соседних домов.
- Анализ: Census показывает, что кластер на 100% жилой. Атрибут Visitability у всех соседей установлен в «Нет».
- Результат (Claim 1 и 2): Система сравнивает атрибут Visitability сантехника («Да») с соседями («Нет») и автоматически изменяет его на «Нет», определяя, что это не публичная локация.
Сценарий 2: Определение «Расположен в» (Located Inside)
- Ситуация: В крупном супермаркете открывается кофейный киоск. Оба листинга имеют одинаковый адрес и координаты.
- Действие системы: Система идентифицирует кластер с очень высокой плотностью (density).
- Анализ (Claim 6 и 7): Система анализирует inter-listing relationship на основе близости и плотности.
- Результат: Система модифицирует взаимосвязь, указывая, что кофейный киоск находится внутри супермаркета. Это также может привести к наследованию атрибутов, например, часов работы (упомянуто в описании патента).
Сценарий 3: Выявление некорректной категории
- Ситуация: В офисном здании, где расположены только юридические фирмы, появляется листинг с категорией «Ресторан».
- Действие системы: Система проводит Census и классифицирует кластер как «Профессиональные услуги».
- Анализ (Claim 17): Система сравнивает категорию «Ресторан» с классом кластера «Профессиональные услуги».
- Результат: Обнаружено несоответствие. Листинг помечается как suspect listing и отправляется на дополнительную проверку, чтобы убедиться, что это не спам или устаревшие данные.
Вопросы и ответы
Что такое «Visitability» (Возможность посещения) в контексте этого патента?
Visitability — это атрибут листинга, который указывает, открыто ли данное местоположение для публичного посещения с целью коммерции. Это ключевой параметр для определения того, является ли локация точкой обслуживания клиентов (Brick-and-Mortar) или это частная резиденция/закрытый офис. Система использует этот атрибут для валидации типа бизнеса.
Как этот патент влияет на Service Area Businesses (SAB), работающие из дома?
Влияние критическое. Если бизнес, работающий из дома, попытается указать свой адрес как публичный офис (т.е. заявит о Visitability), система проанализирует его окружение (жилой кластер). Обнаружив, что соседи недоступны для посещения, система может автоматически исправить атрибут или пометить листинг как подозрительный. Это подчеркивает необходимость скрывать адрес и использовать зоны обслуживания для SAB.
Может ли система автоматически изменить категорию моего бизнеса?
Согласно патенту (Claim 1), система может автоматически изменять атрибуты (например, Visitability) на основе сравнения с соседями. Однако при несоответствии категории (Claim 4 и Claim 17) система склонна идентифицировать листинг как подозрительный (suspect listing) и помечать его для дальнейшей проверки (review), а не изменять категорию мгновенно.
Как система определяет кластер?
Патент описывает несколько методов. Один из технических методов: каждый листинг представляется как узел графа. Если расстояние между двумя узлами меньше заданного порога (distance threshold), между ними проводится связь. Группы связанных узлов (связные компоненты) и образуют кластер. Также могут использоваться методы анализа листингов в радиусе от точки или внутри ячейки карты.
Что такое «Census» (Перепись) и «Class» (Класс) кластера?
Census — это анализ состава кластера, определяющий, какие категории присутствуют и в каком количестве. На основе этого анализа всему кластеру присваивается Class — общая классификация территории. Например, если в кластере 90% листингов — магазины, кластер может получить класс «Розничная торговля».
Как патент помогает определить, что один бизнес находится внутри другого?
Система анализирует inter-listing relationship, основываясь на географической близости и плотности (density) кластера. Если несколько листингов находятся очень близко друг к другу или имеют одинаковый адрес (например, банкомат и магазин), система может определить иерархическую связь и установить отношение «находится внутри».
Что делать, если мой бизнес является исключением в своем районе (например, единственный магазин в жилом квартале)?
В таких случаях существует риск, что система пометит ваш листинг как подозрительный или неверно скорректирует атрибут Visitability. Необходимо предоставить максимум подтверждающих сигналов о легитимности бизнеса: фотографии экстерьера и интерьера, точные часы работы, отзывы клиентов, подтверждающие посещение, и быть готовым к прохождению верификации со стороны Google.
Влияет ли этот механизм на ранжирование в локальном поиске?
Прямого влияния на расчет релевантности нет, но влияние на ранжирование значительно косвенное. Если система изменит категорию бизнеса или определит его как недоступный для посещения (not visitable), это кардинально изменит набор запросов, по которым листинг может ранжироваться. Выявление листинга как подозрительного также может привести к пессимизации.
Как этот патент относится к виртуальным офисам и коворкингам?
Система может создавать проблемы для бизнесов, использующих виртуальные офисы или коворкинги, если их категория не соответствует другим арендаторам или если они заявляют о Visitability там, где это не предусмотрено. В таких плотных кластерах система будет активно искать несоответствия и определять взаимосвязи, что требует аккуратного управления данными в GBP.
Используется ли этот механизм только для бизнесов?
Нет. В патенте указано, что сущности (Entities) включают также жилые объекты, общественные места (парки, остановки) и даже географические объекты (дороги, озера). Система может использоваться для улучшения данных о любых объектах на карте, используя их контекстуальное окружение.