Google использует систему для сбора и проверки данных о точках интереса (POI) от пользователей мобильных устройств. Система проверяет точность данных двумя способами: автоматически, через кластеризацию (если несколько пользователей сообщают об одном и том же объекте в одном месте), или вручную, через модерацию. Также используется система репутации для оценки надежности пользователей, предоставляющих данные.
Описание
Какую задачу решает
Патент решает проблему сбора, верификации и поддержания актуальности данных о географически распределенных объектах или точках интереса (Points of Interest, POI), таких как банкоматы, рестораны, остановки и т.д. Традиционные методы сбора данных могут быть неполными, устаревшими или неверифицированными. Изобретение создает механизм для масштабного краудсорсинга этой информации с использованием мобильных устройств и включает процессы автоматической и ручной верификации для обеспечения качества данных.
Что запатентовано
Запатентована система для получения и обработки тегов местоположения (location tags) от множества пользовательских устройств. Тег местоположения включает категорию объекта и его географические координаты. Система использует два основных механизма верификации: автоматическое подтверждение через кластеризацию (когда достаточное количество пользователей независимо сообщают об одном и том же объекте в пределах порогового расстояния) и ручную модерацию (когда данных для кластеризации недостаточно). Успешно верифицированные данные сохраняются как POI.
Как это работает
Система работает следующим образом:
- Сбор данных: Пользователи через мобильное приложение выбирают категорию объекта (например, «Банкомат») и отправляют тег местоположения, содержащий эту категорию и текущие GPS-координаты устройства.
- Анализ кластеров: Система группирует теги по категориям и анализирует их географическое распределение. Если обнаруживается кластер (несколько тегов одной категории близко друг к другу), местоположение автоматически верифицируется.
- Модерация: Если кластер не обнаружен, система генерирует запрос на модерацию (moderation request). Модератор проверяет тег (возможно, используя историю пользователя) и одобряет его.
- Хранение: Верифицированные данные (через кластер или модерацию) сохраняются как POI в репозитории пространственных данных (Spatial Data Repository).
- Система репутации: Пользователи получают или теряют репутацию в зависимости от того, были ли их данные подтверждены (кластером/модератором) или опровергнуты (негативный отзыв).
Актуальность для SEO
Высокая. Сбор и верификация данных о реальном мире остаются критически важными для Google Maps, Local Search и Knowledge Graph. Описанные механизмы (краудсорсинг, система репутации, автоматическая и ручная верификация) лежат в основе таких программ, как Google Local Guides, и систем обработки пользовательских правок на картах.
Важность для SEO
Патент имеет высокое значение для Local SEO и Entity SEO. Хотя он не описывает алгоритмы ранжирования веб-страниц, он раскрывает фундаментальные механизмы того, как Google собирает и проверяет данные о физических объектах (POI), которые являются основой для локального поиска и Knowledge Graph. Понимание процессов верификации (кластеризация и репутация) подчеркивает важность пользовательского контента (UGC) и сигналов взаимодействия с бизнесом для подтверждения его существования, местоположения и категории.
Детальный разбор
Термины и определения
- Location Tag (Тег местоположения)
- Пакет данных, отправляемый пользовательским устройством. Включает категорию местоположения (Location Category) и местоположение устройства (Device Location), соответствующее географическим координатам устройства в момент отправки.
- Point of Interest (POI, Точка интереса)
- Верифицированное географическое местоположение, соответствующее определенной категории (например, банкомат, ресторан). Сохраняется в репозитории пространственных данных после успешной проверки.
- Cluster / Cluster Location (Кластер / Местоположение кластера)
- Ситуация, когда пороговое количество тегов местоположения с одинаковой категорией получено из географических местоположений, находящихся в пределах порогового расстояния друг от друга. Наличие кластера используется как механизм автоматической верификации.
- Moderation Request (Запрос на модерацию)
- Запрос, генерируемый системой для ручной проверки тега местоположения, когда автоматическая верификация через кластеризацию невозможна (например, недостаточно данных). Может включать историю пользователя (user history).
- Reputation (Репутация)
- Метрика, связанная с пользователем, отражающая надежность предоставляемых им данных. Увеличивается при успешной верификации его тегов (через кластер или модерацию) и уменьшается при получении негативных отзывов или отклонении модератором.
- Spatial Data Repository (Репозиторий пространственных данных)
- База данных, хранящая верифицированные POI и связанные с ними метаданные (изображения, описания).
- Location Category (Категория местоположения)
- Предопределенный тип объекта, который пользователь выбирает при создании тега (например, «Ресторан», «Банкомат», «Парк»).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод получения информации о местоположении.
- Система получает теги местоположения от множества устройств (каждый тег содержит категорию и географическое местоположение).
- Идентифицируется первый набор тегов с определенной категорией.
- Определяется, существует ли местоположение кластера (cluster location) для этого набора тегов.
- Если кластер НЕ существует: генерируется запрос на модерацию для тега из этого набора.
- Система получает одобрение модератора для этого тега.
- В ответ на одобрение модератора, географическое местоположение, соответствующее тегу, сохраняется как точка интереса (POI), связанная с данной категорией.
Ядро изобретения здесь — это использование модерации как альтернативного пути верификации, когда автоматическая верификация (кластеризация) не срабатывает.
Claim 2 (Зависимый от 1): Описывает путь автоматической верификации.
- Если определяется, что местоположение кластера СУЩЕСТВУЕТ для набора тегов, это местоположение сохраняется как POI, связанное с соответствующей категорией.
Это подтверждает, что система использует два пути верификации: автоматический (кластеризация) и ручной (модерация).
Claims 3, 4, 11 (Зависимые): Детализируют систему репутации.
- Репутация пользователя увеличивается, если его тег верифицирован либо через обнаружение кластера (Claim 3), либо через одобрение модератора (Claim 4, 11).
Claims 5, 12 (Зависимые): Детализируют обработку ошибок.
- Репутация пользователя уменьшается в ответ на получение негативного отзыва (negative feedback), связанного с его тегом.
Claims 6, 13 (Зависимые): Определяют понятие кластера.
- Определение существования кластера включает определение того, содержит ли по крайней мере пороговое количество (threshold number) тегов местоположения, находящиеся в пределах порогового расстояния (threshold distance) друг от друга.
Где и как применяется
Изобретение относится к этапам сбора и первичной обработки данных, которые критичны для систем локального поиска и картографических сервисов.
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
Это основная область применения патента. Система выступает как механизм «сканирования» реального мира, используя пользователей мобильных устройств в качестве агентов сбора данных (краулеров). Вместо загрузки веб-страниц система получает теги местоположения, изображения и описания физических объектов.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит обработка собранных данных:
- Верификация: Применение логики кластеризации или модерации для подтверждения точности данных.
- Извлечение признаков: Обработка сопутствующих данных. Патент упоминает возможность выполнения оптического распознавания символов (OCR) на полученных изображениях для извлечения информации о местоположении.
- Хранение: Сохранение верифицированных данных как POI в Spatial Data Repository (эквивалент индекса для пространственных данных).
- Расчет метрик: Обновление метрик репутации пользователей.
Входные данные:
- Теги местоположения (Категория + Географические координаты).
- Изображения и описания (опционально).
- Идентификаторы пользователей (для управления репутацией).
- Данные от модераторов (одобрение/отклонение).
- Негативные отзывы от других пользователей.
Выходные данные:
- Верифицированные Точки Интереса (POI) в репозитории.
- Обновленные оценки репутации пользователей.
На что влияет
- Конкретные типы контента: Влияет исключительно на данные о физических местоположениях (POI) — бизнес-листинги, публичные объекты (парки, банкоматы), временные события (например, упоминается категория «сильный шторм»).
- Специфические запросы: Наибольшее влияние на локальные запросы (например, «банкомат рядом со мной», «рестораны в [городе]»), где требуется точное знание о существовании и местоположении объектов.
- Ниши и тематики: Влияет на все ниши, имеющие физическое присутствие. Особенно важно для категорий, где данные быстро меняются или плохо покрыты официальными источниками.
Когда применяется
- Триггеры активации: Алгоритм активируется при получении нового тега местоположения от пользователя.
- Условия верификации:
- Автоматическая верификация срабатывает, когда достигается пороговое количество тегов в пределах порогового расстояния (кластер).
- Ручная модерация инициируется, когда кластер не обнаружен.
- Обработка экстренных ситуаций: Патент упоминает возможность использования системы для экстренных категорий (например, «сильный шторм»). В этом случае система может транслировать уведомление о чрезвычайной ситуации другим пользователям.
Пошаговый алгоритм
Процесс на стороне сервера (обработка тегов):
- Получение данных: Система получает теги местоположения от пользовательских устройств, содержащие выбранные категории и координаты устройств.
- Идентификация набора: Теги группируются по категориям.
- Проверка кластера: Для группы тегов определяется, существует ли кластер (достигнуты ли пороги по количеству тегов и расстоянию между ними).
- Путь автоматической верификации (Кластер ЕСТЬ):
- Местоположение устройства сохраняется в Spatial Data Repository как POI.
- Репутация пользователя(ей), предоставивших теги, увеличивается.
- Переход к этапу мониторинга обратной связи.
- Путь ручной верификации (Кластера НЕТ):
- Генерируется запрос на модерацию для этих тегов. Запрос может включать историю пользователя.
- Система ожидает ответа от модератора.
- Обработка ответа модератора:
- Если получено одобрение: Местоположение сохраняется как POI, репутация пользователя увеличивается.
- Если получен отказ: Местоположение исключается из хранения, репутация пользователя уменьшается.
- Мониторинг обратной связи: После сохранения POI система отслеживает негативные отзывы (negative feedback) от других пользователей.
- Обработка негативных отзывов: Если получен негативный отзыв (например, превышено пороговое количество жалоб на неверный POI):
- Репутация пользователя(ей), создавших POI, уменьшается.
- POI может быть удален из репозитория.
Какие данные и как использует
Данные на входе
Патент фокусируется на сборе и верификации геоданных и использует следующие типы факторов:
- Географические факторы: Географические координаты устройства (широта, долгота, высота), полученные от позиционирующих устройств (например, GPS, вышки сотовой связи). Точность определения местоположения также может учитываться.
- Пользовательские факторы:
- Выбранная пользователем категория (Location Category).
- Идентификатор пользователя.
- История пользователя (User History) и его текущая Репутация (могут использоваться модератором или для взвешивания вклада в кластер).
- Мультимедиа факторы: Изображения, захваченные камерой устройства в момент создания тега.
- Контентные факторы: Текстовое описание (Description), введенное пользователем.
- Поведенческие факторы: Негативная обратная связь (Negative Feedback) от других пользователей относительно созданного POI.
Какие метрики используются и как они считаются
- Distance Threshold (Пороговое расстояние): Предопределенное расстояние (например, 300 футов), используемое для определения того, находятся ли два тега местоположения достаточно близко, чтобы считаться частью одного кластера.
- Threshold Number (Пороговое количество): Минимальное количество тегов местоположения, необходимое для формирования кластера (например, 3 пользователя).
- Cluster (Кластер): Метрика, определяемая выполнением условий Threshold Number и Distance Threshold.
- Reputation (Репутация): Метрика пользователя, которая корректируется на основе качества его вклада (подтверждение/отклонение тегов, негативная обратная связь).
- Методы анализа текста (NLP): Упоминается использование оптического распознавания символов (Optical Character Recognition, OCR) на изображениях для получения информации о местоположении (например, распознавание текста на вывеске магазина).
Выводы
- Критическая роль UGC в локальном поиске: Патент подтверждает, что пользовательский контент (UGC) является основным источником данных для Google при обнаружении и обновлении информации о реальных объектах (POI). Система спроектирована для масштабирования сбора данных через краудсорсинг.
- Двухуровневая система верификации: Google не доверяет краудсорсинговым данным слепо. Существует четкий механизм верификации: автоматический (через кластеризацию) и ручной (через модерацию). Кластеризация (консенсус пользователей) является предпочтительным методом автоматического подтверждения точности данных.
- Важность объема взаимодействий (Clustering): Для автоматической верификации POI требуется достижение пороговых значений по количеству пользователей и близости их сообщений. Это подчеркивает важность объема позитивных сигналов и взаимодействий с бизнесом (чекины, добавление фото, которые действуют аналогично описанным тегам) для подтверждения его релевантности и местоположения.
- Система репутации и доверенные пользователи: Внедрение системы репутации означает, что не все пользователи равны. Вклад пользователей с высокой репутацией (например, опытных Local Guides) может требовать меньше подтверждений (меньший порог кластеризации) или иметь больший вес при модерации.
- Борьба с манипуляциями и ошибками: Система включает механизмы самокоррекции: уменьшение репутации за неверные данные и обработку негативных отзывов (negative feedback) для удаления ошибочных POI.
- Обогащение данных через мультимедиа: Система предусматривает сбор изображений и их анализ (включая OCR) для извлечения дополнительной информации о POI, что подчеркивает важность визуального контента в локальном поиске.
Практика
Best practices (это мы делаем)
- Стимулирование пользовательской активности (UGC): Активно поощряйте клиентов оставлять отзывы, загружать фотографии и делать чекины в вашем физическом местоположении. Эти действия служат сигналами, аналогичными тегам местоположения в патенте. Больший объем этих сигналов помогает сформировать кластер, подтверждая актуальность и популярность вашего POI.
- Обеспечение точности основных данных (NAP): Убедитесь, что ваш Name, Address, Phone (NAP) абсолютно точны в Google Business Profile и на вашем сайте. Это помогает системе корректно кластеризовать пользовательские сигналы вокруг вашего реального местоположения.
- Работа с визуальным контентом: Загружайте качественные фотографии экстерьера и интерьера. Учитывая упоминание OCR в патенте, убедитесь, что вывески и важная информация (например, часы работы) четко видны на фотографиях. Это помогает как автоматическим системам (OCR), так и модераторам верифицировать ваш бизнес.
- Мониторинг и реагирование на обратную связь: Отслеживайте пользовательские правки и отзывы. Быстро реагируйте на негативную обратную связь (negative feedback), чтобы минимизировать риск удаления или понижения вашего POI.
- Поддержка Local Guides: Взаимодействуйте с сообществом Local Guides. Поскольку патент описывает систему репутации, вклад от высокоуровневых гидов может быть более доверенным и быстрее проходить верификацию.
Worst practices (это делать не надо)
- Генерация фальшивых сигналов взаимодействия: Попытки создать искусственный кластер путем массовой отправки фальшивых тегов, чекинов или отзывов с поддельных аккаунтов рискованны. Система репутации и механизм обработки негативных отзывов направлены на выявление и наказание за такие действия (понижение репутации участников и удаление POI).
- Игнорирование точности геоданных: Предоставление неточных координат или частая смена местоположения без обновления данных затрудняет формирование устойчивого кластера и может привести к необходимости постоянной ручной модерации.
- Пренебрежение UGC: Отсутствие пользовательской активности вокруг вашего POI делает его менее верифицированным в глазах системы, полагающейся на кластеризацию.
Стратегическое значение
Этот патент подчеркивает стратегический приоритет Google в построении точной и актуальной карты реального мира, используя пользователей как основной источник данных. Для Local SEO это означает, что управление репутацией и стимулирование естественной пользовательской активности (UGC) являются не просто факторами ранжирования, а критически важными элементами для подтверждения самого существования и характеристик бизнеса в экосистеме Google. Стратегия должна фокусироваться на создании реального взаимодействия в физической точке, которое затем отражается в цифровых сигналах.
Практические примеры
Сценарий: Ускорение верификации нового кафе в малопроходимом месте.
- Проблема: Новое кафе открылось в переулке. Естественного трафика пока мало, поэтому автоматическая кластеризация сигналов (чекинов, фото) происходит медленно. POI долго находится на модерации или не отображается на карте.
- Действия по патенту:
- Владелец проводит мероприятие для местных жителей и приглашает участников сообщества Local Guides (пользователи с высокой репутацией).
- Участников просят сделать чекин, добавить фото интерьера и вывески (для OCR и модерации) и оставить отзыв.
- Ожидаемый результат:
- Всплеск активности от разных пользователей в одной точке помогает быстрее достичь пороговых значений для формирования кластера.
- Вклад от пользователей с высокой репутацией ускоряет процесс верификации.
- Наличие качественных фото помогает модераторам (если кластер все же не сформировался) подтвердить существование кафе.
Вопросы и ответы
Что такое «кластер» в контексте этого патента и почему он важен для Local SEO?
Кластер — это ситуация, когда достаточное количество пользователей независимо друг от друга сообщают о существовании объекта одной категории в одном и том же месте (в пределах порогового расстояния). В патенте кластер используется как механизм автоматической верификации данных без участия человека. Для Local SEO это означает, что объем пользовательских сигналов (чекины, отзывы, фото), связанных с вашим бизнесом, напрямую влияет на уверенность Google в точности ваших данных.
Как работает система репутации, описанная в патенте?
Система репутации отслеживает надежность каждого пользователя, предоставляющего данные. Репутация увеличивается, если отправленные пользователем данные подтверждаются (автоматически через кластеризацию или вручную модератором). Репутация уменьшается, если данные отклоняются модератором или если на созданный POI поступают негативные отзывы от других пользователей. Пользователи с высокой репутацией, вероятно, считаются более надежными источниками.
Какова роль модераторов в этой системе?
Модераторы подключаются, когда система не может автоматически верифицировать данные, то есть когда не сформирован кластер (например, объект находится в удаленном месте или о нем сообщило слишком мало людей). Модератор вручную проверяет предоставленные данные (тег местоположения, фото, описание) и может учитывать историю и репутацию пользователя перед принятием решения об одобрении POI.
Патент упоминает использование OCR (оптического распознавания символов). Как это влияет на SEO?
Система может анализировать загруженные пользователями изображения и извлекать из них текст (например, с вывесок, указателей, меню). Это подчеркивает важность качественного визуального контента в Google Business Profile. Необходимо следить за тем, чтобы ключевая информация о бизнесе (название, часы работы) была четко видна на фотографиях, так как это помогает Google верифицировать и обогащать данные о вашем POI.
Может ли этот патент использоваться для борьбы со спамом в локальном поиске?
Да. Механизмы верификации направлены на предотвращение создания фальшивых POI. Если спамер пытается создать несуществующий объект, он должен либо сгенерировать достаточно фальшивых сигналов для формирования кластера (что сложно и рискованно из-за системы репутации), либо пройти ручную модерацию. Кроме того, механизм негативной обратной связи позволяет реальным пользователям сообщать о спаме, что приводит к удалению POI и понижению репутации спамера.
Как этот патент связан с программой Google Local Guides?
Патент описывает базовые механизмы, которые, вероятно, лежат в основе Google Local Guides. Local Guides — это реализация описанной краудсорсинговой модели. Уровни гидов напрямую коррелируют с понятием репутации в патенте. Вклад гидов (добавление мест, фото, отзывов) — это те самые теги местоположения и сопутствующие данные, которые обрабатываются системой.
Что делать, если мой бизнес находится в месте с низким пешеходным трафиком?
В таких местах сложнее сформировать естественный кластер пользовательских сигналов. В этом случае верификация, скорее всего, пойдет по пути ручной модерации. Необходимо максимально облегчить работу модератора: предоставить исчерпывающую информацию в GBP, загрузить четкие фотографии экстерьера с вывеской и убедиться в точности координат. Также стоит активнее стимулировать реальных клиентов оставлять отзывы и загружать фото.
Влияет ли этот патент на ранжирование в Local Pack?
Прямо на алгоритмы ранжирования (кто выше) он не влияет. Однако он влияет на то, попадет ли ваш бизнес в базу данных верифицированных POI вообще. Если система не уверена в существовании или категории вашего бизнеса (нет кластера и недостаточно данных для модерации), вы не будете ранжироваться. Косвенно, формирование сильного кластера может указывать на популярность места, что часто коррелирует с более высокими позициями.
Описывает ли патент сбор данных только о постоянных объектах?
Нет. Патент упоминает возможность использования системы для временных или экстренных событий, таких как «сильный шторм». Это показывает гибкость системы для сбора и распространения актуальной информации о местоположении в реальном времени, что может применяться, например, для отображения данных о пробках или происшествиях.
Что важнее для верификации: количество сигналов или качество источников?
Система использует оба подхода. Количество сигналов критично для автоматической верификации через кластеризацию. Однако качество источников (репутация пользователя) также учитывается, особенно на этапе модерации или при взвешивании вклада. В идеале, для надежной верификации необходим объем сигналов от пользователей с хорошей репутацией.