Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует чекины, фотографии и социальные сети для автоматического обновления и валидации данных о локальном бизнесе (POI)

    GEOGRAPHIC DATA UPDATE BASED ON USER INPUT (Обновление географических данных на основе пользовательского ввода)
    • US8849567B2
    • Google LLC
    • 2014-09-30
    • 2012-05-31
    2012 EEAT и качество Local SEO Индексация Патенты Google

    Google использует систему для автоматического обновления своей базы данных физических локаций (POI) на основе краудсорсинговых данных, таких как чекины и посты в социальных сетях. Система присваивает записям «Оценку Достоверности» (Confidence Value). Многократные подтверждения повышают эту оценку, позволяя Google верифицировать существующие локации, добавлять новые или автоматически удалять устаревшие данные о закрывшихся бизнесах.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему устаревания и неточности данных в географических информационных системах (GIS) и базах данных Points of Interest (POI). Поскольку бизнесы часто открываются, закрываются, переезжают или меняют названия, не уведомляя об этом агрегаторы данных, поддерживать актуальность базы в ручном режиме невозможно. Изобретение предлагает автоматизированный метод обновления географических данных на основе анализа пользовательского ввода (краудсорсинга).

    Что запатентовано

    Запатентована система и метод для обновления географической информационной системы путем анализа пользовательского ввода, такого как географические чекины (geographic check-ins) или данные, собранные веб-краулерами. Центральным элементом является механизм Confidence Value (Оценка Достоверности), который используется для верификации существующих POI, валидации новых и деактивации устаревших. Если пользовательский ввод подтверждает существующую запись, ее достоверность повышается. Если ввод указывает на новый POI, он проходит проверку во временном хранилище до достижения порогового уровня достоверности.

    Как это работает

    Система работает в несколько этапов:

    • Сбор данных: Система получает название и локацию POI из пользовательского ввода (например, пост в социальной сети с геотегом, фотография) напрямую или через веб-краулер.
    • Сравнение: Полученные данные сравниваются с основной базой данных (Data Repository). Проверяется совпадение названия и близость локации (в пределах predetermined distance).
    • Верификация существующих POI: Если совпадение найдено, Confidence Value существующей записи увеличивается.
    • Обработка новых POI: Если совпадение не найдено, данные добавляются во временный набор (Temporary Set).
    • Валидация новых POI: Система отслеживает последующие вводы. Если поступают подтверждающие данные в течение определенного времени, Confidence Value временной записи растет. При достижении порога (first predetermined threshold) запись переносится в основную базу. Если подтверждений нет, запись удаляется.
    • Разрешение конфликтов (Деактивация): Если POI достигает очень высокого уровня достоверности (second predetermined threshold), система может снизить Confidence Value других POI с той же локацией, но другими названиями (предполагая, что старый бизнес закрылся).

    Актуальность для SEO

    Высокая. Поддержание точности и свежести локальных данных критически важно для Google Maps и Локального поиска. Использование краудсорсинговых данных, анализа изображений и социальных сигналов для обновления и валидации базы локальных сущностей (часть Knowledge Graph) остается ключевым механизмом, позволяющим масштабировать сбор данных о миллионах физических локаций.

    Важность для SEO

    Патент имеет критическое значение для Local SEO. Он описывает фундаментальный механизм, с помощью которого Google верифицирует существование, название и местоположение бизнеса, используя данные вне прямого контроля владельца (UGC). Это подчеркивает важность стимулирования реальной пользовательской активности (чекины, фото с геотегами) и обеспечения абсолютной согласованности NAP (Name, Address, Phone) во всей экосистеме для поддержания высокого Confidence Value.

    Детальный разбор

    Термины и определения

    Confidence Value (Оценка Достоверности)
    Метрика, указывающая на вероятность того, что POI с определенным названием действительно существует в указанной локации. Может быть представлена как числовое значение (например, от 0 до 1). Увеличивается при получении подтверждающих данных и может уменьшаться при конфликтах.
    Data Repository (Репозиторий данных)
    Основная база данных, хранящая верифицированную географическую информацию о POI (названия, локации и Confidence Values).
    Geographic Check-in (Географический чекин)
    Пользовательский ввод, связывающий пользователя с определенной локацией. Может быть постом в социальной сети, статусом или специализированным чекином.
    Geocode (Геокод)
    Представление географического местоположения, полученное от устройства (например, широта/долгота, данные WiFi/Cell tower).
    POI (Point of Interest / Точка интереса)
    Конкретная физическая локация, представляющая интерес (например, бизнес, организация, парк).
    Predetermined Distance (Предопределенное расстояние)
    Пороговый радиус, используемый для определения географического совпадения. Может варьироваться в зависимости от типа POI или плотности застройки (например, меньше в городе, больше в пригороде).
    Temporary Set (Временный набор точек интереса)
    Временное хранилище для новых или не верифицированных POI, ожидающих валидации.
    Trusted User (Доверенный пользователь)
    Пользователь, известный предоставлением точной информации (например, активный участник сообщества). Ввод от таких пользователей может использоваться для ускоренной верификации.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс верификации и критически важный механизм разрешения конфликтов (деактивации устаревших данных).

    1. Система получает название и локацию POI (Received POI).
    2. Происходит сравнение с Data Repository.
    3. Определяется, есть ли в базе POI (POI-1), чье название совпадает И локация находится в пределах predetermined distance.
    4. Если ДА (совпадение найдено): Confidence Value для POI-1 увеличивается или подтверждается его максимум.
    5. Если НЕТ (совпадение не найдено): Received POI добавляется в Temporary Set.

    Механизм разрешения конфликтов (Ключевая часть Claim 1): Активируется, когда совпадение найдено (Шаг 4):

    1. Система проверяет, есть ли другой POI (POI-2) в базе, чья локация близка к Received POI, но название отличается.
    2. Система проверяет, превышает ли Confidence Value POI-1 второй предопределенный порог (second predetermined threshold – высокий уровень уверенности).
    3. Если оба условия выполнены: Confidence Value POI-2 снижается.

    Этот механизм позволяет системе автоматически определять, что один бизнес заменил другой: сильное подтверждение нового бизнеса (POI-1) активно снижает достоверность старого бизнеса (POI-2) в той же локации.

    Claim 2, 3, 4 (Зависимые): Детализируют процесс подтверждения для POI, попавших в Temporary Set (Claim 2).

    Подтверждение может происходить двумя путями:

    • Ручная верификация (Claim 3): Подтверждение от Trusted User.
    • Автоматическое подтверждение (Claim 4): Система получает последующий ввод (subsequent input), соответствующий POI во временном наборе. Confidence Value этого POI увеличивается. Если он превышает первый предопределенный порог (first predetermined threshold), POI считается подтвержденным и перемещается в основной Data Repository.

    Это описывает краудсорсинговую валидацию: несколько независимых подтверждений необходимы для добавления нового POI в основную базу.

    Где и как применяется

    Изобретение применяется для поддержания качества и актуальности базы данных локальных сущностей (например, Google Maps / Knowledge Graph).

    CRAWLING – Сканирование и Сбор данных
    Система активно использует этот этап. Веб-краулеры (web crawler) сканируют внешние источники (например, социальные сети, сайты с чекинами) для обнаружения публично доступных пользовательских вводов, содержащих географическую информацию и названия POI. Также данные поступают напрямую от пользовательских устройств.

    INDEXING – Индексирование и извлечение признаков
    Основное применение патента. Это процесс обработки и обновления базы данных географических сущностей.

    1. Извлечение признаков (Feature Extraction): Из неструктурированного ввода (текста поста, фотографии вывески) извлекаются структурированные данные: Название POI и Локация. Упоминается использование NLP и преобразование изображения в текст (image-to-text conversion).
    2. Сравнение и Сопоставление (Matching): Извлеченные данные сравниваются с существующим индексом POI.
    3. Управление Индексом (Index Management): Система обновляет Confidence Values, управляет Temporary Set и разрешает конфликты между POI.

    Входные данные:

    • Пользовательский ввод (Geographic Check-in) или данные от веб-краулера.
    • Geocode (например, Latitude/Longitude, IP адрес, данные WiFi).
    • Информация, идентифицирующая POI (текст, изображение, аудио).
    • Статус пользователя (Trusted User или нет).

    Выходные данные:

    • Обновленный Data Repository с новыми Confidence Values, добавленными или удаленными POI.

    На что влияет

    • Конкретные типы контента: Влияет на отображение и точность данных о локальных бизнесах в Local Pack, Google Maps и Knowledge Panels.
    • Специфические запросы: Локальные запросы (например, «ресторан рядом со мной») и навигационные запросы к конкретным локациям.
    • Конкретные ниши: Все ниши локального бизнеса, особенно с высокой динамикой изменений (рестораны, ритейл).

    Когда применяется

    • Триггеры активации: Получение нового пользовательского ввода или обнаружение его веб-краулером.
    • Временные рамки: Для валидации новых POI используется predetermined period of time (например, неделя, месяц). Если подтверждений нет, запись из Temporary Set удаляется.
    • Пороговые значения:
      • Predetermined distance: для географического совпадения (например, 3.5м в городе, 35м в пригороде).
      • First predetermined threshold: для переноса POI из временного набора в основную базу.
      • Second predetermined threshold: для активации снижения достоверности конфликтующих POI.

    Пошаговый алгоритм

    Процесс А: Обработка входящего POI

    1. Получение и Обработка Ввода: Система получает ввод, извлекает Название и Локацию POI (используя NLP или анализ изображений).
    2. Сравнение с Репозиторием: Поиск совпадений в Data Repository по названию (с учетом опечаток/синонимов) и локации (в пределах predetermined distance).
    3. Принятие Решения:
      • Если совпадение найдено: Перейти к Процессу Б.
      • Если совпадение не найдено: Перейти к Процессу В.

    Процесс Б: Обновление существующего POI (Совпадение найдено)

    1. Повышение Достоверности: Увеличить Confidence Value найденного POI (POI-1).
    2. Проверка Конфликтов: Идентифицировать другие POI (POI-2) в том же месте, но с другим названием.
    3. Проверка Порога (Высокий): Превышает ли Confidence Value POI-1 второй порог (second predetermined threshold)?
    4. Понижение Конкурентов: Если ДА, снизить Confidence Value POI-2.
    5. Завершение.

    Процесс В: Обработка нового POI (Совпадение не найдено)

    1. Добавление во Временный Набор: Добавить POI в Temporary Set.
    2. Мониторинг Подтверждений (Цикл):
      • Проверка Времени: Прошло ли predetermined period of time? Если ДА, перейти к шагу 3 (Удаление).
      • Новые Вводы: Получен ли дополнительный ввод, подтверждающий этот POI?
      • Если ДА: Увеличить Confidence Value. Проверить, превышает ли он первый порог (first predetermined threshold) или получено ли подтверждение от Trusted User. Если ДА, перейти к шагу 4 (Продвижение).
      • Если НЕТ: Продолжить мониторинг.
    3. Удаление: Удалить POI из Temporary Set. Завершение.
    4. Продвижение: Переместить POI из Temporary Set в Data Repository. Завершение.

    Какие данные и как использует

    Данные на входе

    • Географические факторы: Критически важны. Используются Geocode (широта/долгота), IP-адрес, данные WiFi или вышек сотовой связи. Патент также упоминает возможность использования высоты (elevation value) и данных с камеры (направление, глубина) для уточнения локации объекта на фото.
    • Контентные и Мультимедиа факторы: Текст из чекинов или постов. Система использует NLP для извлечения названия POI из естественного языка. Также используется image-to-text conversion для распознавания названий на фотографиях (например, вывесках).
    • Пользовательские факторы: Статус пользователя. Система может идентифицировать Trusted User (например, активный участник сообщества или сотрудник) для ускоренной верификации. Также упоминается возможность использования KML-фидов (истории местоположений пользователя).
    • Временные факторы: Временная метка (Timestamp) ввода для проверки свежести данных.

    Какие метрики используются и как они считаются

    • Confidence Value: Основная метрика достоверности. Увеличивается на заданную величину при подтверждении и снижается при конфликтах.
    • Методы Сопоставления Названий (Name Matching):
      • String-edit distance: Для учета опечаток (например, разница не более трех символов).
      • Synonym table: Для учета синонимов (например, «Bar» и «Tavern»).
      • Перестановки слов (Word permutations).
    • Predetermined Distance: Порог географической близости. Может быть динамическим (например, 3.5м для кафе в городе, 35м для супермаркета в пригороде).
    • Пороговые значения (Thresholds): First predetermined threshold (для добавления нового POI), Second predetermined threshold (для деактивации старого POI), Preset threshold (низкий порог для удаления или ручной проверки).

    Выводы

    1. Краудсорсинг как основа актуальности локальных данных: Google активно использует пользовательские сигналы (чекины, посты в соцсетях, фото) как основной механизм для поддержания точности своей географической базы данных, а не только данные от владельцев бизнеса.
    2. Confidence Value – динамическая мера достоверности: Существование POI в базе не является статичным. Confidence Value постоянно пересчитывается на основе входящих сигналов. Высокая оценка требует многократных подтверждений из разных источников.
    3. Валидация через временное хранилище (Temporary Set): Новые или измененные POI не добавляются в основную базу сразу. Они проходят проверку в «песочнице», что защищает от ошибок и спама. Если подтверждений нет в течение определенного времени, данные отбрасываются.
    4. Автоматическое устаревание и замена данных: Система включает агрессивный механизм деактивации старых данных. Если новый POI в том же месте достигает высокой достоверности (Second Predetermined Threshold), система автоматически снижает Confidence Value старых записей (например, закрывшегося бизнеса).
    5. Извлечение данных из неструктурированного контента: Система способна извлекать названия и локации из текста постов и фотографий (вывесок), что значительно расширяет охват источников данных за пределы структурированных чекинов.
    6. Важность внешних сигналов для Local SEO: Для локального продвижения критически важны не только данные в GBP, но и то, как пользователи взаимодействуют с бизнесом в реальном мире и упоминают его онлайн (в том числе на сторонних платформах, сканируемых веб-краулерами).

    Практика

    Best practices (это мы делаем)

    • Стимулирование реальной пользовательской активности: Поощряйте клиентов чекиниться в вашем заведении, публиковать посты и фотографии с упоминанием названия вашего бизнеса и геолокацией. Это напрямую увеличивает Confidence Value вашего POI.
    • Обеспечение абсолютной согласованности NAP: Убедитесь, что название и адрес используются единообразно во всех источниках. Это помогает алгоритму корректно сопоставлять (match) пользовательские упоминания с вашим POI, несмотря на его способность обрабатывать опечатки и синонимы.
    • Оптимизация физического присутствия (Вывески): Убедитесь, что название вашего бизнеса хорошо видно на вывесках. Патент упоминает распознавание текста на фотографиях (image-to-text conversion). Четкая вывеска на фото пользователей служит сигналом валидации.
    • Ускорение индексации новых/переехавших локаций: При открытии или переезде генерируйте максимум реальных сигналов сразу (мероприятия, акции за чекин). Это поможет быстрее преодолеть first predetermined threshold и переместить POI из Temporary Set в основную базу, а также инициировать снижение Confidence Value старой локации.
    • Использование Trusted Users (Local Guides): Активность от доверенных пользователей (например, Google Local Guides высокого уровня) может иметь больший вес при верификации данных и повышении Confidence Value, так как они могут выступать в роли Trusted User.

    Worst practices (это делать не надо)

    • Накрутка фейковых чекинов: Попытки манипуляции рискованны. Система использует Temporary Set и требует подтверждений от разных пользователей в течение времени для достижения порога достоверности. Единичные или аномальные вводы могут быть отфильтрованы или удалены по истечении времени.
    • Игнорирование изменений в названии/адресе: Если бизнес изменился, полагаться только на обновление GBP недостаточно. Необходимо активно информировать клиентов, чтобы генерировать чекины с новыми данными и ускорить процесс обновления в базе Google.
    • Несогласованность брендинга: Использование разных названий (в соцсетях, на вывеске, в GBP) затрудняет системе консолидацию сигналов и может привести к фрагментации Confidence Value между разными записями или дубликатами.

    Стратегическое значение

    Патент подтверждает стратегический сдвиг в Local SEO от управления статическими листингами к управлению сигналами из реального мира (Real-World Signals). Достоверность данных определяется не только владельцем, но и коллективным поведением пользователей. Долгосрочная стратегия должна включать интеграцию онлайн и офлайн маркетинга для генерации устойчивого потока сигналов, подтверждающих актуальность POI и повышающих его Confidence Value.

    Практические примеры

    Сценарий 1: Открытие нового ресторана на месте старого (Смена арендатора)

    1. Ситуация: Ресторан «Ромашка» закрылся, на его месте открылся бар «Кактус».
    2. Действия системы: Пользователи начинают чекиниться в «Кактусе». Система не находит совпадения с «Ромашкой» (название отличается) и добавляет «Кактус» в Temporary Set.
    3. Валидация: В течение месяца система фиксирует 50 чекинов в «Кактусе». Confidence Value «Кактуса» превышает first threshold. «Кактус» добавляется в основную базу.
    4. Разрешение конфликта: Confidence Value «Кактуса» продолжает расти и превышает second threshold. Система идентифицирует «Ромашку» как POI в том же месте с другим названием и снижает ее Confidence Value.
    5. SEO-действие: Владелец «Кактуса» должен активно стимулировать чекины и публиковать фото с новым названием, чтобы ускорить процесс валидации и вытеснения старого бизнеса из базы Google.

    Сценарий 2: Верификация данных через фотографии

    1. Ситуация: Кафе «Зерно» имеет средний Confidence Value.
    2. Действия системы: Пользователь публикует фотографию вывески «Зерно» с геотегом. Система применяет image-to-text conversion и распознает название.
    3. Верификация: Система находит совпадение (название и локация) с существующей записью. Confidence Value записи «Зерно» увеличивается.
    4. SEO-действие: Владелец кафе создает фотозону с хорошо читаемым названием бренда и проводит конкурс на лучшее фото с геотегом. Это генерирует поток подтверждающих визуальных сигналов.

    Вопросы и ответы

    Что такое Confidence Value и как он рассчитывается?

    Confidence Value — это метрика достоверности, показывающая, насколько система уверена, что бизнес с данным названием существует в данной локации. Она рассчитывается на основе количества и качества пользовательских сигналов (чекинов, постов в соцсетях, фотографий с геотегами). Каждый подтверждающий сигнал увеличивает оценку, а конфликтующие сигналы (например, чекины в другой бизнес по этому адресу) могут ее уменьшать.

    Как система определяет, что один бизнес закрылся, а на его месте открылся другой?

    Патент описывает механизм разрешения конфликтов. Когда новый POI набирает очень высокую оценку достоверности (превышает second predetermined threshold), система автоматически снижает Confidence Value других POI, зарегистрированных по этому же адресу, но с другим названием. Это позволяет автоматически отслеживать смену арендаторов на основе изменения паттернов пользовательских чекинов.

    Почему моя новая компания не сразу появляется на картах после регистрации в GBP?

    Согласно патенту, новые данные о POI часто попадают во временный набор (Temporary Set). Для переноса в основную базу данных необходимо, чтобы система получила достаточно подтверждающих сигналов от реальных пользователей и Confidence Value превысил определенный порог. Это механизм защиты от спама и ошибок, который может вызывать задержку.

    Как ускорить появление новой компании на картах или обновление данных?

    Необходимо генерировать реальные подтверждающие сигналы. Стимулируйте посетителей делать чекины, публиковать фотографии вашего заведения с геотегами и упоминать актуальное название бизнеса. Чем больше таких сигналов получит Google, тем быстрее будет достигнут порог достоверности и обновится Confidence Value.

    Использует ли Google данные из сторонних социальных сетей для обновления Google Maps?

    Да. В патенте прямо указано, что данные о POI могут быть получены через operation of a web crawler, который сканирует публичные посты и чекины. Это означает, что активность пользователей на сторонних платформах (если она публична и содержит геоданные) является важным источником информации для валидации локальных данных Google.

    Что произойдет, если пользователи будут писать название моего бизнеса с ошибками?

    Система использует гибкие методы сопоставления названий. Патент упоминает учет опечаток (используя string-edit distance), синонимов (synonym tables) и перестановок слов. Если ошибка незначительна, система, скорее всего, сможет корректно сопоставить ввод с вашим POI. Однако сильные расхождения могут привести к созданию дубликата во временном наборе.

    Кто такие Trusted Users и как они влияют на обновление данных?

    Trusted User – это пользователь с историей предоставления точной информации (например, активный участник Google Local Guides). Патент указывает, что подтверждение от такого пользователя может использоваться для быстрой верификации данных из временного набора или для проверки POI с низкой достоверностью, минуя необходимость накопления множества сигналов.

    Как система обрабатывает здания, где много бизнесов (например, торговые центры)?

    Патент учитывает такие сценарии. Система может ассоциировать одно местоположение с несколькими POI. Если система получает стабильный поток чекинов для разных POI в одном месте, она будет поддерживать высокие Confidence Values для всех них. Механизм снижения достоверности активируется, только если паттерны меняются (один POI явно заменяет другой).

    Насколько важны фотографии, загружаемые пользователями?

    Очень важны. Патент упоминает, что система может извлекать название POI из изображений (например, фотографий вывесок) с помощью image-to-text conversion. Фотографии с геометками служат сильным подтверждающим сигналом о существовании бизнеса в данном месте и помогают повысить Confidence Value.

    Насколько важна согласованность NAP (Name, Address, Phone) в контексте этого патента?

    Критически важна. Поскольку система полагается на автоматическое сопоставление пользовательских упоминаний (из чекинов, соцсетей, фото) с записями в базе данных, любое расхождение в названии или адресе может привести к тому, что система не распознает совпадение. Это замедляет набор Confidence Value и может привести к созданию некорректных дубликатов.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.