Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует полевых операторов для сбора, проверки и обновления данных о локальном бизнесе (Local SEO)

    SYSTEMS AND METHODS FOR THE COLLECTION VERIFICATION AND MAINTENANCE OF POINT OF INTEREST INFORMATION (Системы и методы сбора, верификации и поддержания информации о точках интереса)
    • US20160034493A1
    • Google LLC
    • 2016-02-04
    • 2014-08-01
    2014 EEAT и качество Knowledge Graph Индексация Патенты Google

    Патент Google, описывающий инфраструктуру и многоэтапный процесс для сбора ground-truth данных о точках интереса (POI). Система использует полевых сборщиков данных, верификаторов для контроля качества и транскрибаторов. Этот процесс обеспечивает высокую точность данных о локальных компаниях (название, адрес, телефон, часы работы, фото), используемых в Поиске и Картах.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему точности, полноты и актуальности данных о точках интереса (Points of Interest, POI), таких как локальные компании. Информация о POI часто содержит ошибки, быстро устаревает (бизнесы закрываются, открываются, переезжают) или отсутствует, особенно в развивающихся регионах. Существующие автоматизированные системы не всегда могут обнаружить эти изменения. Изобретение создает надежный конвейер для сбора и верификации ‘ground-truth’ данных непосредственно на местах.

    Что запатентовано

    Запатентована система управления рабочим процессом для сбора, верификации и поддержания информации о POI. Ядром системы является многоуровневый процесс контроля качества, включающий полевых сборщиков (Human Collectors), полевых верификаторов (Human Verifiers) и транскрибаторов (Human Transcribers). Система оценивает работу сборщиков и использует эти оценки (Score) для принятия решения о публикации собранных данных в продакшн-серверах (Production Servers), доступных веб-сервисам (например, Поиск, Карты).

    Как это работает

    Система работает как структурированный конвейер:

    • Сбор данных: Полевые операторы (Human Collectors) получают задания (регионы или списки POI) и собирают данные (атрибуты, фотографии) с помощью мобильных устройств.
    • Контроль качества (QC1): Другие операторы (Human Verifiers) выборочно проверяют работу сборщиков на местах, отмечая ошибки (incorrect, missing, unverifiable) и пропущенные POI.
    • Оценка и апрув: Сборщикам присваивается оценка (Score) на основе точности их работы. Данные одобряются для дальнейшей обработки, если оценка превышает порог.
    • Транскрипция: Транскрибаторы структурируют данные, исправляют ошибки и извлекают текст из фотографий (используя OCR).
    • Контроль качества (QC2): Проверяется точность транскрипции.
    • Публикация и поддержка: Данные попадают в базу Google. Отдельная команда (Human Maintenance Operators) периодически перепроверяет существующие данные на актуальность.

    Актуальность для SEO

    Высокая. Точность и актуальность данных о локальном бизнесе критически важны для Google Maps и Local SEO. Хотя автоматизация процессов (например, с помощью ИИ и анализа изображений) развивается, сбор ‘ground-truth’ данных с помощью полевых операторов (например, подрядчиков или Local Guides, использующих схожие инструменты) остается важной частью экосистемы Google для обеспечения качества локальной выдачи.

    Важность для SEO

    Патент имеет высокое значение для Local SEO (8/10). Он не описывает алгоритмы ранжирования, но раскрывает инфраструктуру, с помощью которой Google строит и верифицирует свою базу данных локальных объектов. Это подтверждает, что Google имеет доступ к ‘ground-truth’ данным, собранным физически на месте. Для SEO-специалистов это подчеркивает критическую важность точности данных в Google Business Profile (GBP), так как Google может физически проверить соответствие онлайн-информации реальности.

    Детальный разбор

    Термины и определения

    Human Collector (Сборщик данных)
    Полевой оператор, использующий мобильное устройство (Mobile Collection Device) для сбора информации о POI в назначенном регионе или по списку.
    Human Verifier (Верификатор данных)
    Полевой оператор, использующий мобильное устройство (Mobile Verification Device) для проверки точности данных, собранных Human Collector. Выполняет функцию контроля качества (QC).
    Human Transcriber (Транскрибатор)
    Оператор, который обрабатывает одобренные данные: очищает их, исправляет ошибки, формализует записи и извлекает информацию из фотографий в структурированные поля.
    Human Maintenance Operator (Оператор поддержки)
    Полевой оператор, который перепроверяет уже существующие в базе данных POI на актуальность (верифицирует или отмечает как закрытые).
    Intermediate Server(s) (Промежуточные серверы)
    Серверы, на которые загружаются собранные данные. Данные хранятся здесь до прохождения верификации и апрува.
    Production Server(s) (Продакшн-серверы)
    Серверы, хранящие верифицированные и обработанные данные о POI, доступные для веб-сервисов (Поиск, Карты).
    Point of Interest (POI) (Точка интереса)
    Любой объект, связанный с географическим положением: бизнес, ресторан, магазин, достопримечательность и т.д.
    Score (Оценка)
    Метрика, рассчитываемая для Human Collector на основе точности собранных им данных, выявленной в процессе верификации. Используется для принятия решения об одобрении данных.
    Dashboard Device (Панель управления)
    Устройство, используемое администраторами для мониторинга процессов, контроля рабочего потока, просмотра статистики и принятия решений (например, об одобрении данных).
    Optical Character Recognition (OCR) (Оптическое распознавание символов)
    Технология, используемая на этапе транскрипции для извлечения текста из фотографий (например, вывесок, визиток), собранных полевыми операторами.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод сбора и верификации информации.

    1. Система получает множество загрузок информации (information uploads) о POI от нескольких мобильных устройств сборщиков (mobile collection devices).
    2. Система предоставляет загрузки, связанные с первым сборщиком, на мобильное устройство верификатора (mobile verification device).
    3. Система получает от устройства верификатора данные, указывающие на точность (accuracy) одной или нескольких загрузок первого сборщика.
    4. Система (или устройство верификатора) определяет оценку (Score) для первого сборщика на основе данных о точности.
    5. Эта оценка используется для определения того, следует ли одобрить (approve) загрузки информации, связанные с первым сборщиком.

    Claim 2 (Зависимый от 1): Детализирует процесс после одобрения.

    1. Одобренные загрузки предоставляются на устройство транскрипции (transcription device).
    2. Система получает от устройства транскрипции одну или несколько правок (edits) к атрибутам, описанным в одобренных загрузках.

    Claim 3 (Зависимый от 2): Описывает контроль качества транскрипции.

    1. Данные о правках предоставляются на устройство верификации транскрипции.
    2. Система получает данные о точности правок.
    3. На основе этих данных принимается решение об одобрении правок.

    Claim 8 (Зависимый от 7, который зависит от 1): Описывает использование фотографий и OCR.

    1. Загрузки информации включают фотографии, изображающие информацию о POI (Claim 7).
    2. Одобренные загрузки предоставляются на устройство транскрипции.
    3. Выполняется OCR для идентификации текста на фотографиях.
    4. Идентифицированный текст предоставляется для выбора в пользовательском интерфейсе устройства транскрипции.

    Claim 10 (Зависимый от 1): Описывает учет пропущенных POI.

    1. Система получает от устройства верификатора данные о том, что сборщик не предоставил информацию об одном или нескольких POI в назначенном регионе.
    2. Оценка (Score) сборщика определяется также на основе этих данных (т.е. пропуски снижают оценку).

    Где и как применяется

    Этот патент описывает инфраструктуру сбора данных, которая напрямую связана с поддержанием базы данных локальных объектов Google (используемой в Google Maps и Local Search).

    CRAWLING – Сканирование и Сбор данных (Crawling & Data Acquisition)
    Это основная область применения патента. Он описывает альтернативный метод ‘сканирования’ физического мира с помощью людей для сбора ground-truth данных о POI. Это не стандартный веб-краулинг, а специализированный процесс сбора локальных данных.

    • Входные данные: Задания (регионы, маршруты), физические наблюдения операторов (текст, фото).
    • Процесс: Физический обход территории, ввод данных в мобильные приложения, загрузка на Intermediate Servers.

    INDEXING – Индексирование и извлечение признаков (Indexing & Feature Extraction)
    Собранные данные обрабатываются и структурируются перед попаданием в основной индекс.

    • Процесс (Верификация): Проверка точности собранных данных полевыми верификаторами, расчет Score для сборщиков.
    • Процесс (Транскрипция): Очистка данных, извлечение текста из изображений с помощью OCR, структурирование атрибутов (NAP, часы работы, категории). Разрешение дубликатов (Duplicate detection and resolution).
    • Выходные данные: Верифицированные, структурированные данные о POI, готовые к публикации на Production Servers.

    Система взаимодействует с администраторами через Dashboard Device для управления рабочим процессом и принятия решений об одобрении данных.

    На что влияет

    • Конкретные типы контента: Влияет исключительно на данные о точках интереса (POI) – локальный бизнес, организации, достопримечательности.
    • Конкретные ниши или тематики: Влияет на все локальные ниши. Особое внимание может уделяться категориям, которые часто меняются (например, рестораны).
    • Географические ограничения: Система может применяться глобально, но особенно актуальна в регионах с недостаточным покрытием данных, высоким уровнем изменений или там, где онлайн-данные ненадежны.

    Когда применяется

    • Условия применения: Система используется для создания начальной базы данных POI (например, при запуске Карт в новом регионе) или для улучшения существующей базы.
    • Триггеры активации (Сбор): Необходимость сбора данных в определенном регионе, известная неточность данных, отсутствие данных, устаревшие данные.
    • Триггеры активации (Верификация): Выборочная проверка работы сборщиков для контроля качества. Частота проверки может зависеть от предыдущих оценок (Score) сборщика.
    • Триггеры активации (Поддержка): Активируется на основе возраста данных (age associated with the information), количества жалоб пользователей (user-reported errors) или важности локации (value of the location).

    Пошаговый алгоритм

    Этап 1: Сбор данных (Collection)

    1. Планирование маршрута: Администратор определяет регион и параметры сбора. Генерируется оптимизированный маршрут для максимального покрытия при минимальном расстоянии.
    2. Назначение задания: Маршрут и задание передаются на мобильное устройство Human Collector.
    3. Сбор информации: Сборщик обходит территорию, создает новые записи POI, вводит атрибуты (Название, Категория) и делает фотографии (вывеска, интерьер, логотип).
    4. Загрузка: Собранные данные загружаются на Intermediate Servers.

    Этап 2: Верификация и Одобрение (Verification & Approval)

    1. Выборка для QC: Администратор или система выбирает партию данных для проверки (например, работу конкретного сборщика за день).
    2. Назначение верификации: Данные передаются на мобильное устройство Human Verifier.
    3. Полевая проверка: Верификатор посещает POI и проверяет каждый атрибут (correct, incorrect (major/minor error), missing, unverifiable). Также отмечает пропущенные или фейковые листинги.
    4. Расчет оценки: Система рассчитывает Score для сборщика (например, вычитая баллы за ошибки и пропуски).
    5. Принятие решения: На основе Score (автоматически или вручную через Dashboard) принимается решение: одобрить данные или отправить на повторный сбор.

    Этап 3: Транскрипция (Transcription)

    1. Обработка данных: Одобренные данные поступают к Human Transcriber.
    2. Извлечение текста (OCR): Система автоматически применяет OCR к фотографиям и предлагает извлеченный текст.
    3. Структурирование: Транскрибатор очищает данные, исправляет ошибки и заполняет поля атрибутов, используя текст из OCR (drag-and-drop или copy/paste).
    4. Разрешение дубликатов: Система ищет потенциальные дубликаты. Транскрибатор принимает решение об объединении записей.
    5. Верификация транскрипции (QC2): Выборочная проверка работы транскрибаторов.

    Этап 4: Публикация и Поддержка (Production & Maintenance)

    1. Публикация: Обработанные данные переносятся на Production Servers и становятся доступными веб-сервисам.
    2. Выборка для поддержки: Система выбирает существующие POI для перепроверки (на основе возраста, жалоб или важности).
    3. Полевая поддержка: Human Maintenance Operator посещает POI и отмечает статус: VERIFIED, CLOSED или NA (не удалось проверить). Также может добавлять новые листинги.
    4. Обновление базы: Данные в Production Servers обновляются.

    Какие данные и как использует

    Данные на входе

    Система собирает и использует следующие данные о POI:

    • Контентные факторы (Атрибуты POI):
      • Название (Name)
      • Категория (Category)
      • Адрес (Address)
      • Телефон (Phone)
      • Веб-сайт (Website)
      • Email
      • Часы работы (Hours)
      • Описание (Description)
    • Технические факторы:
      • Геолокация POI (координаты, полученные с GPS мобильного устройства).
    • Мультимедиа факторы:
      • Фотографии (Photos). Указывается тип фото: вывеска/фасад (Storefront), интерьер (Indoor), логотип (Logo).
    • Системные данные:
      • Идентификаторы работников (Worker ID).
      • Данные о маршрутах и покрытии (Route meters, Total segments).

    Какие метрики используются и как они считаются

    • Score (Оценка сборщика): Метрика качества работы Human Collector. Рассчитывается на основе данных верификации. В патенте приводится пример: листинг начинает с 10 баллов, баллы вычитаются за неверные или отсутствующие атрибуты. Ошибки могут иметь разный вес (major/minor).
    • Accuracy (Точность): Процент корректных данных в проверенной выборке. Например, 90%.
    • Coverage (Покрытие): Метрика, основанная на количестве верифицированных POI по сравнению с количеством пропущенных POI (Missing). Например, 94.3%.
    • Категоризация листингов: Листинги могут быть классифицированы на основе их Score (например, Green, Yellow, Red) для агрегированного анализа качества работы сборщика.

    Выводы

    1. Ground-Truth данные критичны для Local SEO: Патент демонстрирует значительные инвестиции Google в сбор физически верифицированных данных о локальном бизнесе. Это означает, что Google не полагается исключительно на веб-краулинг, данные от владельцев бизнеса или пользователей, а активно собирает и проверяет информацию на местах.
    2. Многоуровневый контроль качества: Система построена на строгой проверке качества. Данные проверяются полевыми верификаторами (QC1), а затем проверяется работа транскрибаторов (QC2). Это обеспечивает высокую надежность данных в Production Servers.
    3. Важность визуальных данных и OCR: Фотографии (фасад, интерьер, логотип) являются ключевым источником данных. Google активно использует OCR для извлечения атрибутов (NAP, часы работы) непосредственно из изображений, что ускоряет обработку и повышает точность.
    4. Систематическое обновление данных: Процесс поддержки (Maintenance) гарантирует, что данные не просто собираются один раз, а периодически перепроверяются. Триггерами для проверки являются возраст данных, жалобы пользователей и важность локации.
    5. Точность превыше всего: Система оценки сборщиков (Score) и возможность отклонения целых партий данных подчеркивают приоритет точности. Неточная информация или попытки обмана (фейковые листинги) активно выявляются.

    Практика

    Best practices (это мы делаем)

    • Обеспечение абсолютной точности GBP: Необходимо гарантировать, что вся информация в Google Business Profile (NAP, часы работы, категории, координаты) на 100% соответствует реальности. Google имеет инфраструктуру для физической проверки этих данных полевыми операторами.
    • Оптимизация визуального присутствия (Вывески и Фасад): Убедитесь, что вывеска бизнеса четкая, читаемая и содержит актуальную информацию (название, телефон, часы работы). Полевые операторы фотографируют фасады, и эта информация используется (в том числе через OCR) для верификации данных.
    • Загрузка качественных фотографий в GBP: Активно загружайте фотографии, соответствующие категориям, упомянутым в патенте: фасад (Storefront), интерьер (Indoor) и логотип (Logo). Это коррелирует с типами данных, которые собирает Google.
    • Мониторинг и быстрое реагирование на изменения: При любых изменениях в бизнесе (переезд, смена часов работы) немедленно обновляйте информацию онлайн. Система поддержки (Maintenance) может обнаружить несоответствия.

    Worst practices (это делать не надо)

    • Предоставление неточной или устаревшей информации: Использование неверных адресов, старых телефонов или неправильных часов работы рискованно. Полевые верификаторы могут пометить атрибуты как incorrect, что может повлиять на доверие к листингу.
    • Создание фейковых листингов (Спам в Картах): Система напрямую предназначена для борьбы с этим. Верификаторы и операторы поддержки активно ищут и помечают несуществующие (fake listings) или закрытые (CLOSED) бизнесы.
    • Игнорирование физического оформления точки: Бизнес с плохой, нечитаемой или отсутствующей вывеской может быть сложнее верифицировать или даже может быть помечен как unverifiable (NA) оператором поддержки.

    Стратегическое значение

    Патент подтверждает, что для Local SEO основой является точность данных. Стратегия должна строиться на полном соответствии онлайн-присутствия (GBP, сайт) и офлайн-реальности (физическая точка, вывеска). Google рассматривает локальные данные как критически важный актив и инвестирует в инфраструктуру для поддержания их качества на уровне ‘ground-truth’. Это снижает эффективность манипулятивных тактик в Local SEO и повышает важность фундаментальной работы с данными о бизнесе.

    Практические примеры

    Сценарий: Верификация данных нового ресторана

    1. Действие SEO-специалиста: Создание листинга в GBP с точным адресом, телефоном, часами работы и категориями. Загрузка фото фасада с новой вывеской.
    2. Действие Google (по патенту): В рамках планового обхода территории Human Collector посещает локацию. Он сверяет название, фотографирует фасад и вводит данные в приложение.
    3. Проверка: Позже Human Verifier может посетить точку для контроля качества. Он сверяет данные сборщика с реальностью. Если данные точны, сборщик получает высокий Score.
    4. Обработка: На этапе транскрипции OCR может извлечь часы работы с фото вывески и сверить их с введенными данными.
    5. Результат: Google получает высококачественные, верифицированные данные о ресторане, что повышает доверие к листингу и его видимость в локальном поиске.

    Сценарий: Обнаружение несоответствия часов работы

    1. Ситуация: Магазин изменил часы работы, но не обновил GBP.
    2. Действие Google (по патенту): Human Maintenance Operator получает задание проверить этот магазин (например, из-за жалобы пользователя).
    3. Проверка: Оператор приходит в указанные часы работы и видит, что магазин закрыт, или видит новые часы на двери. Он помечает атрибут Hours как неверный и/или фотографирует новые часы.
    4. Результат: Данные в базе Google обновляются на основе ‘ground-truth’ информации. Несоответствие устраняется, но доверие к источнику (владельцу GBP) может снизиться.

    Вопросы и ответы

    Означает ли этот патент, что Google физически проверяет каждый бизнес?

    Патент описывает инфраструктуру, позволяющую это делать, но не утверждает о 100% покрытии. Система используется для создания базы данных, контроля качества (выборочная верификация) и обновления информации в приоритетных регионах или категориях. Однако наличие такой системы означает, что любой бизнес потенциально может быть проверен полевым оператором Google.

    Как этот патент влияет на ранжирование в Local Pack?

    Патент не описывает алгоритмы ранжирования (Relevance, Distance, Prominence). Он описывает процесс сбора и верификации данных. Однако точные и верифицированные данные являются фундаментом для ранжирования. Бизнес с подтвержденными данными (особенно если они собраны через этот конвейер) будет иметь преимущество перед бизнесом с неточными, отсутствующими или не верифицированными данными.

    Насколько важны вывески и физическое оформление точки в контексте этого патента?

    Критически важны. Полевые операторы активно фотографируют фасады (Storefront). Эта информация используется для верификации названия, адреса и других атрибутов. Кроме того, Google использует OCR для считывания текста с этих фотографий. Четкая и информативная вывеска облегчает верификацию и подтверждение данных.

    Какие типы фотографий наиболее важны согласно патенту?

    В патенте явно выделяются три типа фотографий, которые собирают полевые операторы: Storefront (фасад/вывеска), Indoor (интерьер) и Logo (логотип). SEO-специалистам следует убедиться, что эти типы фотографий высокого качества присутствуют в Google Business Profile.

    Как система борется с фейковыми листингами или спамом в картах?

    Система имеет несколько механизмов защиты. Human Verifiers проверяют работу сборщиков и могут помечать созданные ими фейковые листинги. Human Maintenance Operators при обходе территории проверяют существование бизнеса и могут пометить несуществующие POI как закрытые (CLOSED) или неверифицируемые (NA).

    Что происходит, если данные в GBP противоречат данным, собранным полевым оператором?

    Патент не описывает точный механизм разрешения конфликтов между разными источниками данных. Однако, учитывая строгий многоуровневый контроль качества (QC1 и QC2), описанный в патенте, данные, собранные через этот конвейер (‘ground-truth’), вероятно, будут иметь высокий приоритет при обновлении базы данных Google.

    Использует ли Google подрядчиков или штатных сотрудников для этой работы?

    Патент описывает роли (Human Collectors, Verifiers и т.д.) и инфраструктуру управления ими (назначение заданий, оценка Score), но не уточняет их статус занятости. Эта инфраструктура подходит как для управления штатными сотрудниками, так и для масштабируемого управления большим количеством подрядчиков.

    Что такое процесс поддержки (Maintenance) и как часто он происходит?

    Это процесс перепроверки уже существующих в базе POI. Операторы проверяют, актуальны ли данные и существует ли бизнес. Частота зависит от триггеров: возраста данных, количества жалоб пользователей на ошибки или важности/популярности локации.

    Может ли эта система использоваться для сбора данных в труднодоступных местах или внутри зданий?

    Да. Система предполагает, что операторы перемещаются пешком и собирают данные на уровне улицы. В патенте упоминается сбор фотографий интерьера (Indoor) и атрибутов, таких как этаж или номер офиса (Floor/Suite #), что подразумевает возможность сбора данных внутри торговых или бизнес-центров.

    Влияет ли этот патент на работу программы Google Local Guides?

    Патент напрямую не упоминает Local Guides. Однако описанные инструменты и рабочие процессы (сбор атрибутов, фотографирование, верификация чужих правок) очень похожи на функционал, доступный участникам программы Local Guides. Вероятно, эта система послужила основой или работает параллельно с краудсорсинговыми инициативами Google.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.