Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует Street View и компьютерное зрение для борьбы с фейковыми компаниями на Картах

    USING IMAGES TO IDENTIFY INCORRECT OR INVALID BUSINESS LISTINGS (Использование изображений для выявления некорректных или недействительных бизнес-листингов)
    • US8462991B1
    • Google LLC
    • 2013-06-11
    • 2011-04-18
    2011 EEAT и качество Local SEO Антиспам Патенты Google

    Google использует автоматизированный анализ геолоцированных изображений (например, Street View) для валидации локальных бизнес-листингов. Система классифицирует окружающую среду и сравнивает ее с заявленной категорией бизнеса. Если категория несовместима с визуальным контекстом (например, «прокат снегоходов» в «пустыне»), листинг помечается как спам, а его Spam Score корректируется.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему «fake location» spam (спам фейковыми местоположениями) в локальном поиске. Он направлен на борьбу с мошенниками, которые создают фиктивные или мошеннические бизнес-листинги (fraudulent business listings) в неправдоподобных местах для перехвата трафика. Система улучшает достоверность данных на картах, автоматически выявляя листинги, которые не соответствуют физической реальности.

    Что запатентовано

    Запатентована система автоматической валидации бизнес-листингов путем сравнения информации из листинга с визуальными данными из его локации. Система использует компьютерное зрение (computer vision techniques) для анализа геолоцированных изображений (например, Street View) и классификации окружающей среды. Затем она проверяет, совместима ли заявленная категория бизнеса (Business Category) с категорией визуального контента (Image Content Category).

    Как это работает

    Система работает в несколько этапов:

    • Категоризация изображений (Офлайн): Геолоцированные изображения анализируются для определения их содержания (например, «пустыня», «город», «промзона»). Для этого используются Seed Clusters — эталонные наборы изображений.
    • Анализ листинга: Система получает данные бизнес-листинга, включая его локацию и категорию.
    • Визуальная проверка: Система выбирает изображения, сделанные рядом с локацией бизнеса, и извлекает их категории.
    • Сравнение совместимости: Категория бизнеса сравнивается с категориями изображений на основе предопределенных правил.
    • Действие: Если категории совместимы (например, «заправка» в «городе»), листинг валидируется и его Spam Score понижается. Если несовместимы (например, «прокат снегоходов» в «пустыне»), Spam Score повышается или листинг отправляется на проверку.

    Актуальность для SEO

    Высокая. Борьба со спамом в Google Maps и Local Pack является приоритетом для Google. Использование визуальных данных (Street View) — это мощный и трудно манипулируемый сигнал для верификации физического присутствия бизнеса и правдоподобности его категории в конкретной локации. Технологии компьютерного зрения активно развиваются, повышая эффективность этого механизма.

    Важность для SEO

    Патент имеет критическое значение для локального SEO (Local SEO). Он описывает конкретный алгоритмический механизм, который может привести к пессимизации или удалению бизнес-профиля (Google Business Profile), если система посчитает его спамным на основе визуального контекста. Это делает стратегии использования фейковых адресов или виртуальных офисов крайне рискованными и подчеркивает важность соответствия данных в GBP физической реальности.

    Детальный разбор

    Термины и определения

    Business Listing (Бизнес-листинг)
    Запись о компании или объекте (Entity Information) в базе данных локального поиска, включающая название, категорию и географическое положение.
    Business Category (Категория бизнеса)
    Классификация типа деятельности компании (например, «пиццерия», «заправка»).
    Compatibility Rules (Правила совместимости)
    Набор предопределенных правил (pre-defined rules), определяющих, может ли бизнес определенной категории находиться в локации определенного типа. Могут создаваться вручную или автоматически.
    Fake Location Spam (Спам фейковых локаций)
    Практика создания поддельных бизнес-листингов с несуществующими адресами для привлечения трафика.
    Image Content Category (Категория содержания изображения)
    Классификация, присвоенная изображению на основе его визуального содержания (например, «лес», «город», «пустыня», «витрина магазина» (storefront), «шоссе»).
    Image Data (Данные изображений)
    Геолоцированные изображения. Включают уличные виды (street level images), аэрофотоснимки (aerial views), виды внутри зданий и изображения, предоставленные пользователями (submitted by users).
    Seed Clusters (Начальные/Эталонные кластеры)
    Предварительно категоризированные наборы изображений с похожим содержанием. Используются как эталоны для классификации новых изображений с помощью сопоставления образов (image pattern matching techniques).
    Spam Score (Оценка спамности)
    Метрика, связанная с бизнес-листингом, указывающая на вероятность того, что листинг является мошенническим или некорректным.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод валидации.

    1. Система получает данные бизнес-листинга (категория, локация).
    2. Система получает доступ к изображению, связанному с этой локацией.
    3. Изображение обрабатывается для определения его содержания и присвоения Image Content Category.
    4. Система определяет, совместима ли Business Category с Image Content Category.
    5. Если совместимы, выполняются ДВА действия: (i) листинг помечается как валидный (flagging the business as valid) И (ii) Spam Score листинга понижается (adjusting a spam score… downwards).

    Ядро изобретения — использование визуального контекста для подтверждения правдоподобности категории бизнеса и прямое влияние этого подтверждения на снижение оценки спамности.

    Claim 3 (Зависимый от 1): Детализирует действие при несовместимости.

    Если Business Category НЕ совместима с Image Content Category, система помечает листинг как требующий дальнейшей проверки (requiring further review).

    Claim 5 (Зависимый от 1): Описывает необходимый предварительный процесс (офлайн).

    Система должна заранее обработать множество геолоцированных изображений, идентифицировать их содержание, определить категории и сохранить эти данные для последующей валидации листингов.

    Claim 10 (Зависимый от 7, который аналогичен 1): Описывает альтернативное действие при несовместимости.

    Если категории несовместимы, система повышает Spam Score листинга (adjusts a spam score… upwards).

    Где и как применяется

    Изобретение применяется в инфраструктуре локального поиска (Google Maps, Local Pack).

    CRAWLING – Сканирование и Сбор данных
    Сбор исходных данных: геолоцированных изображений (Street View, аэрофотосъемка, фото пользователей) и информации о бизнес-листингах.

    INDEXING – Индексирование и извлечение признаков
    Основной этап применения патента. Включает два ключевых процесса:

    1. Обработка изображений (Офлайн): Система анализирует изображения, сравнивает их с Seed Clusters с помощью компьютерного зрения и присваивает Image Content Categories. Эти данные индексируются.
    2. Валидация листингов: При индексации или обновлении листингов система сравнивает Business Category с Image Content Category в соответствующей локации и рассчитывает/корректирует Spam Score.

    RANKING / RERANKING – Ранжирование / Переранжирование
    На этапе ранжирования в локальном поиске система использует рассчитанный Spam Score как сигнал доверия. Листинги с высоким Spam Score пессимизируются или исключаются из выдачи.

    Входные данные:

    • Бизнес-листинг (Категория, Геолокация, текущий Spam Score).
    • Геолоцированные Image Data.
    • Seed Clusters (эталоны для классификации).
    • Compatibility Rules (предопределенные правила).

    Выходные данные:

    • Скорректированный Spam Score.
    • Флаги состояния листинга (Валидный / Невалидный / Требует проверки).

    На что влияет

    • Конкретные типы контента: Исключительно локальные бизнес-листинги (Local SEO), отображаемые в Google Maps и Local Pack (Google Business Profiles).
    • Специфические запросы: Локальные запросы, где пользователь ищет компанию или услугу поблизости (например, «ресторан рядом», «сантехник [город]»).
    • Конкретные ниши или тематики: Наибольшее влияние в нишах, подверженных спаму с фейковыми адресами (например, экстренные службы, ремонтные услуги, аренда, юридические услуги).

    Когда применяется

    • Триггеры активации: Создание нового листинга, обновление адреса или категории существующего листинга, периодическая перепроверка (ревалидация) базы данных.
    • Условия работы: Наличие достаточного покрытия геолоцированными изображениями (например, Street View) в районе заявленного адреса бизнеса.

    Пошаговый алгоритм

    Алгоритм состоит из двух основных процессов.

    Процесс А: Офлайн-анализ и категоризация изображений

    1. Сбор данных: Доступ к корпусу геолоцированных изображений (Image Data).
    2. Идентификация контента: Анализ каждого изображения с помощью компьютерного зрения. Изображение сравнивается с Seed Clusters с использованием сопоставления образов (pattern matching).
    3. Категоризация: Присвоение изображению Image Content Category (например, «пустыня», «городской район», «лес») на основе наиболее близкого кластера.
    4. Сохранение: Ассоциация категорий с изображением и его геолокацией в базе данных.

    Процесс Б: Валидация бизнес-листинга

    1. Выбор листинга: Извлечение Business Category, Geographic Location и текущего Spam Score листинга.
    2. Идентификация изображений: Поиск изображений в базе данных, чья геолокация находится вблизи локации листинга.
    3. Сравнение категорий: Сравнение Business Category с Image Content Categories найденных изображений.
    4. Определение совместимости: Применение Compatibility Rules. (Например, правило: «прокат снегоходов» НЕСОВМЕСТИМ с «пустыней»).
    5. Принятие решения и действие:
      • Если совместимы: Пометить листинг как действительный (Valid) И понизить Spam Score.
      • Если несовместимы: Повысить Spam Score И/ИЛИ пометить листинг для дальнейшей проверки (Further Review) И/ИЛИ пометить как недействительный (Invalid).

    Какие данные и как использует

    Данные на входе

    • Географические факторы: Точные геолокации как бизнес-листингов, так и изображений. Критичны для сопоставления листинга с визуальным контекстом.
    • Мультимедиа факторы: Image Data. Упоминаются уличные виды (Street View), аэрофотоснимки, виды внутри зданий и изображения от пользователей.
    • Контентные факторы (Бизнес-данные): Business Category, заявленная в листинге.
    • Системные данные: Seed Clusters и Compatibility Rules.

    Какие метрики используются и как они считаются

    • Image Content Category: Вычисляется путем анализа изображения и применения методов компьютерного зрения. Используется сопоставление образов (image pattern matching) и сравнение с Seed Clusters.
    • Compatibility (Совместимость): Логическая оценка (Да/Нет), определяемая путем применения заранее заданных правил (pre-defined rules). Правила могут быть созданы вручную или автоматически (например, через анализ совместной встречаемости – co-occurrence analysis – категорий в легитимных листингах).
    • Spam Score: Числовая метрика доверия. Патент описывает механизм ее корректировки: она понижается при совместимости и повышается при несовместимости.

    Выводы

    1. Визуальные данные как источник истины: Google использует данные реального мира (Street View) как объективный источник для автоматической кросс-валидации информации, заявленной в бизнес-листингах. Это снижает зависимость от методов верификации, подверженных манипуляциям.
    2. Важность контекста местности: Система проверяет не просто факт существования объекта, но и его уместность в данной локации. Соответствие типа бизнеса окружающей среде (контексту), определенному компьютерным зрением, является фактором достоверности.
    3. Автоматизированная борьба с Fake Location Spam: Механизм позволяет масштабируемо выявлять фейковые локации без ручной проверки, основываясь на логических несоответствиях (аномалиях).
    4. Прямое влияние на доверие и ранжирование: Результат визуальной валидации напрямую влияет на Spam Score. Согласно Claim 1, успешная валидация не только подтверждает листинг, но и активно снижает его спамность, что может улучшить ранжирование легитимного бизнеса.
    5. Инфраструктурный подход: Эффективность системы базируется на масштабной предварительной офлайн-работе по сбору изображений и их классификации с помощью Seed Clusters.

    Практика

    Best practices (это мы делаем)

    Рекомендации касаются локального SEO и работы с Google Business Profile (GBP).

    • Аудит визуального представления (Street View Audit): Регулярно проверяйте, что отображается в Street View и на спутниковых снимках по адресу компании. Окружение должно соответствовать типу бизнеса. Если Street View показывает пустое поле или явно нерелевантное здание, это может увеличить Spam Score.
    • Точный выбор категорий GBP: Убедитесь, что выбранные Business Categories точно описывают деятельность и не противоречат здравому смыслу для данной локации. Это критично для корректной работы Compatibility Rules.
    • Улучшение визуальных сигналов (для Storefront): Наличие четкой вывески и оформленной входной группы помогает системам компьютерного зрения корректно классифицировать изображение как «витрину» (storefront) или коммерческий объект, что повышает совместимость.
    • Актуализация фото в GBP: Загружайте актуальные фотографии экстерьера и интерьера. Патент упоминает использование изображений от пользователей, поэтому качественные фото могут помочь в корректной классификации локации.
    • Точная установка пина на карте (Pin Placement): Убедитесь, что маркер установлен точно на здании или входе, чтобы система ассоциировала правильные изображения с листингом.

    Worst practices (это делать не надо)

    • Создание фейковых локаций (Location Spam): Регистрация бизнеса в локациях, где он физически отсутствует (пустые участки, парки, чужие здания). Этот патент напрямую направлен на выявление таких манипуляций.
    • Использование виртуальных офисов и P.O. Boxes с нарушениями: Если система идентифицирует локацию как почтовое отделение или коворкинг, а категория бизнеса подразумевает специализированное помещение (например, автосервис или ресторан), это будет расценено как несовместимость.
    • Некорректная категоризация (Category Mismatch): Выбор категорий, которые выглядят неправдоподобно в данной местности, увеличивает риск пессимизации.
    • Регистрация множества листингов по одному адресу (LeadGen): Если визуальные данные не подтверждают присутствие нескольких компаний (нет вывесок, отдельных входов), эти листинги рискуют получить высокий Spam Score.

    Стратегическое значение

    Патент подтверждает стратегию Google по интеграции данных из реального мира для обеспечения качества локального поиска. Автоматизированный анализ Street View позволяет масштабировать борьбу со спамом, используя данные, которые сложно подделать. Для Local SEO это означает, что аутентичность и реальное физическое присутствие являются фундаментальными факторами доверия, а манипуляции с адресами становятся все более рискованными.

    Практические примеры

    Сценарий 1: Выявление спама в сфере услуг (Locksmith)

    1. Ситуация: Спамер создает листинг «Экстренное вскрытие замков» (Business Category: Locksmith), используя в качестве адреса координаты в центре городского парка.
    2. Анализ Google: Система анализирует Street View рядом с точкой. Image Content определяется как деревья и трава. Image Content Category присваивается как «Парк» или «Природа».
    3. Сравнение: Система определяет, что категория «Слесарь» (Locksmith) несовместима с категорией «Парк».
    4. Результат: Spam Score листинга резко повышается, и он помечается для проверки или блокируется.

    Сценарий 2: Валидация нового ресторана

    1. Ситуация: Открывается новый ресторан (Business Category: Restaurant) в торговом районе. Владелец создает листинг в GBP.
    2. Анализ Google: Street View показывает здание с витринами и вывеской. Image Content Category присваивается как «Город» и «Витрина магазина» (Storefront).
    3. Сравнение: Система определяет, что «Restaurant» совместим с «Витриной магазина» и «Городом».
    4. Результат: Spam Score листинга понижается, листинг помечается как валидный, что способствует его ранжированию.

    Вопросы и ответы

    Что такое Seed Clusters и как они используются в этом патенте?

    Seed Clusters — это заранее подготовленные и категоризированные наборы эталонных изображений. Например, один кластер содержит фотографии пустынь, другой — городских улиц, третий — лесов. Система использует их для работы компьютерного зрения: новое изображение сравнивается с этими кластерами с помощью сопоставления образов (pattern matching), чтобы определить, на что оно больше похоже, и присвоить ему соответствующую категорию.

    Какие типы изображений использует эта система?

    В патенте упоминается использование различных типов геолоцированных изображений. В первую очередь это уличные виды (Street View). Также упоминаются аэрофотоснимки (aerial views), виды внутри зданий (views of the inside of a building) и изображения, предоставленные пользователями (submitted by users).

    Что делать, если изображение в Street View устарело или отсутствует?

    Если данные устарели (например, показано пустое поле, а там уже построен бизнес-центр), система может ошибочно посчитать листинг спамным. В этом случае необходимо активно загружать собственные актуальные фотографии экстерьера в Google Business Profile и, если возможно, добавлять собственные панорамы 360° через приложение Street View, чтобы предоставить системе актуальные данные.

    Как система определяет, какие категории совместимы между собой?

    Совместимость определяется на основе предопределенных правил (Compatibility Rules). Эти правила могут быть созданы вручную (например, в виде таблицы совместимости) или сгенерированы автоматически путем анализа данных о совместной встречаемости (co-occurrence) категорий в уже подтвержденных легитимных листингах.

    Влияет ли этот патент на Service Area Businesses (SAB), у которых скрыт адрес?

    Да. Даже если адрес скрыт от пользователей, Google знает физический адрес, указанный при верификации. Система может анализировать этот адрес. Если SAB регистрируется по адресу, который визуально идентифицируется как неправдоподобный для ведения такого бизнеса (например, посреди озера или в заброшенном здании), листинг может быть помечен как спам.

    Может ли этот алгоритм ошибочно заблокировать легитимный бизнес?

    Да, как и любая автоматизированная система, особенно если бизнес находится в необычном месте или если классификация изображения неточна. Именно поэтому патент предусматривает не только повышение Spam Score или блокировку (invalid), но и отправку листинга на ручную проверку (further review) в случае несовместимости.

    Как этот патент влияет на использование виртуальных офисов или коворкингов?

    Патент усложняет их использование для манипуляции локальной выдачей. Система проверит, соответствует ли внешний вид здания заявленной категории. Если вы регистрируете юридическую фирму в офисном здании – это совместимо. Если вы регистрируете автосервис в том же офисном здании – это может быть расценено как несовместимое и привести к повышению Spam Score.

    Влияет ли этот механизм на ранжирование моего легитимного бизнеса?

    Да, положительно. Если ваш бизнес успешно проходит валидацию (категория совместима с местностью), система помечает листинг как валидный И понижает его Spam Score (согласно Claim 1). Более низкий Spam Score означает большее доверие со стороны Google, что является позитивным фактором в локальном ранжировании.

    Насколько детальными являются категории изображений?

    Патент приводит примеры как общих категорий («лес», «поле», «водоем», «город»), так и более специфических («строительная площадка», «витрина магазина», «шоссе»). Детализация зависит от возможностей системы компьютерного зрения, но даже общей классификации достаточно, чтобы выявить грубые несоответствия.

    Может ли система определить конкретный бизнес на изображении, например, прочитав вывеску?

    Патент фокусируется не на распознавании конкретного бизнеса (например, чтении вывески), а на классификации общего контента или типа местности. Цель – определить контекст локации. Однако наличие четкой вывески помогает классифицировать изображение как «витрина магазина» (storefront), что повышает совместимость с коммерческими категориями.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.