
Google анализирует все известные названия (Titles), связанные с локальным бизнесом. Система сравнивает распределение частотности слов в этих названиях с двумя моделями: равномерным распределением (характерно для легитимных данных из разных источников) и распределением по закону Ципфа (характерно для маркетинговых текстов и спама). Если распределение ближе к закону Ципфа, листинг помечается как потенциальный спам и понижается в локальной выдаче.
Патент решает проблему спама в локальном поиске (например, в Google Maps). Он направлен на выявление нелегитимных листингов (spam listings) или листингов, чьи описания (в частности, названия бизнеса – titles) были искусственно манипулированы для повышения позиций в выдаче. Основная уязвимость, которую устраняет патент, — это практика добавления множества вариаций названий, насыщенных ключевыми словами (keyword stuffing), для одного и того же объекта с целью манипуляции ранжированием.
Запатентована система для оценки легитимности локального листинга (listing) путем анализа статистического распределения терминов во всех связанных с ним описаниях. Система сравнивает фактическое распределение частотности терминов с двумя теоретическими моделями: равномерным распределением (uniform distribution) и распределением, характерным для естественного языка (natural language distribution), в частности, по закону Ципфа (Zipf's law). Предполагается, что листинги, чье распределение терминов ближе к естественному языку, с большей вероятностью являются спамом или содержат маркетинговый текст, созданный для манипуляции.
Система агрегирует все известные описания (например, названия бизнеса из разных источников) для одного листинга и анализирует частоту встречаемости каждого уникального термина (Measured Frequency).
Этот набор частот сравнивается с двумя эталонами:
На основе того, к какому эталону ближе фактическое распределение, вычисляется оценка (Score Value). Если оценка указывает на высокую вероятность спама (ближе к закону Ципфа), листинг понижается в результатах поиска или удаляется.
Высокая. Борьба со спамом в локальном поиске и Google Maps остается критически важной задачей. Описанный метод предоставляет надежный статистический механизм для выявления искусственных манипуляций с названиями (Keyword Stuffing) в листингах, что делает его актуальным инструментом в арсенале антиспам-систем Google.
Патент имеет высокое значение для стратегий локального SEO (Local SEO). Он математически обосновывает, почему Google наказывает за перечисление ключевых слов в названии бизнес-профиля (Google Business Profile). Система активно выявляет попытки манипулировать названиями путем добавления вариаций или маркетинговых фраз. Для легитимных бизнесов критически важно использовать свое настоящее, консистентное название и избегать тактик, которые могут сделать распределение терминов похожим на маркетинговый текст.
location-based entity).Titles из разных источников (пользователи, веб-сайты, справочники).Natural Language Distribution, используемая в патенте как эталон для выявления спама.Claim 1 (Независимый пункт): Описывает основной метод анализа листинга.
Measured Frequency, F) — фактическая частота каждого термина.Natural Language Distribution, Z) — оценка частоты терминов в естественном языке.Termcount) и общее количество всех терминов (Occurrences).Uniform Distribution, U) — равномерные значения, основанные на отношении уникальных терминов ко всем терминам.Score Value для листинга. Эта оценка основана на сравнении: насколько F похожа на Z и насколько F похожа на U.Score Value.Claim 13 (Независимый пункт): Детализирует применение метода к локальным объектам с множеством описаний.
location-based entity).Score Value) на основе сравнения, которое оценивает вероятность спама.Claim 15 (Независимый пункт): Описывает процесс с точки зрения системы ранжирования.
Позиция листинга в результатах локального поиска определяется на основе: (a) релевантности запросу, (b) значений частотности терминов (F), и (c) того, являются ли эти значения частотности (F) более похожими на константную функцию (U), чем на функцию убывающих значений (Z).
Изобретение применяется в инфраструктуре локального поиска (Local Search / Google Maps).
CRAWLING & Data Acquisition – Сканирование и Сбор данных
Система собирает данные о локальных бизнесах из множества источников (веб-сайты, справочники, данные от пользователей/владельцев). Ключевым является сбор всех возможных названий (Titles) для одного и того же объекта.
INDEXING & Feature Extraction – Индексирование и извлечение признаков
На этом этапе происходит агрегация данных и основные вычисления. Система связывает различные названия с одним листингом. Затем происходит:
Score Value (вероятность спама).Этот Score Value сохраняется как атрибут листинга в индексе.
RANKING / RERANKING – Ранжирование и Переранжирование
Во время обработки локального поискового запроса система использует предварительно рассчитанный Score Value как фактор ранжирования. Если оценка указывает на высокую вероятность спама (распределение ближе к Z), листинг понижается в выдаче или исключается из нее.
Входные данные:
Titles) или описаний (Descriptions), связанных с конкретным листингом.Выходные данные:
Score Value для листинга, указывающий на вероятность спама.local business listings) в Google Maps и Local Pack. Не влияет на стандартный веб-поиск.Score Value происходит на этапе индексации или при обновлении данных листинга (офлайн или периодически). Применение оценки происходит в реальном времени во время ранжирования.Процесс А: Расчет оценки спама (Индексирование)
Titles).Termcount).Occurrences).Termcount). Система определяет, насколько вектор F близок к U или Z. Используется метод ортогональной проекции F на линию, проходящую через U и Z.Score Value сохраняется для листинга.Процесс Б: Обработка запроса (Ранжирование)
Score Value используется как фактор ранжирования. Листинги с высоким Score Value понижаются в выдаче.Патент фокусируется на анализе текстовых данных, связанных с локальными листингами.
Titles) и описания (Descriptions) листинга. Анализируются термины внутри этих текстовых полей.Uniform Distribution), так как названия обычно схожи или идентичны.Score Value напрямую используется для корректировки ранжирования в локальном поиске, что может привести к значительному понижению или исключению спамных листингов.Этот патент имеет прямое применение в локальном SEO и управлении Google Business Profile (GBP).
Uniform Distribution).Zipf's law) и будет выявлен как спам.Патент подчеркивает стратегическую важность консистентности данных (Data Consistency) как фундаментального элемента Local SEO. Он показывает, что Google обладает сложными статистическими инструментами для выявления манипуляций, которые не зависят от понимания контекста. Долгосрочная стратегия должна фокусироваться на построении реального локального авторитета и обеспечении точности данных, а не на попытках обмануть алгоритмы через манипуляции с названиями.
Сценарий 1: Пессимизация за Keyword Stuffing
Zipf-based Distribution (маркетинговый текст), чем к Uniform Distribution.Score Value (высокая вероятность спама) и понижает его в локальной выдаче.Сценарий 2: Легитимный бизнес (Консистентные данные)
Uniform Distribution.Score Value (низкая вероятность спама). Ранжирование определяется другими факторами (релевантность, дистанция, авторитетность).Что является основной гипотезой этого патента для определения спама?
Основная гипотеза в том, что названия легитимных бизнесов из объективных источников (справочников) обычно консистентны и имеют равномерное распределение терминов (Uniform Distribution). Напротив, спамные или искусственно оптимизированные названия (маркетинговый текст) содержат много разных ключевых слов, и их распределение стремится к закону Ципфа (Zipf's Law).
Как закон Ципфа (Zipf's Law) помогает Google выявить спам в названиях?
Закон Ципфа описывает распределение слов в естественном языке, где частота убывает пропорционально рангу. Когда спамеры добавляют много разных ключевых слов в название, пытаясь охватить разные запросы, текст начинает напоминать маркетинговое описание, следующее закону Ципфа. Google использует это сходство как индикатор манипуляции, а не как признак легитимного названия.
Означает ли это, что любое использование ключевых слов в названии бизнеса является спамом?
Нет, если ключевое слово является частью официального названия бренда (например, "Chicago Plumbing"). Проблема возникает при добавлении ключевых слов, не являющихся частью бренда (например, "Chicago Plumbing - Best Plumbers, Repairs, 24/7 Service"). Алгоритм выявляет именно неестественный паттерн распределения слов, который возникает при таком добавлении.
Влияют ли названия моего бизнеса в сторонних каталогах (Yelp, 2GIS и т.д.) на этот алгоритм?
Да, критически влияют. Патент явно указывает, что система агрегирует названия (Titles) из множества источников. Неконсистентность или наличие спама в названиях на сторонних площадках может привести к увеличению Score Value и пессимизации листинга в Google, так как они участвуют в общем анализе распределения.
Что такое равномерное распределение (Uniform Distribution) в контексте названий бизнеса?
Это ситуация, когда все термины в совокупности названий бизнеса встречаются примерно с одинаковой частотой. Например, если бизнес везде указан как "AAA Locksmith", то термины "AAA" и "Locksmith" будут иметь одинаковую частоту. Это считается признаком консистентности данных и легитимности листинга.
Как система рассчитывает итоговый Score Value?
Система использует методы векторной алгебры. Фактическое (F), равномерное (U) и распределение по Ципфу (Z) представляются как точки в многомерном пространстве. Система определяет, насколько точка F близка к U или Z, используя ортогональную проекцию F на линию U-Z и рассчитывая отношение расстояний. Близость к Z дает более высокий балл (вероятный спам).
Что делать, если у бизнеса действительно несколько официальных названий?
Если вариации незначительны (например, наличие или отсутствие "Inc." или "LLC"), влияние может быть минимальным, так как это не сильно нарушает равномерность распределения. Однако, если названия сильно отличаются и содержат много разных описательных терминов, есть риск, что система классифицирует это как манипуляцию. Рекомендуется выбрать одно основное каноническое название и стремиться к его консистентному использованию.
Применяется ли этот патент только к локальному поиску (Google Maps)?
Да, патент сфокусирован на Listings, ассоциированных с географическими локациями (location-based entity), что делает его в первую очередь инструментом для локального поиска (Google Maps, Local Pack). Он не описывает применение этого метода к ранжированию веб-страниц в основном веб-поиске.
Как этот патент связан с правилами Google Business Profile относительно названий?
Этот патент предоставляет техническое обоснование и конкретный автоматизированный механизм для контроля за соблюдением правил GBP. Правила требуют использовать реальное название бизнеса без лишних дескрипторов. Описанный алгоритм как раз и выявляет нарушения этого правила, анализируя статистику использования слов.
Упоминается ли в патенте идентификация спамеров по их листингам?
Да (Claim 11). Патент явно указывает, что система может идентифицировать пользователя, отправившего спамный листинг. Если пользователь (например, аккаунт агентства или владельца) ассоциирован с высокой долей спама, это может повлиять на ранжирование всех других листингов, управляемых этим пользователем.

Антиспам
Local SEO

Антиспам
Local SEO
EEAT и качество

Антиспам
Local SEO
EEAT и качество

Антиспам
Local SEO

Local SEO
Антиспам
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
EEAT и качество
Индексация

Поведенческие сигналы
Мультимедиа
Семантика и интент

Поведенческие сигналы
Семантика и интент
Мультимедиа

Ссылки
SERP
Структура сайта

Поведенческие сигналы
SERP
Семантика и интент

Ссылки
SERP

EEAT и качество
Ссылки

Семантика и интент
Поведенческие сигналы
EEAT и качество

Поведенческие сигналы
SERP
