
Google использует статистический анализ для борьбы со спамом в названиях компаний (например, в Google Maps). Система анализирует корпус легитимных названий, чтобы понять естественные комбинации слов. Затем для проверяемого названия вычисляется «Оценка Неожиданности» (Surprisingness Value). Если сочетание слов слишком маловероятно (например, «Ресторан Слесарь»), листинг помечается как спам и исключается из выдачи.
Патент решает проблему манипуляции поисковой выдачей, особенно в локальном поиске и картах, путем «keyword-stuffing» (перенасыщения ключевыми словами) в названиях компаний. Он направлен против спамеров (hijackers), которые добавляют в названия своих бизнесов популярные ключевые слова, услуги, локации или названия других известных брендов, чтобы повысить видимость своего листинга по нерелевантным или высокочастотным запросам.
Запатентована система для автоматического определения того, является ли название бизнеса легитимным или мошенническим (переспамленным). Ключевым элементом является расчет «Surprisingness Value» (Оценки Неожиданности) для комбинаций слов в названии. Эта оценка основана на статистическом анализе (матрице совместной встречаемости слов), построенном на базе корпуса заведомо легитимных названий компаний.
Система работает в несколько этапов:
List of Legitimate Business Titles).Word Co-occurrence Matrix), показывающая, как часто пары слов встречаются вместе.Surprisingness Values. Низкое значение означает типичное сочетание (например, «Бургер Ресторан»), высокое — необычное (например, «Слесарь Ресторан»).Surprisingness Value (S).Threshold Value), листинг помечается как мошеннический и может быть исключен из результатов поиска.Высокая. Манипуляции с названиями в Google Business Profile (GBP) остаются одной из самых распространенных и проблемных тактик спама в локальном SEO. Этот патент описывает фундаментальный, масштабируемый и лингвистически независимый (статистический) подход к автоматическому обнаружению этого типа нарушений, который, вероятно, лежит в основе текущих систем фильтрации Google.
Патент имеет критическое значение для стратегий локального SEO (Local SEO). Он напрямую описывает механизм, который Google использует для контроля за одним из самых важных факторов ранжирования в локальном поиске — названием бизнеса. Понимание этого механизма определяет границы допустимых практик при работе с GBP и подчеркивает высокие риски использования любых ключевых слов в поле названия, кроме реального имени бренда.
Surprisingness Value, рассчитанное для нескольких листингов, идентифицированных как принадлежащие одному и тому же бизнесу. Используется для выявления аномальных отклонений.Surprisingness Values. Упоминаются методы TF-IDF и латентно-семантический анализ (LSA).Surprisingness Value, при превышении которого название считается мошенническим или переспамленным.Патент описывает два основных метода применения: абсолютный (сравнение с глобальным порогом) и относительный (сравнение со средним значением для сущности).
Claim 1 (Независимый пункт): Описывает базовый (абсолютный) метод определения легитимности листинга.
Surprisingness Values. Этот процесс включает: (i) идентификацию пар слов в легитимных названиях, (ii) подсчет совместной встречаемости (count value), и (iii) нормализацию подсчетов для создания матрицы, где каждое значение показывает, насколько маловероятно появление данной пары слов.Surprisingness Value (S) для названия этого листинга на основе сохраненной матрицы.Threshold Value).Claim 4 (Независимый пункт): Описывает относительный метод для анализа нескольких листингов, относящихся к одному бизнесу.
Surprisingness Value (S) для каждого из них.Average Surprisingness Value (A) для всего множества листингов этого бизнеса.Этот метод позволяет выявить аномалии: если один из вариантов названия значительно отличается от среднего для этого бизнеса, он помечается как спам, даже если глобальный порог не превышен.
Claim 9 (Независимый пункт): Описывает применение метода в процессе предоставления результатов поиска (фильтрация в реальном времени).
Surprisingness Value (S) для этого листинга.Изобретение применяется в инфраструктуре локального поиска (Local Search, Google Maps) и затрагивает этапы индексирования и ранжирования.
INDEXING – Индексирование и извлечение признаков
List of Legitimate Business Titles, генерацию и нормализацию Word Co-occurrence Matrix для создания Surprisingness Matrix.Entity Information) или оценивать новые/обновленные листинги, рассчитывать их Surprisingness Value (S) и сохранять эту оценку в индексе. Также на этом этапе может применяться сравнительный метод (Claim 4).RANKING / RERANKING – Ранжирование и Переранжирование
withheld, excluded, removed from search results).Входные данные:
List of Legitimate Business Titles (для обучения модели).Entity Information, в частности, название бизнеса (для оценки).Surprisingness Matrix.Выходные данные:
Surprisingness Value (S) для листинга.Surprisingness Value названия превышает установленное пороговое значение (Threshold Value) или значительно отклоняется от среднего значения для данного бизнеса (Average Surprisingness Value).Процесс А: Генерация Матрицы Неожиданности (Офлайн)
Word Co-occurrence Matrix на основе этих подсчетов.Surprisingness Matrix. Используются методы вроде TF-IDF или LSA для приведения значений к стандартной шкале (например, от 0 до 1).Threshold Value (X) вручную или автоматически. Патент (Claim 18) описывает автоматический метод: порог выбирается так, чтобы максимизировать отношение A/F (Обнаруженный спам / Ложные срабатывания) на тестовом наборе данных.Процесс Б: Оценка Листинга и Фильтрация Выдачи (Реал-тайм)
Surprisingness Value (S) на основе сохраненной матрицы (или извлекается из индекса).Business Titles). Система анализирует пары слов в этом поле. Патент также упоминает (в описании), что могут использоваться другие типы информации из листинга, такие как описательная информация (descriptive information) или информация о категории (category information), для определения неожиданных комбинаций слов.List of Legitimate Business Titles. Это критически важный набор данных, используемый как эталон для определения «нормальности» словосочетаний.TF-IDF (term frequency-inverse document frequency) и латентно-семантический анализ (LSA) как возможные методы преобразования сырых частот в Surprisingness Values.Word Co-occurrence Matrix, является лингвистически независимым и масштабируемым.keyword-stuffing создает комбинации слов, которые статистически маловероятны в реальных названиях. Surprisingness Value количественно измеряет эту маловероятность.List of Legitimate Business Titles. Эта база определяет, что считается «нормальным» названием.Surprisingness Value и снижает риск фильтрации.Average Surprisingness Value (Claim 4) и снижает вероятность ложных срабатываний из-за вариативности данных.Surprisingness Value.Surprisingness Value и приведет к быстрой фильтрации (как в примере с Locksmith и Marriott в патенте).Патент подтверждает стратегию Google по жесткому контролю качества данных в локальном поиске. Для SEO-специалистов это означает, что манипуляции с полем названия бизнеса в GBP являются высокорискованной тактикой, которая может привести к полному исключению из выдачи или блокировке профиля. Стратегия локального SEO должна фокусироваться на построении реального бренда и использовании легитимных методов оптимизации, а не на краткосрочных тактиках переспама названия.
Сценарий: Очистка названия GBP для сантехнической компании
Surprisingness Value, так как редко встречаются одновременно в легитимных названиях брендов. Система Google может отфильтровать этот листинг.Surprisingness Value снижается до минимума. Риск фильтрации или блокировки листинга уменьшается. Ранжирование теперь зависит от других факторов (категории, отзывы, близость, сайт), а не от спама в названии.Применяется ли этот алгоритм только к английскому языку?
Нет. Описанный метод основан на статистическом анализе совместной встречаемости слов (Word Co-occurrence), а не на семантическом понимании языка. Это делает его лингвистически независимым. Он может работать на любом языке, при условии, что у Google есть достаточно большая база легитимных названий на этом языке для построения матрицы.
Как Google формирует «Список легитимных названий бизнесов» (List of Legitimate Business Titles)?
Патент не детализирует процесс сбора, указывая, что он может быть выбран вручную как исходный список (seed list) или получен из авторитетных источников (например, Yellow Pages, правительственные сайты). На практике это могут быть данные из официальных государственных реестров или листинги, прошедшие строгую верификацию.
Что делать, если у моего бизнеса действительно необычное (surprising) название?
Если название легитимно, но имеет высокий Surprisingness Value, критически важно обеспечить максимальное подтверждение этого названия в реальном мире и в интернете (консистентность NAP). Наличие сильного бренда, официальной регистрации, вывесок и упоминаний в авторитетных источниках поможет подтвердить легитимность. Механизм Average Surprisingness Value также помогает учесть такие случаи, если название используется консистентно.
Может ли этот патент быть причиной блокировки (suspension) Google Business Profile?
Да, напрямую. Патент описывает механизм идентификации мошеннических или переспамленных названий с целью их исключения из результатов поиска. На практике нарушение правил Google по именованию бизнеса (которое этот алгоритм выявляет) часто приводит к жестким мерам, включая блокировку профиля.
Как работает механизм Average Surprisingness Value и зачем он нужен?
Он используется, когда Google находит несколько листингов для одного и того же бизнеса (например, из разных каталогов). Система рассчитывает среднюю оценку неожиданности (A) для всех вариантов названия. Если один из вариантов сильно отклоняется от среднего (S > A + Порог), он помечается как спам. Это позволяет бороться со спамом или взломом, не наказывая бизнес за небольшие естественные вариации в написании его названия в разных источниках.
Влияет ли этот алгоритм на обычное веб-ранжирование или только на локальный поиск?
Патент сфокусирован исключительно на business listings и business titles. Это указывает на применение в системах локального поиска, таких как Google Maps и Local Pack, где названия бизнесов играют ключевую роль. На стандартное ранжирование веб-страниц этот механизм прямого влияния не оказывает.
Как система определяет оптимальное пороговое значение (Threshold Value)?
Патент предлагает автоматизированный метод (Claim 18). Система тестирует различные пороги на размеченном наборе данных, чтобы найти баланс, который максимизирует отношение обнаруженного спама (истинно положительные результаты) к ложным срабатываниям на легитимных названиях (ложноположительные результаты). Это позволяет настроить чувствительность фильтра.
Если я уберу ключевые слова из названия GBP, мои позиции упадут?
В краткосрочной перспективе это возможно, так как спам в названии является сильным (хотя и запрещенным) фактором ранжирования. Однако сохранение спама ведет к высокому риску фильтрации или блокировки листинга описанным алгоритмом. Долгосрочная стратегия требует использования легитимного названия и оптимизации других факторов (категории, отзывы, сайт).
Анализирует ли система только название или другие поля листинга тоже?
Основной фокус патента — на названиях бизнесов. Однако в описании упоминается, что другие типы информации, включенные в листинг, такие как описательная информация (descriptive information) или категории (category information), также могут быть использованы для определения неожиданных комбинаций слов. Это может означать кросс-проверку релевантности между полями.
Актуален ли этот патент, учитывая современные нейросетевые модели?
Хотя патент использует более простые статистические методы (совместная встречаемость, TF-IDF), описанный принцип остается актуальным. Современные модели могут использовать более сложные методы (например, эмбеддинги) для оценки естественности языка, но конечная цель та же: выявить неестественные, переоптимизированные названия и присвоить им метрику, аналогичную Surprisingness Value.

Антиспам
Local SEO
EEAT и качество

Антиспам
Local SEO

Антиспам
Local SEO
EEAT и качество

Антиспам
Local SEO

Local SEO
Антиспам
Поведенческие сигналы

Мультиязычность
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Knowledge Graph
Семантика и интент
Персонализация

Local SEO
Поведенческие сигналы
Семантика и интент

Персонализация
Поведенческие сигналы
Семантика и интент

Ссылки
SERP

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP
