Google использует несколько алгоритмов для автоматического определения, является ли бизнес сетевым (имеет много филиалов) и ищет ли пользователь именно его. Система анализирует триггерные слова (например, «адреса»), соотношение локальных и веб-запросов (Localness Score), частоту упоминания в названиях и категориях, а также географическое распределение запросов. Это позволяет точнее ранжировать результаты и показывать ближайшие точки на карте.
Описание
Какую задачу решает
Патент решает задачу автоматической идентификации сетевых компаний (chain businesses) и запросов, направленных на их поиск (chain business queries). Система должна отличать сетевые бренды от уникальных локальных компаний, а также отличать названия брендов от общих категорийных терминов (например, отличать сеть «Ikea» от общего термина «flowers» или «pizzeria»). Это необходимо для улучшения качества локальной выдачи, позволяя системе точнее ранжировать результаты и активировать специфические функции, такие как показ ближайшего филиала или официального сайта.
Что запатентовано
Запатентован набор методов для идентификации сетевых бизнесов и связанных с ними запросов путем анализа исторических данных поиска (Historical Search Data) и информации о бизнес-сущностях (Entity Information). Изобретение описывает четыре основных независимых алгоритма, основанных на анализе триггерных слов и кликов, географического распределения запросов, соотношения поисков на картах и в вебе (Localness Score), а также сравнения использования термина в качестве названия или категории.
Как это работает
Система использует четыре ключевых механизма для классификации:
- Анализ триггерных слов и кликов: Идентифицируются слова, часто используемые при поиске сетей (например, «locations», «store locator»). Анализируются запросы с этими словами и определяются наиболее часто кликабельные URL (Navigational Results). Эти данные заносятся в таблицу сетевых бизнесов.
- Географическое разнообразие (L/N): Сравнивается количество уникальных локаций, из которых ищут бизнес (L), с количеством филиалов этого бизнеса (N). Низкое соотношение L/N указывает на сеть, а высокое — на общий термин.
- Оценка локальности (Localness Score): Рассчитывается соотношение популярности запроса в поиске по картам к популярности в веб-поиске. Высокая оценка указывает на локальный интент, свойственный сетевым бизнесам.
- Название vs Категория (C/T): Сравнивается, как часто термин используется в качестве названия бизнеса (T) и в качестве категории (C). Если термин чаще используется как категория, он исключается из списка сетей.
Актуальность для SEO
Высокая. Понимание бизнес-сущностей (Entity Understanding) и точная интерпретация локального интента остаются критически важными задачами для Google, особенно с ростом мобильного и картографического поиска. Базовые сигналы и логика, описанные в патенте (поведение пользователей, географические паттерны, структура данных о бизнесе), остаются фундаментальными для локального поиска.
Важность для SEO
Патент имеет высокое значение (80/100), особенно для Local SEO и продвижения мультилокационных бизнесов. Он напрямую влияет на то, как Google классифицирует бизнес-сущности и интерпретирует брендовые запросы. Корректная идентификация компании как chain business определяет, будет ли показан локальный блок (Map Pack), какой филиал получит приоритет и какой URL будет считаться основным навигационным ресурсом (например, страница поиска филиалов).
Детальный разбор
Термины и определения
- Chain Business (Сетевой бизнес)
- Бизнес, имеющий несколько филиалов или точек присутствия, объединенных общим названием или брендом (например, рестораны, банки, магазины, франшизы).
- Chain Business Query (Запрос о сетевом бизнесе)
- Запрос, целью которого является поиск информации о конкретном сетевом бизнесе, часто с локальным интентом.
- Chain Business Tables (Таблицы сетевых бизнесов)
- Хранилище данных, содержащее идентифицированные сетевые бизнесы, связанные с ними запросы и URL.
- Entity Information (Информация о сущностях)
- База данных бизнес-листингов (например, Google Business Profile), содержащая названия (Titles), категории (Categories), URL и геолокацию бизнесов.
- Historical Search Data (Исторические данные поиска)
- Агрегированные данные о прошлых поисковых сессиях, включающие запросы, показанные результаты (URL), выбранные пользователем результаты (клики), тип поиска (Web/Map) и геолокацию.
- Localness Score (Оценка локальности)
- Метрика, определяющая вероятность локального интента запроса. Рассчитывается как соотношение популярности запроса в поиске по картам к его популярности в веб-поиске.
- Navigational Result/URL (Навигационный результат/URL)
- Предпочитаемый результат поиска; URL, который выбирается наибольшим процентом пользователей по данному запросу (высокий click rate). Для сетевых бизнесов это часто страница поиска филиалов (Store Locator).
- Trigger Term (Триггерное слово)
- Слово или фраза в запросе, указывающая на интент поиска сетевого бизнеса. Примеры: «locations» (адреса), «store locator» (поиск магазина), «branches» (филиалы).
- Viewport (Область просмотра)
- Часть карты, которую просматривает пользователь при вводе запроса. Используется для определения имплицитной (неявной) геолокации запроса.
Ключевые утверждения (Анализ Claims)
Патент включает четыре основных независимых метода (Claims 1, 6, 11, 16) для идентификации сетевых бизнесов и запросов.
Claim 1 (Независимый пункт): Метод триггерных слов и кликов.
- Система получает Trigger Term (например, «store locator»).
- Из исторических данных извлекаются запросы, содержащие этот термин и название бизнеса (например, «Walmart store locator»).
- Для этих запросов определяется наиболее часто выбираемый результат (Navigational URL).
- Генерируется запись в таблице сетевых бизнесов, связывающая название бизнеса («Walmart») с этим навигационным URL.
Claim 6 (Независимый пункт): Метод соотношения локаций и листингов (L/N).
- Определяется количество бизнесов (N), имеющих определенное название, на основе Entity Information.
- Определяется количество уникальных географических запросов (L) из исторических данных, которые включают это название и уникальную геолокацию (явную или имплицитную).
- Вычисляется соотношение (Ratio) между L и N.
- Название определяется как сетевое, если это соотношение соответствует порогу. (Низкое соотношение L/N указывает на то, что это, скорее всего, сеть, а не общий термин, который ищут везде, но который редко является названием бизнеса).
Claim 11 (Независимый пункт): Метод оценки локальности (Localness Score).
- Определяется количество запросов по картам (Map Queries) и количество веб-запросов (Web Queries) для определенного названия.
- Вычисляется соотношение (Localness Score).
- Название определяется как сетевое, если это соотношение превышает порог (высокая оценка указывает на локальный интент, свойственный поиску физических точек).
Claim 16 (Независимый пункт): Метод соотношения категорий и названий (C/T).
- Определяется количество бизнесов, у которых данный термин фигурирует в Категории (C).
- Определяется количество бизнесов, у которых данный термин фигурирует в Названии (T). (Примечание: В тексте Claims буквы могут отличаться от описания, но суть метода неизменна).
- Вычисляется соотношение C/T.
- Термин определяется как название сети, если соотношение соответствует порогу. (Если термин чаще встречается в категориях, чем в названиях, это, вероятно, общий термин, например, «Pizzeria»).
Где и как применяется
Изобретение затрагивает несколько этапов поисковой архитектуры, преимущественно в офлайн-обработке данных для улучшения понимания сущностей и запросов.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит сбор и анализ Entity Information (данные из GBP и других источников). Описанные методы (особенно 2, 3, 4) используются для анализа этой информации и классификации бизнесов как сетевых или несетевых. Эта классификация сохраняется как признак сущности.
QUNDERSTANDING – Понимание Запросов
Основной этап применения, работающий в двух режимах:
- Офлайн-подготовка: Система анализирует Historical Search Data офлайн. Метод 1 используется для генерации Chain Business Tables, связывая запросы с навигационными URL. Методы 2 и 3 также используются для анализа логов запросов.
- Реальное время: При получении запроса система сверяется с подготовленными данными для классификации запроса как Chain Business Query.
RANKING / RERANKING – Ранжирование и Переранжирование
Результаты классификации используются в реальном времени. Если запрос идентифицирован как Chain Business Query:
- Система может повысить в ранжировании идентифицированный Navigational URL (например, страницу Store Locator).
- Система может активировать отображение локальных результатов (Local Pack) или карты с ближайшими филиалами, используя геолокацию пользователя.
Входные данные:
- Historical Search Data (запросы, результаты, клики, типы поиска Web/Map, геолокация).
- Entity Information (названия, категории, URL, адреса бизнесов).
- Списки Trigger Terms.
Выходные данные:
- Chain Business Tables (соответствие названий сетей и навигационных URL).
- Классификация сущностей (сетевой/несетевой бизнес).
- Классификация запроса.
На что влияет
- Конкретные типы контента и ниши: Наибольшее влияние оказывается на Local SEO для бизнесов с множеством филиалов: ритейл, банки, рестораны, аптеки и т.д.
- Специфические запросы: Влияет на брендовые и навигационные запросы, особенно те, которые содержат название сети с указанием локации или триггерными словами (например, «Сбербанк адреса», «Пятерочка рядом»).
Когда применяется
- Офлайн-обработка: Применяется периодически для анализа обновленных исторических данных и бизнес-листингов и перестроения Chain Business Tables.
- Онлайн-обработка (Real-time): Активируется при обработке запроса, если система определяет, что он может иметь локальный интент или содержать название бренда, идентифицированное в Chain Business Tables.
Пошаговый алгоритм
Патент описывает несколько независимых алгоритмов.
Алгоритм 1: Генерация таблицы сетевых бизнесов на основе триггерных слов
- Идентификация триггерного слова: Система определяет слово, указывающее на сетевой запрос (например, «locations»).
- Доступ к историческим данным: Система обращается к Historical Search Data.
- Идентификация запросов: Выбираются запросы, содержащие триггерное слово и название бизнеса.
- Идентификация навигационных URL: Для выбранных запросов определяются URL, которые пользователи выбирали чаще всего (Navigational Results). Могут применяться пороги кликабельности (например, >50%).
- Генерация таблицы: Создается Chain Business Table, связывающая название бизнеса и навигационный URL.
- Расширение списка запросов (Опционально): Система может найти другие запросы в логах (даже без триггеров), для которых идентифицированный URL также является навигационным, и добавить их в таблицу.
Алгоритм 2: Идентификация на основе географического разнообразия (L/N)
- Выбор кандидата: Выбирается название бизнеса (Title), которое может быть сетевым.
- Подсчет филиалов (N): Определяется количество бизнесов в Entity Information, связанных с этим названием.
- Подсчет уникальных локаций (L): Определяется количество уникальных географических запросов (с явной или имплицитной локацией, включая Viewport) в Historical Search Data, включающих это название.
- Расчет соотношения: Вычисляется соотношение L/N.
- Сравнение с порогом: Соотношение сравнивается с порогом (например, 2.0).
- Классификация: Если L/N меньше порога, название классифицируется как сетевой бизнес. Если больше — как несетевой (возможно, общий термин).
Алгоритм 3: Идентификация на основе Localness Score
- Выбор кандидата: Выбирается название бизнеса.
- Расчет Localness Score (V): Определяется соотношение количества запросов на картах к количеству веб-запросов, включающих это название.
- Сравнение с порогом: V сравнивается с порогом локальности.
- Классификация: Если V выше порога, название классифицируется как сетевой бизнес (высокий локальный интент).
Алгоритм 4: Идентификация на основе Название vs Категория (C/T)
- Выбор кандидата: Выбирается название бизнеса.
- Подсчет в категориях (C): Определяется количество бизнесов в Entity Information, у которых это название встречается в поле «Категория».
- Подсчет в названиях (T): Определяется количество бизнесов, у которых это название встречается в поле «Название» (Title).
- Расчет соотношения: Вычисляется соотношение C/T.
- Сравнение с порогом: Соотношение сравнивается с порогом (например, 1.2).
- Классификация: Если C/T меньше порога, название классифицируется как сетевой бизнес. Если больше — как категория/общий термин.
Какие данные и как использует
Данные на входе
- Поведенческие факторы: Критически важные данные. Используются Historical Search Data: логи запросов, показанные URL и клики пользователей (для определения Navigational Results и click rate). Также используется тип поиска (веб или карты).
- Географические факторы: Локация пользователя при поиске (явная в запросе или имплицитная из Viewport или IP/GPS). Используется для анализа географического распределения запросов (L). Геолокация филиалов из Entity Information.
- Структурные факторы (Entity Data): Entity Information (база данных бизнес-листингов). Используются поля: Название (Title), Категория (Category), URL.
- Контентные факторы (Опционально): В описании патента упоминается возможность сканирования веб-сайта на наличие триггерных слов (например, ссылки «store locator») для идентификации сетевого бизнеса.
Какие метрики используются и как они считаются
- Click Rate / Navigational Threshold: Процент кликов на URL по запросу. Используется в Алгоритме 1. Порог может быть, например, 50%.
- Ratio L/N (Location/Number Ratio): Соотношение числа уникальных географических локаций запроса (L) к числу филиалов бизнеса (N). Используется в Алгоритме 2.
Выводы
- Многофакторная классификация сущностей: Google использует комбинацию разнообразных сигналов (поведенческих, географических, структурных данных из листингов) для классификации бизнес-сущностей (сеть или не сеть). Система не полагается на один метод для решения проблемы неоднозначности имен.
- Критичность поведенческих сигналов: То, как пользователи ищут (Web vs Map, использование Trigger Terms) и на что кликают (Navigational Results), напрямую обучает алгоритмы распознаванию брендов и их классификации.
- Важность данных Entity Information (GBP): Точность и консистентность данных в Google Business Profile (название, категория) критически важны. Алгоритмы L/N и C/T напрямую зависят от качества данных в базе Google. Некорректные данные могут привести к неверной классификации бизнеса.
- Идентификация и Приоритезация Навигационного URL (Store Locator): Система активно ищет главный Navigational URL для сетевого бизнеса (часто страницу поиска филиалов). После идентификации этот URL может получать значительное повышение в ранжировании по связанным запросам.
- Отделение брендов от общих терминов: Ключевая задача патента — отличить настоящий бренд от общего или категорийного термина с помощью статистических фильтров (L/N, C/T, Localness Score). Это подчеркивает важность уникального и консистентного брендинга.
Практика
Best practices (это мы делаем)
Рекомендации в основном касаются сетевых бизнесов (Chain Businesses):
- Оптимизация страницы поиска филиалов (Store Locator): Создайте и оптимизируйте единую страницу поиска филиалов. Убедитесь, что она является Navigational Result для запросов с Trigger Terms (например, «[Бренд] адреса»). Это требует оптимизации мета-тегов, UX и обеспечения высокого CTR из поиска (Алгоритм 1).
- Консистентность данных (NAP) и Категорий: Обеспечьте абсолютную консистентность Названия, Адреса, Телефона и Основной Категории для всех филиалов в Google Business Profile и других источниках. Это критично для корректного подсчета N (числа филиалов) и T (упоминаний в названии) в Алгоритмах 2 и 4.
- Использование уникальных брендовых названий: Избегайте использования общих терминов в качестве названия бренда. Алгоритм 4 направлен на то, чтобы отфильтровать названия, которые слишком похожи на категории.
- Стимулирование локальных запросов (Map Search): Работайте над видимостью филиалов на картах. Высокий Localness Score (Алгоритм 3) подтверждает системе, что ваш бизнес является локальной сущностью, которую ищут в офлайне.
- Использование Trigger Terms на сайте: Убедитесь, что на сайте есть четкие ссылки на Store Locator с использованием триггерных слов (например, «Найти магазин»). Патент упоминает возможность сканирования сайта для идентификации сетевых бизнесов по контенту.
Worst practices (это делать не надо)
- Отсутствие единого Store Locator: Если у каждого филиала свой отдельный сайт или нет централизованного каталога, системе будет сложнее идентифицировать Navigational Result (Алгоритм 1).
- Неконсистентные названия филиалов: Использование разных форматов названий для филиалов одной сети мешает системе агрегировать данные и корректно рассчитывать статистические метрики (N и T).
- Манипуляции с категориями в листингах: Добавление названия бренда в поле категории или некорректный выбор основных категорий может исказить расчет Category/Title Ratio (Алгоритм 4) и привести к классификации бренда как общего термина.
- Игнорирование низкого CTR по брендовым запросам: Если пользователи по запросам вашего бренда с триггерными словами кликают не на ваш сайт (а, например, на агрегаторы), система не закрепит ваш URL как навигационный.
Стратегическое значение
Патент подчеркивает стратегическую важность управления сущностями (Entity Management) и консистентности данных для мультилокационных бизнесов в локальном поиске. Он демонстрирует, что классификация бренда (как сети или как общего термина) является ключевым фактором для доминирования в локальной выдаче. Это требует скоординированных усилий в области брендинга, UX (для обеспечения высоких навигационных сигналов) и локального SEO (для точности данных в GBP).
Практические примеры
Сценарий 1: Оптимизация Store Locator для сетевой кофейни «AromaCup» (Применение Алгоритма 1)
- Анализ: SEO-специалист проверяет, какой результат чаще всего кликают пользователи по запросу «AromaCup адреса». Допустим, это главная страница aromacup.com, а не локатор aromacup.com/locations.
- Действия: Необходимо улучшить видимость и удобство страницы aromacup.com/locations. Оптимизировать ее Title и Description, включив Trigger Terms («Найти кофейню», «Адреса»). Улучшить внутреннюю перелинковку и разместить заметную ссылку на главной странице.
- Цель: Сделать aromacup.com/locations основным Navigational Result.
- Ожидаемый результат: Google идентифицирует этот URL в Chain Business Table и начнет приоритетно показывать его в выдаче по запросам, связанным с поиском филиалов.
Сценарий 2: Исправление проблем с идентификацией нового бренда (Применение Алгоритмов 2 и 4)
- Анализ: Новый бренд быстро открывает филиалы, но Google не распознает его как сеть. Название бренда похоже на общий термин (например, «Best Shoes»).
- Действия: Необходимо активно регистрировать все филиалы в GBP и ключевых каталогах с консистентным названием «Best Shoes». Убедиться, что выбрана правильная основная категория («Обувной магазин»), и что само название не совпадает с категорией.
- Цель: Увеличить количество идентифицированных филиалов (N) и количество вхождений в названиях (T).
- Ожидаемый результат: Соотношение L/N (Алгоритм 2) и соотношение C/T (Алгоритм 4) уменьшатся до значений ниже пороговых, что поможет системе классифицировать «Best Shoes» как сетевой бизнес, а не общий термин.
Вопросы и ответы
Что такое «Trigger Terms» и как их использовать в SEO?
Trigger Terms — это слова, указывающие на намерение пользователя найти филиал сетевой компании (например, «адреса», «магазины», «store locator»). Google анализирует запросы с этими словами, чтобы найти официальный локатор магазинов (Navigational URL). В SEO их следует использовать в Title, H1 и анкорных текстах ссылок, ведущих на страницу вашего локатора, чтобы помочь Google правильно ее идентифицировать.
Как SEO-специалист может повлиять на то, какой URL будет выбран в качестве навигационного (Navigational URL) для сети?
Система определяет этот URL на основе исторических данных о кликах пользователей (CTR). Чтобы повлиять на выбор, необходимо сделать страницу поиска филиалов (Store Locator) максимально релевантной, удобной и видимой в поиске для запросов с Trigger Terms. Оптимизация мета-тегов и улучшение UX будут способствовать увеличению кликов на нее, что приведет к ее закреплению в Chain Business Tables.
Что такое «Localness Score» и почему он важен?
Localness Score — это метрика, измеряющая соотношение популярности запроса в локальном поиске (на Картах) к его популярности в обычном веб-поиске. Высокий балл указывает на сильный локальный интент. Система использует эту метрику, чтобы отличать локальные сущности (включая сетевые бизнесы, такие как «Starbucks») от глобальных веб-сущностей или общих терминов (таких как «Yahoo»).
Как система отличает название сети от общего термина, например, «Pizzeria»?
Используются несколько методов, в частности C/T Ratio (Алгоритм 4). Система проверяет, как часто термин используется в качестве названия по сравнению с использованием в качестве категории. Если термин используется в качестве категории значительно чаще, чем в качестве названия (как «Pizzeria»), он считается общим термином и исключается из списка сетей.
Какое значение имеет консистентность NAP (Name, Address, Phone) в контексте этого патента?
Консистентность NAP критически важна. Для расчета L/N Ratio (Алгоритм 2) системе необходимо точно подсчитать количество филиалов (N) с одинаковым названием. Для расчета C/T Ratio (Алгоритм 4) нужно точно сравнить частоту использования термина в названиях (T). Расхождения в данных (Entity Information) приведут к ошибкам в расчетах и неправильной классификации бизнеса.
Что такое соотношение L/N и как оно используется для идентификации сетей?
L/N Ratio сравнивает количество уникальных географических локаций (L), из которых ищут название, с общим количеством филиалов с этим названием (N). Если у компании много филиалов (высокий N) и ее ищут из разных мест (высокий L), соотношение L/N будет низким (например, < 2.0), что характерно для сетей. Высокое соотношение указывает на общий термин (например, «цветы» ищут везде, но мало бизнесов с таким названием).
Применяются ли эти алгоритмы в реальном времени при обработке запроса?
Нет, сами алгоритмы идентификации и классификации работают в офлайн-режиме, анализируя большие объемы Historical Search Data и Entity Information. Однако результаты их работы — Chain Business Tables и классификация сущностей — сохраняются и используются в реальном времени на этапе ранжирования для улучшения выдачи по конкретному запросу.
Что такое имплицитная геолокация запроса (implicit location) и Viewport?
Это когда пользователь не указывает местоположение в запросе (например, ищет просто «Starbucks»), но система определяет его местоположение по другим сигналам. Патент явно упоминает использование Viewport (область карты, которую просматривает пользователь) или местоположения устройства (IP/GPS) для определения этой имплицитной локации. Эти данные учитываются при расчете L в алгоритме L/N.
Могут ли эти методы использоваться вместе?
Да. Патент описывает эти методы как независимые фильтры. В описании также упоминается, что они могут быть использованы вместе для генерации общего Prominence Score (Оценки значимости), который определяет вероятность того, что бизнес является сетевым, и используется для ранжирования.
Использует ли Google данные с моего сайта для определения статуса сети?
Да, в патенте упоминается (в описании, не в Claims), что система может сканировать контент веб-сайта на наличие Trigger Terms (например, ссылки с текстом «Store Locator»). Наличие таких элементов на сайте может служить дополнительным сигналом для идентификации бизнеса как сетевого.