Как Google определяет 'эталонное расстояние' для локальных бизнесов, чтобы сбалансировать релевантность и близость похожих мест

Google использует механизм для определения списка похожих локальных бизнесов. Система агрегирует несколько списков похожих мест, ранжированных по разным сигналам (например, по типу кухни, по отзывам). Затем вычисляется ‘эталонное расстояние’ на основе того, как далеко находятся наиболее похожие бизнесы. Это расстояние используется для корректировки финального списка: слишком далекие места понижаются, даже если они очень похожи по тематике.

Описание

Какую задачу решает

Патент решает проблему балансировки между тематической схожестью (relatedness) и географической близостью при формировании списков похожих локальных сущностей (например, похожих ресторанов или магазинов). Различные алгоритмы могут генерировать списки похожих мест, используя разные сигналы (например, один фокусируется на типе кухни, другой — на отзывах или поведении пользователей). Эти списки могут содержать сущности, которые очень похожи тематически, но находятся слишком далеко, чтобы быть полезными в локальном контексте (например, ресторан той же сети в другом городе). Изобретение направлено на агрегацию этих разрозненных списков и корректировку их с учетом географической реальности конкретной локации.

Что запатентовано

Запатентована система агрегации и корректировки списков похожих локальных сущностей. Для определенной локальной сущности (например, ресторана) система получает несколько списков похожих мест, ранжированных по разным критериям. Эти списки объединяются в композитный список (composite set). Затем система вычисляет «эталонное расстояние» (reference distance), которое отражает типичное расстояние до наиболее похожих сущностей в этой локации. Финальный композитный список корректируется с использованием этого эталонного расстояния для балансировки схожести и дистанции.

Как это работает

Ключевой механизм работы системы:

Сбор данных: Система получает несколько списков (respective sets) похожих локальных сущностей для исходной сущности. Каждый список ранжирован по своему набору сигналов схожести (order of relatedness).
Агрегация: Списки объединяются в единый композитный список. Ранжирование в нем определяется на основе позиций сущностей в исходных списках (вычисляется Composite Relatedness Score).
Вычисление эталонного расстояния: Система анализирует Топ-N наиболее похожих сущностей из композитного списка и вычисляет reference distance. Это может быть среднее или медианное расстояние до этих Топ-N мест.
Корректировка ранжирования: Оценки схожести (Composite Relatedness Score) всех сущностей в композитном списке корректируются на основе их фактического расстояния и вычисленного reference distance. Сущности, находящиеся дальше эталонного расстояния, могут быть понижены, а ближе — повышены.

Актуальность для SEO

Высокая. Локальный поиск остается критически важной областью для Google. Балансировка релевантности и дистанции является фундаментальной задачей при ранжировании локальных результатов и предложении похожих мест (например, в Google Maps или блоках Local Pack). Механизм адаптивного определения «локальности» (через reference distance) для разных типов бизнеса и разных географических зон крайне актуален для обеспечения качественного пользовательского опыта.

Важность для SEO

Патент имеет высокое значение для локального SEO (Local SEO). Он описывает механизм, который напрямую влияет на то, какие бизнесы будут показаны как «похожие» или как они будут ранжироваться в локальной выдаче. Понимание того, что Google не просто использует фиксированный радиус, а вычисляет адаптивное reference distance, позволяет точнее прогнозировать видимость бизнеса. Если ваш бизнес находится дальше, чем типичное «эталонное расстояние» для вашей ниши в данном районе, его видимость может быть искусственно ограничена, несмотря на высокую тематическую релевантность.

Детальный разбор

Термины и определения

Local Entity (Локальная сущность): Физический объект (physical entity), привязанный к географическому местоположению и имеющий локальное значение для этого местоположения (например, ресторан, магазин, достопримечательность).
First Local Entity (Первая локальная сущность): Исходная сущность, для которой генерируется список похожих мест.
Second Local Entities (Вторые локальные сущности): Сущности, которые считаются похожими или связанными с первой локальной сущностью.
Respective Sets (Соответствующие наборы): Различные списки вторых локальных сущностей, сгенерированные разными алгоритмами или на основе разных сигналов схожести.
Order of Relatedness (Порядок связанности/схожести): Ранжирование сущностей в списке на основе того, насколько они похожи на первую локальную сущность.
Composite Set (Композитный набор): Единый список похожих сущностей, полученный путем агрегации Respective Sets.
Composite Relatedness Score (CRS) (Композитная оценка схожести): Оценка, присваиваемая каждой сущности в композитном наборе, основанная на ее ранге и оценке схожести в исходных списках.
Reference Distance (Эталонное расстояние): Расстояние, вычисленное на основе композитного набора. Оно отражает типичную дистанцию до наиболее похожих сущностей для данной первой локальной сущности. Является «эмерджентным» (emergent), то есть определяется данными, а не задается заранее.
Proper Subset (Надлежащее подмножество): Выборка из композитного набора (например, Топ-N наиболее похожих сущностей), используемая для вычисления Reference Distance.
Central Tendency (Мера центральной тенденции): Статистическая мера (например, среднее арифметическое, медиана, взвешенное среднее), используемая для расчета Reference Distance на основе расстояний до сущностей в Proper Subset.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод агрегации и корректировки списков локальных сущностей.

Система получает данные о первой локальной сущности и несколько разных наборов (respective sets) вторых локальных сущностей, связанных с ней. Каждый набор ранжирован по-своему (respective order of relatedness).
Определяется композитный набор (composite set) путем объединения исходных наборов. Сущности ранжируются согласно композитному порядку схожести (composite order of relatedness).
На основе композитного набора вычисляется эталонное расстояние (reference distance) для первой локальной сущности. Оно зависит от ее местоположения и местоположения вторых локальных сущностей.
Композитный порядок корректируется (adjusting) на основе reference distance и фактического расстояния до каждой второй локальной сущности. Уточняется, что корректировка включает понижение (demoting) сущности, если ее фактическое расстояние превышает reference distance.
Скорректированный композитный набор предоставляется пользователю.

Claim 2 (Зависимый от 1): Детализирует процесс создания композитного набора.

Для каждой второй локальной сущности вычисляется композитная оценка схожести (composite relatedness score) на основе ее рангов в исходных наборах. Композитный порядок определяется этими оценками.

Claim 4 (Зависимый от 2): Детализирует процесс корректировки.

Корректировка композитного порядка происходит путем изменения composite relatedness score каждой сущности на основе ее фактического расстояния и reference distance.

Claim 5 (Зависимый от 4): Уточняет механизм корректировки.

Composite relatedness score увеличивается пропорционально величине reference distance по отношению к фактическому расстоянию. Это означает, что чем ближе сущность по сравнению с эталонным расстоянием, тем больше бустинг она получает.

Claim 7 (Зависимый от 1): Детализирует вычисление reference distance.

Выбирается надлежащее подмножество (proper subset) из композитного набора.
Reference distance определяется на основе расстояний от первой локальной сущности до каждой сущности в этом подмножестве.

Claim 8 (Зависимый от 7): Уточняет выбор подмножества.

Подмножество состоит из Топ-N сущностей, имеющих наивысший ранг (highest degrees of relatedness) в композитном порядке.

Где и как применяется

Изобретение применяется в системах локального поиска для определения схожести между локальными сущностями и ранжирования результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно обработать данные о локальных сущностях. Сюда входит:

Идентификация локальных сущностей и их географических координат.
Генерация исходных списков схожести (Respective Sets) с помощью различных подсистем (Entity Similarity Subsystem). Эти списки могут генерироваться независимо от местоположения (Claim 3).
Выполнение процесса агрегации и корректировки, описанного в патенте, с помощью Local Entity Aggregator.

Результат — скорректированные композитные списки похожих сущностей — сохраняется в базе данных (Local Entity Data).

RANKING / RERANKING – Ранжирование / Переранжирование
Поисковая система (Search System) и ее подсистема локального поиска (Local Search Result Subsystem) используют эти предварительно рассчитанные данные о схожести локальных сущностей при обработке запросов пользователей. Например, при поиске «рестораны рядом с [Название места]» или при отображении блока «Похожие места» на карточке организации.

Входные данные:

Первая локальная сущность (X) и ее географическое положение.
Несколько списков (Respective Sets) похожих сущностей (Y1, Y2… Yn), ранжированных по схожести с X. Каждый список содержит оценки схожести (Relatedness Score) и порядковые позиции (Ordinal Position).

Выходные данные:

Скорректированный композитный список похожих сущностей (Y»), ранжированный по скорректированным оценкам схожести (Adjusted Composite Relatedness Score).

На что влияет

Конкретные типы контента: Патент напрямую влияет на контент, связанный с локальными сущностями — страницы организаций, профили в Google Business Profile, каталоги, карты.
Специфические запросы: Влияет на локальные запросы (коммерческие и информационные), где важна близость (например, «пиццерия рядом», «похожие магазины»).
Конкретные ниши или тематики: Влияет на все локальные ниши. Особенность патента в том, что он адаптивен: reference distance для пиццерий в центре города будет меньше, чем для загородных отелей или автосалонов в том же регионе.

Когда применяется

Алгоритм применяется в процессе предобработки данных о локальных сущностях (офлайн) для генерации финальных списков похожих мест.

Условия работы: Применяется для локальных сущностей, для которых доступно несколько исходных списков схожести (Respective Sets), сгенерированных разными методами.
Исключения и особые случаи: Патент описывает возможность исключения Топ-1 (или нескольких топовых) сущностей из расчета reference distance, чтобы избежать искажений, вызванных, например, другими филиалами той же сети, которые часто находятся далеко друг от друга.

Пошаговый алгоритм

Процесс агрегации и корректировки списка похожих локальных сущностей для Первой локальной сущности (X).

Сбор исходных данных:
Система получает несколько списков (Respective Sets) Вторых локальных сущностей (Y), ранжированных по схожести с X.
Агрегация и расчет композитной оценки (CRS):
- Для каждой сущности Y, присутствующей хотя бы в одном списке, вычисляется Композитная оценка схожести (Composite Relatedness Score, CRS).
- Расчет может учитывать оценку схожести (RS) и порядковую позицию (OP) сущности Y в каждом списке k, где она присутствует. Формула: $CRS_{Y_j} = f([RS_k(Y_j), OP_k(Y_j)])$ .
- Также может учитываться количество списков, в которых присутствует сущность Y.
Формирование композитного списка:
Все уникальные сущности Y объединяются в Composite Set и ранжируются по убыванию CRS.
Выбор подмножества для анализа (Proper Subset):
- Из композитного списка выбирается Топ-N сущностей с наивысшими CRS (например, N=5, 10 или 20).
- В некоторых вариантах Топ-1 или несколько первых сущностей могут быть исключены из подмножества, чтобы избежать искажений от филиалов сети.
Вычисление эталонного расстояния (Reference Distance, RDx):
- Определяются расстояния от X до каждой сущности Y в выбранном подмножестве.
- Вычисляется Reference Distance (RDx) как мера центральной тенденции этих расстояний (например, среднее, медиана).
- Может применяться взвешивание: расстояния до более высокоранжированных сущностей могут иметь больший вес при расчете RDx.
Корректировка оценок (Adjusted CRS):
- Для каждой сущности Yj в композитном списке ее исходная оценка CRS корректируется на основе ее фактического расстояния до X (Dxj) и эталонного расстояния (RDx).
- Формула корректировки: $Adj\_CRS_{Y_j} = CRS_{Y_j} * f(Dx_j, RDx)$ f(Dxj,RDx).
- Функция f может быть реализована по-разному:
  - Повышение оценки, если Dxj < RDx (Claim 5).
  - Понижение (демпфирование) оценки, если Dxj > RDx (например, асимптотическое затухание).
Финальное ранжирование:
Композитный список переранжируется на основе скорректированных оценок (Adjusted CRS) и сохраняется для использования поисковой системой.

Какие данные и как использует

Данные на входе

Патент фокусируется на процессе агрегации и не детализирует, какие именно сигналы используются для генерации исходных списков схожести, но упоминает следующие типы данных, используемые в описанном механизме:

Географические факторы: Географическое местоположение (координаты) как исходной (First Local Entity), так и всех похожих (Second Local Entities) сущностей. Это критически важно для расчета расстояний и Reference Distance.
Сигналы схожести (Relatedness Signals): Исходные списки (Respective Sets), ранжированные по схожести. В тексте упоминаются примеры сигналов, которые могут использоваться для их генерации (хотя и не являются частью изобретения):
- Контентные факторы: Ключевые слова-дескрипторы (keyword descriptors), анализ сайта (site analysis).
- Поведенческие факторы: Доли кликов по запросам (query term click fractions), совместная встречаемость в выборе результатов поиска (search result selection co-occurrence).

Какие метрики используются и как они считаются

Relatedness Score (RS) и Ordinal Position (OP): Оценка схожести и порядковая позиция сущности в исходных списках. Используются как входные данные для агрегации.
Composite Relatedness Score (CRS): Агрегированная оценка схожести. Вычисляется как функция от RS и OP из всех списков, где присутствует сущность. $CRS = f(RS, OP)$ .
Reference Distance (RDx): Эталонное расстояние. Вычисляется как мера центральной тенденции (среднее, медиана, взвешенное среднее) расстояний до Топ-N наиболее похожих сущностей из композитного списка.
Adjusted Composite Relatedness Score (Adj_CRS): Скорректированная оценка схожести. Вычисляется путем умножения CRS на функцию корректировки, зависящую от фактического расстояния (Dxj) и эталонного расстояния (RDx). $Adj\_CRS = CRS * f(Dxj, RDx)$ .
Методы вычислений: Используются статистические методы (меры центральной тенденции) и взвешивание (например, при расчете RDx вес может зависеть от ранга сущности).

Выводы

«Локальность» адаптивна и зависит от контекста: Google не использует фиксированный радиус для определения локальной зоны. Вместо этого система вычисляет Reference Distance индивидуально для каждой сущности на основе того, где расположены наиболее похожие на нее места. Это значит, что «локальная зона» для кафе может быть 500 метров, а для уникального музея — 50 километров.
Баланс схожести и дистанции: Система стремится найти баланс. Высокая тематическая схожесть (Composite Relatedness Score) является основой, но она затем корректируется дистанцией. Слишком далекие объекты будут понижены (demoted), даже если они идеально подходят по тематике (Claim 1).
Бустинг за близость (относительно эталона): Если объект находится ближе, чем Reference Distance, его оценка схожести может быть повышена (Claim 5). Это дает преимущество близко расположенным релевантным бизнесам.
Агрегация сигналов для уменьшения предвзятости: Система объединяет результаты разных алгоритмов схожести (Respective Sets), чтобы финальный список не зависел от ограничений или предвзятости какого-либо одного метода.
Обработка сетевых бизнесов: Патент признает проблему, когда филиалы одной сети (очень похожие, но далекие) могут искажать восприятие локальности. Предлагается механизм для смягчения этого влияния путем исключения топовых результатов при расчете Reference Distance.

Практика

Best practices (это мы делаем)

Максимизация сигналов тематической схожести (Relatedness): Поскольку основой для попадания в композитный список является высокая схожесть (CRS), необходимо усиливать все доступные сигналы, указывающие на релевантность бизнеса конкретной категории и тематике. Это включает оптимизацию GBP (категории, атрибуты, услуги, товары), контент на сайте, а также получение тематических отзывов и ссылок.
Анализ локальной конкурентной среды: Необходимо понимать, как выглядит «типичная локальность» для вашей ниши в вашем районе. Если конкуренты в Топе локальной выдачи в основном находятся в радиусе 1 км, вероятно, Reference Distance будет небольшим. Это важно учитывать при выборе местоположения бизнеса или планировании зоны обслуживания (Service Area Business).
Управление филиалами сети: Если вы управляете сетью, важно понимать, что система может пытаться ограничить показ далеких филиалов как «похожих мест» для другого филиала. Каждый филиал должен рассматриваться как отдельная локальная сущность с сильными сигналами привязки к своей конкретной зоне.

Worst practices (это делать не надо)

Игнорирование географических факторов в пользу тематики: Нельзя полагаться только на тематическую оптимизацию, если физическое местоположение бизнеса находится значительно дальше от пользователя или от центра кластера похожих бизнесов, чем Reference Distance. Система активно борется с показом релевантных, но слишком далеких результатов.
Манипуляции с зоной обслуживания (для SAB): Попытки чрезмерно расширить зону обслуживания в надежде охватить больше запросов могут быть неэффективны, если система определит, что Reference Distance для данной услуги в данном регионе значительно меньше заявленной зоны.

Стратегическое значение

Патент подчеркивает важность понимания локального контекста на гиперлокальном уровне. Стратегия локального SEO должна учитывать не только традиционные факторы (оптимизация профиля, отзывы, цитирования), но и физическую реальность расположения бизнесов в конкретной нише. Google стремится моделировать реальное поведение пользователей, которое сильно зависит от готовности преодолевать определенные расстояния для разных типов услуг. Адаптивное Reference Distance является ключевым инструментом для этого моделирования.

Практические примеры

Сценарий 1: Определение зоны видимости для нового кафе

Задача: Оценить потенциальный радиус видимости в локальном поиске для нового кафе в спальном районе.
Действия (на основе патента):
1. Идентифицировать 5-10 наиболее похожих и успешных кафе в этом районе (аналог Proper Subset).
2. Рассчитать среднее расстояние между ними или от предполагаемого центра кластера (аналог Reference Distance).
3. Предположить, что Google будет использовать схожее расстояние для ранжирования.
Ожидаемый результат: Если Reference Distance составляет 800 метров, то основная борьба за локальный Топ будет происходить внутри этого радиуса. За его пределами видимость будет резко снижаться из-за механизма корректировки дистанции.

Сценарий 2: Анализ причин низкой видимости автосервиса

Задача: Автосервис имеет отличные отзывы и хорошо оптимизированный сайт (высокий потенциальный CRS), но плохо ранжируется в локальной выдаче города.
Действия (на основе патента): Проанализировать географическое распределение конкурентов. Возможно, автосервис находится на окраине, в то время как большинство похожих бизнесов сконцентрировано в другом районе.
Ожидаемый результат: Система могла вычислить Reference Distance, основываясь на кластере конкурентов. Автосервис находится значительно дальше этого расстояния от потенциальных клиентов в городе, поэтому его рейтинг корректируется (понижается) механизмом Distance Adjustment Process, несмотря на высокую тематическую схожесть.

Вопросы и ответы

Что такое «Эталонное расстояние» (Reference Distance) простыми словами?

Это расстояние, которое система считает «нормальным» или типичным для поиска похожих мест в конкретной ситуации. Оно не фиксировано, а вычисляется динамически. Например, если для пиццерии А большинство похожих хороших пиццерий находится в радиусе 2 км, то это расстояние и будет эталонным. Если другое место находится в 10 км, система может посчитать его слишком далеким.

Означает ли это, что Google не использует фиксированный радиус в локальном поиске?

Да, патент подтверждает, что система использует более сложный механизм, чем просто фиксированный радиус (например, «показать все в радиусе 5 км»). Reference Distance адаптивно и зависит от плотности и расположения похожих бизнесов в конкретной местности и нише, что делает выдачу более релевантной для пользователя.

Как система решает, что важнее: схожесть или расстояние?

Сначала система определяет схожесть (Composite Relatedness Score), агрегируя данные из разных источников. Это основа. Затем она вычисляет Reference Distance на основе наиболее похожих мест. Финальный этап — корректировка оценки схожести с учетом расстояния. Если расстояние слишком велико по сравнению с эталонным, оценка будет понижена.

Может ли мой бизнес ранжироваться высоко, если он находится далеко от конкурентов?

Это зависит от того, как рассчитывается Reference Distance. Если ваш бизнес уникален и похожих мест мало (например, специализированный музей), Reference Distance будет большим, и удаленность не станет проблемой. Если же вы открыли кафе далеко от кластера других кафе, система может посчитать ваше расположение неоптимальным и понизить вас в выдаче для пользователей внутри этого кластера.

Как этот патент влияет на сетевые бизнесы с множеством филиалов?

Патент учитывает, что филиалы одной сети очень похожи, но часто расположены далеко друг от друга. Чтобы далекие филиалы не искажали расчет Reference Distance, система может исключать самые похожие (но далекие) результаты из расчета эталонного расстояния. Это помогает сфокусироваться на реальных локальных альтернативах, а не на других точках той же сети.

Что такое Composite Relatedness Score (CRS) и как его повысить?

CRS — это общая оценка того, насколько ваш бизнес похож на другой (или релевантен запросу), основанная на агрегации разных сигналов. Чтобы его повысить, нужно работать над всеми аспектами локального SEO: точные категории в GBP, насыщенный контент на сайте, релевантные отзывы и упоминания, которые подтверждают вашу экспертизу в конкретной области.

Если я нахожусь ближе эталонного расстояния, получу ли я бустинг?

Да, в патенте (Claim 5) указано, что оценка схожести может быть увеличена пропорционально тому, насколько ваше расстояние меньше эталонного. Это дает значительное преимущество бизнесам, расположенным близко к пользователю или к центру локального кластера.

Использует ли система среднее или медиану для расчета Reference Distance?

Патент упоминает использование «меры центральной тенденции» (Central Tendency), что может включать среднее арифметическое, медиану или взвешенное среднее. Конкретная реализация может варьироваться. Медиана часто предпочтительнее, так как она более устойчива к выбросам (например, одному очень далекому похожему месту).

Влияет ли этот патент только на блок «Похожие места» или на общее локальное ранжирование?

Хотя патент описывает механизм генерации списков похожих сущностей, результирующие данные о схожести и скорректированные оценки (Adjusted CRS) сохраняются в базе данных локальных сущностей. Эти данные затем используются поисковой системой при обработке локальных запросов, поэтому влияние распространяется и на общее локальное ранжирование (Local Pack, Google Maps).

Происходят ли эти вычисления в реальном времени при запросе пользователя?

Согласно описанию, процесс агрегации, расчета Reference Distance и корректировки оценок выполняется заранее (офлайн) во время индексации или предобработки данных. При запросе пользователя система использует уже готовые, скорректированные данные о схожести локальных сущностей для быстрого ранжирования.

Как Google определяет ‘эталонное расстояние’ для локальных бизнесов, чтобы сбалансировать релевантность и близость похожих мест