
Google определяет, насколько похожи друг на друга локальные бизнесы (например, рестораны), анализируя поведение пользователей. Система изучает, какие запросы вводят пользователи и как часто они кликают на конкретный бизнес в ответ на эти запросы. Сравнивая эти поведенческие профили, Google вычисляет меру сходства, учитывая распределение кликов и отфильтровывая общие или навигационные термины.
Патент решает задачу идентификации и ранжирования локальных сущностей (например, бизнесов, достопримечательностей), которые похожи на заданную локальную сущность. Цель — предоставить пользователям релевантные предложения или альтернативы (например, предложить похожие рестораны). Система стремится сделать это вычислительно эффективным способом, ограничивая сравнение географической областью, и повысить точность, используя фактическое поведение пользователей (запросы и клики) как индикатор сходства, фильтруя при этом «шумные» или предвзятые запросы.
Запатентована система для вычисления меры сходства (Similarity Measure) между локальными сущностями на основе данных из логов запросов. Изобретение использует два ключевых показателя для каждого термина запроса, связанного с сущностью: Term Value (частота запросов, включающих термин) и Selection Value (частота кликов по результатам, ссылающимся на сущность, в ответ на эти запросы). Сходство определяется путем сравнения этих значений, с акцентом на распределение кликов (Selection Ratios) и качество термина (Term Quality).
Система работает в несколько этапов:
Term Values (TV) и Selection Values (SV) для терминов, связанных с каждой локальной сущностью.Proper Subset) других локальных сущностей, обычно ограниченное географически (например, в радиусе K миль). Это повышает эффективность и релевантность.Selection Ratios (например, SV/TV), чтобы понять, насколько сильно термин связан именно с этой сущностью (концентрация кликов).Location Bias, например, "NYC") или навигационной (Navigational Bias, например, бренды) предвзятостью фильтруются или понижаются в весе.Высокая. Определение сходства сущностей является фундаментальной задачей в локальном поиске и рекомендательных системах (Google Maps, Local Pack). Использование поведенческих данных (запросов и кликов) для понимания природы бизнеса и его связей остается стандартной практикой. Методы, описанные в патенте, напрямую связаны с функциями типа «Похожие места».
Патент имеет высокое значение (85/100) для стратегий локального SEO. Он раскрывает механизм, с помощью которого Google определяет природу бизнеса и его конкурентное окружение, основываясь не столько на заявленных категориях (GBP) или контенте сайта, сколько на фактическом поведении пользователей. Понимание того, какие запросы приводят к кликам на ваш бизнес и на бизнес конкурентов, критически важно для формирования релевантного поведенческого профиля.
Term Values и Selection Values.Selection Value к Term Value (SV/TV) для конкретного термина и сущности. Используется для измерения распределения и концентрации кликов.Selection Ratio и Term Quality для обеих сравниваемых сущностей.Claim 1 (Независимый пункт): Описывает основной метод определения связанных локальных сущностей.
Local Entities (физических объектов с гео-привязкой).Term Value (TV): пропорционально частоте термина в логах запросов.Selection Value (SV): пропорционально количеству кликов на результаты для этой сущности при использовании этого термина.Proper Subset вторых локальных сущностей.Similarity Measure по отношению к первой сущности на основе TV и SV обеих сущностей.Similarity Measure.Claim 2 (Зависимый от 1): Уточняет критерий выбора подмножества.
Выбор Proper Subset включает только те локальные сущности, которые находятся в пределах порогового расстояния (threshold distance) от географического местоположения первой локальной сущности.
Claim 5 (Зависимый от 1): Вводит концепцию распределения кликов.
Расчет Similarity Measure включает:
Selection Ratio (пропорционально SV/TV) для первой сущности.Selection Ratio для второй сущности.Claim 7 (Зависимый от 1): Вводит концепцию качества термина.
Расчет Similarity Measure включает:
Term Quality Score для каждого термина.Location Bias или Navigational Bias.Изобретение описывает преимущественно офлайн-процесс анализа данных для генерации карты сходства локальных сущностей. Результаты этого процесса затем используются на этапах ранжирования.
INDEXING – Индексирование и извлечение признаков (Офлайн-анализ)
Основная работа алгоритма происходит на этом этапе в виде пакетной обработки данных (Data Pipeline).
Local Entity Data.Local Entity Query Term Profiler анализирует Query Logs для расчета Term Values и Selection Values.Term Quality и выявления предвзятостей (Bias).Local Entity Similarity Subsystem выполняет итеративный процесс сравнения каждой сущности с ее географически близкими соседями для расчета Similarity Measure.RANKING / RERANKING – Ранжирование / Переранжирование
Рассчитанные данные о сходстве могут использоваться Local Search Result Subsystem как сигнал ранжирования в локальном поиске. Например, если Ресторан А релевантен запросу, Ресторан Б, имеющий высокую Similarity Measure с Рестораном А, также может получить повышение.
METASEARCH – Метапоиск и Смешивание
Результаты используются для генерации блоков рекомендаций, таких как «Похожие места» или «Люди также ищут», отображаемых на SERP или в интерфейсах карт.
Входные данные:
Query Logs), включая данные о запросах и кликах (Selection Data).Local Entity Data) с географическими координатами.Выходные данные:
Similarity Measures.High Quality Terms), фильтруя навигационные и чисто географические.Threshold Distance). Требует наличия достаточного объема данных в логах запросов.Процесс А: Расчет схожести локальных сущностей
Term Values (TV) и Selection Values (SV) для связанных с ней терминов запросов.Proper Subset вторых локальных сущностей (Subset B), которые находятся в пределах порогового расстояния от Entity A.Selection Ratio (SV/TV) для каждого термина для Entity A и Entity B.Term Quality для каждого термина (см. Процесс Б).Similarity Measure между Entity A и Entity B. Это может включать расчет Constituent Scoring Components (CSC), взвешенных с учетом Selection Ratios и Term Quality. Система может также сравнивать Selection Ratio сущности с медианным значением для этого термина, чтобы определить его значимость.Similarity Measure по отношению к Entity A.Процесс Б: Определение качества термина (Term Quality)
High Quality. В противном случае — как Low Quality.Query Logs). Term Value).Selections) на результаты поиска, ссылающиеся на локальную сущность (для расчета Selection Value).Proper Subset) и для определения Location Bias термина.High Quality Term).Location Bias, Navigational Bias и категориальной принадлежности термина.Constituent Scoring Components (CSC). Пример функции из описания: CSCq=f(TVqj,SVqj,TVqk,SVqk).Selection Ratio (SV/TV). Это позволяет отличить общие термины (например, «отзывы») от специфических (например, «пицца»). Концентрация кликов по термину на конкретной сущности является сильным сигналом схожести.Location Bias (названия городов) и Navigational Bias (бренды) считаются низкокачественными для целей сравнения. Приоритет отдается категорийным терминам.High Quality Terms), которые точно описывают ваш бизнес. Это укрепит связь между этими терминами и вашей сущностью, повышая Selection Ratio.Selection Value по качественным терминам, тем четче ваш профиль и точнее система определит похожие бизнесы.Selection Ratios по нишевым запросам. Это поможет системе понять специализацию и правильно подобрать схожие сущности для разных аспектов деятельности.Navigational Bias и имеют меньший вес при определении схожести. Нельзя игнорировать оптимизацию под категориальные запросы.Этот патент подчеркивает переход от статического понимания локальных сущностей к динамическому, основанному на поведении пользователей. Стратегия локального SEO должна быть направлена на то, чтобы поведенческий профиль бизнеса (совокупность запросов, по которым на него кликают) максимально точно соответствовал его реальной деятельности. Это определяет, с кем Google будет сравнивать ваш бизнес и кому рекомендовать его в качестве альтернативы.
Сценарий: Определение схожести для кафе с размытым позиционированием
Selection Ratio и, вероятно, будет иметь низкий Term Quality (шумный). Его вес минимален.Selection Ratios как по «Кофе», так и по «Бургерам».Selection Value и Selection Ratio по запросам, связанным с кофе, и, возможно, уменьшить акцент на бургерах, чтобы ее поведенческий профиль больше совпадал с профилем «Зерна».Как Google определяет, похож ли мой ресторан на ресторан конкурента согласно этому патенту?
Google анализирует логи запросов. Если пользователи часто используют одни и те же категорийные термины (например, "итальянская паста", "семейный ужин") и кликают как на ваш ресторан, так и на ресторан конкурента в ответ на эти запросы, система рассчитывает высокую Similarity Measure. При этом учитывается не только общее количество кликов, но и их доля (Selection Ratio) для каждого бизнеса.
Что такое Term Value (TV) и Selection Value (SV) простыми словами?
Term Value (TV) отражает, как часто термин используется в поиске в целом (популярность термина). Selection Value (SV) отражает, как часто пользователи кликали именно на вашу сущность, когда использовали этот термин в запросе. Сравнение этих двух метрик для разных бизнесов позволяет определить их схожесть.
Почему Google сравнивает мой бизнес только с ближайшими конкурентами?
Патент описывает механизм ограничения области сравнения по географическому признаку (Threshold Distance). Это делается для вычислительной эффективности (не нужно сравнивать миллионы сущностей друг с другом) и для повышения релевантности, так как пользователи обычно ищут локальные альтернативы поблизости.
Что важнее: общее количество кликов или доля кликов по запросу (Selection Ratio)?
Доля кликов (Selection Ratio, SV/TV) важнее для определения схожести. Высокая доля кликов по конкретному термину является сильным сигналом того, что этот термин действительно важен для вашего бизнеса. Это помогает отфильтровать шум от общеупотребительных терминов, по которым клики распределены между множеством разных бизнесов.
Что такое "качественный термин" (High Quality Term) в контексте локального SEO?
Это термин, который хорошо описывает категорию бизнеса и не имеет предвзятости. Например, "пицца" или "стрижка" — это качественные термины. Термины вроде названий городов (имеют Location Bias) или названий брендов (имеют Navigational Bias) считаются менее качественными для определения общего сходства между разными бизнесами.
Если я получаю много трафика по нерелевантному запросу, это хорошо?
С точки зрения этого патента, это может навредить. Если вы получаете значительную долю кликов по запросам, которые не соответствуют вашей основной деятельности, это размывает ваш поведенческий профиль. Система может начать считать ваш бизнес похожим на те сущности, которые действительно релевантны этому запросу, и перестать ассоциировать вас с вашими прямыми конкурентами.
Как я могу повлиять на то, с кем Google сравнивает мой бизнес?
Вы можете повлиять на это, формируя свой поведенческий профиль кликов. Сосредоточьтесь на оптимизации контента (сайт и GBP) и повышении CTR по наиболее релевантным, категорийным запросам. Цель состоит в том, чтобы максимизировать Selection Value и Selection Ratio именно по тем терминам, которые определяют вашу нишу.
Используется ли контент моего сайта для определения схожести?
В данном патенте контент сайта напрямую не используется для расчета Similarity Measure. Сходство определяется на основе анализа логов запросов и кликов. Однако контент сайта косвенно влияет на то, по каким запросам вы ранжируетесь и получаете клики, что, в свою очередь, формирует входные данные (Selection Values) для этого алгоритма.
Может ли этот алгоритм связать два бизнеса из разных категорий GBP?
Да. Если два бизнеса (например, Кофейня и Пекарня) находятся рядом и оба получают высокий Selection Ratio по терминам типа "круассаны на завтрак" и "свежая выпечка", система определит высокую степень схожести между ними на основе этих общих поведенческих паттернов, несмотря на разные основные категории в GBP.
Что такое Location Bias и почему это плохо для определения схожести?
Location Bias возникает, когда термин привязан к географии (например, «Манхэттен»). Это плохо, потому что цель алгоритма — найти похожие по природе бизнесы. Если бы термин «Манхэттен» учитывался, система бы решила, что пиццерия на Манхэттене больше похожа на химчистку на Манхэттене (так как у обоих есть клики по этому термину), чем на пиццерию в Бруклине, что неверно с точки зрения категории бизнеса.

Local SEO

Поведенческие сигналы
Local SEO

Local SEO
Поведенческие сигналы
Персонализация

Local SEO
SERP

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
SERP
Ссылки

Поведенческие сигналы
Ссылки
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Local SEO
Ссылки
SERP

Мультимедиа
EEAT и качество
Ссылки

Мультиязычность
Поведенческие сигналы
SERP

Индексация
Техническое SEO
Структура сайта

Мультиязычность
Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы
