Анализ патента (IBM), описывающего механизм улучшения локального поиска. Система рассчитывает «Оценку Ассоциации» страницы с географическим регионом на основе локальных терминов (адреса, телефоны), близости к другим регионам и входящих ссылок с других локально релевантных сайтов. Эта оценка используется для повышения веса географических ключевых слов во время индексации, что позволяет локальным сайтам ранжироваться выше национальных агрегаторов.
Описание
Какую задачу решает
Патент решает проблему низкой релевантности результатов в локальном поиске. Стандартные алгоритмы, основанные на анализе ссылок (например, Page Rank), часто отдают предпочтение глобальным сайтам (агрегаторам, справочным службам), а не локальным поставщикам услуг. Это происходит потому, что глобальные сайты имеют высокий общий Page Rank за счет большого количества ссылок со всего мира, даже если они менее релевантны для конкретного географического запроса (например, «сантехник + город»). Изобретение предлагает механизм для идентификации и повышения в ранжировании страниц, которые действительно локально связаны с искомым регионом.
Что запатентовано
Запатентована система индексирования и ранжирования, которая рассчитывает Association Score (Оценку Ассоциации) между страницей и географическим регионом. Эта оценка базируется на трех компонентах: наличии на странице локальных индикаторов (Terms), географической близости (Neighbor regions) и анализе локального графа ссылок (входящие ссылки с других локально ассоциированных страниц). Ключевая особенность — эта оценка используется для модификации веса (Weight) географических ключевых слов непосредственно в индексе.
Примечание: Патент принадлежит IBM, а не Google, но описывает фундаментальные концепции, важные для понимания алгоритмов локального поиска.
Как это работает
Механизм работает в несколько этапов во время индексации и ранжирования:
- Идентификация локальных терминов: Краулер анализирует страницу на наличие предопределенных географических индикаторов (адреса, индексы, телефоны, местные названия). Каждый индикатор имеет свою оценку (Term Score).
- Расчет базовой Оценки Ассоциации: Сумма Term Scores найденных индикаторов формирует базовый Association Score страницы для региона.
- Учет соседства: Association Score может быть увеличен, если страница также имеет ассоциации с географически соседними регионами.
- Анализ локальных ссылок: Система применяет графовый алгоритм (похожий на PageRank), чтобы увеличить Association Score страницы, если на нее ссылаются другие страницы с высоким Association Score в том же регионе.
- Модификация индекса: Система увеличивает вес (Weight) географических ключевых слов на странице пропорционально ее итоговому Association Score с помощью специальной формулы.
- Ранжирование: При поиске итоговая оценка (Match Score) рассчитывается как произведение суммы модифицированных весов ключевых слов и Page Rank страницы.
Актуальность для SEO
Средняя. Описанные концепции (использование локальных сигналов, NAP, локального графа ссылок) являются фундаментальными для локального SEO и остаются крайне актуальными. Однако патент подан в 2005 году и принадлежит IBM. Современные алгоритмы локального поиска Google (например, связанные с Google Business Profile и Maps) используют гораздо более сложные механизмы, включая данные о местоположении пользователя, поведенческие факторы и сущности Knowledge Graph, которые в этом патенте не рассматриваются.
Важность для SEO
Патент имеет высокое значение для специалистов по локальному SEO (7.5/10). Он детально описывает механизм, как поисковая система может определять и количественно оценивать локальную релевантность сайта, выходя за рамки простого упоминания названия города. Он подчеркивает критическую важность наличия сильных локальных индикаторов (особенно телефонных номеров и точных адресов) и стратегическую необходимость построения ссылочного профиля с других локально релевантных ресурсов для повышения Association Score.
Детальный разбор
Термины и определения
- Association Score (Оценка Ассоциации)
- Метрика, указывающая на степень или вероятность того, что конкретная просканированная страница содержит контент, который является локальным или связанным с определенным Geographic Region.
- Geographic Region (Географический регион)
- Уникальный идентификатор города или другого географического местоположения (город, штат, индекс, страна).
- Match Score (Оценка соответствия)
- Итоговая оценка ранжирования страницы по запросу. Рассчитывается как произведение суммы весов (Total Weight) всех совпавших ключевых слов на странице и Page Rank страницы.
- Neighbor Geographic Region (Соседний географический регион)
- Регион, который находится в пределах порогового расстояния, времени в пути, в том же округе, штате или имеет тот же телефонный код, что и рассматриваемый регион.
- Page Rank (Рейтинг страницы)
- Стандартная метрика, указывающая на относительную важность страницы, обычно рассчитываемая с помощью анализа ссылок.
- Term (Термин, Локальный индикатор)
- Контент (слова, числа), присутствие которого на странице указывает на связь с Geographic Region. Примеры: индекс, телефонный код и номер, названия улиц, достопримечательности.
- Term Score (Оценка термина)
- Относительная степень важности того, что присутствие данного Term указывает на локальную ассоциацию. Например, телефонный номер имеет более высокий Term Score, чем просто название города.
- Weight (Вес ключевого слова)
- Метрика в индексе, указывающая на относительную важность ключевого слова на странице. В данном патенте этот вес модифицируется на основе Association Score.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод индексирования с учетом географии.
- Система определяет Association Scores для страниц относительно географических регионов.
- Определение Association Score включает нахождение географического Term в контенте страницы и добавление соответствующего Term Score.
- Утверждается иерархия сигналов: Term Score телефонного номера выше, чем Term Score названия географического региона.
- Association Score увеличивается на основе Neighbor Association Score (оценки соседнего региона).
- Создается индекс на основе этих Association Scores.
- Создание индекса включает: выбор ключевых слов и их весов (Weights); нахождение ключевых слов, которые совпадают с географическими Terms; увеличение Weights этих совпадающих ключевых слов на основе Association Score и Term Scores.
- Утверждается конкретная формула для увеличения весов, включающая умножение и деление различных оценок (Term Scores, Association Score, максимальный Term Score, сумма Term Scores).
Claim 3 (Зависимый от 1): Дополняет метод определения Association Score.
Определение Association Score также включает его увеличение на основе Association Scores входящих связанных страниц (incoming linked pages). Это механизм распространения локального авторитета через ссылочный граф.
Claim 12 и 13 (Зависимые от 10): Описывают процесс использования индекса при поиске.
Система упорядочивает страницы в результатах поиска на основе их модифицированных Weights (Claim 12), а также на основе Page Rank (Claim 13).
Где и как применяется
Изобретение применяется преимущественно на этапе индексирования контента, что впоследствии влияет на ранжирование.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Краулер (Crawler) выполняет следующие действия:
- Расчет базовой локальной релевантности: Анализирует контент для вычисления начального Association Score на основе найденных Terms и их Term Scores.
- Учет географического соседства: Корректирует Association Score с учетом ассоциаций с Neighbor Geographic Regions.
- Расчет Page Rank: Выполняет стандартный анализ ссылок.
- Анализ локального графа ссылок: Применяет графовый алгоритм для обновления Association Score на основе оценок входящих ссылок. Локальная релевантность распространяется по ссылкам.
- Модификация индекса: Система увеличивает Weights тех ключевых слов, которые являются географическими терминами, пропорционально итоговому Association Score.
RANKING – Ранжирование
На этом этапе поисковая система (Search Engine) использует модифицированный индекс:
- Расчет релевантности: Суммирует модифицированные Weights всех ключевых слов на странице, которые совпали с запросом.
- Расчет итоговой оценки: Вычисляет Match Score путем умножения суммарного веса на Page Rank страницы.
Входные данные:
- Контент страниц.
- Граф ссылок между страницами.
- Предопределенный список географических регионов, локальных индикаторов (Terms) и их оценок (Term Scores).
- Данные о географическом соседстве регионов.
Выходные данные:
- Модифицированный индекс (Index), содержащий ключевые слова с скорректированными весами (Weights) и Page Rank.
- Рассчитанные Association Scores для каждой страницы и региона.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на локальные запросы — коммерческие и сервисные запросы с географическим модификатором (например, «пиццерия Рочестер») или подразумеваемым локальным интентом.
- Конкретные типы контента: Влияет на страницы локального бизнеса, организаций, местных новостных ресурсов.
- Конкретные ниши или тематики: Услуги (сантехники, юристы, врачи), ритейл, недвижимость — тематики, где локальная привязка критична и существует конкуренция с национальными агрегаторами.
Когда применяется
- Во время индексации: Алгоритм расчета Association Score и модификации Weights применяется каждый раз, когда страница сканируется или переиндексируется.
- Во время ранжирования: Модифицированные веса используются при обработке запросов, содержащих географические термины.
Пошаговый алгоритм
Процесс А: Индексирование (Выполняется Crawler)
- Обход страниц: Система начинает цикл обхода страниц.
- Получение страницы: Извлекается контент текущей страницы.
- Определение начальных Association Scores:
- Цикл по всем регионам и связанным с ними терминам.
- Если термин найден на странице, добавить его Term Score к Association Score региона.
- Применение бустинга за соседство: Для регионов с Association Score > 0, проверить соседей. Если у соседа Association Score > 0, увеличить Association Score текущего региона.
- Добавление в индекс: Страница добавляется в индекс с начальными весами ключевых слов (на основе частоты/позиции).
- Завершение обхода.
- Пост-обработка (после сканирования всех страниц):
- Расчет Page Rank: Вычисляется Page Rank для всех страниц.
- Применение графового алгоритма (Распространение локальности): Система увеличивает Association Score страницы на основе Association Scores страниц, ссылающихся на нее. Формула учитывает оценку ссылающейся страницы, деленную на количество ее исходящих ссылок.
- Модификация весов в индексе: Система находит ключевые слова, совпадающие с географическими терминами, и увеличивает их Weight по формуле: W = W + [(T/M)*(A/S)*W].
Процесс Б: Ранжирование (Выполняется Search Engine)
- Получение запроса: Система получает ключевые слова запроса.
- Поиск совпадений: Находятся страницы в индексе, содержащие ключевые слова.
- Расчет суммарного веса (Total): Для каждой страницы суммируются модифицированные Weights всех совпавших ключевых слов.
- Расчет итоговой оценки: Рассчитать Match Score = Total * Page Rank страницы.
- Сортировка и отображение: Результаты упорядочиваются по Match Score.
Какие данные и как использует
Данные на входе
- Контентные факторы: Текст страницы анализируется на наличие специфических Terms. К ним относятся: название региона, индексы, город, округ, штат, страна, телефонные коды и номера, прозвища или слоганы региона, названия спортивных команд, учебных заведений, названия улиц, достопримечательности.
- Ссылочные факторы: Используются входящие ссылки (inbound links). Анализируется Association Score ссылающейся страницы. Также используется количество исходящих ссылок (outbound links) со ссылающейся страницы для нормализации передаваемого веса (делитель O(ti)).
- Географические факторы: Используются данные о географической близости регионов (Neighbor Geographic Regions). Критерии близости могут включать расстояние, время в пути, административное деление и т.д.
Какие метрики используются и как они считаются
- Term Score (T): Предопределенная оценка важности локального индикатора. Указано, что телефонный номер имеет более высокий вес, чем название города.
- Association Score (A или AS): Рассчитывается в три этапа:
- Базовая оценка: Сумма Term Scores найденных на странице.
- Бустинг за соседство: Увеличение оценки, если соседние регионы также имеют положительную оценку.
- Бустинг за ссылки: Распространение оценки через входящие ссылки. Формула: AS(A,gj) = Σ (AS(ti,gj) / O(ti)), где AS(A,gj) – оценка страницы A для региона gj, AS(ti,gj) – оценка ссылающейся страницы ti, O(ti) – количество исходящих ссылок со страницы ti.
- Weight (W): Начальный вес ключевого слова, который затем модифицируется. Формула модификации: W_new = W + [(T/M) * (A/S) * W].
- T – Term Score совпадающего термина.
- M – максимальный Term Score в списке регионов страницы.
- A – Association Score.
- S – сумма Term Scores для совпадающего термина.
- Page Rank (PR): Стандартная оценка авторитетности.
- Match Score: Итоговая оценка ранжирования. Формула: Match Score = (Σ W_new) * PR.
Выводы
- Три столпа локальной ассоциации: Патент четко выделяет три механизма определения локальности:
- On-Page: Наличие специфических локальных индикаторов (Terms) с разным весом (Term Scores).
- Proximity (Близость): Ассоциация с соседними регионами (Neighbor Geographic Regions) усиливает локальную привязку.
- Local Link Graph (Локальный граф ссылок): Входящие ссылки со страниц, которые сами имеют высокий Association Score с тем же регионом, значительно повышают оценку акцептора.
- Географическая релевантность «запекается» в индекс: Локальная ассоциация не применяется как фильтр во время запроса. Вместо этого она используется для модификации веса (Weight) конкретных ключевых слов непосредственно во время индексации.
- Не все локальные индикаторы одинаково важны: Система использует взвешенные Term Scores. В патенте прямо указано, что наличие телефонного номера является более сильным сигналом локальности, чем простое упоминание названия города.
- Page Rank по-прежнему важен: Итоговая оценка ранжирования (Match Score) является произведением релевантности (суммы модифицированных весов) и Page Rank. Авторитетность сайта остается ключевым компонентом ранжирования.
- Механизм борьбы с агрегаторами: Описанный метод позволяет локальным сайтам с высоким Association Score (за счет сильных индикаторов и локальных ссылок) конкурировать с национальными агрегаторами, у которых может быть высокий Page Rank, но низкий Association Score для конкретного города.
Практика
Best practices (это мы делаем)
- Максимизация сильных локальных индикаторов (Terms): Обеспечьте наличие полного и консистентного NAP (Name, Address, Phone Number). Используйте локальный номер телефона, так как он имеет высокий Term Score. Интегрируйте в контент названия местных достопримечательностей, улиц, районов и другие уникальные идентификаторы региона.
- Фокус на локальном линкбилдинге (Local Link Graph): Активно стройте ссылочный профиль с сайтов, которые сами имеют высокую локальную релевантность в вашем регионе (местные СМИ, торговые палаты, локальные бизнес-партнеры, поставщики). Согласно патенту, такие ссылки напрямую передают Association Score.
- Оптимизация под соседние регионы (Proximity): Если ваш бизнес обслуживает несколько соседних городов или районов (Service Areas), создавайте контент, который демонстрирует вашу связь с ними. Механизм Neighbor Geographic Region усилит вашу основную локальную привязку.
- Поддержание общего авторитета (Page Rank): Не забывайте о стандартных SEO-практиках для повышения общего авторитета сайта. Page Rank является множителем в итоговой формуле ранжирования.
Worst practices (это делать не надо)
- Спам названием города (Keyword Stuffing): Многократное повторение названия города без других сильных локальных индикаторов неэффективно, так как название города имеет относительно низкий Term Score.
- Игнорирование локальных ссылок: Построение ссылочного профиля исключительно из национальных или нерелевантных по географии ресурсов не поможет увеличить Association Score, даже если эти сайты имеют высокий общий авторитет.
- Использование виртуальных офисов без локального подтверждения: Если страница использует адрес виртуального офиса, но не имеет локальных ссылок и других сильных сигналов, ее Association Score будет низким.
- Использование только 8-800 номеров: Отсутствие локального телефонного номера лишает сайт одного из самых сильных локальных индикаторов, упомянутых в патенте.
Стратегическое значение
Патент подтверждает, что для успешного локального продвижения необходима стратегия, направленная на построение реальной локальной экосистемы вокруг сайта. Стратегический приоритет должен отдаваться интеграции максимально точных географических данных и формированию связей внутри местного сообщества (локальный граф ссылок). Понимание механизма Association Score позволяет целенаправленно работать над факторами, которые отличают локальный бизнес от национального агрегатора в глазах поисковой системы.
Практические примеры
Сценарий: Повышение локальной релевантности для сайта кафе
- Анализ текущих индикаторов: Кафе имеет страницу контактов с адресом и названием города. Association Score низкий.
- Усиление On-Page Terms: Добавить локальный телефонный номер (высокий Term Score). В описании кафе упомянуть ближайшие достопримечательности или станции метро (средний Term Score). Добавить блок «Как добраться» с указанием маршрутов по местным улицам.
- Усиление Local Link Graph: Получить ссылку с местного новостного портала в обзоре новых кафе района. Зарегистрироваться в местной ассоциации рестораторов и получить ссылку с их сайта. Договориться о ссылке с сайтом местного поставщика кофе.
- Ожидаемый результат: Association Score кафе значительно увеличивается за счет новых индикаторов и локальных ссылок. Вес ключевых слов (например, название района и города) на сайте кафе увеличивается в индексе. При поиске «кафе в [Район]» сайт ранжируется выше за счет более высокого Match Score.
Вопросы и ответы
В чем основное отличие этого метода от стандартного ранжирования?
Стандартное ранжирование обычно оценивает релевантность на основе частоты и расположения ключевых слов. Этот патент предлагает модифицировать вес (Weight) географических ключевых слов во время индексации на основе Association Score страницы с этим регионом. Таким образом, название города на сайте местного бизнеса будет иметь больший вес в индексе, чем то же слово на сайте национального агрегатора.
Насколько важен Page Rank в этом патенте?
Page Rank остается критически важным. Итоговая оценка ранжирования (Match Score) рассчитывается как произведение суммы модифицированных весов ключевых слов и Page Rank. Это означает, что для достижения топа необходимы как высокая локальная релевантность (высокие модифицированные веса), так и достаточный общий авторитет сайта.
Какие локальные индикаторы (Terms) наиболее важны?
Патент явно указывает, что система использует взвешенные оценки (Term Scores) и приводит пример: телефонный номер имеет более высокий Term Score, чем название географического региона. Это подразумевает, что точные данные NAP (особенно локальный телефон и точный адрес с индексом) являются наиболее сильными сигналами локальной привязки.
Как работает механизм анализа локальных ссылок?
Система распространяет Association Score по ссылкам, используя графовый алгоритм. Если страница А ссылается на страницу Б, часть Association Score страницы А передается странице Б (с нормализацией по количеству исходящих ссылок со страницы А). Это означает, что ссылки с сайтов, которые сами признаны локально релевантными в вашем регионе, напрямую повышают вашу локальную релевантность.
Что такое «Бустинг за соседство» (Neighbor Geographic Region)?
Это механизм, который увеличивает Association Score страницы для региона А, если эта же страница также имеет положительный Association Score для географически соседнего региона Б. Это помогает усилить локальную привязку для бизнесов, работающих на границе нескольких районов или обслуживающих несколько пригородов (Service Areas).
Применяет ли Google этот конкретный алгоритм?
Этот патент принадлежит IBM (подан в 2005 году). Мы не можем утверждать, что Google использует именно эту реализацию и формулы. Однако концепции, описанные в патенте — оценка локальности через контентные сигналы, близость и локальный граф ссылок — являются фундаментальными для работы современных систем локального поиска Google.
Как этот патент помогает бороться с национальными агрегаторами в локальной выдаче?
Национальные агрегаторы часто имеют высокий Page Rank, но низкий Association Score для конкретного города, так как они упоминают сотни городов и не имеют сильных локальных индикаторов (например, местных телефонов) и локальных ссылок из этого города. Локальные сайты, оптимизированные согласно этому патенту, получат более высокие модифицированные веса для географических запросов, что компенсирует разницу в Page Rank.
Стоит ли фокусироваться на получении ссылок только с локальных сайтов?
Нет, необходим баланс. Локальные ссылки необходимы для повышения Association Score. Однако общий Page Rank, который строится за счет разнообразного и авторитетного ссылочного профиля (включая национальные и тематические ресурсы), по-прежнему необходим как множитель в формуле ранжирования.
Имеет ли значение количество исходящих ссылок на странице?
Да, имеет. При расчете распространения Association Score через ссылки, оценка локальности ссылающейся страницы делится на количество исходящих ссылок с нее (O(ti) в формуле). Это означает, что страница с меньшим количеством исходящих ссылок передает больший локальный авторитет, аналогично классическому PageRank.
Как использовать этот патент при оптимизации сети филиалов?
Для каждого филиала необходимо создать отдельную страницу с уникальным набором сильных локальных индикаторов (уникальный контент, локальный телефон, точный адрес филиала). Также критически важно строить локальный ссылочный профиль индивидуально для каждого филиала с ресурсов, релевантных именно его местоположению, чтобы максимизировать Association Score для соответствующего региона.