Google использует механизм для определения местоположения веб-страницы, даже если на ней нет адреса. Система находит адрес на других страницах того же сайта (например, в разделе «Контакты») и присваивает его связанным страницам (например, товарам или услугам), анализируя текст ссылок и расстояние в кликах между ними.
Описание
Какую задачу решает
Патент решает фундаментальную проблему локального поиска: как ассоциировать географическое местоположение с веб-страницами, которые не содержат явных адресов или идентификаторов местоположения. Часто ключевые слова (например, название товара или услуги) находятся на одной странице, а физический адрес бизнеса — на другой (например, «Контакты»). Если поисковая система не может связать эти данные, она не покажет релевантную страницу в ответ на локальный запрос (например, [товар + город]).
Что запатентовано
Запатентована система для автоматического присвоения идентификаторов географического местоположения (Geographic Location Identifiers, GLI) веб-документам. Суть изобретения заключается в механизме распространения (propagation) GLI: если адрес найден на одной странице сайта, он может быть присвоен другим связанным страницам того же сайта, которые его не содержат, на основе анализа «релевантности» (relevancy) связей между ними.
Как это работает
Система работает в несколько этапов:
- Идентификация и Стандартизация: Система сканирует документы, идентифицирует GLI (адреса, телефоны) и приводит их к стандартному формату (Standardization), исправляя ошибки и дополняя данные.
- Первичное Присвоение и Уточнение: GLI присваивается странице, на которой он найден. При наличии нескольких адресов выбирается наиболее точный (Refinement).
- Определение Релевантности Связей: Система анализирует ссылки между страницами на одном сайте (Local). Связь считается «релевантной» для передачи местоположения, если она удовлетворяет эвристическим критериям: расстояние в пределах заданного числа кликов (например, 2-5) и использование специфических терминов в анкоре ссылки или заголовке целевой страницы (например, «контакты», «адрес», «о нас»).
- Распространение (Propagation): GLI распространяется со страницы-источника на связанные «релевантные» страницы.
Актуальность для SEO
Высокая. Патент описывает основополагающую технологию для локального поиска и Google Maps (изобретатели — создатели технологии, лежащей в основе Google Maps). Понимание того, как Google использует структуру сайта для определения географической привязки контента, остается критически важным для Local SEO, несмотря на эволюцию алгоритмов и интеграцию с Google Business Profile.
Важность для SEO
Патент имеет критическое значение для Local SEO. Он напрямую демонстрирует, как архитектура сайта, внутренняя перелинковка и выбор анкорного текста влияют на способность Google понять географическую релевантность контента. Неправильная структура или неоптимизированные внутренние ссылки на страницы с адресами могут привести к тому, что важные страницы услуг или товаров не будут ранжироваться в локальном поиске.
Детальный разбор
Термины и определения
- Anchor (Анкор)
- Видимый текст гиперссылки. Используется как ключевой сигнал для определения релевантности ссылки при распространении географических данных.
- Geographic Location Identifier (GLI) (Идентификатор географического местоположения)
- Информация, связанная с физическим географическим положением. Включает полные или частичные почтовые адреса, телефонные номера, коды городов, координаты и т.д.
- Local (Локальный документ)
- Документ, находящийся на том же веб-сайте, что и исходный документ. Является обязательным условием для распространения GLI.
- Predetermined number of links (Предопределенное количество ссылок / Link Distance)
- Порог расстояния (в кликах) между двумя документами, в пределах которого возможна передача GLI. В патенте упоминается диапазон 2-5 ссылок.
- Refinement (Уточнение)
- Процесс определения того, является ли один GLI более точным (специфичным), чем другой. Например, «123 Main St, Fairfax, VA» уточняет «Fairfax, VA». Система предпочитает более точные идентификаторы.
- Relevant Link/Document (Релевантная ссылка/документ)
- Ссылка или документ, признанные подходящими для переноса географической информации. Релевантность определяется эвристически, часто на основе триггерных слов в анкоре, URL или заголовке (Title) связанного документа.
- Standardization (Стандартизация)
- Процесс приведения идентифицированных GLI к единому формату. Включает исправление ошибок, дополнение данных (например, добавление почтового индекса) и структурирование адреса по компонентам.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает ядро изобретения — метод присвоения географических идентификаторов.
- Идентификация множества веб-документов.
- Идентификация Geographic Location Identifiers (GLI) в некоторых из этих документов.
- Присвоение идентифицированных GLI тем документам, которые их содержат.
- Присвоение этих же GLI другим документам на основе релевантности (relevancy) между документом, содержащим GLI, и другим документом.
Ключевым является шаг 4 — распространение географической информации на основе анализа связей.
Claims 9, 10, 11 (Зависимые): Определяют критерии relevancy, используемые в Claim 1.
- Claim 9 (Локальность): Документ-источник GLI должен быть «локальным» (local) по отношению к целевому документу (т.е. на том же сайте).
- Claim 10 (Терминология): Термин, связанный с документом-источником (например, анкор ссылки или заголовок), должен включать термин, ассоциируемый с географическими местоположениями.
- Claim 11 (Близость): Документ-источник должен быть связан с целевым документом в пределах предопределенного количества ссылок (Link Distance).
Claim 15 (Зависимый): Приводит список эвристических терминов, определяющих релевантность:
“location(s)”, “direction(s)”, “find”, “finder”, “locate”, “locater”, “store(s)”, “branch(es)”, “about”, “company”, “contact”, “information”.
Claim 18 (Зависимый): Описывает альтернативный метод распространения через обратные ссылки (backlinks), если соблюдены условия локальности и близости.
Claim 19 (Зависимый): Описывает процесс уточнения (Refinement). Если система находит новый GLI, который уточняет (является более специфичным) уже присвоенный GLI, старый заменяется новым.
Где и как применяется
Изобретение применяется на этапе обработки проиндексированного контента для извлечения и присвоения географических признаков.
CRAWLING – Сканирование и Сбор данных
Система собирает контент веб-страниц и структуру внутренних ссылок (граф сайта).
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Geographic Location Engine анализирует собранные данные:
- Извлечение и Стандартизация: Система ищет GLI в тексте, нормализует их и выбирает наиболее точные (Refinement).
- Анализ Структуры и Ссылок: Анализируется внутренний граф ссылок и анкоры для определения «локальности» и «релевантности» связей.
- Присвоение Признаков (Feature Extraction) и Пропагация: Система присваивает GLI как признак не только страницам-источникам, но и распространяет его на связанные страницы, используя описанную логику.
RANKING – Ранжирование
На этом этапе система использует предварительно вычисленные GLI (признаки документа) для ответа на запросы с локальным интентом.
Входные данные:
- Контент сканированных веб-документов.
- Структура внутренних ссылок (граф сайта).
- База данных эвристических терминов (например, «контакты», «адрес»).
Выходные данные:
- Аннотированные документы в индексе, где страницам присвоены стандартизированные GLI, даже если они не присутствовали в исходном тексте страницы.
На что влияет
- Конкретные типы контента: Наибольшее влияние на страницы товаров, услуг, меню, статей и главные страницы локальных бизнесов, которые сами по себе могут не содержать адреса.
- Специфические запросы: Критически важно для коммерческих и информационных запросов с локальным интентом (например, «ремонт холодильников Москва» или «лучшая пицца рядом»).
- Конкретные ниши или тематики: Фундаментально для Local SEO, сайтов электронной коммерции с физическими точками продаж, ресторанов, сервисных центров и любых бизнесов, привязанных к локации.
Когда применяется
- Условия работы: Алгоритм применяется во время процесса индексирования или переиндексирования веб-сайта.
- Триггеры активации: Обнаружение потенциального Geographic Location Identifier на любой странице сайта запускает процесс стандартизации и попытку его пропагации.
- Условия распространения: Пропагация происходит только при выполнении критериев релевантности: 1) Локальность (тот же сайт); 2) Релевантность ссылки (анкор/заголовок содержит эвристические термины); 3) Расстояние (в пределах заданного порога кликов, например, 2-5).
Пошаговый алгоритм
Процесс состоит из двух основных фаз: первичная обработка адресов и их распространение.
Фаза 1: Идентификация и Стандартизация (на основе FIG. 6)
- Сканирование документа (P): Система анализирует контент страницы P.
- Идентификация GLI (A): Поиск потенциальных адресов или телефонных номеров (A).
- Стандартизация: Адрес A приводится к стандартному формату.
- Проверка существующих ассоциаций: Система проверяет, был ли ранее ассоциирован с P другой адрес A’.
- Анализ Уточнения (Refinement):
- Если A’ уточняет A или равен A: новый адрес A игнорируется.
- Если A уточняет A’: старый адрес A’ удаляется, и A присваивается P.
- Первичное Присвоение: Стандартизированный адрес ассоциируется со страницей P.
Фаза 2: Распространение GLI (на основе FIG. 7, 8, 9)
- Инициализация: Начинается с документа P (который может не иметь GLI).
- Идентификация релевантных страниц (P’): Поиск страниц P’, которые содержат GLI и являются «релевантными» для P. Критерии релевантности:
- P’ находится на том же сайте, что и P (Local).
- Анкор ссылки, связывающей P и P’ (или URL, или заголовок P’), содержит эвристические термины («контакты», «адрес» и т.д.).
- Проверка расстояния: Определяется, достижима ли страница P’ из P (или наоборот, при использовании обратных ссылок) в пределах предопределенного количества кликов (Link Distance).
- Присвоение GLI: Если P’ релевантна и находится в пределах допустимого расстояния, GLI, ассоциированные с P’, также ассоциируются с P.
- Итеративное Распространение: Процесс может повторяться для распространения GLI через цепочки релевантных ссылок по всему сайту.
Какие данные и как использует
Данные на входе
- Контентные факторы:
- Текст страницы: Для извлечения Geographic Location Identifiers (адреса, телефоны).
- HTML Title: Заголовок целевой страницы может использоваться для определения релевантности ссылки, если он содержит эвристические термины.
- Технические факторы:
- URL-структура: Используется для определения того, находятся ли две страницы на одном сайте (Locality). Также URL может анализироваться на наличие эвристических терминов или адресов.
- Ссылочные/Структурные факторы:
- Внутренний граф ссылок: Определяет пути для пропагации GLI и используется для расчета Link Distance.
- Анкор-тексты (Anchor text): Критически важны для определения релевантности ссылки. Анализируются на наличие эвристических терминов.
Какие метрики используются и как они считаются
- Relevancy (Релевантность связи): Эвристическая оценка. Рассчитывается на основе набора условий: (Locality == True) AND (Наличие эвристических терминов в анкере, URL или Title == True).
- Link Distance (Расстояние в ссылках): Числовое значение, количество кликов между двумя документами. Сравнивается с порогом (Predetermined number of links), например, ≤ 5.
- Refinement (Уточнение): Логика сравнения двух стандартизированных адресов для определения, какой из них более специфичен.
- Методы анализа:
- Сопоставление с образцом (Pattern Matching): Используется для идентификации адресов и телефонных номеров в тексте.
- Эвристический анализ: Используется для оценки релевантности ссылок на основе предопределенного списка ключевых терминов.
Выводы
- Географическая привязка может быть унаследована: Страница может быть признана географически релевантной и ранжироваться по локальным запросам, даже если на ней самой нет адреса. Она наследует эти данные от связанных страниц того же сайта.
- Критичность структуры сайта и перелинковки для Local SEO: Внутренняя структура ссылок и используемые анкорные тексты играют ключевую роль в распространении географических данных по сайту. То, как вы ссылаетесь на свою страницу контактов, напрямую влияет на локальное ранжирование.
- Сигнальные слова (Heuristic Terms) в анкорах: Патент явно перечисляет слова, которые Google ищет в анкорах или заголовках для идентификации страниц-источников адресов (например, «Directions», «Contact», «Location», «Store», «About»). Использование этих терминов необходимо для активации механизма.
- Ограничение по глубине (Link Distance): Географическая информация распространяется только в пределах нескольких кликов (2-5). Страницы, находящиеся слишком далеко от источника адреса, могут не получить географическую привязку.
- Важность точности данных (Standardization и Refinement): Система стремится использовать наиболее точные и полные адреса. Это подчеркивает важность предоставления корректной и полной адресной информации (NAP) на сайте.
Практика
Best practices (это мы делаем)
- Создание явной страницы контактов/местоположения: Необходимо иметь выделенную страницу («Контакты», «Как добраться», «Наш адрес»), содержащую полный, стандартизированный и точный почтовый адрес и номер телефона (NAP) в текстовом формате. Эта страница будет служить основным источником GLI для всего сайта.
- Использование эвристических анкоров: При ссылках на страницу контактов с других страниц сайта (например, в главном меню или футере) используйте точные Heuristic Terms. Лучшие варианты: «Контакты» (Contact), «Как добраться» (Directions), «Местоположение» (Location), «Магазины» (Stores), «О компании» (About).
- Обеспечение доступности источника GLI: Страница контактов должна быть легко доступна с любой другой страницы сайта, в идеале в 1 клик (например, через сквозное меню). Это гарантирует соблюдение порога Link Distance и эффективную пропагацию GLI.
- Оптимизация Title и URL страницы контактов: Убедитесь, что Title и URL страницы с адресами также содержат релевантные термины (например, /contact, «Адрес и контакты [Бренд]»), так как они могут использоваться для определения релевантности ссылки.
Worst practices (это делать не надо)
- Скрытие адреса в изображениях или скриптах: Если адрес представлен картинкой или загружается через неиндексируемый JavaScript, система не сможет его извлечь (Pattern Matching) и использовать для географической привязки сайта.
- Использование неинформативных или неоднозначных анкоров: Использование анкоров типа «Напишите нам», «Здесь» или иконок без текстового сопровождения для ссылки на страницу с адресом не позволит системе признать ссылку релевантной для передачи GLI.
- Глубокое расположение страницы контактов: Если страница с адресом находится глубоко в архитектуре сайта (более 5 кликов от главных страниц), механизм пропагации может не сработать из-за превышения порога Link Distance.
- Отсутствие адреса на сайте: Полное отсутствие почтового адреса или телефона на сайте делает невозможным применение данного механизма географической привязки.
Стратегическое значение
Этот патент является фундаментальным для Local SEO. Он подтверждает, что для успешного локального ранжирования необходимо технически правильно донести информацию о местоположении бизнеса до поисковой системы через структуру сайта. Стратегия должна включать оптимизацию информационной архитектуры и внутренней перелинковки не только для навигации, но и для эффективной передачи ключевой бизнес-информации (местоположения) во время индексирования.
Практические примеры
Сценарий: Оптимизация сайта ресторана
- Проблема: У ресторана есть страница «Меню Ланча» и страница «Адрес и Карта». Страница меню не ранжируется по запросам типа «[блюдо] + [город]», так как на ней нет адреса.
- Анализ (по патенту): Необходимо обеспечить передачу GLI со страницы «Адрес и Карта» на страницу «Меню Ланча». Проверяем связь между ними.
- Действия:
- Убедиться, что на странице «Адрес и Карта» указан полный текстовый адрес.
- В глобальном меню сайта (доступном со страницы «Меню Ланча») разместить ссылку на страницу «Адрес и Карта».
- Использовать анкорный текст, содержащий Heuristic Terms, например, «Как добраться» (Directions) или «Наше расположение» (Our Location).
- Результат: Система идентифицирует адрес. Распознает ссылку как релевантную (анкор содержит сигнальное слово, обе страницы на одном сайте (Local), расстояние 1 клик). Адрес присваивается странице «Меню Ланча», что позволяет ей ранжироваться по локальным запросам.
Вопросы и ответы
Нужно ли размещать адрес и телефон (NAP) на каждой странице сайта для хорошего локального ранжирования?
Нет, это не обязательно. Согласно патенту, Google использует механизм пропагации (распространения) географической информации. Достаточно иметь NAP на одной странице (например, «Контакты») и убедиться, что на нее ведут «релевантные» ссылки с других страниц сайта. Система автоматически присвоит этот адрес связанным страницам.
Какой текст ссылки (анкор) лучше всего использовать для ссылки на страницу контактов?
Патент явно выделяет набор эвристических терминов (Heuristic Terms), которые сигнализируют о релевантности ссылки для передачи адреса. Рекомендуется использовать точные формулировки, такие как: «Контакты» (Contact), «Как добраться» (Directions), «Местоположение» (Location), «Магазины» (Stores), «О компании» (About). Это повышает вероятность корректной географической привязки.
Как далеко может распространяться адресная информация по сайту?
Патент устанавливает ограничение по расстоянию в кликах (Link Distance). В качестве примера приводится диапазон от 2 до 5 ссылок. Это означает, что важные страницы должны находиться на небольшом расстоянии от страницы-источника адреса. Размещение ссылки на контакты в сквозном меню решает эту проблему.
Что произойдет, если на сайте есть два разных адреса на разных страницах?
Система использует механизм уточнения (Refinement). Если один адрес более специфичен, чем другой (например, полный адрес против только города), система предпочтет более специфичный. Если адреса относятся к разным локациям (филиалы), структура сайта должна четко разделять, какие страницы услуг относятся к какому филиалу, чтобы избежать путаницы при пропагации GLI.
Что именно считается идентификатором географического местоположения (GLI)?
Патент определяет GLI широко. Это может быть полный почтовый адрес, частичный адрес (например, улица и город), номер телефона (включая код города), почтовый индекс или даже географические координаты. Все эти данные могут быть извлечены и использованы для географической привязки страницы.
Что такое «стандартизация» адреса и почему это важно?
Стандартизация (Standardization) — это процесс приведения найденного адреса к общепринятому формату. Система исправляет опечатки, добавляет недостающую информацию (например, индекс) и структурирует данные. Это важно для точности географической привязки. SEO-специалистам следует предоставлять адрес в максимально корректном и полном формате.
Если я использую иконку вместо слова «Контакты» в меню, поймет ли Google, что там находится адрес?
Это менее надежно. Патент фокусируется на анализе текстовых анкоров, URL и заголовков страниц для определения релевантности. Если иконка не сопровождается текстом или атрибутами (например, alt-текстом), содержащими Heuristic Terms, система может не распознать ссылку как источник географической информации.
Применяется ли этот механизм распространения адресов между разными доменами?
Нет. Патент явно указывает на критерий «Local», что означает, что документ-источник GLI и целевой документ должны находиться на одном и том же веб-сайте. Внешние ссылки не используются в этом конкретном механизме для передачи географического местоположения.
Что важнее для определения релевантности ссылки: анкор или заголовок (Title) целевой страницы?
Патент упоминает оба фактора. Анкорный текст является сильным сигналом. Однако, если анкор не информативен, система может проверить HTML-заголовок (Title) или URL целевой страницы на наличие эвристических терминов или самого адреса. Рекомендуется оптимизировать все три элемента.
Может ли телефонный номер использоваться как идентификатор местоположения?
Да, патент явно включает телефонные номера и коды городов в определение Geographic Location Identifier (GLI). Система может идентифицировать телефонный номер, определить его географическую привязку (например, по коду города) и распространить эту информацию на другие страницы сайта.