Google использует алгоритм для определения наиболее авторитетной (официальной) страницы для конкретного бизнеса или адреса. Система анализирует кластер связанных страниц, изучая, как они ссылаются друг на друга, а также совпадение названия бизнеса с анкорами, заголовками (Title) и доменом. Страницы, посвященные только одной локации, получают преимущество.
Описание
Какую задачу решает
Патент решает проблему идентификации официальной (авторитетной) страницы для локального бизнеса или конкретного адреса. Сложность заключается в том, что авторитетная страница (например, главная страница ресторана) сама может не содержать адрес или контактную информацию, которые часто находятся на других страницах (например, в каталогах или обзорах), ссылающихся на нее. Изобретение улучшает качество локального поиска, позволяя системе надежно определять официальный сайт организации (Entity Home).
Что запатентовано
Запатентована система для определения авторитетности документов, связанных с определенной локацией или бизнесом. Система формирует набор документов-кандидатов (Candidate Documents) и вычисляет для них оценку авторитетности (Authoritative Score). Эта оценка базируется на взвешенной комбинации сигналов, таких как совпадение названия бизнеса с анкорным текстом ссылок, заголовком документа (Title) и доменным именем.
Как это работает
Механизм работает в несколько этапов:
- Сбор кандидатов: Система идентифицирует документы, содержащие информацию о локации (адрес, телефон, название бизнеса) (Группа A). Затем добавляются документы, на которые они ссылаются (Группа B), и документы, полученные путем сокращения URL (родительские директории) (Группа C).
- Анализ сигналов: Для каждого кандидата оценивается совпадение названия бизнеса с анкорами входящих ссылок, Title и доменом. Также учитывается количество ссылок от других кандидатов.
- Расчет оценки: Сигналы взвешиваются и объединяются для получения Authoritative Score. Оценка повышается, если документ связан только с одной локацией.
- Идентификация: Документ с наивысшим Authoritative Score признается авторитетным для данной локации/бизнеса.
Актуальность для SEO
Высокая. Хотя данный патент является продолжением заявки, поданной в 2004 году, задача идентификации официального представительства бизнеса остается фундаментальной для локального поиска (Local Search), Графа Знаний (Knowledge Graph) и интеграции с Google Business Profile. Описанные сигналы (консистентность NAP, анкорный текст, совпадение домена, уникальность локации) по-прежнему являются основой Local SEO.
Важность для SEO
Критическое значение для Local SEO (9/10). Описанный механизм напрямую определяет, какой именно URL будет ассоциирован с бизнес-сущностью и показан в результатах локального поиска (например, в Local Pack или на Картах). Понимание этого алгоритма позволяет оптимизировать сайт и управлять внешними цитированиями так, чтобы Google выбрал правильную страницу в качестве авторитетной.
Детальный разбор
Термины и определения
- Authoritative Document (Авторитетный документ)
- Документ (например, веб-страница), который система идентифицирует как наиболее репрезентативный (официальный сайт) для определенной локации или бизнеса.
- Authoritative Score (Оценка авторитетности)
- Числовая метрика, рассчитываемая путем взвешивания и объединения различных сигналов для определения авторитетности документа-кандидата.
- Candidate Documents (Документы-кандидаты)
- Набор документов, которые потенциально могут быть авторитетными для локации. Включает три группы: (A) документы со сниппетами локации, (B) документы, на которые ссылаются из группы A, (C) документы, полученные путем сокращения URL (URL stripping) из групп A и B.
- Location (Локация)
- В контексте патента определяется как адрес и/или бизнес, расположенный по этому адресу.
- Signals (Сигналы)
- Факторы, используемые для расчета Authoritative Score (анкорный текст, заголовок, доменное имя, структура ссылок).
- Snippet (Сниппет)
- Часть текста документа (или весь документ), содержащая информацию, связанную с локацией (например, адрес, телефон, название бизнеса – NAP).
- Text Similarity Technique (Техника оценки схожести текста)
- Метод для определения совпадения названия бизнеса с текстом. Учитывает различные формулировки и опечатки, а также частоту встречаемости слов/биграмм в конкретной географической области.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод идентификации авторитетной веб-страницы для бизнеса.
- Система идентифицирует набор веб-страниц кандидатов, связанных с бизнесом.
- Для каждой страницы идентифицируется набор сигналов.
- Рассчитывается Authoritative Score для каждой страницы на основе этих сигналов. Оценка базируется на одном или нескольких из следующих факторов:
- Количество исходящих ссылок (outlinks) с других страниц-кандидатов, указывающих на данную страницу.
- Совпадение анкорного текста ссылок, указывающих на страницу, с названием бизнеса.
- Совпадение заголовка (Title) страницы с названием бизнеса.
- Количество географических локаций, идентифицированных на странице.
- Совпадение доменного имени, связанного со страницей, с названием бизнеса.
- Расчет включает взвешивание и объединение оценок, связанных с этими сигналами.
- Страница с наивысшим Authoritative Score идентифицируется как авторитетная веб-страница для бизнеса.
Claims 2, 4 (Зависимые от 1 и 2): Уточняют метод идентификации кандидатов.
Веб-страницы анализируются для поиска сниппетов текста с информацией о бизнесе (Группа А). Веб-страницы, на которые ссылаются страницы из Группы А, также включаются в список кандидатов (Группа B).
Claim 6 (Зависимый от 1): Дополняет метод идентификации кандидатов.
Удаление частей адреса (URL) существующей страницы-кандидата для идентификации дополнительных кандидатов (Группа C). Это механизм URL stripping (движение вверх по иерархии сайта).
Claim 12 и 19 (Зависимые): Уточняют расчет Authoritative Score.
Authoritative Score для страницы увеличивается, если количество географических локаций, связанных с этой страницей, меньше определенного порога (в идеале равно 1). Система предпочитает страницы, сфокусированные на одной конкретной локации.
Где и как применяется
Изобретение применяется в основном на этапе индексирования для определения ключевых характеристик сущностей и связанных с ними документов.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Система выполняет следующие действия:
- Извлечение локационной информации: Анализ корпуса документов для идентификации локаций и бизнесов (извлечение NAP — Name, Address, Phone).
- Идентификация кандидатов: Определение набора Candidate Documents (Группы A, B, C) для каждой локации.
- Извлечение и расчет сигналов: Анализ ссылочного графа (анкоры, структура ссылок) и контента (заголовки, домены). Также проводится предварительный расчет частотности слов по географическим зонам для Text Similarity Technique.
- Определение авторитетности: Расчет Authoritative Score и идентификация Authoritative Document. Эта информация сохраняется как атрибут сущности (Бизнес/Локация) и ассоциируется с выбранным URL.
RANKING – Ранжирование (Локальное ранжирование)
На этапе ранжирования система использует предварительно рассчитанные данные. Когда поступает запрос с локальным интентом, система может использовать Authoritative Score для приоритизации Authoritative Document в результатах локального поиска (например, Local Pack, Карты).
Входные данные:
- Корпус документов (веб-страницы) и ссылочный граф.
- Извлеченные данные о локациях (адреса, телефоны, названия бизнесов).
- Статистические данные о частоте терминов по географическим регионам.
Выходные данные:
- Идентификация Authoritative Document (официального URL) для конкретной локации/бизнеса.
- Authoritative Score для документов-кандидатов.
На что влияет
- Конкретные типы контента и ниши: Наибольшее влияние оказывается на Local SEO и бизнесы с физическими локациями (ритейл, рестораны, услуги, организации). Влияет на страницы филиалов, главные страницы локальных бизнесов и листинги в каталогах.
- Специфические запросы: Влияет на запросы с локальным интентом (например, «пиццерия рядом») и навигационные запросы, связанные с поиском конкретного бизнеса.
Когда применяется
Алгоритм применяется в процессе индексирования (офлайн), когда система обрабатывает документы, содержащие информацию о локациях или названиях бизнесов. Использование рассчитанных оценок происходит в реальном времени во время ранжирования.
Пошаговый алгоритм
Процесс определения авторитетного документа для локации.
- Идентификация набора кандидатов (Сбор Групп A, B, C):
- Группа A (Сниппеты): Поиск сниппетов текста в корпусе документов, содержащих информацию о локации (NAP). Документы с этими сниппетами формируют Группу A.
- Группа B (Ссылки): Идентификация документов, на которые ссылаются документы из Группы A. Они добавляются в Группу B.
- Группа C (URL Stripping): Генерация дополнительных кандидатов путем сокращения URL адресов документов из Групп A и B (например, из site.com/location/menu генерируются site.com/location и site.com).
- Объединение: Формирование итогового набора Candidate Documents.
- Определение сигналов для кандидатов:
- Сигнал 1 (Внутренние ссылки кандидатов): Подсчет количества ссылок на данный документ от других документов из набора кандидатов.
- Сигнал 2 (Анкорный текст): Анализ анкорного текста входящих ссылок (из всего корпуса). Определение совпадения анкора с названием бизнеса с использованием Text Similarity Technique. Учитывается редкость терминов в регионе: для редких названий допускается больше вариаций и опечаток.
- Сигнал 3 (Заголовки документов): Анализ заголовков (Titles) кандидатов на предмет совпадения с названием бизнеса (также с использованием Text Similarity Technique).
- Сигнал 4 (Доменные имена): Анализ доменных имен кандидатов на предмет совпадения с названием бизнеса (используя sub-string matching и/или Text Similarity Technique).
- Взвешивание и объединение сигналов (Расчет Authoritative Score):
- Присвоение весов: Применение весовых коэффициентов к сигналам. Патент предполагает, что сигналы, связанные с анкорным текстом и доменным именем, могут иметь больший вес.
- Агрегация: Комбинирование взвешенных значений сигналов для получения Authoritative Score.
- Бонус за одну локацию: Увеличение Authoritative Score, если документ связан с единственной локацией (и пессимизация, если с несколькими, согласно Claim 12/19).
- Определение авторитетности: Сравнение Authoritative Scores всех кандидатов. Документ с наивысшей оценкой идентифицируется как Authoritative Document для данной локации.
Какие данные и как использует
Данные на входе
- Контентные факторы:
- Текст документа: Используется для извлечения сниппетов с информацией о локации (NAP).
- Заголовки (Titles): Анализируются на предмет совпадения с названием бизнеса.
- Технические факторы:
- URL-структура: Используется для анализа доменного имени на совпадение с названием бизнеса и для генерации кандидатов методом URL stripping.
- Ссылочные факторы:
- Входящие ссылки и Анкор-тексты: Анкорный текст анализируется на предмет совпадения с названием бизнеса (ключевой сигнал).
- Исходящие ссылки: Используются для идентификации кандидатов Группы B.
- Ссылки между кандидатами: Количество таких ссылок является одним из сигналов авторитетности.
- Географические факторы:
- Извлеченные адреса и телефонные номера используются для группировки документов вокруг одной локации.
- Данные о частоте слов/биграмм в конкретной географической области (например, по zip-коду) используются для калибровки Text Similarity Technique.
Какие метрики используются и как они считаются
- Authoritative Score: Основная метрика. Рассчитывается путем взвешенной суммы оценок по различным сигналам с возможным бонусом за фокус на одной локации.
- Text Similarity Score: Метрика схожести текста (названия бизнеса с анкором, заголовком, доменом).
- Term Frequency/Rarity (Частота/Редкость термина): Используется для калибровки Text Similarity Score. Система анализирует частоту встречаемости слов и биграмм в документах, связанных с определенной географической областью. Редкие названия (например, уникальный бренд) получают больше гибкости при сравнении, чем частые термины (например, «Пиццерия»).
- Location Count (Количество локаций): Количество различных локаций, связанных с документом. Если это число меньше порога (в идеале равно 1), Authoritative Score увеличивается.
Выводы
- Идентификация «Официального дома» сущности (Entity Home): Патент описывает конкретный алгоритм для определения канонического URL, который представляет сущность (бизнес или локацию) в интернете. Это не предположение, а вычисляемый процесс.
- Критичность консистентности сигналов (Off-page и On-page): Для установления авторитетности критически важна согласованность информации о бизнесе (NAP) в интернете (сниппеты/цитаты), в ссылочном графе (анкоры) и на самом сайте (заголовки, домен).
- Значимость брендовых анкоров: Совпадение анкорного текста с названием бизнеса является сильным сигналом авторитетности. Патент предполагает, что этот сигнал, наряду с доменным именем, может иметь больший вес, чем другие.
- Пессимизация за неоднозначность локации: Страницы, связанные с несколькими локациями (например, общие списки филиалов), с меньшей вероятностью будут выбраны в качестве авторитетного документа для конкретной локации из-за механизма «бонуса за одну локацию» (Claim 12/19).
- Важность структуры URL: Механизм URL stripping (Группа C) показывает, что иерархическая структура URL, позволяющая при сокращении адреса попасть на главную страницу или основной раздел, способствует правильной идентификации авторитетного документа.
- Учет уникальности названия: Система адаптирует строгость сопоставления текста в зависимости от уникальности названия бизнеса в регионе (Text Similarity Technique). Это дает преимущество уникальным брендам при нечетких совпадениях в анкорах или цитатах.
Практика
Best practices (это мы делаем)
- Обеспечение консистентности NAP (Name, Address, Phone): Убедитесь, что название бизнеса, адрес и телефон указаны одинаково на вашем сайте и во всех внешних источниках (каталоги, соцсети, обзорные сайты). Это критично для формирования Группы A и корректного анализа сигналов.
- Оптимизация ключевых элементов под название бизнеса: Заголовок (Title) главной страницы (или страницы локации) должен точно соответствовать названию бизнеса. Если возможно, доменное имя также должно отражать название (Сигнал 4).
- Стимулирование брендовых анкоров в цитированиях: При получении внешних ссылок и построении локальных цитирований (Local Citations) стремитесь к тому, чтобы в анкорном тексте использовалось точное название бизнеса (Сигнал 2). Это прямой и сильно взвешенный сигнал авторитетности согласно патенту.
- Структурирование многофилиальных сайтов: Если у бизнеса несколько локаций, создавайте отдельные, уникальные страницы для каждого филиала. Убедитесь, что каждая страница четко сфокусирована только на одной локации, чтобы получить «бонус за одну локацию» при расчете Authoritative Score. Все внешние цитирования для филиала должны вести на его уникальную страницу.
- Использование иерархической структуры URL: Организуйте URL так, чтобы при удалении сегментов (URL stripping) система могла идентифицировать релевантные верхнеуровневые страницы. Например, site.com/locations/new-york/store1.
Worst practices (это делать не надо)
- Несогласованность данных о бизнесе: Использование разных вариантов названий или адресов на разных платформах затрудняет для системы сбор кандидатов и анализ схожести текста.
- Игнорирование брендового анкорного текста: Получение ссылок только с общими анкорами («тут», «сайт компании») или фокус исключительно на коммерческих анкорах упускает возможность усилить сигнал авторитетности.
- Размещение всех филиалов на одной странице: Создание одной длинной страницы со списком всех адресов без выделенных страниц для локаций приведет к пессимизации при расчете Authoritative Score для конкретного адреса.
- Использование общих (Generic) доменов и тайтлов без уникального брендинга: Система применяет более строгие правила сопоставления к общим терминам, что затрудняет идентификацию авторитетности, если название не уникально.
Стратегическое значение
Патент подтверждает фундаментальные принципы Local SEO и важность управления представлением сущности (Entity Management). Он демонстрирует, как Google алгоритмически связывает off-page сигналы (упоминания NAP, ссылки, анкоры) с on-page сигналами (заголовки, структура URL) для определения «официального источника» (Entity Home). Стратегия должна быть направлена на создание четкого и последовательного цифрового следа для каждой локации бизнеса, чтобы максимизировать Authoritative Score.
Практические примеры
Сценарий 1: Определение авторитетной страницы для ресторана «Big Nick’s Pizza Joint»
- Сбор Кандидатов:
- Группа A: Страницы на Yelp, TripAdvisor и в локальном блоге, содержащие адрес и название «Big Nick’s Pizza Joint».
- Группа B: Yelp и TripAdvisor ссылаются на bignicks.com/menu. Блог ссылается на bignicks.com. Эти URL добавляются в кандидаты.
- Группа C: Из bignicks.com/menu генерируется bignicks.com (если его еще нет).
- Анализ Сигналов для bignicks.com:
- Домен: Совпадает с названием бизнеса (bignicks.com).
- Заголовок: «Big Nick’s Pizza Joint — Official Site». Сильное совпадение.
- Анкоры: 10 внешних сайтов ссылаются с анкором «Big Nick’s Pizza», 5 сайтов с анкором «Big Nick’s Pizza Joint». Сильные совпадения.
- Локация: Страница связана только с одним адресом.
- Расчет и Результат: bignicks.com получает высокий Authoritative Score за счет сильных совпадений по всем сигналам и бонуса за одну локацию. Система выбирает bignicks.com как Authoritative Document, а не страницу на Yelp.
Сценарий 2: Оптимизация для филиала сети фитнес-клубов «StrongLife» в Марьино.
- Плохая практика: Цитирования для филиала в Марьино ссылаются на главную страницу stronglife.com. stronglife.com содержит информацию о 50 локациях. Система понижает Authoritative Score этой страницы для локации Марьино из-за низкой специфичности.
- Хорошая практика: Создается страница stronglife.com/maryino. Цитирования размещаются со ссылкой на stronglife.com/maryino и анкором «StrongLife Марьино». stronglife.com/maryino получает высокий Authoritative Score для локации Марьино, так как анкоры релевантны, а страница специфична для одной локации.
Вопросы и ответы
Как этот патент влияет на сайты многофилиальных компаний (multi-location businesses)?
Влияние критическое. Патент явно указывает на механизм повышения Authoritative Score, если страница связана менее чем с пороговым количеством локаций (в идеале — с одной, Claims 12 и 19). Это означает, что для каждой локации должна быть создана отдельная, уникальная страница. Общая страница «Наши адреса» не будет считаться авторитетной для конкретного филиала.
Что важнее всего для определения авторитетной страницы согласно патенту?
Патент не выделяет один самый важный фактор, но указывает, что Authoritative Score — это взвешенная комбинация сигналов. При этом упоминается, что сигналы, связанные с анкорным текстом и доменным именем, могут быть взвешены сильнее, чем другие. Поэтому брендовые анкоры и совпадение домена критически важны.
Как Google обрабатывает вариации в названии бизнеса (Text Similarity)?
Система использует технику оценки схожести текста, которая учитывает частоту встречаемости слов в географическом регионе. Для редких и уникальных названий допускается больше вариаций, опечаток и частичных совпадений. Для общих названий (например, «Лучшая Пицца») требования к точности выше. Это подчеркивает преимущество уникального брендинга.
Что такое «бонус за одну локацию» (single location bonus)?
Это механизм, описанный в Claims 12 и 19. Если система определяет, что документ связан только с одной географической локацией, его Authoritative Score увеличивается. Это помогает отфильтровать каталоги, агрегаторы и общие страницы брендов, отдавая предпочтение странице, посвященной конкретному физическому адресу.
Нужно ли размещать адрес на главной странице, чтобы она считалась авторитетной?
Нет, это как раз та проблема, которую решает патент. Авторитетная страница (например, главная) сама может не содержать адреса. Система идентифицирует ее через ссылки со страниц, которые содержат адрес (Группа A ссылается на Группу B). Однако наличие консистентного NAP на авторитетной странице не повредит и поможет подтвердить локацию.
Как система формирует набор кандидатов на авторитетность?
Она использует три группы: (A) Страницы, где найдены сниппеты с адресом, телефоном или названием бизнеса (цитаты). (B) Страницы, на которые ссылаются из группы A. (C) Страницы, полученные путем усечения URL из групп A и B (родительские директории, главная страница). Это обеспечивает полный охват потенциально релевантных страниц.
Что такое URL stripping и зачем он используется в этом алгоритме?
URL stripping (Группа C кандидатов) — это процесс сокращения URL путем удаления конечных сегментов (например, из /a/b/c получается /a/b и /a). Он используется для поиска потенциально более авторитетных страниц в иерархии сайта. Часто подстраницы (например, меню или контакты) содержат локационную информацию, но авторитетной страницей является главная страница сайта или раздела.
Как я могу повлиять на то, какая страница будет выбрана в качестве авторитетной?
Необходимо максимизировать сигналы для целевой страницы. Убедитесь, что внешние упоминания вашего бизнеса (NAP) ссылаются именно на эту страницу (формирование Группы B). Оптимизируйте Title и убедитесь, что страница посвящена только одной локации. Также обеспечьте, чтобы другие страницы-кандидаты (например, страница контактов) ссылались на целевую авторитетную страницу (Сигнал 1).
Влияют ли ссылки из социальных сетей или каталогов на этот алгоритм?
Да, влияют двумя способами. Во-первых, если они содержат локационную информацию (NAP), они могут войти в Group A и помочь сформировать кластер кандидатов. Во-вторых, анкорный текст ссылок из любых источников (Signal 2) анализируется на совпадение с названием бизнеса, что напрямую влияет на Authoritative Score.
Как этот патент связан с концепцией «Entity Home» и Google Business Profile?
Этот патент описывает один из алгоритмов для определения «Entity Home» — канонического URL, который представляет сущность (бизнес или локацию) в интернете. Authoritative Document, идентифицированный этим методом, по сути и является «Entity Home» для данной локации, и именно его Google будет стремиться использовать в качестве ссылки в Google Business Profile и Local Pack.