
Патент описывает механизмы Google для решения проблемы дублирования контента, возникающей из-за нескольких эквивалентных доменных имен (например, с WWW и без). Верифицированные владельцы могут указать предпочтительный домен, который Google будет использовать для перезаписи URL-адресов перед индексацией, консолидируя сигналы ранжирования. Патент также описывает интерфейсы для управления верификацией владельцев и контроля скорости сканирования (Crawl Rate).
Патент решает проблему дублирования контента и размывания сигналов ранжирования (например, PageRank), когда один и тот же веб-сайт доступен по нескольким эквивалентным доменным именам (например, с WWW и без WWW). Индексация одного и того же документа под разными URL приводит к неэффективному расходованию краулингового бюджета и ослаблению авторитетности контента. Также решается задача предоставления владельцам сайтов контроля над тем, как и с какой скоростью краулеры сканируют их ресурсы.
Запатентована система, позволяющая верифицированным владельцам сайтов (Verified Owners) указывать предпочтительное доменное имя (Preferred Domain Name). Поисковая система использует это предпочтение для перезаписи URL-адресов (URL Rewriting) к предпочтительному домену перед индексацией, обеспечивая консолидацию сигналов. Также запатентованы методы верификации владельцев и интерфейсы для управления скоростью сканирования (Crawl Rate Control).
Система функционирует через несколько ключевых механизмов:
Verification Tag/File).Preferred Domain Name.PageRank (document importance value), консолидируются на этом URL.Высокая. Описанные механизмы лежат в основе функциональности Google Search Console (ранее Google Webmaster Tools). Процессы верификации владельцев, управление скоростью сканирования и сама концепция указания предпочтительного домена являются фундаментальными аспектами технического SEO. Хотя методы каноникализации эволюционировали (Google теперь чаще полагается на 301 редиректы и rel=canonical), инфраструктура для управления настройками сайта, описанная в патенте, остается крайне актуальной.
Патент имеет высокое значение для технического SEO (8.5/10). Он описывает фундаментальную инфраструктуру, позволяющую Google решать проблемы каноникализации на уровне домена и консолидировать сигналы ранжирования. Понимание этих механизмов критически важно для обеспечения корректной индексации сайта, управления краулинговым бюджетом и поддержания статуса верифицированного владельца для доступа к инструментам управления индексацией.
Robots) запрашивают документы с веб-сайта.Патент охватывает три основные области: управление предпочтительным доменом, верификацию владельцев и контроль скорости сканирования.
Claim 1 (Независимый пункт): Описывает основной процесс индексации с использованием предпочтительного домена.
Это фундаментальный механизм каноникализации на уровне домена, основанный на предпочтениях владельца. Ключевым моментом является то, что перезапись происходит до индексации.
Claim 2 и 3 (Зависимые): Уточняют, что метаданные, в частности document importance value (показатель важности документа, например, PageRank), генерируются для перезаписанного URL.
Это подтверждает, что целью перезаписи является консолидация сигналов ранжирования на каноническом URL.
Claim 5 (Зависимый): Детализирует процесс установления ассоциации.
Это подчеркивает важность верификации для управления настройками индексации.
Claim 11 (Независимый пункт): Описывает процесс с точки зрения взаимодействия с пользователем.
Этот пункт защищает пользовательский интерфейс (например, в Google Search Console) для управления каноническим доменом.
Изобретение затрагивает этапы сканирования и индексирования, а также инфраструктуру взаимодействия с владельцами сайтов.
CRAWLING – Сканирование и Сбор данных
На этом этапе система (Web Crawler System) применяет два ключевых механизма:
Crawl Rate Database) определяют скорость, с которой роботы могут обращаться к сайту, основываясь на установленных лимитах (Crawl Rate Limit) и исторических данных (Past Utilization Value).INDEXING – Индексирование и извлечение признаков
На этом этапе обрабатываются уже перезаписанные (канонические) URL.
Page Rankers), ассоциируются именно с каноническим URL.Входные данные:
Verification Tag/File на сайте).Sitemaps.Выходные данные:
PageRank) для канонических URL.Is crawl rate limit a factor?).Процесс А: Выбор предпочтительного домена (Preferred Domain Name Selection)
Preferred Domain Name для перезаписи URL и метаданных документов этого сайта.Процесс Б: Индексирование с использованием предпочтительного домена
PageRank) генерируются для документа с использованием перезаписанного URL.Процесс В: Контроль скорости сканирования (Crawl Rate Control)
Crawl Rate Limit). Данные о сканировании (Crawl Data) сохраняются.Past Utilization Value).Verification File) или метатегов (Verification Tag) для подтверждения прав собственности.User ID) для привязки настроек к аккаунту.Timestamp), связанные с верификацией владельца и установкой предпочтений. Статистика сканирования за период времени (например, для расчета Past Utilization Value).Crawl Data (статистика по количеству доступных страниц, времени доступа, загруженным байтам). Данные из Domain Name Database и Site Owner Verification Database.Verification Tag/File на сайте для данного пользователя.URL Rewriting для решения проблемы эквивалентных доменов. URL-адреса приводятся к предпочтительному виду до индексации, что является эффективным способом консолидации сигналов.PageRank (document importance value), рассчитываются и применяются к каноническому URL, предотвращая размывание авторитетности.Crawl Rate) предоставляется исключительно верифицированным владельцам. Механизм верификации через уникальные теги/файлы является обязательным условием.Past Utilization Value). Увеличение скорости разрешается только тогда, когда это действительно необходимо для более полного охвата сайта.Sitemaps должны использовать предпочтительный домен.Crawl Rate Control) для мониторинга нагрузки на сервер. При необходимости снижайте скорость, чтобы избежать проблем с производительностью. Если контент обновляется часто, а сервер имеет запас мощности, можно запросить увеличение скорости, следуя логике патента.Verification Tag/File приведет к потере статуса верифицированного владельца и доступа к управлению настройками индексации и сканирования.Этот патент подчеркивает стратегический приоритет Google в отношении чистоты индекса и эффективного сканирования. Он демонстрирует стремление Google взаимодействовать напрямую с верифицированными владельцами сайтов для получения точных инструкций по индексации. Для SEO-специалистов это подтверждает, что техническая конфигурация сайта и использование инструментов для вебмастеров (GSC) являются не опциональными, а фундаментальными требованиями для успешного продвижения. Консолидация сигналов на канонических URL является основой для построения авторитетности.
Сценарий 1: Каноникализация домена (WWW vs без WWW)
Preferred Domain Name.URL Rewriting и изменяет её на www.example.com/page1.html перед индексацией. Сигналы консолидируются на версии с WWW.Сценарий 2: Управление скоростью сканирования для крупного E-commerce сайта
Crawl Rate Control и выбирает опцию "Slower" (Медленнее), чтобы снизить использование сетевых ресурсов.Crawl Rate Limit, и роботы Google снижают частоту запросов, уменьшая нагрузку на сервер во время пикового трафика.Означает ли этот патент, что 301 редиректы или rel=canonical не нужны для каноникализации домена?
Нет. Патент описывает механизм, позволяющий владельцу указать предпочтение (то, что раньше было настройкой предпочтительного домена в GSC). Однако на практике для надежной каноникализации всегда рекомендуется использовать стандартные методы, такие как 301 редиректы и атрибут rel=canonical. Эти сигналы более универсальны и понятны всем поисковым системам. Механизм патента служит дополнительным уровнем контроля для Google.
Как именно Google верифицирует владельца сайта согласно патенту?
Патент описывает использование специфичных для пользователя идентификаторов, которые должны быть размещены на сайте. Это может быть верификационный файл (Verification File) с уникальным именем или верификационный метатег (Verification Tag) с уникальным содержанием, размещенный, например, в заголовке главной страницы. Система проверяет наличие этого файла или тега для подтверждения прав.
Как работает механизм URL Rewriting, описанный в патенте?
URL Rewriting происходит внутри системы Google до индексации. Когда система обрабатывает URL, она проверяет, принадлежит ли домен этого URL к группе эквивалентных доменов, для которых установлено предпочтение. Если домен в URL не является предпочтительным, система заменяет его на Preferred Domain Name, сохраняя остальную часть пути. Документ индексируется уже с новым, перезаписанным URL.
Что происходит с PageRank при использовании этого механизма?
Патент явно указывает (Claim 3), что показатель важности документа (document importance value, такой как PageRank) генерируется для перезаписанного URL. Это означает, что все сигналы авторитетности, направленные на любые эквивалентные домены, консолидируются на предпочтительном домене, предотвращая размывание веса.
Могу ли я увеличить скорость сканирования (Crawl Rate) моего сайта в любой момент?
Не всегда. Патент описывает интеллектуальный механизм. Система сначала анализирует, является ли текущий лимит скорости реальным ограничением для сканирования вашего сайта (сравнивая лимит с Past Utilization Value). Если сайт и так сканируется не на пределе лимита (например, из-за медленных ответов сервера), то запрос на увеличение скорости будет отклонен или проигнорирован.
Что такое процесс ре-верификации (Re-verification) и зачем он нужен?
Это механизм управления доступом. Он позволяет одному верифицированному владельцу просмотреть список всех верификационных файлов/тегов, существующих на сайте, удалить неактуальные (например, принадлежащие бывшим сотрудникам) и запустить повторную проверку. Владельцы, чьи файлы были удалены, теряют статус верифицированного владельца.
Что произойдет, если несколько верифицированных владельцев укажут разные предпочтительные домены?
Патент не описывает детально механизм разрешения конфликтов в такой ситуации. Однако, исходя из описанной структуры базы данных, предполагается, что для сайта существует единая настройка предпочтительного домена. На практике в системах типа GSC последнее изменение настройки, сделанное любым верифицированным владельцем, обычно имеет приоритет.
Насколько актуален этот патент, учитывая развитие алгоритмов каноникализации Google?
Патент крайне актуален как описание инфраструктуры взаимодействия Google с владельцами сайтов. Хотя алгоритмы автоматического определения канонических URL стали совершеннее, механизмы верификации, управления доступом и контроля скорости сканирования, описанные в патенте, по-прежнему активно используются в Google Search Console.
Описывает ли этот патент генерацию Sitemaps?
Да, значительная часть патента (первые фигуры и описание) посвящена методам генерации Sitemaps, включая извлечение URL из файловой системы или логов доступа, добавление метаданных (дата изменения, частота обновления, приоритет) и генерацию дифференциальных Sitemaps (содержащих только новые или измененные URL).
Где на практике SEO-специалист сталкивается с реализацией этого патента?
Практически вся работа в Google Search Console основана на этом патенте: процесс добавления и верификации сайта, аудит пользователей с правами доступа, отчеты о сканировании и возможность управления скоростью сканирования в настройках сайта. Также сюда относится устаревшая функция указания основного зеркала (с WWW или без).

Краулинг
Техническое SEO
Индексация

Индексация
Краулинг
Техническое SEO

Индексация
Краулинг
Техническое SEO

Краулинг
Техническое SEO
Индексация

Техническое SEO
Краулинг
Индексация

Поведенческие сигналы
SERP
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Ссылки
SERP

Семантика и интент
Поведенческие сигналы
SERP

Ссылки
SERP

Ссылки
SERP
Структура сайта

Персонализация
Ссылки

Поведенческие сигналы
Персонализация
Local SEO

Поведенческие сигналы
SERP
Семантика и интент

SERP
Персонализация
Поведенческие сигналы
