
Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
Патент решает проблему «гниения ссылок» (link rot). Когда веб-ресурсы перемещаются, меняют доменные имена или структуру, сохраненные идентификаторы (URI или URL) становятся недействительными (outdated URI). Это приводит к появлению «битых» ссылок в закладках пользователей, истории поиска и на веб-страницах, ухудшая пользовательский опыт. Изобретение направлено на автоматическое поддержание актуальности этих коллекций ссылок.
Запатентована система и метод для поддержания целостности коллекций URI путем их синхронизации с эталонным индексом документов (Document Index). Система использует этот индекс как источник истины для определения актуального канонического URI (Canonical URI) для ресурса и заменяет устаревшие или неканонические версии в различных хранилищах на актуальные.
Система функционирует в нескольких режимах:
URI (например, сервер закладок), либо периодически сверяют свои данные с Document Index (Pull), либо подписываются на службу публикации обновлений (URI Updates Publisher Server) для получения актуальных данных (Push).Canonical URI для замены.Высокая. Устаревание ссылок — постоянная проблема интернета. Поддержание функциональности ссылок критически важно для пользовательского опыта в экосистеме Google (например, закладки и история Chrome) и для связности веба в целом. Описанные механизмы являются фундаментальной инфраструктурой для обеспечения целостности данных.
Влияние на SEO минимальное (Инфраструктура/UX). Патент не описывает алгоритмы ранжирования. Он фокусируется на обновлении уже сохраненных идентификаторов для улучшения пользовательского опыта. Однако он подчеркивает критическую важность корректного технического управления каноникализацией и редиректами на сайте. Это гарантирует, что Google быстро распознает актуальные URL, что косвенно влияет на эффективность сканирования и консолидацию сигналов ранжирования.
URI, запрашивать канонические URI и выполнять перенаправление в реальном времени.Document Index о том, какие документы ссылаются на данный ресурс. Используется для поиска страниц, содержащих устаревшие исходящие URI.URI для доступа к ресурсу, хранящаяся в Document Index. Может отличаться от сохраненного URI из-за перемещения ресурса или удаления ненужных параметров (например, идентификаторов сессий).URI. Он обнаруживает изменения URI, например, через HTTP-редиректы (301/302), мета-обновления или анализ текста на странице.Canonical URI ресурса, другие (включая устаревшие) URI этого ресурса (Other URIs) и информацию об обратных ссылках (Backlinks).URI, который больше не является каноническим или не позволяет получить доступ к ресурсу (неработающая ссылка).URI из Document Index и рассылает обновления подписчикам (например, серверам закладок). Также может отвечать за уведомление владельцев контента о битых ссылках.Claim 1 (Независимый пункт): Описывает базовый метод обновления сохраненного URI.
URI из URI collection.Document Index, который хранит информацию о канонических URI.Canonical URI для данного ресурса от сохраненного URI.URI в коллекции на Canonical URI.Claim 2 (Зависимый от 1): Описывает механизм оптимизации для больших коллекций.
URI из коллекции.Canonical URI, система заменяет каждое вхождение (each instance) устаревшего URI в исходной коллекции на канонический. (Например, если 100 пользователей добавили одну ссылку в закладки, она проверяется один раз, а обновляется у всех).Claims 3-7 (Зависимые от 1): Уточняют типы коллекций, к которым применим метод: закладки (3), история поиска (4), сообщения (email/SMS) (5), дискуссионные группы/форумы (6), URI, включенные в документ (веб-страницу) (7).
Claim 9 (Независимый пункт): Описывает модель публикации/подписки (Push Model) с точки зрения издателя (URI Updates Publisher Server).
Document Index список Canonical URIs, которые изменились с определенного момента времени.URI.URI (URI update).URI.Claim 12 (Зависимый от 9): Описывает механизм уведомления владельцев сайтов.
URI.URI на этот адрес. (Claim 14 уточняет, что уведомление включает новый Canonical URI).Изобретение описывает инфраструктурные процессы, тесно связанные с этапами сканирования и индексирования, но само обновление коллекций происходит асинхронно, вне основного конвейера обработки поискового запроса.
CRAWLING – Сканирование и Сбор данных
Crawler обнаруживает изменения URI во время сканирования контента. Это происходит путем обнаружения кодов редиректов (HTTP 301 или 302), мета-тегов обновления (refresh redirect) или анализа текста документа (например, "эта страница перемещена").
INDEXING – Индексирование и извлечение признаков
Это ключевой этап. Document Index обновляется на основе данных краулера и служит источником истины. Для ресурса сохраняется новый Canonical URI, старый URI помечается как альтернативный (Other URIs), также сохраняется информация об обратных ссылках (Backlinks).
Применение вне основного поискового конвейера (Инфраструктура и Экосистема)
Основная логика патента реализуется здесь:
Document Index (напрямую или через подписку) для обновления пользовательских данных.Add-on Application для исправления ссылок в реальном времени при возникновении ошибок доступа.Backlinks из индекса, чтобы найти страницы с битыми ссылками и уведомить их владельцев.URI (документы, изображения, видео, потоки данных, подкасты).URI и получает ошибку (при использовании клиентского приложения).Crawler обновляет Document Index, это может служить триггером для генерации обновлений.Патент описывает несколько взаимосвязанных процессов.
Процесс А: Проактивное обновление коллекции URI (Pull Model)
URI из своей базы данных.URI из списка уникальных URI.Document Index для получения соответствующего Canonical URI.URI и полученный Canonical URI.URI отличаются, система находит все вхождения устаревшего URI в основной коллекции (например, в аккаунтах разных пользователей) и заменяет их на Canonical URI.Процесс Б: Публикация и подписка на обновления (Push Model)
URI Updates Publisher Server периодически проверяет Document Index на наличие URI, которые изменились с момента последней проверки.URI в своей базе данных на канонические.Процесс В: Коррекция в реальном времени (Add-on)
URI, и браузер не может получить доступ (например, ошибка 404).Add-on Application перехватывает ошибку.Canonical URI у Document Index.Canonical URI найден, приложение перенаправляет браузер на этот адрес, минуя показ ошибки пользователю.URI был сохранен локально (например, в закладках), он обновляется.Процесс Г: Уведомление владельцев контента
URI (например, во время Процесса Б).Document Index для получения Backlinks, чтобы найти документы, содержащие этот устаревший URI.Canonical URI для замены.Система использует данные, полученные в процессе сканирования, индексирования и взаимодействия с пользователем.
Add-on Application для реактивного обнаружения устаревших URI.Document Index хранит структурированные записи: Canonical URI, Other URIs (устаревшие/альтернативные) и Backlinks.URI.URI в коллекциях (закладки, история и т.д.).Патент не описывает сложных метрик, оценок или алгоритмов машинного обучения. Основные механизмы основаны на сравнении строк и управлении базами данных:
URI от Canonical URI. Это бинарное решение (отличается/не отличается), запускающее обновление.URI для оптимизации процесса обновления (Процесс А).URI, которые изменились «с определенного момента времени».Document Index служит эталоном для определения Canonical URI не только для поиска, но и для всей экосистемы Google (закладки, история, почта). Google стремится к максимальной консистентности данных.Crawler своевременно и корректно обнаруживать изменения URI. Использование постоянных (301) редиректов является ключевым фактором для быстрого обновления индекса и пользовательских данных.Backlinks) и предоставлять им корректный URL для замены. Это указывает на стремление улучшать общую гигиену ссылочного графа веба.URL (миграция, изменение структуры) необходимо использовать постоянные (301) редиректы. Это гарантирует, что Crawler быстро обновит Document Index, что позволит системам, описанным в патенте, корректно обновить закладки и историю пользователей, обеспечивая им беспрепятственный возврат на ваш сайт.Document Index правильно идентифицирует предпочтительный URI, который затем будет распространяться этой системой.Canonical URI в Document Index. В результате система не сможет оперативно обновить устаревшие ссылки в закладках пользователей.Document Index не сможет определить новый Canonical URI. Пользователи, сохранившие ссылку, столкнутся с ошибкой, и автоматическая система обновления не сработает.Canonical URI, что замедлит работу всей инфраструктуры.Патент подтверждает, что инфраструктура Google глубоко интегрирована. Данные поискового краулера влияют не только на SERP, но и на работу других сервисов. Для SEO-стратегии это подчеркивает критическую важность технически безупречного управления миграциями и изменениями URL. Ошибки в настройке редиректов приводят не только к потере позиций и трафика из поиска, но и к прямому ухудшению UX для лояльных пользователей, которые не смогут вернуться на сайт по сохраненным ссылкам.
Сценарий 1: Миграция сайта и обновление закладок пользователя
http://old-site.com/page. Сайт переехал на https://new-site.com/page с настройкой 301 редиректа.Crawler обнаруживает 301 редирект. Document Index обновляет Canonical URI на новый адрес.https://new-site.com/page.Сценарий 2: Уведомление вебмастера о неработающей исходящей ссылке
http://siteB.com/resource. Site B удалил эту страницу (404).Crawler обнаруживает 404 ошибку на Site B. Document Index обновляется.Backlinks, чтобы найти Site A как источник ссылки на устаревший URI.Влияет ли этот патент на ранжирование сайтов в поиске Google?
Нет, этот патент не описывает алгоритмы ранжирования. Он посвящен инфраструктуре для обновления сохраненных идентификаторов ресурсов (URI) в различных коллекциях, таких как закладки или история поиска. Его основная цель — улучшение пользовательского опыта путем исправления неработающих ссылок, а не оценка качества контента для целей поиска.
Как Google определяет новый канонический URL, если старый перестал работать?
Система полагается на данные, собранные краулером (Crawler). Краулер обнаруживает изменения, следуя по HTTP-редиректам (301/302), анализируя мета-теги обновления (meta refresh) или текст на странице. Для SEO это подчеркивает критическую важность настройки корректных 301 редиректов при изменении URL для быстрого обновления индекса.
Означает ли этот патент, что Google автоматически исправляет битые обратные ссылки, ведущие на мой сайт?
Нет, он этого не гарантирует. Патент описывает возможность (Claim 12, Процесс Г) уведомления владельца сайта-источника о том, что его исходящая ссылка устарела, и предоставления ему нового Canonical URI. Однако он не описывает механизм автоматического изменения контента на чужих сайтах. Ответственность за исправление ссылки лежит на владельце сайта-источника.
Что такое «URI Updates Publisher Server» и как он работает?
Это специализированный сервер-посредник. Он отслеживает изменения канонических URI в основном индексе Google (Document Index) и рассылает уведомления об этих изменениях подписчикам (Push Model). Подписчиками могут быть другие сервисы Google (например, сервер закладок, сервер истории поиска), которые хотят поддерживать свои базы данных URI в актуальном состоянии.
Может ли Google уведомить меня, если на моем сайте есть неработающие исходящие ссылки?
Да, патент описывает такой механизм (Процесс Г, Claim 12). Система может использовать данные об обратных ссылках (Backlinks) в индексе, чтобы найти документы, ссылающиеся на устаревший URI. Затем она может идентифицировать владельца этого документа и отправить уведомление. На практике такие уведомления часто интегрированы в Google Search Console.
Что произойдет, если я изменю URL страницы, но не настрою 301 редирект?
Краулер не сможет легко связать старый URL с новым, и Document Index не будет содержать актуальный Canonical URI для старого адреса. Пользователи, которые сохранили старый URL в закладках или истории поиска, будут сталкиваться с ошибкой (например, 404), и автоматическая система обновления, описанная в патенте, не сможет им помочь.
Что такое «Add-on Application» и используется ли это сейчас?
В патенте это описывается как плагин или тулбар браузера, который перехватывает ошибки доступа и пытается найти канонический URL в реальном времени (Процесс В). Хотя тулбары устарели, эта функциональность встроена в современные браузеры, такие как Google Chrome, особенно при использовании синхронизации аккаунта, для обеспечения актуальности закладок и истории.
В чем разница между каноникализацией в этом патенте и SEO-концепцией каноникализации?
В SEO каноникализация — это выбор предпочтительного URL для ранжирования среди дубликатов и консолидации сигналов. В данном патенте каноникализация — это процесс обновления сохраненной строки URI в базе данных (например, в закладке) до её актуальной, рабочей версии (Canonical URI) из индекса Google. Это разные процессы, хотя оба полагаются на корректное определение канонического адреса в индексе.
Как оптимизируется обновление больших коллекций URI?
Патент предлагает оптимизацию (Claim 2, Процесс А) для ситуаций, когда множество пользователей сохранили одну и ту же ссылку. Вместо проверки каждой закладки индивидуально, система создает список уникальных URI, проверяет их каноничность, а затем распространяет обновления на все экземпляры измененных URI во всей базе данных.
Какова основная ценность этого патента для SEO-специалиста?
Основная ценность заключается в понимании инфраструктуры Google и критической важности технического SEO. Корректная настройка 301 редиректов гарантирует не только передачу веса для ранжирования, но и обеспечивает бесшовный пользовательский опыт для лояльной аудитории, которая возвращается на сайт через закладки или историю поиска.

Свежесть контента
Ссылки
Техническое SEO

Индексация
Свежесть контента

Свежесть контента
Антиспам
Ссылки

Краулинг
Техническое SEO
Индексация

Краулинг
Индексация
Свежесть контента

Структура сайта
SERP
Ссылки

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Антиспам
SERP

Knowledge Graph
Ссылки
EEAT и качество

Поведенческие сигналы
SERP

Ссылки
SERP
Свежесть контента

Антиспам
Ссылки
Техническое SEO
