
Google использует механизм для архивирования и индексирования различных версий веб-страниц по мере их изменения. Система присваивает каждой версии диапазон дат ее актуальности и сохраняет данные о релевантности (включая фразы и сигналы) именно для этой версии. Это позволяет поисковой системе анализировать историю изменений контента, оценивать частоту обновлений и находить документы, которые были релевантны в определенный прошлый период времени.
Патент решает проблему ограничений традиционных поисковых систем, которые обычно индексируют и хранят данные о релевантности только для текущей версии документа. Это не позволяет пользователям искать предыдущие версии страниц или находить контент, который был актуален в определенный исторический период. Кроме того, это мешает поисковой системе использовать информацию об истории изменений документа (например, частоту обновлений или эволюцию релевантности) при ранжировании.
Запатентована система и метод для создания архивного индекса (archival index), который хранит несколько версий (instances или versions) одного и того же документа. Каждая версия связана с определенным диапазоном дат (date range), в течение которого она была актуальна. Для каждого диапазона дат система хранит специфичные для этой версии данные о релевантности (relevance data), включая фразы, содержащиеся в документе.
Система работает на этапе индексирования. Когда система обнаруживает документ, она определяет, изменился ли он с момента предыдущего индексирования. Если изменений нет, текущие данные сохраняются. Если документ изменился:
Это позволяет поисковой системе иметь доступ к истории документа и его релевантности в разные периоды времени.
Высокая. Хотя патент подан в 2005 году, описанная в нем инфраструктура для отслеживания изменений контента во времени является фундаментальной для современных поисковых систем. Механизмы оценки свежести контента (Freshness), частоты обновлений и анализа временной релевантности критически важны в 2025 году и опираются на возможность хранить и анализировать исторические данные о документах.
Патент имеет важное стратегическое значение для SEO. Он описывает не алгоритм ранжирования, а инфраструктуру, которая позволяет Google точно измерять, как, когда и насколько существенно меняется контент. Это предоставляет данные, необходимые для работы алгоритмов, чувствительных к свежести и частоте обновлений. Понимание этого механизма критично для разработки стратегий обновления контента и управления жизненным циклом страниц.
valid). Состоит из даты начала (open date) и даты окончания (closed date) или статуса "open"/"current" для текущей версии.PageRank, количество входящих ссылок (inlinks), длину документа, частоту терминов и типы HTML-разметки.Claim 1 (Независимый пункт): Описывает метод создания архивного индекса документов, индексированных по фразам.
first date range), включающего предыдущую дату, в течение которого документ был действителен.current information-retrieval relevance data), включая фразы в текущей версии.current date range).previous information-retrieval relevance data), включая фразы из старой версии, в ассоциации с первым диапазоном дат.Ядро изобретения — это процесс сохранения отдельных наборов данных о релевантности (включая фразы) для разных версий одного документа, каждая из которых привязана к своему диапазону дат актуальности.
Claim 6 (Зависимый от 1): Уточняет метод определения того, изменился ли документ.
current set of topics) для документа во время индексирования.prior set of topics).Это указывает на то, что система может использовать семантические изменения (изменение тематики), а не только поверхностные правки, для распознавания новой версии.
Claim 16 (Независимый пункт): Описывает процесс обновления диапазонов дат при обнаружении изменений.
new prior date range) с указанием даты закрытия (closed date).new current date range) с текущей датой в качестве даты открытия (open date).Этот пункт детализирует механизм управления жизненным циклом версий документа в индексе.
Изобретение является инфраструктурным и затрагивает основные этапы сбора и хранения данных.
CRAWLING – Сканирование и Сбор данных
На этом этапе система получает доступ к документу и фиксирует дату доступа, что необходимо для последующего анализа версий.
INDEXING – Индексирование и извлечение признаков
Основное применение патента. Во время индексирования система:
Relevance Data, включая фразы, PageRank, inlinks) для новой версии.Date Ranges: закрывает старый диапазон и открывает новый.RANKING / RERANKING – Ранжирование / Переранжирование
Хотя патент не описывает алгоритмы ранжирования, он предоставляет данные, которые могут использоваться на этих этапах:
PageRank или ссылок) между разными версиями.Входные данные:
Relevance Data, предыдущий Date Range).Выходные данные:
Relevance Data (фразы, признаки) и соответствующий Date Range.YMYL-тематики, где актуальность информации критична.Процесс архивного индексирования документа
Relevance Data или текущего набора тем (Topics) с данными предыдущей версии.first date range) для предыдущей версии, включая предыдущую дату индексирования и недавнюю дату (например, вчерашний день), в течение которых старая версия была действительна.current relevance data), включая извлечение фраз из текущего контента.current date range), который начинается с сегодняшней даты и имеет статус "открыт".Патент фокусируется на использовании следующих типов данных для индексирования версий и определения изменений:
Good Phrases. Изменение в наборе фраз и, как следствие, в наборе тем (Topics) документа используется для определения того, что документ изменился (Claim 6).Date Ranges).Relevance Data, сохраняемые для каждой версии, могут включать: term frequency).PageRank документа.inlinks).Date Ranges) за определенный период времени.Frequency of Updates). Это позволяет отличать сайты, которые обновляются часто и существенно, от тех, что обновляются редко.Topics) для определения того, является ли изменение достаточно существенным для создания новой версии. Это позволяет системе игнорировать незначительные правки (например, изменение футера или даты).Relevance Data (включая фразы, PageRank, ссылки) для каждой версии позволяет Google анализировать, как менялась релевантность и авторитетность документа во времени. Документ мог быть авторитетным в прошлом, но потерять актуальность сейчас, и наоборот.YMYL и быстро меняющихся нишах). Обновления должны влиять на основную тематику страницы, добавляя новую информацию или актуализируя данные.Date Ranges.Topics) для фиксации новой версии. Если темы не меняются, система может не засчитать обновление как существенное.Этот патент подтверждает долгосрочную стратегию Google по пониманию контента во временном контексте. Для SEO-специалистов это подчеркивает переход от разовой оптимизации к управлению жизненным циклом контента. Стратегия должна включать не только создание нового контента, но и планирование регулярной и существенной актуализации существующего. Понимание того, что Google хранит историю версий и связанных с ними сигналов, должно влиять на принятие решений об обновлении, консолидации или удалении контента.
Сценарий: Актуализация годового обзора
Topics) и фразы (названия моделей) не изменились. Обновление может быть проигнорировано как несущественное.Date Range для версии 2024 года и создает новую версию для 2025 года с новыми Relevance Data. Это дает сильный сигнал свежести для запросов о смартфонах.Описывает ли этот патент алгоритм Google Freshness (QDF)?
Нет, этот патент не описывает сам алгоритм ранжирования по свежести. Он описывает инфраструктуру индексирования, которая необходима для работы таких алгоритмов. Патент объясняет, как Google собирает и хранит данные об изменениях документов во времени (историю версий и их даты актуальности), которые затем могут использоваться алгоритмами ранжирования для оценки свежести.
Как система определяет, что документ изменился?
Патент предлагает несколько методов. Ключевой метод, упомянутый в Claim 6, — это анализ изменения набора тем (Topics) документа. Если текущий набор тем существенно отличается от предыдущего (например, более чем на 5%, как упомянуто в описании), документ считается измененным. Также упоминаются другие возможные метрики: изменение длины документа, частоты терминов или HTML-разметки.
Что означает, что система использует изменение "Тем" (Topics) для фиксации обновления?
Это означает, что система оценивает семантическое содержание страницы. Если вы добавили новый раздел, удалили старый блок текста или актуализировали данные, это, скорее всего, изменит ключевые фразы и темы страницы. Если же вы просто поменяли дату в футере или исправили опечатку, основные темы останутся прежними, и система может не посчитать это существенным обновлением.
Стоит ли часто вносить мелкие правки на страницу, чтобы она выглядела свежей?
Исходя из этого патента, такая тактика, скорее всего, неэффективна. Поскольку система стремится определить существенные изменения (например, через изменение тем), мелкие правки могут игнорироваться и не приводить к созданию новой значимой версии в индексе. Фокусироваться следует на существенных обновлениях, которые добавляют ценность и актуализируют информацию.
Хранит ли Google все версии страницы, которые когда-либо существовали?
Патент описывает механизм для хранения нескольких версий (multiple versions) документа и связанных с ними данных о релевантности. Он не утверждает, что хранятся абсолютно все изменения, но подтверждает наличие архивного индекса, хранящего историю значимых версий документа.
Как этот патент влияет на контент, который не должен меняться (например, исторические документы)?
Если контент не меняется, система просто подтверждает это при повторном индексировании и не создает новые версии (Claim 1). Это нормально. Однако, если ниша предполагает свежесть, отсутствие обновлений может быть расценено алгоритмами ранжирования (использующими эти данные) как негативный сигнал.
Может ли старая версия страницы ранжироваться лучше, чем текущая?
Да. Патент указывает, что система может повышать старые версии, если они более релевантны запросу, особенно если запрос содержит указание даты в прошлом. Также упоминается, что если релевантность документа достигла пика в прошлом, а затем снизилась, старая версия может быть предпочтительнее.
Сохраняются ли ссылочные сигналы и PageRank для старых версий?
Да. Патент явно упоминает, что Relevance Data, сохраняемые для каждой версии, могут включать PageRank и количество входящих ссылок (inlinks) (Claim 4, 5). Это позволяет системе отслеживать авторитетность документа именно в тот период времени, когда версия была актуальна.
Влияет ли частота сканирования (Crawl Rate) на работу этого механизма?
Да, напрямую. Чтобы обнаружить изменения и создать новую версию, Googlebot должен сначала посетить и проиндексировать страницу. Если страница сканируется редко, система не сможет оперативно отслеживать ее обновления, и актуальная версия может попадать в индекс с задержкой.
Что происходит, когда я обновляю контент на уже существующем URL?
Происходит именно то, что описано в патенте. Google сравнивает новый контент со старым. Если изменения существенны, старая версия архивируется с закрытой датой актуальности, а новая версия становится текущей. Сигналы релевантности пересчитываются для новой версии, но при этом сохраняется история предыдущих версий этого URL.

Свежесть контента
Ссылки
Техническое SEO

Персонализация
Поведенческие сигналы
Свежесть контента

Персонализация
Свежесть контента
Индексация

EEAT и качество
Свежесть контента
Семантика и интент

Индексация
Техническое SEO

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
SERP
Мультимедиа

Индексация
Краулинг
Ссылки

Персонализация
Семантика и интент
Поведенческие сигналы

Ссылки
Поведенческие сигналы
SERP

Ссылки

Безопасный поиск
Поведенческие сигналы
Семантика и интент

Антиспам
Ссылки
Семантика и интент

Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
