
Патент описывает метод для генерации Sitemaps на сайтах, где фактическое время последнего изменения контента недоступно (например, для данных в БД). Система сравнивает текущий номер версии контента с версией на момент прошлой генерации Sitemap. Если версия изменилась, в тег
Патент решает проблему обеспечения эффективного сканирования и своевременного обновления поискового индекса для контента, у которого отсутствует доступная или надежная метка времени последнего изменения (actual last modified time). Это особенно актуально для контента, хранящегося в базах данных (например, UGC, медиа-галереи, товары в E-commerce), где изменения в содержимом не отражаются на уровне временных меток файловой системы. Без точного сигнала об изменении краулер не может эффективно приоритизировать повторное сканирование.
Запатентован метод генерации файла Sitemap, который использует номера версий контента (Version Numbers) в качестве альтернативного индикатора изменений, когда фактическое время модификации недоступно. Система сравнивает текущую версию элемента с версией, зафиксированной при предыдущей генерации Sitemap. При обнаружении различий система искусственно устанавливает значение Last Modified Time (тег <lastmod>) на актуальное время, сигнализируя о необходимости пересканирования.
Механизм реализуется на стороне веб-сайта в процессе генерации Sitemap:
Historical List или stored version number) на момент последней генерации Sitemap.<lastmod> на время, более позднее, чем время предыдущей генерации (например, текущее системное время).Высокая. Управление краулинговым бюджетом и обеспечение свежести индекса остаются критически важными задачами технического SEO. Хотя современные CMS часто лучше обрабатывают временные метки, проблема остается актуальной для крупных, управляемых базами данных сайтов, самописных систем и UGC-платформ. Этот патент предлагает надежный резервный механизм для таких случаев.
Патент имеет значительное инфраструктурное влияние на техническое SEO. Он не описывает алгоритмы ранжирования, но критически важен для обеспечения базовых процессов сканирования и индексации. Для сайтов с ненадежными временными метками внедрение подхода на основе версий при генерации Sitemap является ключевым для поддержания актуальности контента в индексе и эффективного расходования краулингового бюджета.
<lastmod>), указывающее краулеру дату изменения. В данном патенте это значение устанавливается искусственно на основе изменения версии.Claim 8 (Независимый пункт, Метод): Описывает основной процесс обработки отдельного элемента контента.
current version number) элемента контента.previously stored version number).Last Modified Time в записи Sitemap для этого элемента на время, более позднее, чем время генерации последнего Sitemap.actual last modified time... is not available).Claim 17 (Независимый пункт, Метод): Описывает процесс пакетной обработки через сравнение списков.
current list) номеров версий контента из базы данных.historical list).Last Modified Time в Sitemap на время, более позднее, чем время генерации последнего Sitemap.Claim 1 (Независимый пункт, Система): Определяет архитектуру системы.
Sitemap Generator, который сравнивает текущий номер версии с ранее сохраненным.Last Modified Time основано на результате сравнения, при условии, что фактическое время изменения недоступно.Зависимые пункты (например, Claims 11, 12, 14): Уточняют детали реализации и контекст:
Last Modified Time может использоваться текущее системное время (Claim 14).photograph sharing website), где инструменты редактирования обновляют номер версии изображения (Claims 11, 12).Изобретение описывает механизм, реализуемый на инфраструктуре веб-сайта (Sitemap Generator) для управления поведением поисковой системы.
CRAWLING – Сканирование и Сбор данных
Это основная фаза, на которую влияет изобретение. Сгенерированный Sitemap с точно рассчитанными значениями <lastmod> напрямую управляет планированием сканирования (Crawl Scheduling). Предоставление актуальной даты изменения позволяет Network Crawler оптимизировать ресурсы и приоритизировать сканирование обновленного контента, даже если стандартные сигналы (например, HTTP-заголовок Last-Modified) недоступны.
INDEXING – Индексирование и извлечение признаков
Обеспечивая своевременное повторное сканирование, механизм гарантирует, что в индекс (Index) и кеш (Item Cache) попадает самая свежая версия контента, поддерживая актуальность данных для ранжирования.
Входные данные (для Sitemap Generator):
Content Database.Current Version Numbers) этих элементов.Historical List) с момента последней генерации.Выходные данные (для Network Crawler):
<loc>) и временем последнего изменения (<lastmod>). Для измененного контента <lastmod> будет содержать искусственно установленное свежее время.photograph sharing website).actual last modified time).version number.Процесс генерации Sitemap с использованием номеров версий:
Historical List).Current Version Number) из базы данных.<lastmod> для этого элемента на время, которое позже времени предыдущей генерации Sitemap (например, текущее системное время).<lastmod> (либо свежим из шага 5, либо историческим, если изменений не было).Патент фокусируется исключительно на данных, необходимых для определения факта изменения контента.
Version Number: Ключевой фактор. Индикатор, который должен обновляться при любом изменении контента.image files), аудио, видео и текстовым файлам.Система не вычисляет сложные метрики, а использует прямое сравнение и системные данные.
Current Version Number и Stored Version Number.<lastmod> при обнаружении изменений. Указывается, что можно использовать текущее время или текущий день.<lastmod> в Sitemap для управления поведением краулера и оптимизации краулингового бюджета.<lastmod> устанавливается искусственно (на текущее время), если обнаружено изменение версии. Это допустимая практика, если она точно отражает факт обновления контента.Last-Modified и заполняет <lastmod> в Sitemap. Они должны соответствовать времени значимого изменения контента.<lastmod> только при наличии изменений.<lastmod> (и номер версии) обновляется только при значимых изменениях контента, а не при технических или незначительных правках.<lastmod> приведет к замедлению обнаружения изменений и устареванию индекса.Патент подтверждает стратегическую важность файлов Sitemap как надежного канала коммуникации для управления сканированием. Он подчеркивает, что SEO-стратегия должна включать обеспечение технической инфраструктуры, способной точно сигнализировать об изменениях контента. Для современных веб-приложений, часто использующих сложные базы данных, реализация альтернативных методов отслеживания изменений является необходимостью для обеспечения конкурентоспособности в поиске.
Сценарий: Обеспечение актуальности карточек товаров в E-commerce на самописной CMS
Интернет-магазин хранит товары в базе данных. Цены и наличие часто меняются, но CMS не обновляет метки времени Last-Modified.
content_hash. При любом изменении товара (цена, описание, наличие) рассчитывается новый хеш контента и сохраняется в этом поле.Historical List).content_hash в БД со значением в лог-файле.<lastmod> для этого товара текущую дату и время. Если хеши равны, дата <lastmod> остается прежней.<lastmod> только для измененных товаров и оперативно ставит их в очередь на пересканирование.Является ли описанный механизм заменой HTTP-заголовка Last-Modified?
Нет, это резервный механизм (fallback). В идеале сайт должен корректно отдавать HTTP-заголовок Last-Modified и использовать ту же дату в <lastmod>. Метод из патента предназначен строго для ситуаций, когда получение этой фактической даты невозможно или она ненадежна (как указано в патенте: actual last modified time... is not available).
Что делать, если у моего контента нет системы нумерации версий?
Если стандартные метки времени недоступны, необходимо внедрить механизм отслеживания изменений. Это не обязательно должен быть номер версии (1.1, 1.2). Можно использовать хеш-сумму значимого контента страницы. Если контент меняется, меняется и хеш. Главное, чтобы генератор Sitemap мог сравнить текущее значение с предыдущим.
Как именно система определяет, что контент изменился?
Система полагается на данные, предоставляемые CMS или базой данных. Она сохраняет состояние индикатора изменений (номера версии или хеша) на момент последней генерации Sitemap (Historical List) и сравнивает его с текущим состоянием. Любое несовпадение интерпретируется как изменение контента.
Что произойдет, если номер версии изменился?
Sitemap Generator искусственно устанавливает значение тега <lastmod> в новом файле Sitemap на текущее системное время (или любую дату, более позднюю, чем предыдущая генерация). Это служит сигналом для краулера о том, что контент обновлен и его нужно пересканировать.
Что произойдет, если я буду указывать свежую дату <lastmod> для страниц, которые не менялись?
Это крайне не рекомендуется и противоречит сути патента. Если вы постоянно сигнализируете об изменениях, но краулер не обнаруживает нового контента, Google начнет терять доверие к вашим файлам Sitemap. Это приведет к неэффективному расходованию краулингового бюджета и может замедлить индексацию действительно важных обновлений.
Влияет ли этот патент на ранжирование?
Напрямую нет. Это патент, связанный с инфраструктурой сканирования и индексации. Однако косвенное влияние есть: если обновленный контент быстрее попадает в индекс благодаря этому механизму, он быстрее начнет ранжироваться по актуальным данным. Это особенно важно для контента, чувствительного ко времени (QDF).
Для каких сайтов этот патент наиболее актуален?
Он наиболее актуален для сайтов, где контент хранится в базах данных и управляется сложными или самописными системами, которые не могут надежно предоставлять фактическое время изменения. Примеры включают крупные платформы UGC, сайты отзывов, E-commerce каталоги и медиа-хостинги (как указано в патенте).
Как хранить исторический список версий (Historical List)?
Это зависит от реализации вашего генератора Sitemap. Исторический список можно хранить в отдельной таблице базы данных, в кеше (например, Redis) или в файле на сервере (например, в формате JSON). Важно, чтобы этот список был доступен при следующей генерации Sitemap и обновлялся после ее завершения.
Может ли этот механизм использоваться для изображений или видео?
Да, патент явно упоминает это. Например, если пользователь отредактировал фотографию с помощью инструментов на сайте (поворот, обрезка), система должна обновить номер версии этого изображения. Генератор Sitemap обнаружит это изменение и обновит <lastmod>, гарантируя, что поисковая система проиндексирует новую версию.
Может ли этот метод помочь с индексацией новых страниц?
Да. В алгоритме (FIG. 2) указано, что если элемент отсутствует в последнем сгенерированном Sitemap (ITEM NOT PRESENT IN LAST GENERATED SITEMAP), он также обрабатывается как измененный. Для него устанавливается свежее время <lastmod>, что способствует его приоритетному сканированию и индексации.

Краулинг
Техническое SEO
Свежесть контента

Краулинг
Индексация
Техническое SEO

Краулинг
Техническое SEO
Индексация

Свежесть контента
Индексация
Техническое SEO

Индексация
Краулинг
SERP

Local SEO
Ссылки
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

Local SEO
Поведенческие сигналы
Свежесть контента

Поведенческие сигналы
SERP
Мультимедиа

Поведенческие сигналы
Ссылки
SERP

SERP
Поведенческие сигналы
Персонализация

Local SEO
SERP
Ссылки

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

EEAT и качество
SERP
Ссылки
