
Google использует систему для определения даты первой публикации отдельных фрагментов контента (например, предложений или абзацев). Система сегментирует контент и отслеживает его историю в «Карте дат» (Date Map). Используя нечеткое сравнение (Edit Distance) и нормализацию, система игнорирует незначительные правки и точно датирует только существенные обновления контента.
Патент решает проблему определения точной даты первой публикации отдельных частей контента внутри веб-страницы. Стандартные методы фиксируют дату обновления всей страницы, что не отражает возраст её отдельных компонентов. Изобретение позволяет автоматически определять, когда конкретный абзац или предложение было впервые добавлено, и отличать существенные обновления контента от незначительных правок.
Запатентована система для гранулярного датирования контента и его визуализации. Система сегментирует веб-страницу на Data Fragments (фрагменты данных) и отслеживает историю их появления в Date Map (карте дат). Ключевой особенностью является использование нечеткого сравнения (Edit Distance) для игнорирования незначительных изменений, гарантируя, что дата публикации не сбрасывается при мелких правках. Также описан метод визуального отображения возраста фрагментов пользователю.
Система работает в два этапа: отслеживание и отображение.
Отслеживание (Индексирование):
Date Annotation Engine сегментирует контент на фрагменты.Date Map.Edit Distance. Если разница между текущим и историческим фрагментом ниже порога (Threshold Distance), они считаются одинаковыми.Date Map с текущей датой.Отображение (Визуализация):
Date Map и отображает страницу с использованием индикаторов (Indicia), таких как цвет или шрифт, показывающих возраст каждого фрагмента.Высокая. Хотя аспект визуализации (подсветка возраста контента) не используется в публичном поиске, лежащая в основе технология гранулярного анализа возраста контента крайне актуальна. Определение свежести (Freshness), оригинальности контента и понимание эволюции страницы являются критически важными задачами для оценки качества контента в 2025 году. Механизмы, описанные в патенте, предоставляют необходимую инфраструктуру для этого.
Патент имеет важное стратегическое значение для SEO, особенно для стратегий обновления контента (Content Refresh). Он детально раскрывает инфраструктуру, позволяющую Google игнорировать «фейковые» обновления (изменение даты в CMS или незначительные правки текста) благодаря использованию Edit Distance. Это напрямую влияет на то, как система оценивает свежесть страницы и её отдельных частей.
Date Map.Data Fragment и дату его первой публикации (обнаружения системой).Data Fragment пользователю.Date Map.Edit Distance, при котором два фрагмента считаются совпадающими. Определяет чувствительность системы к изменениям контента.Патент разделен на механизм отслеживания дат (Claims 1-8) и механизм их отображения (Claims 9-20).
Claim 1 (Независимый пункт) - Механизм отслеживания: Описывает процесс обновления истории контента.
Search Data Fragments.Date Map для нахождения соответствующего Target Data Fragment.Search Data Fragment добавляется в Date Map и ему присваивается текущая дата как дата первой публикации.Claim 4 (Зависимый от 1) - Нечеткое сравнение (Fuzzy Matching): Уточняет механизм сравнения на шаге 3.
Соответствие определяется, если Edit Distance между поисковым и целевым фрагментами меньше определенного порогового значения (Threshold Distance). Это означает, что система использует нечеткое сравнение и игнорирует незначительные изменения (например, исправление опечаток), не сбрасывая возраст контента.
Claim 5 (Зависимый от 1) - Игнорирование порядка слов:
Термины в Search Data Fragment могут быть упорядочены в алфавитно-цифровом порядке перед сравнением. Это позволяет системе считать фрагменты идентичными, даже если порядок слов в них изменился.
Claim 9 (Независимый пункт) - Механизм отображения: Описывает процесс визуализации возраста контента.
Date Map или текущая дата, если фрагмент новый).Indicia (например, цвета или шрифта) для визуальной передачи даты публикации каждого фрагмента.Изобретение применяется преимущественно на этапе индексирования для анализа эволюции контента.
CRAWLING – Сканирование и Сбор данных
Web Crawling Engine обнаруживает и загружает контент веб-страницы, инициируя процесс анализа дат.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента. Date Annotation Engine анализирует сырой контент, выполняет сегментацию, нормализацию и сравнение с историческими данными в Date Map. Происходит вычисление Edit Distance и обновление Date Map. Дата первой публикации каждого фрагмента извлекается как признак (Feature Extraction).
Примечание: Патент также описывает слой визуализации (через Web Date Server или плагин браузера), который использует данные Date Map для отображения пользователю, но это не является частью стандартной архитектуры ранжирования.
Входные данные:
Date Map для данного URI (если есть).Threshold Distance).Выходные данные:
Date Map, содержащая все фрагменты с датами их первого обнаружения.YMYL-тематики), так как позволяет оценить свежесть конкретных утверждений, а не всей страницы в целом.Date Annotation Engine.Date Map происходит, когда обнаруживается новый Data Fragment, который не имеет совпадения в существующей карте.Threshold Distance. Изменение контента считается новым, только если Edit Distance превышает этот порог.Процесс отслеживания дат (Date Annotation Engine)
Date Map для данного URI. Если не найдена, создается новая.Data Fragments в соответствии с заданной гранулярностью (например, по предложениям).Date Map.Edit Distance между текущим фрагментом и фрагментами в Date Map.Edit Distance меньше установленного Threshold Distance.Date Map с текущей датой.Date Map.Data Fragments.Date Map к конкретной странице.Date Map) для отслеживания дат публикации на уровне отдельных фрагментов (предложений, абзацев), а не только документа в целом.Edit Distance (нечеткое сравнение), удаление стоп-слов и возможность игнорирования порядка слов гарантируют, что дата публикации фрагмента не сбрасывается при исправлении опечаток или легком рерайтинге.Threshold Distance.Date Maps демонстрирует техническую возможность Google точно определять, какая часть контента является свежей, а какая — исторической. Это является необходимой основой для алгоритмов, чувствительных к свежести (QDF), и может использоваться для определения первоисточника контента.Edit Distance.Edit Distance и нормализации специально разработаны для игнорирования таких изменений.Date Map, если сам контент не изменился существенно.Edit Distance.Патент имеет критическое значение для понимания того, как Google интерпретирует свежесть контента. Он подтверждает, что оценка свежести происходит на гранулярном уровне и устойчива к манипуляциям. Для SEO-специалистов это означает, что стратегия обновления контента должна быть основана на добавлении реальной ценности. Система способна точно определить, какая часть страницы была обновлена и когда, что напрямую влияет на сигналы свежести.
Сценарий: Обновление статьи "Лучшие практики SEO"
Действие 1: Незначительное обновление (Игнорируется системой)
Edit Distance минимально (добавление/замена прилагательных, замена "является" на тире). Изменение ниже порога Threshold Distance.Действие 2: Существенное обновление (Регистрируется системой)
Data Fragment. В Date Map он отсутствует.Date Map с текущей датой. Страница получает сигнал свежести, так как содержит контент с разными датами публикации.Означает ли этот патент, что Google знает точную дату написания каждого предложения на моем сайте?
Да, патент описывает инфраструктуру именно для этого. Система создает Date Map, где для каждого фрагмента контента (например, предложения) хранится дата, когда этот фрагмент был впервые обнаружен краулером Google. Это позволяет отслеживать эволюцию контента на гранулярном уровне.
Что такое «Edit Distance» и почему это критично для SEO?
Edit Distance (Расстояние редактирования) — это метрика, показывающая, насколько сильно отличаются две строки текста. Это критично для SEO, так как Google использует её для определения, является ли изменение контента существенным. Если Edit Distance ниже определенного порога, Google считает фрагмент неизменным и сохраняет его оригинальную дату публикации, игнорируя мелкие правки.
Сбросит ли исправление опечаток или замена синонимов дату публикации моего контента?
Согласно патенту, это маловероятно. Система использует пороги Edit Distance и нормализацию (удаление стоп-слов), чтобы игнорировать незначительные изменения. Чтобы дата была обновлена, изменения должны быть существенными и затрагивать смысловое содержание фрагмента.
Что произойдет, если я изменю порядок слов в предложении?
В одном из вариантов реализации (Claim 5) система сортирует слова во фрагменте в алфавитно-цифровом порядке перед сравнением. Если этот вариант используется, изменение порядка слов будет полностью проигнорировано, и фрагмент будет считаться неизменным.
Как этот патент влияет на алгоритмы свежести (Freshness)?
Патент не описывает сам алгоритм ранжирования, но предоставляет для него критически важные данные. Вместо того чтобы оценивать свежесть всей страницы по дате последнего обновления, алгоритмы Freshness могут использовать данные из Date Map, чтобы оценить, какой процент контента является действительно новым и насколько актуальна каждая часть документа.
Эффективно ли менять дату публикации в CMS, чтобы «освежить» статью?
Нет, это неэффективно. Описанный механизм полагается исключительно на фактическое изменение контента, обнаруженное краулером, а не на метаданные, предоставляемые CMS. Если контентные фрагменты остались прежними, Google будет знать их реальный возраст.
Поможет ли этот механизм бороться с воровством контента?
Да, это мощный инструмент для определения первоисточника. Поскольку Google фиксирует дату первого обнаружения каждого конкретного фрагмента текста на каждом URI, он может легко определить, где этот текст появился впервые. Это может использоваться для определения канонического источника.
Как лучше всего обновить старую статью, чтобы Google посчитал ее свежей?
Необходимо внести существенные изменения, которые превысят порог Edit Distance. Лучший подход — добавить новые разделы, абзацы с актуальной информацией или значительно переработать существующие фрагменты, изменив их смысл и структуру, а не просто выполнить поверхностный рерайтинг.
Насколько гранулярно Google отслеживает даты публикации?
Патент указывает, что гранулярность (Data Fragment) может быть настроена на разных уровнях: абзац, предложение, фраза или даже отдельные слова. Это позволяет системе очень точно определять возраст различных частей одной и той же страницы.
Используется ли описанная в патенте функция визуализации возраста контента?
Функция визуализации с помощью цветового кодирования или временных слайдеров не наблюдается в основном поиске Google. Однако инфраструктура для отслеживания дат (Date Maps), описанная в патенте, вероятно, используется внутренними системами для оценки свежести контента.

Индексация
Краулинг
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Свежесть контента
Knowledge Graph

Свежесть контента
Ссылки
Техническое SEO

Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
SERP

Поведенческие сигналы
Ссылки

Поведенческие сигналы
Персонализация
Семантика и интент

Структура сайта
Техническое SEO
Индексация

Структура сайта
Техническое SEO
Ссылки

Local SEO
Ссылки
SERP

Поведенческие сигналы
Ссылки
SERP

Персонализация
Поведенческие сигналы
SERP

Ссылки
Семантика и интент
SERP

Поведенческие сигналы
SERP
