
Google отслеживает историю изменений данных об авторстве (имя автора, ссылки на профили) на веб-странице. Если авторство меняется слишком часто, система определяет, что это не статья одного автора (например, главная страница сайта или агрегатор), и исключает её из специализированной базы данных авторского контента. Это подчеркивает важность стабильных сигналов для E-E-A-T.
Патент решает проблему поддержания чистоты специализированной базы данных авторского контента (Authored-Content Database). Системы идентификации авторства могут ошибочно принимать неавторский контент за авторский. Это происходит, когда документы (называемые resemblance documents) имеют сигналы, похожие на авторский контент (например, байлайны, ссылки на профили), но на самом деле являются агрегаторами, главными страницами новостных сайтов, комментариями или блоками "связанные статьи". Изобретение улучшает точность идентификации истинного авторского контента.
Запатентован метод для выявления и удаления документов, ошибочно классифицированных как авторский контент, путем анализа временной стабильности сигналов авторства. Система отслеживает историю данных об авторстве (sequence of authorship data) для каждого документа. Если эти данные (например, имя автора или ссылка на его профиль) меняются чаще установленного порога (set threshold), система классифицирует документ как нестабильный и удаляет его из базы данных авторского контента.
Механизм основан на предположении, что настоящий авторский контент (статья) редко меняет автора, в то время как страницы-агрегаторы часто меняют отображаемый контент и, следовательно, предполагаемых авторов.
Authored-Content Database, сохраняя Authorship Data (имена, ссылки на профили).Authorship History).set threshold (например, три изменения за определенный период), документ помечается как неавторский контент.blacklisted) в базе данных авторского контента.Низкая (для конкретной реализации) / Средняя (для концепции). Патент подан в 2013 году и напрямую связан с программой Google Authorship (использование rel="author" и привязка к социальным профилям), которая была закрыта в 2014 году. Описанная инфраструктура в том виде, скорее всего, не используется. Однако, концепция использования временной стабильности данных для валидации сигналов и классификации типа контента остается актуальной, особенно в контексте E-E-A-T и идентификации сущностей.
Влияние на современные SEO-стратегии минимальное (3/10). Прямое тактическое применение низкое, так как описанная система Google Authorship не существует. Патент представляет скорее стратегический интерес, демонстрируя, как Google использует исторические данные и стабильность контента/метаданных для валидации сигналов. Это подчеркивает важность консистентности и стабильности информации об авторах (E-E-A-T) на сайте с течением времени.
rel="author" или связь с социальным профилем).author name), ссылки на социальные профили (link URL), идентификатор профиля (profile ID) и информацию о том, как эти данные представлены.Claim 1 (Независимый пункт): Описывает основной метод поддержания базы данных авторского контента.
sequence of authorship data) для документа, проиндексированного в authored-content database, в течение определенного периода времени.set threshold).authored-content database.Claim 2 и 3 (Зависимые): Уточняют процесс анализа.
quantifying data changes) между этими двумя наборами.Claim 4 (Зависимый): Приводит пример порогового значения. Установленный порог составляет три или более изменений в течение определенного периода времени.
Claim 5 (Зависимый): Определяет состав данных об авторстве. Последовательность данных об авторстве включает как минимум одно имя автора и информацию, относящуюся к расположению страницы профиля автора (т.е. ссылку на профиль).
Изобретение применяется на этапах сканирования и индексирования для классификации контента и поддержания качества специализированного индекса.
CRAWLING – Сканирование и Сбор данных
Краулер (Crawler) периодически посещает документы, которые ранее были идентифицированы как авторский контент. Он извлекает текущие данные об авторстве (имена, ссылки, разметку, например rel="author") для обновления истории.
INDEXING – Индексирование и извлечение признаков
Это основной этап применения патента.
Authorship Identification Engine обрабатывает извлеченные данные для определения текущих авторов документа.Authorship History для документа, добавляя новую запись или отмечая отсутствие изменений.Processing Framework, например, MapReduce) анализирует историю изменений, подсчитывает количество Qualifying Authorship-Data Changes и сравнивает его с Set Threshold.Authored-Content Database или его удалении/занесении в черный список.Входные данные:
Authored-Content Database.Authorship History).Выходные данные:
Authored-Content Database (с удаленными или помеченными документами).YMYL-тематики).Authored-Content Database.Authorship Data, превышающих порог.Set Threshold (например, 3 или более изменений за период).time cutoff, например, 60 дней), чтобы устаревшие изменения игнорировались.white-listed table).Процесс поддержания базы данных авторского контента:
Authored-Content Database наполняется документами, идентифицированными как авторский контент. Для каждого сохраняются исходные Authorship Data.Authorship Data извлекаются из документа.Authorship History. Если набор авторов изменился по сравнению с предыдущей записью (Qualifying Authorship-Data Change), в историю добавляется новое событие.Authorship History за определенный период времени (например, за последние 60 дней).reputation for instability) документа. Изменения, не связанные с авторством (например, реклама), игнорируются.Set Threshold (например, 3).non-authored-content document).blacklisted), с учетом возможных исключений из белого списка.Система фокусируется на данных, связанных с идентификацией автора.
<rel="author" link>.rel=me для связи профилей.social profile page).chain of links), которые ведут от документа к верифицируемому профилю автора.Authorship History) документа во времени.Author name (Имя автора), Link URL (URL ссылки на профиль), Profile ID (Идентификатор профиля).Authorship Data (например, за два дня), если хотя бы одно поле в одном наборе не имеет эквивалента в другом наборе (по имени, ID или ссылке).Resemblance documents), а не статичной статьей одного автора.Qualifying Authorship-Data Changes (имя, ID профиля, ссылка на профиль). Она игнорирует поверхностные изменения на странице (например, в рекламе или комментариях), если они не влияют на основные данные об авторстве.E-E-A-T. Нестабильность ключевой информации может привести к потере доверия системы.ВАЖНО: Прямое практическое применение этого патента ограничено из-за прекращения программы Google Authorship. Выводы ниже основаны на общих принципах работы поисковых систем, извлеченных из патента.
author.url или sameAs), эти URL не должны часто меняться.Qualifying Authorship-Data Change.reputation for instability.Патент подтверждает важность темпорального анализа (анализа данных во времени) в алгоритмах Google. Стабильность и консистентность сигналов, особенно связанных с E-E-A-T и идентификацией сущностей, критически важны для корректной классификации контента и формирования доверия. Нестабильность этих сигналов может привести к тому, что Google будет игнорировать авторство или неправильно классифицировать тип страницы, что сведет на нет усилия по продвижению экспертности авторов.
Сценарий 1: Фильтрация главной страницы новостного сайта
Authorship Identification Engine ошибочно индексирует site.com в Authored-Content Database.Authorship Data для site.com: Авторы А, Б, В.Authorship Data: Авторы Г, Д, Е.Qualifying Authorship-Data Change.Set Threshold (например, 3). Система определяет, что site.com является нестабильным resemblance document, и удаляет его из Authored-Content Database.Сценарий 2: Риск при частых изменениях авторства статьи
Authorship History.E-E-A-T этой страницы.Связан ли этот патент с Google Authorship?
Да, напрямую. Описанные механизмы (использование социальных профилей, rel="author") и время подачи заявки (2013 год) указывают на то, что изобретение решало проблемы качества идентификации в рамках программы Google Authorship. Эта программа была официально закрыта в 2014 году.
Актуален ли этот патент сейчас (в 2025 году)?
В описанном виде — нет. Конкретная реализация (Authored-Content Database на основе Google+) устарела. Однако базовая идея — использование стабильности данных во времени для валидации типа контента — высокоактуальна. Google по-прежнему стремится идентифицировать авторов для оценки E-E-A-T, и стабильность этой информации является важным фактором доверия.
Что такое "Resemblance documents" (Похожие документы)?
Это документы, которые содержат сигналы, похожие на авторский контент, но таковым не являются. Классические примеры: главная страница новостного сайта, на которой отображаются заголовки и авторы последних статей, или страница категории. Система стремится отфильтровать такие документы.
Как система определяет, что изменение является значимым (квалифицирующим)?
Изменение считается значимым (Qualifying Authorship-Data Change), если меняется само идентифицированное авторство: имя автора, ID его профиля или ссылка на профиль. Изменения в тексте статьи, добавление комментариев или смена рекламных блоков игнорируются, если они не затрагивают эти основные данные.
Какой порог изменений используется для удаления документа из базы?
В патенте в качестве примера приводится порог (Set Threshold) в три или более значимых изменений в течение определенного периода времени. Также упоминается использование временного окна, например, 60 дней (time cutoff), за пределами которого старые изменения не учитываются.
Что произойдет, если я легитимно изменю автора статьи (например, при обновлении материала другим экспертом)?
Единичное или редкое изменение допустимо и не приведет к превышению порога нестабильности. Система ищет паттерн частых изменений, характерный для агрегаторов. Если вы измените автора один раз при существенном обновлении контента, это не вызовет проблем. Важно поддерживать стабильность после изменения.
Как этот патент влияет на E-E-A-T?
Косвенно. Он демонстрирует, что консистентность и стабильность сигналов, связанных с авторством и экспертизой, важны для Google. Если информация об авторе постоянно меняется, это может подорвать доверие к источнику и негативно сказаться на оценке E-E-A-T, так как система не сможет надежно связать контент с автором.
Нужно ли мне беспокоиться об этом патенте при редизайне сайта или смене CMS?
Да, если эти изменения затрагивают способ отображения, верстку или микроразметку авторов. Резкое изменение сигналов может быть зафиксировано как изменение. Важно убедиться, что после обновления система по-прежнему корректно и стабильно идентифицирует автора, и избегать частых изменений в реализации.
Применяется ли этот метод к разметке Schema.org/Author?
В патенте разметка Schema.org не упоминается, он фокусируется на rel="author" и анализе контента. Однако абсолютно логично предположить, что современные системы Google применяют аналогичный подход к анализу стабильности данных об авторстве, полученных из микроразметки.
Что такое "репутация нестабильности" (reputation for instability)?
Это внутренняя метрика, упомянутая в патенте, которая количественно оценивает, как часто меняются данные об авторстве для конкретного документа в течение определенного временного окна. Чем выше эта метрика, тем больше вероятность того, что документ является динамическим, а не стабильной авторской работой.

EEAT и качество
Свежесть контента
SERP

Индексация
Мультимедиа

Индексация
Мультимедиа

EEAT и качество
Индексация
Краулинг

Свежесть контента
Индексация
Техническое SEO

Local SEO
Поведенческие сигналы

Local SEO
Семантика и интент
Поведенческие сигналы

Ссылки
Антиспам
Краулинг

Персонализация
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
Персонализация
EEAT и качество

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Ссылки
SERP

Поведенческие сигналы
Персонализация
Local SEO
