Анализ патента, лежащего в основе Google Authorship. Описан механизм верификации авторства путем создания замкнутого цикла ссылок: от контента к профилю автора (используя атрибуты вроде rel=»author») и обратно от профиля к сайту с контентом (используя атрибуты вроде rel=»contributor-to»). Также описан альтернативный метод через верификацию email-адреса автора.
Описание
Какую задачу решает
Патент решает проблему валидации заявлений об авторстве в интернете. Он направлен на предотвращение ситуаций, когда контент ложно приписывается определенному лицу или организации (entity), которые его не создавали (например, через поддельные bylines). Цель — создать надежный механизм для подтверждения личности автора контента.
Что запатентовано
Запатентована система подтверждения авторства, основанная на анализе связей между контентом и профилем автора. Основной механизм требует двустороннего подтверждения (петли): контент должен ссылаться на профиль автора с использованием first predefined authorship attribute (например, rel=»author»), а профиль должен ссылаться обратно на сайт с контентом, используя second predefined authorship attribute (например, rel=»contributor-to»). Также описан альтернативный метод через верификацию Authorship Identifiers (например, email).
Как это работает
Система функционирует путем анализа ссылочных связей и идентификаторов:
- Заявление авторства: В документе размещается ссылка на профиль автора с атрибутом типа rel=»author» или rel=»me».
- Траверс ссылок: Система следует по этой ссылке. Патент поддерживает косвенные связи через chain of links (цепочку ссылок).
- Валидация обратной связи: Система проверяет, содержит ли конечный профиль автора обратную ссылку на исходный веб-сайт с атрибутом типа rel=»contributor-to».
- Подтверждение: Если цикл замыкается, авторство подтверждается.
- Альтернативный метод: Система может проверить, был ли Authorship Identifier (например, email или byline) в документе предварительно верифицирован автором для использования на этом домене.
Актуальность для SEO
Низкая для конкретной реализации. Патент описывает техническую основу программы Google Authorship. Google официально прекратил поддержку этой программы и обработку разметки rel=»author» для этих целей много лет назад (около 2014-2016 гг.). Описанные технические методы устарели.
Важность для SEO
Прямое влияние на современные SEO-стратегии минимальное (3/10), так как описанная технология устарела. Внедрение rel=»author» неэффективно. Однако патент имеет высокое концептуальное значение, демонстрируя ранние усилия Google по верификации сущностей авторов. Это заложило основу для понимания важности авторства в контексте E-E-A-T, хотя методы верификации с тех пор эволюционировали (например, к Schema.org и Knowledge Graph).
Детальный разбор
Термины и определения
- Authorship Attribute (Атрибут авторства)
- Специальный атрибут ссылки, используемый для заявления или подтверждения авторства. Разделяется на первый и второй типы.
- First Predefined Authorship Attribute (Первый предопределенный атрибут авторства)
- Атрибут в ссылке из контента на профиль, заявляющий об авторстве. Примеры в патенте: rel=»author», rel=»me».
- Second Predefined Authorship Attribute (Второй предопределенный атрибут авторства)
- Атрибут в ссылке из профиля на сайт с контентом, подтверждающий вклад автора в этот сайт. Пример в патенте: rel=»contributor-to».
- Authorship Identifier (Идентификатор авторства)
- Данные в документе, идентифицирующие автора, например, адрес электронной почты (email address) или строка подписи (byline). Используется в альтернативном методе верификации.
- Chain of links (Цепочка ссылок)
- Последовательность ссылок между исходным документом и профилем автора, где каждая ссылка содержит first predefined authorship attribute. Позволяет подтверждать авторство косвенно.
- Entity (Сущность)
- Автор контента: человек, группа людей или организация.
- Profile (Профиль)
- Документ, связанный с сущностью автора, используемый для верификации. Также называется trusted document.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной механизм подтверждения авторства через анализ косвенных связей (цепочки ссылок).
- Система получает доступ к первому документу на первом веб-сайте.
- Первый документ косвенно связан со вторым документом через цепочку ссылок (chain of links).
- Каждая ссылка в цепочке содержит first predefined authorship attribute (например, rel=»author»).
- Авторство первого документа условно подтверждается, ТОЛЬКО ЕСЛИ второй документ содержит вторую ссылку, указывающую обратно на первый веб-сайт.
- Эта обратная ссылка должна содержать second predefined authorship attribute (например, rel=»contributor-to»), подтверждающий, что сущность является автором или участником контента на первом веб-сайте.
Ядро изобретения — это требование двустороннего подтверждения (петли или «рукопожатия») для верификации авторства, даже если связь между контентом и профилем осуществляется через промежуточные документы.
Claim 3 (Зависимый): Детализирует процесс обхода.
Система обходит ссылки в цепочке, начиная с первого документа, до тех пор, пока не будет найден второй документ, содержащий необходимую обратную ссылку и атрибут.
Claim 4 (Зависимый): Определяет результат при неудачной верификации.
Если второй документ с требуемыми условиями не найден, система определяет, что первый документ имеет неподтвержденное авторство (non-confirmed authorship).
Claim 13 (Зависимый): Описывает действие после успешного подтверждения.
В ответ на подтверждение авторства система ассоциирует первый документ с сущностью в поисковом индексе (search index).
Где и как применяется
Изобретение применяется на этапах сбора и обработки данных для установления связей между контентом и сущностями авторов.
CRAWLING – Сканирование и Сбор данных
На этом этапе система собирает документы (контент и профили) и извлекает ссылки и их атрибуты, а также Authorship Identifiers.
INDEXING – Индексирование и извлечение признаков
Основной этап применения. Authorship Confirmation Module анализирует собранные данные:
- Анализ атрибутов: Идентификация наличия predefined authorship attributes.
- Траверс ссылок: Система следует по цепочкам ссылок для поиска петли подтверждения.
- Валидация идентификаторов: Проверка Authorship Identifiers (email/byline) и их статуса подтверждения для домена.
- Ассоциация: При успешном подтверждении система ассоциирует документ с сущностью автора в поисковом индексе (Search Index).
Входные данные:
- Документы (контент и профили) и их URL/домены.
- Ссылки внутри документов и их атрибуты (rel=»author», rel=»contributor-to» и т.д.).
- (Альтернативно) Authorship Identifiers, извлеченные из контента.
- (Альтернативно) База данных профилей с подтвержденными идентификаторами.
Выходные данные:
- Статус авторства документа (confirmed или non-confirmed).
- Связь между документом и сущностью автора в поисковом индексе.
На что влияет
- Конкретные типы контента: Влияет на контент, где авторство имеет значение (статьи, блоги, новости, академические работы).
- Специфические запросы: Влияет на запросы, где авторство может служить сигналом качества или где пользователи ищут контент конкретного автора.
Когда применяется
- Триггеры активации (Метод ссылок): Наличие в документе ссылки с first predefined authorship attribute (например, rel=»author»).
- Триггеры активации (Метод идентификаторов): Наличие в документе Authorship Identifier (email, byline).
- Условия подтверждения: Успешное замыкание петли подтверждения (наличие обратной ссылки с second predefined authorship attribute) ИЛИ наличие подтвержденного статуса для идентификатора авторства на данном домене.
Пошаговый алгоритм
Алгоритм А: Подтверждение через атрибуты ссылок
- Доступ к документу: Система получает доступ к первому документу на первом сайте.
- Идентификация заявления: Поиск ссылок с first predefined authorship attribute (например, rel=»author»).
- Инициализация траверса: Если заявление найдено, начать обход цепочки ссылок.
- Траверс цепочки: Переход к целевому документу. Проверка наличия дальнейших ссылок с first predefined authorship attribute. Повторение процесса до конца цепочки.
- Анализ конечного документа (Профиля): Система анализирует конечный документ в цепочке (второй документ).
- Валидация обратной связи: Поиск ссылки на первый сайт, содержащей second predefined authorship attribute (например, rel=»contributor-to»).
- Принятие решения: Если валидация успешна (петля замкнута), авторство подтверждается. В противном случае присваивается статус non-confirmed authorship.
- Пост-обработка: При подтверждении обновить поисковый индекс, связав документ с сущностью.
Алгоритм Б: Подтверждение через идентификаторы (Альтернативный метод, описанный в патенте)
- Доступ к документу: Система получает доступ к документу на определенном домене.
- Извлечение идентификатора: Извлечение Authorship Identifier (email, byline).
- Поиск профиля: Поиск профиля сущности, связанного с этим идентификатором.
- Проверка статуса: Проверка Confirmation Status в профиле. Определяет, подтвердила ли сущность (например, через email-верификацию), что она использует этот идентификатор для публикаций на данном домене.
- Принятие решения: Если статус подтвержден, авторство документа подтверждается.
Какие данные и как использует
Данные на входе
- Ссылочные факторы: Критически важные данные. Используются целевые адреса ссылок (URL/URI) и специфические атрибуты ссылок: rel=»author», rel=»me» (как first attribute) и rel=»contributor-to» (как second attribute).
- Технические факторы: URL и доменные имена используются для идентификации документов и веб-сайтов при проверке обратных ссылок.
- Контентные факторы (Идентификаторы): В альтернативном методе используются данные из контента: адреса электронной почты (email address) и строки подписи (byline).
- Данные профиля: Информация из профиля автора, включая подтвержденные идентификаторы и связанные сайты.
Какие метрики используются и как они считаются
Патент не описывает вычисление метрик, оценок (scores) или использование машинного обучения. Процесс подтверждения является детерминированным и бинарным:
- Наличие атрибутов: Проверяется точное наличие предопределенных атрибутов в ссылках.
- Структура связей (Петля): Проверяется наличие замкнутого цикла между контентом и профилем через требуемые атрибуты, включая возможность прохода через цепочку ссылок.
- Статус верификации идентификатора: Бинарная проверка (подтвержден/не подтвержден) для Authorship Identifier на данном домене.
Выводы
- Двустороннее подтверждение как основа доверия: Ключевой элемент системы — требование двустороннего подтверждения («рукопожатия»). Недостаточно заявить об авторстве в контенте; автор должен подтвердить связь с сайтом в своем профиле. Это предотвращает ложное приписывание авторства.
- Гибкость через цепочки ссылок: Система поддерживает не только прямые ссылки, но и chain of links (например, Статья -> Страница автора на сайте -> Внешний профиль), что обеспечивает гибкость внедрения.
- Множественные методы валидации: Патент описывает два подхода: основанный на структуре ссылок (rel атрибуты) и основанный на идентификаторах (email/byline), что показывает комплексный подход к верификации.
- Связывание контента с сущностями: Конечная цель — надежно связать документ с конкретной Entity (автором) в поисковом индексе, что является фундаментом для оценки авторитетности.
- Устаревание технической реализации: Самый важный вывод для современного SEO: описанная реализация (Google Authorship через rel=»author») полностью устарела и не используется Google. Прямое применение этих методов невозможно.
Практика
Best practices (это мы делаем)
ВАЖНО: Специфические технические механизмы (rel=»author» и т.д.), описанные в патенте, устарели. Однако, исходя из принципов патента (важность верификации авторства), актуальны следующие практики:
- Использование актуальной разметки (Schema.org): Вместо устаревших rel атрибутов используйте современную структурированную разметку. Указывайте автора через свойство author (типа Person или Organization) в разметке контента (Article, BlogPosting).
- Создание полных профилей авторов: Поддерживайте подробные профили авторов. Принцип связи между контентом и профилем, заложенный в патенте, остается актуальным. Используйте свойство sameAs в Schema.org для связи профиля автора с его внешними авторитетными профилями (соцсети, Knowledge Graph).
- Четкое указание авторства (Byline): Используйте явные и последовательные подписи (bylines) в контенте. Это один из Authorship Identifiers, упомянутых в патенте, и остается важным сигналом для E-E-A-T.
- Обеспечение двусторонней связи (Концептуально): Поддерживайте принцип двусторонней связи: сайты должны ссылаться на профили авторов, а авторы в своих профилях (например, в соцсетях) должны указывать ссылки на сайты, для которых они пишут.
Worst practices (это делать не надо)
- Внедрение устаревшей разметки Google Authorship: Тратить ресурсы на внедрение rel=»author», rel=»me» или rel=»contributor-to». Эта разметка игнорируется Google для целей, описанных в патенте.
- Ложные заявления об авторстве: Приписывать контент известным экспертам без их ведома. Патент был направлен на борьбу именно с этой практикой, требуя подтверждения со стороны автора.
- Игнорирование авторства: Публикация контента (особенно в YMYL-тематиках) анонимно или без указания квалификации авторов.
Стратегическое значение
Патент имеет важное историческое и стратегическое значение. Он фиксирует попытку Google внедрить формализованную систему верификации авторов. Хотя эта реализация была свернута, она подчеркнула стратегический приоритет Google на идентификацию сущностей (авторов) и их связь с контентом. Это стало фундаментом для развития оценки авторитетности и экспертизы в рамках E-E-A-T. Стратегически это подтверждает, что долгосрочное SEO должно фокусироваться на построении реальной экспертизы и ее четкой, проверяемой демонстрации.
Практические примеры
Сценарий: Внедрение Google Authorship (Исторический пример, ок. 2012 г.)
Этот пример демонстрирует, как работала система, описанная в патенте. В настоящее время этот метод не работает и не должен использоваться.
- Действие Автора (Контент): Автор публикует статью на сайте example.com/article и ставит ссылку на свой профиль в Google+ с атрибутом rel=»author».
Код: <a href=»http://plus.google.com/johndoe» rel=»author»>John Doe</a>. (Это First Predefined Authorship Attribute). - Действие Автора (Профиль): В своем профиле Google+ автор добавляет ссылку на сайт example.com в разделе «Мои публикации» (Contributor to). Система автоматически добавляла атрибут rel=»contributor-to». (Это Second Predefined Authorship Attribute).
- Действие Системы: Googlebot сканирует статью, следует по ссылке rel=»author» на профиль, обнаруживает обратную ссылку rel=»contributor-to» на исходный домен.
- Результат (в 2012 г.): Авторство подтверждено. В SERP могло отображаться фото автора.
- Результат (Сейчас): Разметка игнорируется.
Вопросы и ответы
Стоит ли мне внедрять атрибут rel=»author» на моем сайте, основываясь на этом патенте?
Нет. Этот патент описывает систему Google Authorship, которая была официально закрыта Google много лет назад. Атрибут rel=»author» больше не используется поисковой системой для подтверждения авторства или отображения информации об авторе в сниппетах. Внедрение этого атрибута не принесет пользы для SEO.
Какое значение имеет этот патент, если описанная система устарела?
Патент имеет важное концептуальное значение. Он демонстрирует, как Google подходит к валидации утверждений: требуется двустороннее подтверждение (петля или «рукопожатие»). Это помогает понять, почему для E-E-A-T важны не просто заявления об экспертности на вашем сайте, но и подтверждения этих заявлений из внешних или верифицированных источников.
Как подтверждать авторство контента сегодня?
Вместо rel=»author» следует использовать микроразметку Schema.org. В разметке контента (например, Article) используйте свойство author, указывая сущность типа Person. В разметке Person используйте свойство sameAs для связи с авторитетными профилями автора для помощи в распознавании сущности (Entity Reconciliation).
Что такое «цепочка ссылок» (Chain of links) в контексте подтверждения авторства?
Цепочка ссылок позволяет подтверждать авторство косвенно. Например, Статья А ссылается на Страницу Автора Б (с rel=»author»), а Страница Автора Б ссылается на Внешний Профиль В (с rel=»me»). Если Профиль В подтверждает вклад в сайт Статьи А (с rel=»contributor-to»), авторство подтверждается через эту цепочку.
Что такое «Authorship Identifier» и как он работает?
Authorship Identifier — это альтернативный метод подтверждения, описанный в патенте. Это может быть адрес электронной почты или строка подписи (byline) в статье. Авторство подтверждается, если автор заранее валидировал этот идентификатор для данного домена (например, через email-подтверждение), доказав, что он действительно публикуется на этом сайте.
Как этот патент связан с E-E-A-T и Knowledge Graph?
Патент описывает инфраструктуру для надежного связывания контента с сущностями (авторами). Это является необходимым условием для построения Knowledge Graph и оценки экспертности и авторитетности (E-E-A-T). Хотя реализация изменилась, цель осталась прежней — идентифицировать и валидировать авторов.
Описывает ли патент, как подтвержденное авторство влияет на ранжирование?
Нет. Патент сфокусирован исключительно на механизме подтверждения (валидации) авторства. Он не описывает, как именно эта информация используется в алгоритмах ранжирования. Однако он указывает (Claim 13), что после подтверждения система ассоциирует документ с сущностью в поисковом индексе, делая данные доступными для других систем.
Что происходит, если заявление об авторстве не подтверждено?
Если система не может найти петлю подтверждения или валидированный идентификатор, документу присваивается статус non-confirmed authorship. Это означает, что система не может надежно связать контент с заявленным автором.
Чем отличаются атрибуты rel=»author», rel=»me» и rel=»contributor-to»?
rel=»author» и rel=»me» используются для ссылки из контента на профиль автора (first attribute), указывая на того, кто создал контент или на другой профиль того же автора. rel=»contributor-to» используется для ссылки из профиля автора обратно на сайт с контентом (second attribute), подтверждая, что автор предоставляет контент для этого сайта.
Требует ли система, чтобы профиль автора был на том же домене, что и контент?
Нет. Патент явно указывает, что второй документ (профиль) может быть размещен как на том же домене (first domain), так и на отдельном домене (second domain). Главное требование — наличие замкнутого цикла ссылок с необходимыми атрибутами между контентом и профилем.