Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google проверяет и использует консенсус в структурированных данных для формирования прямых ответов в поиске

    PROVIDING THIRD PARTY ANSWERS (Предоставление ответов от третьих сторон)
    • US9824161B1
    • Google LLC
    • 2017-11-21
    • 2013-11-08
    2013 EEAT и качество Антиспам Патенты Google Семантика и интент

    Google анализирует структурированные данные (например, Schema.org) на страницах из результатов поиска. Чтобы проверить достоверность информации перед показом ее в виде прямого ответа (например, Featured Snippet), система ищет «согласованное значение» (Consistent Value). Это требует, чтобы одинаковые данные подтверждались на нескольких независимых, тематически релевантных и авторитетных сайтах.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает две основные проблемы: (1) необходимость пользователя переходить по нескольким ссылкам для поиска конкретного факта и (2) риск отображения неточной или спамной информации, предоставленной третьими сторонами через структурированные данные. Цель изобретения — предоставить краткий и достоверный ответ непосредственно на SERP, используя механизм валидации сторонних данных.

    Что запатентовано

    Запатентована система для извлечения, валидации и отображения информации из структурированных данных (Structured Data), найденных в результатах поиска. Ключевым элементом является механизм валидации через консенсус: система ищет Consistent Value (согласованное значение) для определенного свойства на нескольких независимых ресурсах. Если консенсус, подтвержденный тематикой и авторитетностью источников, найден, система генерирует прямой ответ (Representation).

    Как это работает

    Система работает следующим образом:

    • Получение результатов и данных: После получения результатов поиска Structured Data Validator извлекает структурированные данные из топовых ресурсов.
    • Анализ тематики: Topic Engine определяет темы (Topics) этих ресурсов.
    • Валидация (Поиск Консенсуса): Система ищет Consistent Value — идентичные или похожие значения для одного свойства на разных сайтах. При этом критически важно, чтобы сайты имели совпадающую тему (matching topic).
    • Взвешивание: Консенсус взвешивается с учетом рангов сайтов в поиске, их авторитетности и исторических данных о поведении пользователей (records of user selections).
    • Генерация ответа: Если согласованное значение найдено, Structured Data Result Provider использует Template Database для форматирования ответа в зависимости от типа данных (например, цитата, рецепт) и отображает его на SERP.

    Актуальность для SEO

    Высокая. Структурированные данные (Schema.org) и генерация прямых ответов (Featured Snippets, Knowledge Panels) являются фундаментальными элементами современного поиска Google. Этот патент описывает конкретный механизм, как Google обеспечивает достоверность этих ответов, опираясь на консенсус в вебе, что критически важно для поддержания качества поиска и борьбы с дезинформацией.

    Важность для SEO

    Влияние на SEO значительно (85/100). Патент напрямую влияет на стратегии использования микроразметки и оптимизации под Featured Snippets. Он показывает, что для успеха недостаточно просто внедрить разметку; необходимо, чтобы данные были фактически точными и соответствовали консенсусу среди авторитетных, тематически релевантных сайтов. Также подчеркивается, что более высокое ранжирование и авторитетность увеличивают вес данных сайта в механизме валидации.

    Детальный разбор

    Термины и определения

    Consistent Value (Согласованное значение)
    Значение для определенного свойства в структурированных данных, которое идентифицировано как идентичное или похожее на нескольких независимых ресурсах в результатах поиска. Является основой для генерации ответа.
    Matching Topic (Совпадающая тема)
    Критическое условие, при котором ресурсы, участвующие в формировании консенсуса, должны относиться к одной и той же теме. Ресурсы без совпадающей темы исключаются из расчета консенсуса.
    Structured Data (Структурированные данные)
    Данные, организованные с использованием стандартизированной разметки (например, Schema.org, microformats), предоставляемые владельцами сайтов (третьими сторонами).
    Property (Свойство) и Value (Значение)
    Компоненты структурированных данных. Например, Property=»author», Value=»Albert Einstein».
    Representation (Представление/Ответ)
    Сформированный блок информации (прямой ответ), основанный на Consistent Value, который отображается на странице результатов поиска (например, Featured Snippet).
    Structured Data Validator (Валидатор структурированных данных)
    Компонент системы, который извлекает структурированные данные и определяет наличие Consistent Value, анализируя консенсус, ранги, темы и поведение пользователей.
    Topic Engine (Движок определения тем)
    Компонент, определяющий темы ресурсов. Используется для обеспечения контекстуальной релевантности при поиске консенсуса.
    Authoritative Score (Оценка авторитетности)
    (Упомянуто в описании) Метрика достоверности ресурса. Высокая оценка может позволить отобразить ответ даже из одного источника без консенсуса, если он признан particularly authoritative.

    Ключевые утверждения (Анализ Claims)

    Патент содержит несколько ключевых независимых пунктов, фокусирующихся на роли тематики в валидации данных.

    Claim 1 (Независимый пункт): Описывает метод валидации с акцентом на консенсус строго внутри тематического кластера.

    1. Система получает результаты поиска (веб-ресурсы).
    2. Для каждого ресурса система: (i) идентифицирует структурированные данные, (ii) идентифицирует тему (topic) ресурса, (iii) определяет текстовые значения и связанные свойства.
    3. Определяется Consistent Value. Это основано на количестве различных веб-ресурсов, которые одновременно: (a) имеют совпадающую тему (matching topic) И (b) содержат идентичное текстовое значение и свойство.
    4. Критическое условие: При подсчете этого количества исключаются (exclusive of) ресурсы, которые не имеют совпадающей темы.
    5. В ответ система предоставляет Representation этого значения как возможный ответ.

    Это утверждение подчеркивает, что консенсус должен быть тематически релевантным. Совпадения данных на сайтах разных тематик игнорируются при формировании ответа.

    Claims 2 и 3 (Зависимые от 1): Уточняют, что определение Consistent Value также зависит от:

    • Рангов ресурсов в результатах поиска (Claim 2). Более высокий ранг дает больший вес в консенсусе.
    • Записей о выборе пользователей (records of user selections) в ответ на ранее предоставленную информацию (Claim 3). Поведенческие данные служат обратной связью для оценки качества ответа.

    Claim 5 (Независимый пункт): Описывает альтернативный метод валидации с анализом тематического ландшафта SERP, включая расхождения.

    1. Система получает результаты и извлекает структурированные данные.
    2. Определяется Consistent Value на основе идентичности данных в разных ресурсах.
    3. Ключевое уточнение: Это определение частично основано на темах согласующихся ресурсов И на темах ресурсов, которые, как определено, НЕ содержат согласованного значения.
    4. Система предоставляет Representation.

    Система анализирует контекст расхождений. Если сайты, противоречащие консенсусу, принадлежат к другой тематике, это может усилить доверие к консенсусу внутри релевантной тематики.

    Где и как применяется

    Изобретение интегрировано в несколько этапов поискового процесса.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе происходит предварительное извлечение Structured Data из ресурсов. Также Topic Engine анализирует ресурсы для определения их тем. Могут рассчитываться Authoritative Scores. Эти данные сохраняются для использования в реальном времени.

    RANKING – Ранжирование
    Основная поисковая система генерирует набор релевантных результатов и определяет их ранги. Эти ранги являются важным входным сигналом (весовым коэффициентом) для валидации структурированных данных.

    METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
    Основной этап применения патента (генерация SERP Features).

    1. Анализ выдачи: Structured Data Validator анализирует извлеченные структурированные данные и темы топовых ресурсов, полученных на этапе RANKING.
    2. Определение консенсуса: Валидатор ищет Consistent Value, используя ранги, тематическое соответствие (matching topic) и поведенческие сигналы.
    3. Генерация и Внедрение: Если консенсус найден, Structured Data Result Provider генерирует ответ (Representation), который затем внедряется в финальную выдачу (SERP), часто на «нулевой позиции».

    Входные данные:

    • Ранжированный набор результатов поиска.
    • Извлеченные структурированные данные (Properties и Values) для каждого ресурса.
    • Темы ресурсов (от Topic Engine).
    • Исторические данные о поведении пользователей (Records of user selections).
    • (Опционально) Оценки авторитетности ресурсов (Authoritative Scores).

    Выходные данные:

    • Страница результатов поиска (SERP) с интегрированным прямым ответом (Representation), основанным на проверенных структурированных данных.

    На что влияет

    • Конкретные типы контента: Влияет на любой контент, размеченный структурированными данными: рецепты, продукты (E-commerce), события, цитаты (как в примере патента), факты о сущностях (люди, организации, фильмы, книги).
    • Специфические запросы: Наибольшее влияние на информационные запросы, где пользователь ищет конкретный факт или определение (например, «ингредиенты для блюда Y», «автор цитаты X»).

    Когда применяется

    Алгоритм применяется при выполнении следующих условий:

    • Наличие данных: Ресурсы в топе выдачи содержат релевантные структурированные данные.
    • Достижение консенсуса: Structured Data Validator успешно определяет Consistent Value. Это требует, чтобы достаточное количество ресурсов согласились по значению свойства, и чтобы эти ресурсы имели схожие темы (matching topic) и достаточный авторитет/ранг.
    • Исключения: В описании патента (не в Claims) указано, что система может представить значение даже из одного источника, если этот источник имеет очень высокий Authoritative Score (определен как particularly authoritative).

    Пошаговый алгоритм

    1. Получение и ранжирование результатов: Система генерирует первичный набор ранжированных результатов для запроса.
    2. Извлечение данных и тем: Structured Data Validator получает доступ к структурированным данным (Properties и Values) и темам (от Topic Engine) для ресурсов в выдаче.
    3. Идентификация кандидатов: Валидатор группирует значения по свойствам, найденным в разных ресурсах.
    4. Определение консенсуса (Consistent Value Determination): Для каждого кандидата система оценивает уровень согласованности. Это многофакторный процесс:
      • Тематический фильтр: Исключение ресурсов, не имеющих совпадающей темы (matching topic) (согласно Claim 1).
      • Подсчет совпадений: Подсчет количества оставшихся ресурсов с идентичным или похожим значением.
      • Взвешивание по рангу и авторитету: Придание большего веса значениям с сайтов, ранжирующихся выше (согласно Claim 2) или имеющих высокий Authoritative Score.
      • Анализ расхождений: Изучение тем сайтов, которые предоставляют конфликтующие данные (согласно Claim 5).
    5. Валидация на основе поведения: Учет исторических данных (records of user selections) для проверки удовлетворенности пользователей этим ответом ранее (согласно Claim 3).
    6. Выбор лучшего значения: Выбирается значение с наивысшей оценкой согласованности. Если порог уверенности превышен, оно принимается как Consistent Value.
    7. Генерация ответа: Structured Data Result Provider выбирает соответствующий шаблон из Template Database на основе типа данных.
    8. Формирование SERP: Сгенерированный ответ (Representation) вместе с атрибуцией источника внедряется в страницу результатов поиска.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании следующих данных для валидации и генерации ответов:

    • Структурные факторы (Ключевые): Structured Data (микроразметка). Система анализирует Properties и Values, предоставленные третьими сторонами.
    • Поведенческие факторы: Records of user selections. Используются для оценки качества и релевантности ответа. Если пользователи часто игнорируют ответ, доверие к нему снижается.
    • Системные данные (Контекст и Авторитет):
      • Ранги ресурсов: Используются как весовой коэффициент при определении консенсуса.
      • Темы ресурсов (Topics): Полученные от Topic Engine, критически важны для обеспечения того, что консенсус достигается в рамках релевантного контекста (matching topic).
      • Authoritative Score: (Упомянуто в описании). Оценка авторитетности ресурса, которая может влиять на принятие решения даже без консенсуса. Патент упоминает, что она может основываться на обратной связи, идентичности источника или ссылочных данных (how many other resources reference the resource).

    Какие метрики используются и как они считаются

    Конкретные формулы не приводятся, но описаны следующие метрики и факторы:

    • Оценка согласованности (Consistency Score — неявная метрика): Агрегированная оценка, определяющая уверенность системы в Consistent Value. Она положительно коррелирует с:
      • Количеством ресурсов с идентичным/похожим значением в рамках одной темы.
      • Рангами и авторитетностью этих ресурсов.
      • Историческими данными об удовлетворенности пользователей.
    • Тематическое соответствие (Matching Topic): Метрика, определяющая принадлежность ресурсов к одному тематическому кластеру. Ресурсы вне кластера исключаются из расчета.

    Выводы

    1. Валидация через консенсус (Wisdom of the Crowd): Основная идея патента — Google не доверяет слепо структурированным данным с одного сайта. Система требует подтверждения (Consistent Value) на других независимых ресурсах, прежде чем представить информацию как факт в прямом ответе. Это механизм защиты от спама и ошибок.
    2. Тематический контекст критичен (Topical Authority): Консенсус ищется строго среди ресурсов с совпадающими темами (matching topics) (Claim 1). Это предотвращает ложные срабатывания, когда одинаковые значения используются в разных контекстах. Система также анализирует тематику сайтов, противоречащих консенсусу (Claim 5).
    3. Ранг и авторитет как факторы доверия (Weighted Consensus): Позиция сайта в результатах поиска (Claim 2) и его общая авторитетность (Authoritative Score) напрямую влияют на его вес при определении консенсуса. Данные с авторитетных сайтов считаются более надежными.
    4. Поведенческие сигналы как обратная связь: Система использует исторические данные о кликах (records of user selections) для самокоррекции (Claim 3). Неудовлетворительные ответы отсеиваются.
    5. Исключение для авторитетов: Хотя ядро патента — консенсус, в описании упоминается возможность использования данных из единственного источника с очень высоким Authoritative Score (particularly authoritative).

    Практика

    Best practices (это мы делаем)

    • Внедрять точные и полные структурированные данные: Используйте Schema.org для разметки всего релевантного контента. Точность критична, так как данные будут сверяться с другими сайтами для поиска Consistent Value.
    • Следовать консенсусу в нише: Убедитесь, что ваши данные соответствуют общепринятым фактам и данным на авторитетных сайтах (например, Википедия, официальные источники). Если ваши данные отличаются от данных всех конкурентов, они вряд ли будут выбраны. Используйте стандартные форматы значений.
    • Укреплять тематическую авторитетность (Topical Authority): Система проверяет matching topic. Убедитесь, что ваш сайт и страницы четко сфокусированы на своей тематике, чтобы Google рассматривал их как релевантный источник для формирования консенсуса в этой области.
    • Улучшать общее ранжирование и E-E-A-T: Поскольку ранг ресурса используется как весовой коэффициент, страницы, ранжирующиеся выше, имеют больше шансов стать источником ответа. Высокий Authoritative Score может позволить использовать ваши данные даже без консенсуса.

    Worst practices (это делать не надо)

    • Предоставлять неточные или ложные данные (Spam): Попытка манипулировать ответами через разметку неэффективна. Механизм консенсуса отфильтрует данные, которые не подтверждаются другими авторитетными источниками.
    • Размещение разметки вне контекста: Использование структурированных данных на страницах, тематика которых не соответствует данным. Topic Engine отфильтрует такие попытки, так как условие matching topic не будет выполнено.
    • Использование нестандартных форматов значений: Использование уникальных форматов для значений (например, дат, имен), которые могут помешать системе распознать их как эквивалентные данным на других сайтах, даже если они верны по сути.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Google на предоставление быстрых и достоверных ответов, основанных на данных из веба. Он демонстрирует сложный механизм валидации, объединяющий структурированные данные, алгоритмы ранжирования, тематический анализ и поведенческие факторы. Для SEO-стратегии это означает, что точность данных и авторитетность сайта становятся ключевыми факторами для достижения видимости в блоках с ответами (Position Zero).

    Практические примеры

    Сценарий 1: Валидация рецепта (Консенсус и Ранжирование)

    1. Запрос: «время приготовления лазаньи»
    2. Анализ выдачи: Система анализирует Топ-5 кулинарных сайтов с разметкой Recipe (Свойство: totalTime).
    3. Извлечение данных и тем: Topic Engine подтверждает, что все сайты относятся к кулинарии (matching topic).
      • Сайт 1 (Ранг 1): 60 минут
      • Сайт 2 (Ранг 2): 55-65 минут
      • Сайт 3 (Ранг 3): 60 минут
      • Сайт 4 (Ранг 4): 20 минут (ошибка или экспресс-рецепт)
    4. Определение консенсуса: Система видит, что большинство высокоранжированных сайтов (1, 2, 3) указывают время около 60 минут. Значение Сайта 4 игнорируется как выброс.
    5. Результат: Генерация Representation (Featured Snippet) с указанием времени «60 минут», вероятно, с атрибуцией Сайта 1.

    Сценарий 2: Влияние тематики (Matching Topic)

    1. Запрос: «Высота Эвереста»
    2. Анализ выдачи: В топе сайты о географии и новостной сайт.
    3. Извлечение данных:
      • Сайт А (Ранг 1, Тема=География): 8848.86 м
      • Сайт Б (Ранг 2, Тема=География): 8849 м
      • Сайт В (Ранг 3, Тема=Новости, статья о фильме «Эверест»): Указывает высоту лагеря 5400 м в разметке.
    4. Применение логики патента: Система ищет консенсус среди сайтов с matching topic (География). Сайты А и Б формируют консенсус. Сайт В исключается из расчета высоты горы (согласно Claim 1), так как его контекст или данные относятся к другому объекту (лагерь vs вершина), или его основная тема не совпадает.
    5. Результат: Генерация ответа «8848.86 м» или «8849 м».

    Вопросы и ответы

    Как система определяет, является ли значение «согласованным» (Consistent Value)?

    Система использует комбинацию факторов для определения консенсуса. Ключевыми являются: количество независимых сайтов с идентичным значением; совпадение тем этих сайтов (matching topic); и ранги этих сайтов в поиске (чем выше ранг, тем больше вес). Также учитываются исторические данные о кликах пользователей на этот ответ.

    Что произойдет, если структурированные данные на моем сайте отличаются от данных конкурентов?

    Если ваши данные сильно отличаются от консенсуса авторитетных сайтов, система, скорее всего, проигнорирует их при генерации прямого ответа, так как не сможет их валидировать. Исключение возможно, если ваш сайт обладает исключительно высоким Authoritative Score, но в общем случае стратегически важно придерживаться общепринятых фактов.

    Какова роль «Тематического движка» (Topic Engine) в этом процессе?

    Его роль критически важна. Claim 1 патента явно указывает, что ресурсы, не имеющие совпадающей темы (matching topic), исключаются из расчета согласованности. Это гарантирует, что консенсус оценивается в правильном контексте и предотвращает ложные срабатывания из-за случайных совпадений на нерелевантных сайтах.

    Связан ли этот патент с блоками ответов (Featured Snippets)?

    Да, напрямую. Патент описывает механизм генерации Representation — прямого ответа на запрос, отображаемого на SERP. Это один из основных способов, которым Google формирует Featured Snippets, особенно те, которые основаны на фактах, списках или инструкциях, размеченных с помощью структурированных данных.

    Как система использует данные о поведении пользователей (user selections)?

    Система использует исторические данные о кликах как механизм обратной связи (Claim 3). Если система показывает ответ, но пользователи его игнорируют и переходят на другой результат (особенно тот, который противоречит ответу), это сигнализирует о низком качестве ответа. В таком случае система может перестать показывать этот Consistent Value.

    Может ли система показать ответ, если только один сайт содержит структурированные данные?

    Согласно основным механизмам (Claims 1 и 5), требуется консенсус между как минимум двумя ресурсами. Однако в описании патента упоминается исключение: система может показать ответ из одного источника, если этот источник имеет очень высокий Authoritative Score (признан particularly authoritative).

    Что важнее для SEO в контексте этого патента: высокий ранг или наличие структурированных данных?

    Необходимо и то, и другое. Структурированные данные предоставляют контент для ответа. Высокий ранг необходим, чтобы страница попала в выборку для анализа, и он же служит важным весовым коэффициентом (фактором доверия) при определении консенсуса. Одно без другого не работает эффективно.

    Как обеспечить выбор именно моего сайта в качестве источника (атрибуции) для ответа, если консенсус достигнут?

    Хотя ответ основан на консенсусе нескольких сайтов, атрибуция (ссылка) обычно ведет на один источник. Патент указывает, что ранг ресурса учитывается в процессе (Claim 2). Сайт с наивысшим рангом и наилучшим качеством среди тех, кто сформировал консенсус, имеет наибольшие шансы быть указанным в качестве источника.

    Влияет ли этот механизм на отображение расширенных сниппетов (Rich Snippets), таких как цены или рейтинги?

    Да, механизм валидации применим к любым структурированным данным, отображаемым на SERP. Если система обнаружит значительные расхождения или отсутствие консенсуса в данных о ценах или рейтингах (например, при подозрении на накрутку), она может отказаться отображать эти элементы или использовать усредненные данные, чтобы обеспечить достоверность информации для пользователя.

    Что такое «Authoritative Score» и как его повысить?

    Это внутренняя метрика Google, оценивающая вероятность того, что ресурс содержит точную информацию. Патент предполагает, что он может основываться на отзывах пользователей, репутации источника и ссылочных данных (how many other resources reference the resource). Повышение этого показателя достигается через комплексную работу над E-E-A-T и получение качественных обратных ссылок.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.