
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
Патент решает задачу предоставления пользователю консолидированной информации о конкретной сущности (в данном случае, книге), когда его запрос направлен на поиск этой сущности. Система стремится предоставить единый «обогащенный результат» (Rich Result), агрегируя разрозненные данные из нескольких источников (корпусов). Кроме того, патент решает проблему качества и согласованности данных, предлагая механизм исправления информации на основе консенсуса, найденного в веб-ресурсах.
Запатентована система и метод для выборочного запуска и генерации обогащенных результатов в ответ на запросы о публикациях. Ключевым механизмом является триггер, основанный на доминировании оценки релевантности (score) первого результата поиска над остальными. Если доминирование достаточно велико (превышает порог), система генерирует Rich Result, агрегируя данные из разных корпусов (Книги, Веб, Товары) и применяя механизм коррекции данных на основе консенсуса информации в вебе.
Clustering Engine) и ассоциирует веб-страницы с этими книгами (Web Association Engine).Rich Result. Также могут проверяться дополнительные условия (наличие сниппета, цен).Rich Result Engine сравнивает варианты данных (например, написание названия или автора) из разных корпусов и выбирает «наиболее популярный вариант» (most popular variant) из веб-ресурсов.Rich Result вместе со стандартными результатами поиска.Высокая. Патент описывает фундаментальные механизмы работы с сущностями, агрегации данных и формирования обогащенных результатов (включая элементы Knowledge Panel). Принципы определения интента по доминированию результата и использование консенсуса веба для валидации и коррекции структурированных данных критически важны в современном семантическом поиске и развитии Knowledge Graph.
Патент имеет высокое стратегическое значение (8.5/10). Он демонстрирует, как Google использует данные со всего интернета для формирования и валидации информации о сущностях. Для SEO это подчеркивает критическую важность согласованности и распространенности данных о бренде/продукте/сущности (Consistency) во всем вебе. Google полагается на консенсус веба для определения истины, что делает управление данными на внешних ресурсах ключевым элементом Entity SEO.
Web Association Engine, показывающая вероятность того, что веб-ресурс ссылается на конкретную книгу.Rich Result и отвечает за коррекцию данных путем сравнения информации из разных корпусов.Web Association Engine, показывающая степень, в которой веб-сайт посвящен конкретной книге (например, обзор имеет высокую тематичность, а список бестселлеров — низкую).Web Corpus), которые упоминают публикацию или связаны с ней.Claim 1 (Независимый пункт): Описывает основной процесс генерации обогащенного результата для поиска книг.
corpus of digital book resources).score) первого результата пороговому значению относительно оценок других результатов. Это условие определяет, будет ли показан Rich Result.corpus of web resources, используя данные первого результата, чтобы найти веб-ресурсы, ссылающиеся на эту книгу.Rich Result, включающий данные из первого результата и данные из найденных веб-ресурсов (цены, ссылки, сниппет, авторы).Rich Result предоставляется вместе с другими результатами поиска.Claim 2, 3 (Зависимые): Уточняют условие срабатывания триггера (Score Dominance).
Порог считается достигнутым, если оценка первого результата как минимум в пороговое кратное число раз (threshold multiple) превышает оценку результата, занимающего второе, третье или четвертое место в ранжировании. Это указывает на высокую уверенность системы в интенте пользователя.
Claim 6 (Зависимый): Детализирует получение информации о ценах.
Система получает результаты из products corpus, используя ISBN книги, и определяет цену на основе этих результатов.
Claim 8 и 9 (Зависимые): Детализируют механизм коррекции данных (Data Correction).
Генерация Rich Result включает определение того, является ли элемент данных из первого результата поиска некорректным, используя веб-ресурсы (Claim 8). Процесс коррекции (Claim 9) включает:
multiple variants) элемента данных из веб-ресурсов.most popular variant) на основе частоты его появления.Изобретение затрагивает несколько этапов поиска, используя офлайн-процессы для подготовки данных и онлайн-процессы для генерации выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые офлайн-процессы:
Clustering Engine анализирует Books Corpus, чтобы сгруппировать разные записи об одной и той же книге.Web Association Engine анализирует Web Corpus и ассоциирует веб-страницы с конкретными книгами, рассчитывая Confidence Value и Topicality Value.RANKING – Ранжирование
Система выполняет поиск в специализированном индексе (Books Corpus) и рассчитывает оценки релевантности (scores) для результатов.
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента:
Rich Result Engine.Web Corpus и Products Corpus.most popular variant).Rich Result формируется и встраивается в страницу результатов.Входные данные:
Books Corpus, Web Corpus, Products Corpus.Выходные данные:
Rich Result) с агрегированными и скорректированными данными о сущности.Алгоритм применяется только при выполнении строгого набора условий:
Score) первого результата значительно превышает последующие (например, в 10 раз выше). Это указывает на высокую уверенность системы в том, что пользователь ищет именно эту сущность.Snippet acceptable).Prices available).Information pages available).Если эти данные отсутствуют, Rich Result не будет показан, даже если порог уверенности достигнут.
Процесс А: Офлайн-подготовка данных
Clustering Engine обрабатывает Books Corpus. Записи метаданных с пересекающейся информацией (Title, Author, ISBN) группируются.Web Association Engine анализирует Web Corpus. Для веб-страниц рассчитываются Confidence Value и Topicality Value. Если значения превышают пороги, веб-ресурс аннотируется связью с книгой.Процесс Б: Обработка запроса в реальном времени
scores) для результатов из Books Corpus.Rich Result.Products Corpus (например, используя ISBN) для извлечения цен.Rich Result Engine сравнивает метаданные из Books Corpus с вариантами из Web Corpus. Выбирается most popular variant для использования в Rich Result.Rich Result собирается и отправляется клиенту.Система использует данные из трех основных корпусов:
Books Corpus (Структурированные данные):
Web Corpus (Неструктурированные данные):
Products Corpus (Коммерческие данные):
Web Corpus.Rich Results.Web Corpus для валидации и исправления данных из структурированных источников (Books Corpus). Система предпочитает most popular variant данных из веба, считая его более надежным. Это механизм самокоррекции Knowledge Graph.Confidence и Topicality для определения того, какие внешние ресурсы будут использованы для формирования Rich Result или получат в нем ссылки (Related Websites).most popular variant для коррекции своих данных, необходимо, чтобы этот популярный вариант был корректным и доминирующим.Products Corpus).Web Association Engine ищет ресурсы с высокими показателями Confidence и Topicality. Качественные обзоры повышают вероятность использования данных в Rich Result и включения сайта в связанные ресурсы.Products Corpus может заблокировать показ Rich Result.most popular variant).Rich Result.Topicality). Такие страницы вряд ли будут использованы системой для формирования Rich Result.Этот патент имеет важное стратегическое значение для Entity SEO. Он демонстрирует переход от простого извлечения данных к их валидации через консенсус веба. Стратегия SEO должна включать управление присутствием сущности во всем интернете, а не только на собственном сайте. Создание согласованного и авторитетного информационного следа является фундаментом для корректного отображения в Knowledge Graph и других обогащенных результатах. Google полагается на веб как на механизм самоочистки данных.
Сценарий 1: Коррекция названия компании/продукта через консенсус веба
Rich Result Engine анализирует Web Corpus. Он находит 5000 упоминаний «Старое Название» (в старых новостях, каталогах) и только 200 упоминаний «Новое Название».most popular variant и использует его.Сценарий 2: Блокировка Rich Result из-за отсутствия цены
Prices available не выполнено. Rich Result не отображается.Что является главным условием для показа обогащенного результата (Rich Result) согласно патенту?
Основным триггером является высокая степень уверенности системы в интенте пользователя. Это определяется математически: оценка ранжирования (Score) первого результата должна значительно (например, в 10 раз) превышать оценки последующих результатов (Score Dominance). Это гарантирует, что Rich Result показывается только при очень точном соответствии запроса конкретной сущности.
Что произойдет, если порог уверенности достигнут, но данных о сущности мало?
Даже если порог уверенности достигнут, патент описывает дополнительные обязательные условия. Система должна найти приемлемый сниппет, информацию о ценах в Products Corpus и связанные информационные страницы в Web Corpus. Если хотя бы одно из этих условий не выполняется, обогащенный результат показан не будет.
Как работает механизм «коррекции данных» (Data Correction)?
Это процесс валидации информации. Система сравнивает данные из структурированных источников (например, Books Corpus) с тем, как эта информация представлена в интернете (Web Corpus). Если существуют разные варианты написания (например, названия или имени автора), система анализирует частоту их использования и выбирает «наиболее популярный вариант» (most popular variant). Веб-консенсус используется для исправления потенциальных ошибок.
Какое это имеет значение для Entity SEO и Knowledge Graph?
Критическое. Это означает, что Google использует консенсус веба как источник истины для валидации данных в Knowledge Graph. Для SEO важно управлять информацией о сущности по всему интернету, обеспечивая согласованность и преобладание корректных данных, чтобы Google принял правильную версию.
Что делать, если Google показывает неверную информацию о моем продукте или компании в обогащенном результате?
Необходимо проанализировать, какая информация преобладает в интернете. Если на большинстве авторитетных сайтов указана неверная информация, Google примет ее как most popular variant. Нужно работать над исправлением данных на внешних ресурсах (СМИ, каталоги, Википедия), чтобы сформировать новый, корректный консенсус.
Что такое Confidence Value и Topicality Value?
Это метрики, используемые Web Association Engine для оценки веб-страниц. Confidence Value — вероятность того, что страница ссылается на данную сущность. Topicality Value — степень того, насколько страница посвящена именно этой сущности (обзор имеет высокую Topicality, упоминание в списке — низкую). Они важны для выбора качественных связанных сайтов для Rich Result.
Как повысить шансы моего сайта появиться в ссылках внутри обогащенного результата?
Ваш сайт должен быть тесно ассоциирован с сущностью и иметь высокие показатели Topicality. Создавайте подробный, авторитетный контент о сущности (например, официальный сайт продукта, подробный обзор). Это увеличивает вероятность того, что Web Association Engine идентифицирует ваш сайт как релевантный.
Какова роль ISBN или других идентификаторов (GTIN) в этом процессе?
Идентификаторы критически важны для связывания данных между разными системами. Например, Google использует ISBN/GTIN, чтобы найти информацию о сущности в основном корпусе, а затем использует тот же идентификатор для запроса цен в Products Corpus. Использование корректных идентификаторов и микроразметки обязательно.
Применяется ли этот патент только к книгам?
Патент описан на примере книг (Books Corpus), но описанные механизмы — триггер по доминированию результата, агрегация данных из разных корпусов и коррекция данных на основе консенсуса веба — являются универсальными принципами работы Google с любыми сущностями (продукты, организации, люди).
Что такое Clustering Engine и зачем он нужен?
Clustering Engine работает офлайн и решает задачу объединения разрозненной информации об одной и той же сущности из разных источников. Он анализирует пересечения в метаданных (название, автор, ISBN), чтобы понять, что разные записи относятся к одной сущности. Это основа для последующей агрегации данных.

Knowledge Graph
Семантика и интент
Индексация

Семантика и интент
Ссылки
Knowledge Graph

Семантика и интент
EEAT и качество
SERP

Knowledge Graph
Семантика и интент
SERP

Индексация

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
Антиспам
Краулинг

Ссылки
Поведенческие сигналы
Антиспам

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
SERP
Мультимедиа
