
Google использует этот механизм для ответов на запросы, требующие списка элементов (например, «города в Калифорнии»). Система извлекает потенциальные списки из неструктурированных веб-документов, анализирует их взаимосвязи и совпадения в виде графа (Vertex-Edge Graph) и использует методы консенсуса (например, поиск клик) для определения наиболее достоверных и релевантных сущностей.
Патент решает задачу идентификации и ранжирования списка связанных сущностей (related instances) в ответ на поисковый запрос, который явно или неявно запрашивает такой список (например, «президенты США»). Основная проблема заключается в том, как надежно извлечь и верифицировать эту информацию из unstructured collection of electronic documents (Интернета), где данные не соответствуют строгой схеме, и как определить наиболее достоверные элементы для итогового набора.
Запатентована система для обработки запросов, ищущих списки сущностей. Система идентифицирует и извлекает потенциальные группы сущностей из веб-документов. Ключевым элементом изобретения является метод оценки релевантности извлеченных сущностей путем представления их характеристик и взаимосвязей в виде графа (vertex-edge graph). Анализ этого графа (например, с помощью поиска клик или машинного обучения) позволяет системе оценить достоверность каждой отдельной сущности на основе консенсуса между различными источниками.
Система работает в несколько этапов:
Biased Queries), смещенных в сторону поиска списков, и запросов к авторитетным источникам (Source-Constrained Queries).vertex-edge graph.cliques (клики) — плотно связанные подграфы, указывающие на высокую степень подтверждения сущностей разными источниками. Также могут применяться алгоритмы машинного обучения.Высокая. Идентификация сущностей, понимание их взаимосвязей и заполнение Knowledge Graph являются центральными элементами современного поиска. Описанные методы извлечения информации из неструктурированных данных и использования графового анализа для валидации на основе консенсуса остаются крайне актуальными для понимания того, как Google оценивает и структурирует фактологическую информацию. Хотя конкретные методы ML могли эволюционировать, базовые принципы остаются в силе.
Патент имеет высокое значение для SEO, особенно в контексте Entity SEO и оптимизации под Featured Snippets. Он раскрывает механизмы, с помощью которых Google идентифицирует группы связанных сущностей, используя структуру контента (списки, таблицы) и консенсус между источниками. Понимание этих механизмов критично для стратегий, направленных на улучшение распознавания сущностей сайта и их атрибутов поисковой системой.
Claim 1 (Независимый пункт): Описывает основной процесс идентификации и ранжирования группы сущностей из неструктурированных данных.
unstructured collection of electronic documents.Claim 2 (Зависимый от 1): Детализирует процесс определения релевантности групп (Шаг 3).
Релевантность групп вычисляется на основе трех компонентов: (i) релевантность групп исходным документам; (ii) вероятность (likelihoods) того, что идентифицированные группы действительно являются группами; (iii) релевантность исходных документов запросу.
Claim 3 (Зависимый от 1): Детализирует процесс идентификации групп (Шаг 2).
Идентификация включает формирование biased query (для поиска групп) и constrained query (для поиска в компендиумах), а затем выполнение поиска с использованием всех трех типов запросов (исходного, смещенного, ограниченного).
Claim 5 (Зависимый от 1): Детализирует процесс индивидуальной оценки сущностей (Шаг 4).
Оценка включает представление характеристик (features) сущностей в vertex-edge graph и оценку сущностей на основе этого графа.
Claims 6 и 7 (Зависимые от 5): Описывают две альтернативные конфигурации графа.
overlap) между группами.Claim 11 (Зависимый от 5): Уточняет метод оценки на основе графа.
Оценка сущностей включает идентификацию cliques в графе.
Изобретение охватывает несколько этапов поиска, от понимания запроса до финального ранжирования и представления результатов.
QUNDERSTANDING – Понимание Запросов
Система определяет, что запрос направлен на поиск группы связанных сущностей. Здесь же формируются вспомогательные запросы (Biased Queries и Source-Constrained Queries).
INDEXING – Индексирование и извлечение признаков
На этом этапе Extractors могут предварительно идентифицировать группы сущностей (списки, таблицы) в документах, хотя извлечение может происходить и во время выполнения запроса.
RANKING – Ранжирование (Отбор Кандидатов)
Система использует исходный и модифицированные запросы для поиска документов-кандидатов. Рассчитывается базовая релевантность исходных документов запросу (R_DQ).
RERANKING / Specialized Ranking – Переранжирование
Основная логика патента. Система извлекает потенциальные группы из документов-кандидатов, оценивает их релевантность (S_G), строит vertex-edge graph, анализирует его (поиск cliques, применение ML/EM алгоритмов) и вычисляет финальные индивидуальные оценки для сущностей.
METASEARCH – Метапоиск и Смешивание (Представление)
Результатом является ранжированный список сущностей, который может быть представлен пользователю в структурированном виде (например, в виде таблицы, карточек или блока ответов).
Входные данные:
Extractors.Выходные данные:
Knowledge Graph и формирования блоков ответов.group of related instances).Этап 1: Обработка запроса и сбор кандидатов
Biased Query (например, + «список»).Source-Constrained Query (например, поиск по энциклопедиям).Extractors для идентификации потенциальных групп (списков, таблиц) в документах.Этап 2: Оценка релевантности групп
Knowledge Graph.Vertex-Edge Graph. Сущности, которые часто встречаются вместе в разных источниках или в пересекающихся списках (формируют Cliques), считаются более достоверными и релевантными.Biased Queries), добавляя термины вроде «список», и специально проверяет авторитетные источники (Compendia Sources) для эффективного поиска структурированных данных.features).<ul>), нумерованные списки (<ol>) и таблицы (<table>). Это повышает вероятность того, что Extractors корректно идентифицируют группу (высокий LG).Vertex-Edge Graph.Biased Queries (например, «лучшие X», «список Y»). Используйте соответствующие формулировки в заголовках и тексте.Cliques) выявляет консенсус. Создание полных и точных списков увеличивает вероятность того, что ваши данные станут частью авторитетной клики.overlap) с другими источниками.<div>, <br> или CSS для визуального оформления списков вместо семантических тегов. Это снижает LG и затрудняет извлечение данных.Патент подтверждает стратегическую важность структурирования данных на веб-страницах для облегчения машинного понимания и извлечения сущностей (Entity-Based SEO). Он демонстрирует, что Google активно использует структуру HTML и визуальное представление данных (списки, таблицы) для сбора фактов. Стратегия SEO должна включать обеспечение того, чтобы ключевые сущности и их взаимосвязи были представлены в формате, удобном для извлечения (extraction-friendly), и подтверждались консенсусом в сети.
Сценарий: Оптимизация страницы категории E-commerce
Цель: Помочь Google идентифицировать список моделей телевизоров определенного бренда как группу связанных сущностей.
<ul class="product-list">). Это повышает LG.Biased Query «список телевизоров Samsung QLED 2025».Extractors идентифицируют список продуктов по тегам <li>.Vertex-Edge Graph, сравнивая этот список с списками на других сайтах (например, Samsung.com, другие ритейлеры).Clique и получают высокий балл достоверности.Featured Snippets.Что такое Vertex-Edge Graph и как он используется для оценки сущностей?
Это структура данных, где сущности или группы представлены как вершины (точки), а их взаимосвязи — как ребра (линии). Например, если две сущности часто появляются в одном списке на разных сайтах, они соединяются ребром. Анализируя этот граф, Google ищет Cliques — плотно связанные группы вершин. Наличие клики указывает на консенсус между источниками, что повышает достоверность и оценку входящих в нее сущностей.
Насколько важна HTML-структура (списки, таблицы) согласно этому патенту?
Она критически важна. Патент описывает Extractors, которые специально ищут списки, таблицы и структурированный текст для идентификации групп сущностей. Система оценивает вероятность того, что структура является группой (LG). Использование корректной семантической верстки (<li>, <table>) напрямую способствует правильному извлечению данных.
Заменяет ли этот механизм необходимость в микроразметке Schema.org?
Нет, не заменяет, но дополняет. Этот патент описывает, как Google извлекает структурированные данные из unstructured content, когда явная разметка отсутствует. Микроразметка Schema.org (например, ItemList) предоставляет данные напрямую и устраняет неоднозначность, но описанный механизм позволяет Google находить и, что более важно, проверять эти данные, используя консенсус в сети.
Что такое Biased Query и Source-Constrained Query?
Это модификации исходного запроса для улучшения поиска списков. Biased Query добавляет термины, указывающие на перечисление (например, «список президентов США»), чтобы найти страницы со списками. Source-Constrained Query ограничивает поиск авторитетными источниками (например, энциклопедиями), чтобы получить более достоверные данные.
Как Google определяет, что список на странице релевантен самой странице?
Система вычисляет метрику RGD (Relevance of Group to Document). Она сравнивает текст и концепции внутри группы (списка) с текстом и концепциями остальной части документа. Если связь слабая (например, список ингредиентов на странице о ремонте автомобиля), группа получит низкую оценку и, вероятно, будет проигнорирована.
Что важнее для оценки сущности: авторитетность источника или консенсус между многими источниками?
Патент предполагает, что оба фактора важны и используются совместно. Авторитетность источника влияет на начальную оценку релевантности документа (RDQ) и используется в Source-Constrained Queries. Консенсус (анализ графа и клики) используется на этапе индивидуальной оценки сущностей для валидации данных, извлеченных из всех источников.
Как этот патент связан с Knowledge Graph?
Этот патент описывает один из фундаментальных механизмов, который Google может использовать для заполнения и обновления Knowledge Graph. Он предоставляет метод для автоматического извлечения списков связанных сущностей и их атрибутов из интернета и механизм для проверки их достоверности перед добавлением в базу знаний.
Влияет ли частота упоминания сущности в интернете на ее ранжирование в списке?
Да, но обратно пропорционально. Патент описывает шаг переоценки (rescoring), на котором оценки сущностей могут быть взвешены по обратной частоте их появления в коллекции документов. Это делается для того, чтобы понизить слишком общие или часто встречающиеся термины и повысить более специфичные и релевантные сущности в финальном ранжированном списке.
Что делать, если мой сайт содержит уникальный список сущностей, которого нет больше нигде?
Поскольку система сильно полагается на консенсус (Cliques) для валидации, уникальный список может столкнуться с трудностями при получении высокой оценки достоверности, если он не подтверждается другими источниками. В этом случае критически важно максимизировать авторитетность вашего сайта (E-E-A-T), чтобы повысить базовую оценку релевантности (RDQ), и обеспечить максимально четкую структуру списка (LG).
Как система обрабатывает синонимы или разные написания одной и той же сущности?
Патент упоминает шаг переоценки (rescoring), на котором система может изменять оценки похожих или связанных идентификаторов сущностей. Это включает обработку разных вариантов написания, транслитераций, аббревиатур и сокращений (например, «Роберт Кеннеди» и «Бобби Кеннеди»). В некоторых реализациях такие идентификаторы могут быть объединены в одну сущность (нормализация).

Семантика и интент
Индексация
Knowledge Graph

Семантика и интент
Knowledge Graph

Knowledge Graph
Семантика и интент

Knowledge Graph
Семантика и интент

Семантика и интент
Knowledge Graph

Ссылки
Антиспам
EEAT и качество

EEAT и качество
Индексация
Семантика и интент

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Local SEO
SERP
Ссылки

Индексация
Краулинг
Ссылки

Индексация
Поведенческие сигналы

Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы
