
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
Патент решает проблему ограниченности стандартной поисковой выдачи (SERP) при обработке исследовательских запросов (exploratory search), связанных с сущностями (entity). Традиционный ранжированный список часто фокусируется только на одном или нескольких доминирующих аспектах и не предоставляет пользователю обзор различных направлений (axes of information) для изучения темы. Изобретение направлено на автоматическую идентификацию ключевых аспектов (aspects) и использование их для организации структурированной выдачи, облегчая пользователю многомерное исследование.
Запатентована система (компонент Aspector) и метод для автоматической генерации, кластеризации и ранжирования аспектов, связанных с сущностью. Система анализирует поведение пользователей (логи запросов) и базы знаний для выявления кандидатов. Затем она объединяет семантически схожие аспекты и ранжирует финальный набор, обеспечивая баланс между популярностью (Popularity Score) и разнообразием (Diversity Score). Цель — предоставить набор тем, которые представляют собой различные оси для исследования информации о сущности.
Система работает в несколько этапов:
Query Refinements) и суперстрок (Query Super-strings), связанных с сущностью или ее классом (Class). Также используются данные из баз знаний.оценки схожести (Similarity Scores) между кандидатами путем сравнения результатов поиска (SERP) по ним. Похожие аспекты объединяются (дедупликация), а другие могут быть сгруппированы по общему классу.Mashup или фасетной навигации).Высокая. Понимание сущностей, их атрибутов и связанных с ними интентов (аспектов) является ядром современного семантического поиска (Knowledge Graph, MUM). Описанные механизмы лежат в основе того, как Google структурирует выдачу для исследовательских запросов, предлагая связанные поиски, фасетную навигацию и различные блоки контента. Это фундаментальный патент для Entity SEO и построения Topical Authority.
Патент имеет критическое значение (9/10) для формирования контент-стратегии. Он раскрывает механизм, с помощью которого Google определяет структуру темы и ключевые подтемы (аспекты) для конкретной сущности. SEO-специалистам необходимо убедиться, что их контент покрывает эти разнообразные и популярные аспекты, чтобы соответствовать цели системы — предоставить пользователю всесторонний обзор темы, а не просто ответ на узкий запрос.
axis of information), по которой можно получить дополнительные сведения о сущности. Текст, который называет эту ось (например, «погода» или «отели» для сущности «Гавайи»).class members).Dwell Time.Claim 1 (Независимый пункт): Описывает полный цикл обработки запроса с использованием аспектов.
сущность, и парсит его для извлечения сущности.аспекты.Similarity Score. Ключевой момент: расчет основан на идентификации и сравнении наборов поисковых результатов для соответствующих запросов кандидатов.combining на основе Similarity Score), (ii) кандидаты группируются (grouping) с использованием Aspect Classes.Diversity Score и Popularity Score (основанного на частоте появления).Claim 6 (Независимый пункт): Описывает офлайн-процесс генерации и хранения аспектов (аналогичен шагам генерации, модификации и ранжирования из Claim 1, но с фокусом на сохранении ассоциации в хранилище данных, а не на обработке живого запроса).
Claim 10 и 11 (Зависимые от 6): Детализируют генерацию кандидатов.
Сущность ассоциируется с классом. Кандидаты генерируются как для самой сущности, так и для ее класса. Источником являются истории поисковых запросов (user search histories) как для сущности, так и для других членов класса.
Claim 12 и 13 (Зависимые от 6): Детализируют расчет Similarity Score.
Схожесть рассчитывается на основе сравнения наборов результатов поиска. Сравнение может включать анализ путей (URL) или заголовков и сниппетов результатов.
Claim 16 (Зависимый от 6): Детализирует алгоритм ранжирования, направленный на максимизацию разнообразия.
Popularity Score для каждого аспекта.Similarity Score (мера сходства с уже ранжированными аспектами) для каждого неранжированного аспекта.Изобретение затрагивает несколько этапов поисковой архитектуры, преимущественно в офлайн-обработке для подготовки данных и на финальных этапах для структурирования выдачи.
INDEXING / QUNDERSTANDING (Офлайн-процессы)
Основная часть работы алгоритма (генерация и ранжирование аспектов) происходит здесь в режиме офлайн-обработки компонентом Aspector:
User Search Histories) для идентификации Query Refinements и Query Super-strings.Knowledge Bases) для идентификации сущностей, классов и признаков.Similarity Scores (требует доступа к индексу), Popularity Scores.QUNDERSTANDING (Онлайн)
Во время выполнения запроса система идентифицирует сущность в запросе и извлекает связанные с ней предварительно рассчитанные аспекты.
RANKING / METASEARCH (Онлайн)
Система может инициировать несколько параллельных поисков по [Сущность + Аспект] для каждого из топовых аспектов (мультиплексирование поиска).
METASEARCH / RERANKING (Онлайн)
Финальный этап, где происходит структурирование SERP. Система организует полученные результаты поиска в соответствии с идентифицированными аспектами, формируя Mashup или фасетную презентацию.
сущность, для которой система предварительно рассчитала набор высокоранжированных аспектов.Процесс А: Офлайн-генерация и ранжирование аспектов (Aspector)
Entity Class).Query Refinements и Query Super-strings, связанных с сущностью.Entity Class (для борьбы с нехваткой данных).Similarity Scores между всеми парами аспектов. Aspect Classes и группировка аспектов, принадлежащих к одному классу (с учетом обработки неоднозначности).Popularity Score для каждого аспекта (на основе частоты в логах).Процесс Б: Обработка запроса и презентация (Онлайн)
user search histories) — критически важный источник. Используются для идентификации Query Refinements и Query Super-strings, а также для расчета Popularity Scores. Упоминается возможность использования CTR и Dwell Time.Entity Classes и Aspect Classes, а также как прямой источник аспектов.titles) и сниппеты (snippets) результатов поиска используются для расчета Similarity Scores между аспектами.1. Popularity Score (Оценка популярности):
Рассчитывается на основе частоты (fq) в логах запросов. Например, для Query Refinement (qj) запроса (q):
pr(qj∣q)=j∑fq(qj)fq(qj)
2. Similarity Score (Оценка схожести): Рассчитывается между двумя аспектами путем сравнения их наборов результатов поиска (Di и Dj). Используются TF-IDF векторы (X, Y) для контента результатов. Схожесть между двумя результатами (di,dj) рассчитывается как косинусное расстояние:
сущность. Это позволяет Google строить карту темы (Topic Map) на основе реальных данных, а не ручного курирования.Query Refinements и Query Super-strings являются основными источниками для генерации аспектов. То, как пользователи уточняют свои запросы, напрямую формирует понимание Google о структуре этой темы и ее важных подтемах.Mashup), которая служит отправной точкой для исследования темы.Diversity и объединяет схожие аспекты, важно, чтобы контент, нацеленный на разные аспекты, был достаточно уникальным и фокусировался на разных интентах. Избегайте каннибализации, создавая четкую структуру (например, Хаб и Спицы).Knowledge Base.Этот патент подтверждает стратегический приоритет Google на понимание сущностей и организацию информации вокруг них (Entity-Oriented Search). Он подчеркивает, что Google стремится понять все измерения (аспекты) темы, чтобы удовлетворить разнообразные пользовательские интенты. Долгосрочная SEO-стратегия должна быть направлена на полное покрытие тем (Topic Coverage), а не на ранжирование по отдельным ключевым словам. Способность сайта стать авторитетным источником по всем основным аспектам сущности является ключом к устойчивости в поиске.
Сценарий: Оптимизация сайта для сущности «Машинное обучение»
Similarity Score высокий, так как возвращают схожие результаты) и объединяет их. «Алгоритмы» и «библиотеки Python» различны (Diversity Score высокий).mashup или фасетах), когда Google организует SERP по этим аспектам, демонстрируя Тематический Авторитет.Что такое «Аспект» (Aspect) в контексте этого патента и чем он отличается от ключевого слова?
Аспект — это ось информации или фасет, по которому можно изучать сущность. Это не просто ключевое слово, а идентифицированная подтема или интент. Например, для сущности «iPhone» ключевым словом может быть «купить iPhone», а аспектами будут «обзоры», «характеристики», «сравнение моделей». Аспекты представляют различные направления, по которым пользователи хотят исследовать сущность.
Как Google определяет, какие аспекты являются наиболее важными для сущности?
Система использует комбинацию популярности (Popularity Score) и разнообразия (Diversity Score). Популярность определяется частотой, с которой пользователи ищут этот аспект в логах запросов (через Query Refinements и Query Super-strings). Разнообразие гарантирует, что выбранные аспекты не дублируют друг друга. Система выбирает самый популярный аспект первым, а затем итеративно выбирает следующие популярные аспекты, которые минимально похожи на уже выбранные.
Как система определяет, что два разных аспекта на самом деле об одном и том же?
Для этого рассчитывается Similarity Score. Система не просто сравнивает названия аспектов, а анализирует поисковую выдачу для каждого из них. Если Топ-N результатов сильно пересекаются или их контент (заголовки, сниппеты) имеет высокую косинусную близость (на основе TF-IDF векторов), то аспекты считаются семантически схожими и могут быть объединены.
Что такое «Класс» сущности и зачем он используется?
Класс — это абстракция сущности (например, «Город» для «Парижа»). Он используется для генерализации и переноса знаний. Если данных по конкретной сущности мало (редкая сущность), система может использовать аспекты, сгенерированные для других, более популярных членов этого же класса (например, аспект «достопримечательности» популярен для всех городов), чтобы обеспечить полноту покрытия темы.
Как этот патент связан с Topical Authority?
Патент напрямую связан с Topical Authority. Он описывает механизм, с помощью которого Google автоматически определяет структуру темы (набор ключевых аспектов). Чтобы сайт считался авторитетным по теме (сущности), он должен качественно покрывать большинство этих популярных и разнообразных аспектов. Покрытие только одного аспекта недостаточно.
Что такое «Mashup» в контексте патента?
Mashup — это формат представления поисковой выдачи, описанный в патенте. Вместо единого списка ссылок, результаты группируются в блоки на одном экране, где каждый блок соответствует определенному аспекту сущности. Это позволяет пользователю сразу увидеть разные направления для исследования темы (например, Погода, Отели, Достопримечательности на одном экране при поиске локации).
Как использовать знание этого патента при разработке контент-стратегии?
Необходимо перейти от оптимизации отдельных страниц под ключевые слова к построению комплексного покрытия темы. Идентифицируйте основные сущности в вашей нише, проанализируйте популярные уточнения запросов (аспекты) и создайте структуру контента (например, Хаб и Спицы), которая систематически покрывает эти аспекты, обеспечивая при этом разнообразие информации.
Использует ли система данные о кликах (CTR) и времени на сайте (Dwell Time)?
Да, в патенте упоминается, что Popularity Score может рассчитываться не только на основе частоты запросов в логах, но также с использованием данных о Click-Through Rate и Dwell Time для результатов, соответствующих аспекту. Это означает, что аспекты, которые приводят к более вовлеченному поведению пользователей, могут считаться более популярными.
Стоит ли создавать отдельные страницы для очень похожих аспектов?
Согласно патенту, система стремится объединять похожие аспекты (Combining) и ценит разнообразие (Diversity). Создание отдельных страниц для очень близких аспектов (например, «туры в Японию» и «путевки в Японию») может привести к каннибализации. Лучше объединить их в одну сильную страницу, если система с высокой вероятностью посчитает их семантически схожими на основе анализа SERP.
Как система обрабатывает двусмысленные аспекты?
Патент признает риск неправильной группировки двусмысленных аспектов (например, группировка «Food» (еда) и «History» (история) в класс «Альбом», если есть такие альбомы). Чтобы избежать этого, система может идентифицировать двусмысленные аспекты (например, используя страницы разрешения неоднозначностей Wikipedia) и исключать их из процесса группировки по классам.

Семантика и интент
Knowledge Graph
SERP

SERP
Семантика и интент
Knowledge Graph

Семантика и интент
Knowledge Graph
Индексация

Knowledge Graph
Семантика и интент
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
SERP

Индексация
SERP
Персонализация

Семантика и интент
Мультимедиа
Персонализация

Ссылки
Семантика и интент
SERP

SERP
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Local SEO

Семантика и интент
Структура сайта
Ссылки

Ссылки
EEAT и качество
SERP

Техническое SEO
SERP
Ссылки
