Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи

IDENTIFYING QUERY ASPECTS (Идентификация аспектов запроса)

US8458171B2
Google LLC
2009-07-30
2013-06-04

Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.

Какую проблему решает

Патент решает проблему ограниченности стандартной поисковой выдачи (SERP) при обработке исследовательских запросов (exploratory search), связанных с сущностями (entity). Традиционный ранжированный список часто фокусируется только на одном или нескольких доминирующих аспектах и не предоставляет пользователю обзор различных направлений (axes of information) для изучения темы. Изобретение направлено на автоматическую идентификацию ключевых аспектов (aspects) и использование их для организации структурированной выдачи, облегчая пользователю многомерное исследование.

Что запатентовано

Запатентована система (компонент Aspector) и метод для автоматической генерации, кластеризации и ранжирования аспектов, связанных с сущностью. Система анализирует поведение пользователей (логи запросов) и базы знаний для выявления кандидатов. Затем она объединяет семантически схожие аспекты и ранжирует финальный набор, обеспечивая баланс между популярностью (Popularity Score) и разнообразием (Diversity Score). Цель — предоставить набор тем, которые представляют собой различные оси для исследования информации о сущности.

Как это работает

Система работает в несколько этапов:

Генерация кандидатов: Анализируются логи запросов для поиска уточнений (Query Refinements) и суперстрок (Query Super-strings), связанных с сущностью или ее классом (Class). Также используются данные из баз знаний.
Модификация кандидатов: Вычисляются оценки схожести (Similarity Scores) между кандидатами путем сравнения результатов поиска (SERP) по ним. Похожие аспекты объединяются (дедупликация), а другие могут быть сгруппированы по общему классу.
Ранжирование: Аспекты ранжируются итеративно. Первый выбирается по максимальной популярности. Последующие выбираются так, чтобы максимизировать их популярность при минимальной схожести с уже выбранными (максимизация разнообразия).
Применение: При получении запроса о сущности система извлекает топовые аспекты и организует выдачу, группируя результаты по этим аспектам (например, в формате Mashup или фасетной навигации).

Актуальность для SEO

Высокая. Понимание сущностей, их атрибутов и связанных с ними интентов (аспектов) является ядром современного семантического поиска (Knowledge Graph, MUM). Описанные механизмы лежат в основе того, как Google структурирует выдачу для исследовательских запросов, предлагая связанные поиски, фасетную навигацию и различные блоки контента. Это фундаментальный патент для Entity SEO и построения Topical Authority.

Важность для SEO

Патент имеет критическое значение (9/10) для формирования контент-стратегии. Он раскрывает механизм, с помощью которого Google определяет структуру темы и ключевые подтемы (аспекты) для конкретной сущности. SEO-специалистам необходимо убедиться, что их контент покрывает эти разнообразные и популярные аспекты, чтобы соответствовать цели системы — предоставить пользователю всесторонний обзор темы, а не просто ответ на узкий запрос.

Термины и определения

Aspect (Аспект): Ось информации (axis of information), по которой можно получить дополнительные сведения о сущности. Текст, который называет эту ось (например, «погода» или «отели» для сущности «Гавайи»).
Aspect Class (Класс аспекта): Категория, к которой принадлежит аспект. Используется для группировки. Например, аспекты «Нью-Йорк» и «Чикаго» принадлежат к классу «Города США».
Aspector: Компонент поисковой системы (упомянутый на схемах), отвечающий за генерацию, ранжирование и ассоциацию аспектов с сущностями.
Diversity Score (Оценка разнообразия): Метрика, оценивающая, насколько неранжированный аспект отличается от уже ранжированных аспектов. Используется для обеспечения разнообразия финального набора.
Entity (Сущность): Текст, который именует или идентифицирует объект (физический, концептуальный), обладающий свойствами.
Entity Class (Класс сущности): Абстракция сущности (например, «шоколадный торт» принадлежит к классу «еда»). Используется для генерации аспектов для редких сущностей на основе данных о других членах этого класса (class members).
Mashup (Мэшап): Формат представления поисковой выдачи, где результаты и информация для нескольких аспектов представлены на одном экране и организованы по этим аспектам.
Popularity Score (Оценка популярности): Метрика, оценивающая важность или частоту использования аспекта. Рассчитывается на основе частоты его появления в логах запросов. Может также учитывать CTR и Dwell Time.
Query Refinement (Уточнение запроса): Запрос, который пользователь вводит после исходного запроса о сущности в рамках одной сессии. Например, «компьютер» -> «ноутбук».
Query Super-string (Суперстрока запроса): Запрос в логах, который включает в себя текст другого запроса. Например, «Вьетнам тур пакет» является суперстрокой для «Вьетнам тур».
Similarity Score (Оценка схожести): Численная оценка схожести между двумя аспектами. Рассчитывается путем сравнения наборов результатов поиска (SERP), соответствующих этим аспектам.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный цикл обработки запроса с использованием аспектов.

Система получает запрос, включающий сущность, и парсит его для извлечения сущности.
Генерируется группа кандидатов в аспекты.
Для пар кандидатов рассчитывается Similarity Score. Ключевой момент: расчет основан на идентификации и сравнении наборов поисковых результатов для соответствующих запросов кандидатов.
Группа модифицируется: (i) схожие кандидаты объединяются (combining на основе Similarity Score), (ii) кандидаты группируются (grouping) с использованием Aspect Classes.
Модифицированные кандидаты ранжируются на основе Diversity Score и Popularity Score (основанного на частоте появления).
Один или несколько топовых аспектов ассоциируются с сущностью.
Система получает наборы результатов поиска, специфичные для каждого из ассоциированных аспектов.
Система предоставляет презентацию результатов, организованную в соответствии с ассоциированными аспектами.

Claim 6 (Независимый пункт): Описывает офлайн-процесс генерации и хранения аспектов (аналогичен шагам генерации, модификации и ранжирования из Claim 1, но с фокусом на сохранении ассоциации в хранилище данных, а не на обработке живого запроса).

Claim 10 и 11 (Зависимые от 6): Детализируют генерацию кандидатов.

Сущность ассоциируется с классом. Кандидаты генерируются как для самой сущности, так и для ее класса. Источником являются истории поисковых запросов (user search histories) как для сущности, так и для других членов класса.

Claim 12 и 13 (Зависимые от 6): Детализируют расчет Similarity Score.

Схожесть рассчитывается на основе сравнения наборов результатов поиска. Сравнение может включать анализ путей (URL) или заголовков и сниппетов результатов.

Claim 16 (Зависимый от 6): Детализирует алгоритм ранжирования, направленный на максимизацию разнообразия.

Рассчитывается Popularity Score для каждого аспекта.
Аспект с наивысшей популярностью получает наивысший ранг.
Остальные аспекты ранжируются итеративно:
- Рассчитывается Similarity Score (мера сходства с уже ранжированными аспектами) для каждого неранжированного аспекта.
- Следующий наивысший ранг присваивается аспекту, у которого отношение популярности к схожести (Popularity Score / Similarity Score) является наивысшим.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, преимущественно в офлайн-обработке для подготовки данных и на финальных этапах для структурирования выдачи.

INDEXING / QUNDERSTANDING (Офлайн-процессы)
Основная часть работы алгоритма (генерация и ранжирование аспектов) происходит здесь в режиме офлайн-обработки компонентом Aspector:

Анализ логов запросов (User Search Histories) для идентификации Query Refinements и Query Super-strings.
Анализ баз знаний (Knowledge Bases) для идентификации сущностей, классов и признаков.
Расчет Similarity Scores (требует доступа к индексу), Popularity Scores.
Кластеризация, группировка и ранжирование аспектов.
Сохранение финальных ассоциаций [Сущность -> Аспекты] в базе данных.

QUNDERSTANDING (Онлайн)
Во время выполнения запроса система идентифицирует сущность в запросе и извлекает связанные с ней предварительно рассчитанные аспекты.

RANKING / METASEARCH (Онлайн)
Система может инициировать несколько параллельных поисков по [Сущность + Аспект] для каждого из топовых аспектов (мультиплексирование поиска).

METASEARCH / RERANKING (Онлайн)
Финальный этап, где происходит структурирование SERP. Система организует полученные результаты поиска в соответствии с идентифицированными аспектами, формируя Mashup или фасетную презентацию.

На что влияет

Специфические запросы: Наибольшее влияние на информационные и исследовательские запросы, где пользователь вводит название сущности для изучения темы (например, [Hawaii], [Dyson V15], [Albert Einstein]).
Конкретные ниши: Продукты, локации (путешествия), персоны, организации, медиа (фильмы, книги) — ниши с четко определенными сущностями, имеющими множество фасетов.
Структура SERP: Влияет на формирование связанных запросов, блоков PAA и любых элементов интерфейса, предлагающих фасетную навигацию или исследование подтем.

Когда применяется

Триггеры активации: Когда в запросе идентифицирована сущность, для которой система предварительно рассчитала набор высокоранжированных аспектов.
Условия работы: Применяется, когда интент запроса предполагает исследование (exploratory search), а не поиск конкретного факта или навигацию.

Пошаговый алгоритм

Процесс А: Офлайн-генерация и ранжирование аспектов (Aspector)

Получение Сущности и Класса: Система выбирает сущность и определяет ее класс (Entity Class).
Генерация Кандидатов:
- Анализ логов запросов для поиска Query Refinements и Query Super-strings, связанных с сущностью.
- Генерация аспектов на основе данных о других членах Entity Class (для борьбы с нехваткой данных).
- Извлечение признаков из баз знаний.
Модификация Кандидатов (Объединение/Clustering):
- Расчет Similarity Scores между всеми парами аспектов.
  - Получение Топ-N результатов поиска для каждого аспекта.
  - Создание TF-IDF векторов для заголовков/сниппетов результатов.
  - Расчет косинусной близости между векторами.
  - Агрегация схожести на уровне наборов результатов.
- Применение алгоритма кластеризации (например, graph partition) для объединения высоко схожих аспектов.
Модификация Кандидатов (Группировка/Grouping):
- Идентификация Aspect Classes и группировка аспектов, принадлежащих к одному классу (с учетом обработки неоднозначности).
Ранжирование Кандидатов:
- Расчет Popularity Score для каждого аспекта (на основе частоты в логах).
- Выбор аспекта с максимальной популярностью в качестве первого.
- Итеративный выбор следующих аспектов: выбор аспекта с максимальным отношением Popularity/Similarity (где Similarity — это схожесть с уже выбранными аспектами).
Сохранение: Ассоциация топовых K аспектов с сущностью сохраняется в базе данных.

Процесс Б: Обработка запроса и презентация (Онлайн)

Получение Запроса и Идентификация Сущности.
Извлечение Аспектов: Извлекаются ассоциированные с сущностью топовые аспекты (из Процесса А).
Получение Результатов: Система получает наборы результатов поиска (например, для комбинаций [Сущность + Аспект]).
Презентация (Mashup): Результаты представляются пользователю в организованном виде, где каждый блок соответствует определенному аспекту.

Какие данные и как использует

Данные на входе

Поведенческие факторы (User Behavior): Логи запросов (user search histories) — критически важный источник. Используются для идентификации Query Refinements и Query Super-strings, а также для расчета Popularity Scores. Упоминается возможность использования CTR и Dwell Time.
Структурные факторы (Knowledge Bases): Базы знаний (упомянуты Wikipedia, Freebase) используются для определения Entity Classes и Aspect Classes, а также как прямой источник аспектов.
Контентные факторы (Search Results Content): Заголовки (titles) и сниппеты (snippets) результатов поиска используются для расчета Similarity Scores между аспектами.
Технические факторы (URLs/Paths): Пути или веб-адреса результатов поиска также могут использоваться для расчета схожести.

Какие метрики используются и как они считаются

1. Popularity Score (Оценка популярности):

Рассчитывается на основе частоты (fq) в логах запросов. Например, для Query Refinement ( $q_j$ ) запроса ( $q$ ):

$p_r(q_j|q) = \frac{fq(q_j)}{\sum_j fq(q_j)}$

2. Similarity Score (Оценка схожести): Рассчитывается между двумя аспектами путем сравнения их наборов результатов поиска ( $D_i$ и $D_j$ ). Используются TF-IDF векторы (X, Y) для контента результатов. Схожесть между двумя результатами ( $d_i, d_j$ ) рассчитывается как косинусное расстояние:

$s i m (d_{i}, d_{j}) = \frac{X \cdot Y}{∣ Выводы Автоматизация фасетного поиска и Topical Mapping: Патент описывает масштабируемую систему для автоматического определения того, как пользователи исследуют сущность . Это позволяет Google строить карту темы (Topic Map) на основе реальных данных, а не ручного курирования. Поведение пользователей определяет структуру темы: Query Refinements и Query Super-strings являются основными источниками для генерации аспектов. То, как пользователи уточняют свои запросы, напрямую формирует понимание Google о структуре этой темы и ее важных подтемах. Приоритет разнообразия (Engineered Diversity): Алгоритм ранжирования агрессивно поощряет разнообразие. Система не просто выбирает самые популярные аспекты, а стремится выбрать набор популярных, но тематически различных аспектов. Популярный, но дублирующийся аспект будет понижен. Семантическая близость определяется через сравнение SERP: Ключевой механизм — определение схожести аспектов путем анализа контента результатов поиска (TF-IDF, косинусная близость), а не текста самих аспектов. Если выдачи похожи, аспекты считаются семантически схожими. Использование Классов для Long-Tail Сущностей: Система использует иерархию классов для переноса знаний. Если данных по конкретной сущности мало, система может использовать аспекты, сгенерированные для других членов этого же класса, обеспечивая покрытие даже для редких тем. Структурированная выдача (Mashup) как цель: Конечная цель — отойти от плоского списка «10 синих ссылок» и предоставить организованную выдачу (Mashup), которая служит отправной точкой для исследования темы.Практика Best practices (это мы делаем) Построение Topical Authority через охват аспектов: Необходимо идентифицировать все ключевые аспекты (интенты), которые Google связывает с целевой сущностью на основе анализа поведения пользователей. Стратегия контента должна систематически охватывать каждый из этих аспектов, чтобы максимизировать релевантность по всей теме. Исследование интентов и аспектов в SERP: Анализируйте выдачу по широким запросам, связанным с сущностью. Функции SERP (например, «Things to know», «People Also Ask», связанные поиски, фасеты) являются прямыми индикаторами аспектов, идентифицированных системой. Используйте их для планирования контента. Создание четко разграниченного контента для разных аспектов: Поскольку система ценит Diversity и объединяет схожие аспекты, важно, чтобы контент, нацеленный на разные аспекты, был достаточно уникальным и фокусировался на разных интентах. Избегайте каннибализации, создавая четкую структуру (например, Хаб и Спицы). Оптимизация под классы сущностей: Понимайте, к какому классу Google относит вашу сущность. Если сущность находится в «длинном хвосте», убедитесь, что вы охватываете базовые аспекты, характерные для всего класса, так как Google может заимствовать их у более популярных членов класса. Использование структурированных данных (Schema.org): Помогайте Google идентифицировать сущности и их классы на вашем сайте. Корректная разметка помогает системе понять контекст и взаимосвязи, что может улучшить ассоциацию вашего контента с релевантными аспектами и Knowledge Base . Worst practices (это делать не надо) Фокус только на основном интенте (Head Term): Игнорирование второстепенных аспектов сущности. Например, оптимизация сайта о «Гавайях» только под «отели». Это ограничивает потенциал ранжирования в структурированной выдаче, где Google ищет разнообразие. Создание избыточного контента (Каннибализация аспектов): Создание множества страниц, которые охватывают один и тот же аспект с небольшими вариациями. Система определит высокую схожесть (путем сравнения SERP) и объединит эти аспекты, выбрав только одну страницу. Игнорирование семантической структуры и связей: Создание контента без учета связей между сущностями, их классами и аспектами. Недостаточное понимание того, как Google структурирует тему, приведет к неэффективной стратегии и потере Topical Authority. Стратегическое значение Этот патент подтверждает стратегический приоритет Google на понимание сущностей и организацию информации вокруг них (Entity-Oriented Search). Он подчеркивает, что Google стремится понять все измерения (аспекты) темы, чтобы удовлетворить разнообразные пользовательские интенты. Долгосрочная SEO-стратегия должна быть направлена на полное покрытие тем (Topic Coverage), а не на ранжирование по отдельным ключевым словам. Способность сайта стать авторитетным источником по всем основным аспектам сущности является ключом к устойчивости в поиске. Практические примеры Сценарий: Оптимизация сайта для сущности «Машинное обучение» Идентификация аспектов: Анализ логов и SERP показывает, что пользователи ищут: «курсы», «алгоритмы», «применение», «история», «библиотеки Python». Это кандидаты в аспекты. Анализ разнообразия и схожести: Google определяет, что «курсы» и «обучение» слишком похожи (Similarity Score высокий, так как возвращают схожие результаты) и объединяет их. «Алгоритмы» и «библиотеки Python» различны (Diversity Score высокий). Ранжирование аспектов: «Курсы» — самый популярный. Затем выбираются «алгоритмы» и «библиотеки Python», так как они популярны и разнообразны. Действия SEO: Вместо одной огромной статьи «Все о машинном обучении», создается хаб с высококачественными, четко разграниченными страницами для каждого идентифицированного аспекта: /ml/courses (оптимизированная под интент обучения) /ml/algorithms (технический обзор) /ml/python-libraries (фокус на инструментах) Ожидаемый результат: Сайт имеет больше шансов появиться в структурированной выдаче (например, в блоках mashup или фасетах), когда Google организует SERP по этим аспектам, демонстрируя Тематический Авторитет.Вопросы и ответы Что такое «Аспект» (Aspect) в контексте этого патента и чем он отличается от ключевого слова? Аспект — это ось информации или фасет, по которому можно изучать сущность. Это не просто ключевое слово, а идентифицированная подтема или интент. Например, для сущности «iPhone» ключевым словом может быть «купить iPhone», а аспектами будут «обзоры», «характеристики», «сравнение моделей». Аспекты представляют различные направления, по которым пользователи хотят исследовать сущность. Как Google определяет, какие аспекты являются наиболее важными для сущности? Система использует комбинацию популярности (Popularity Score) и разнообразия (Diversity Score). Популярность определяется частотой, с которой пользователи ищут этот аспект в логах запросов (через Query Refinements и Query Super-strings). Разнообразие гарантирует, что выбранные аспекты не дублируют друг друга. Система выбирает самый популярный аспект первым, а затем итеративно выбирает следующие популярные аспекты, которые минимально похожи на уже выбранные. Как система определяет, что два разных аспекта на самом деле об одном и том же? Для этого рассчитывается Similarity Score . Система не просто сравнивает названия аспектов, а анализирует поисковую выдачу для каждого из них. Если Топ-N результатов сильно пересекаются или их контент (заголовки, сниппеты) имеет высокую косинусную близость (на основе TF-IDF векторов), то аспекты считаются семантически схожими и могут быть объединены. Что такое «Класс» сущности и зачем он используется? Класс — это абстракция сущности (например, «Город» для «Парижа»). Он используется для генерализации и переноса знаний. Если данных по конкретной сущности мало (редкая сущность), система может использовать аспекты, сгенерированные для других, более популярных членов этого же класса (например, аспект «достопримечательности» популярен для всех городов), чтобы обеспечить полноту покрытия темы. Как этот патент связан с Topical Authority? Патент напрямую связан с Topical Authority. Он описывает механизм, с помощью которого Google автоматически определяет структуру темы (набор ключевых аспектов). Чтобы сайт считался авторитетным по теме (сущности), он должен качественно покрывать большинство этих популярных и разнообразных аспектов. Покрытие только одного аспекта недостаточно. Что такое «Mashup» в контексте патента? Mashup — это формат представления поисковой выдачи, описанный в патенте. Вместо единого списка ссылок, результаты группируются в блоки на одном экране, где каждый блок соответствует определенному аспекту сущности. Это позволяет пользователю сразу увидеть разные направления для исследования темы (например, Погода, Отели, Достопримечательности на одном экране при поиске локации). Как использовать знание этого патента при разработке контент-стратегии? Необходимо перейти от оптимизации отдельных страниц под ключевые слова к построению комплексного покрытия темы. Идентифицируйте основные сущности в вашей нише, проанализируйте популярные уточнения запросов (аспекты) и создайте структуру контента (например, Хаб и Спицы), которая систематически покрывает эти аспекты, обеспечивая при этом разнообразие информации. Использует ли система данные о кликах (CTR) и времени на сайте (Dwell Time)? Да, в патенте упоминается, что Popularity Score может рассчитываться не только на основе частоты запросов в логах, но также с использованием данных о Click-Through Rate и Dwell Time для результатов, соответствующих аспекту. Это означает, что аспекты, которые приводят к более вовлеченному поведению пользователей, могут считаться более популярными. Стоит ли создавать отдельные страницы для очень похожих аспектов? Согласно патенту, система стремится объединять похожие аспекты (Combining) и ценит разнообразие (Diversity). Создание отдельных страниц для очень близких аспектов (например, «туры в Японию» и «путевки в Японию») может привести к каннибализации. Лучше объединить их в одну сильную страницу, если система с высокой вероятностью посчитает их семантически схожими на основе анализа SERP. Как система обрабатывает двусмысленные аспекты? Патент признает риск неправильной группировки двусмысленных аспектов (например, группировка «Food» (еда) и «History» (история) в класс «Альбом», если есть такие альбомы). Чтобы избежать этого, система может идентифицировать двусмысленные аспекты (например, используя страницы разрешения неоднозначностей Wikipedia) и исключать их из процесса группировки по классам.Похожие патенты Как Google использует атрибуты сущностей для генерации «Дополненных запросов» и уточнения поиска Google использует механизм для помощи в исследовании тем, связанных с сущностями (люди, места, продукты). Система распознает сущность в запросе, определяет ее ключевые атрибуты (анализируя результаты поиска или Knowledge Graph) и автоматически генерирует список предлагаемых «дополненных запросов» (Сущность + Атрибут). Это позволяет пользователю одним кликом запустить новый, более сфокусированный поиск по теме. US10055462B2 2018-08-21 Семантика и интент Knowledge Graph SERP Как Google использует сущности, онтологии и векторные представления для кластеризации и организации поисковой выдачи Google использует этот механизм для структурирования поисковой выдачи по широким запросам. Система группирует результаты в кластеры на основе их связи с сущностями из Базы Знаний. Для объединения кластеров используются онтологические связи (иерархия, синонимы) и векторная близость (embedding similarity). Система параллельно тестирует несколько алгоритмов и выбирает наилучшую структуру SERP на основе метрик качества (покрытие, баланс, пересечение, силуэт). US10496691B1 2019-12-03 SERP Семантика и интент Knowledge Graph Как Google определяет сущности (например, болезни) по списку признаков (например, симптомов) в запросе пользователя Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы. US8843466B1 2014-09-23 Семантика и интент Knowledge Graph Индексация Как Google ранжирует сущности в Knowledge Graph, используя адаптивные веса для метрик вклада, известности и наград Google использует систему для ранжирования сущностей, извлеченных из Knowledge Graph. Система рассчитывает четыре ключевые метрики: связанность, значимость типа, вклад и награды. Затем она применяет весовые коэффициенты, которые адаптируются в зависимости от типа сущности (например, «Фильм» или «Человек»), чтобы определить итоговый рейтинг. Это влияет на то, какие сущности будут показаны в каруселях, панелях знаний и других функциях поиска, связанных с сущностями. US10235423B2 2019-03-19 Knowledge Graph Семантика и интент SERP Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы" Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы. US8244749B1 2012-08-14 Семантика и интент Персонализация Поведенческие сигналыПопулярные патенты Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска. US8131754B1 2012-03-06 Поведенческие сигналы Персонализация Семантика и интент Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules) Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости. US9146966B1 2015-09-29 Поведенческие сигналы SERP Как Google индексирует контент внутри мобильных приложений для показа в результатах поиска (App Indexing) Google использует механизм для индексации контента, который пользователи просматривают в нативных мобильных приложениях. Система получает данные о просмотренном контенте и deep links напрямую от приложения на устройстве. Эта информация сохраняется в индексе (персональном или публичном) и используется для генерации результатов поиска, позволяя пользователям переходить к контенту внутри приложений напрямую из поисковой выдачи. US10120949B2 2018-11-06 Индексация SERP Персонализация Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя. US20200159765A1 2020-05-21 Семантика и интент Мультимедиа Персонализация Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response. US12353458B2 2025-07-08 Ссылки Семантика и интент SERP Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы. US9213748B1 2015-12-15 SERP Семантика и интент Поведенческие сигналы Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов. US10366422B2 2019-07-30 Поведенческие сигналы Local SEO Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title) Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума. US7590628B2 2009-09-15 Семантика и интент Структура сайта Ссылки Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам. US8682892B1 2014-03-25 Ссылки EEAT и качество SERP Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время. US9342615B2 2016-05-17 Техническое SEO SERP Ссылкиseohardcore}$

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи

Описание

Какую проблему решает

Что запатентовано

Как это работает

Актуальность для SEO

Важность для SEO

Детальный разбор

Термины и определения

Ключевые утверждения (Анализ Claims)

Где и как применяется

На что влияет

Когда применяется

Пошаговый алгоритм

Какие данные и как использует

Данные на входе

Какие метрики используются и как они считаются

Выводы

Практика

Best practices (это мы делаем)

Worst practices (это делать не надо)

Стратегическое значение

Практические примеры

Вопросы и ответы

Похожие патенты

Популярные патенты