
Google использует статистический анализ частоты запросов и их связи с категориями документов для выявления сильных ассоциаций (например, запрос «суши-бар» и категория «Японский ресторан»). Если пользователь вводит запрос, который является таким ключевым словом, документы, принадлежащие к соответствующей категории, получают повышение в ранжировании.
Патент решает задачу повышения релевантности поисковой выдачи путем использования категоризации документов. На момент подачи заявки существующие методы категоризации считались недостаточно полезными для поисковых систем. Изобретение предлагает механизм для автоматического определения того, какие поисковые запросы (ключевые слова) статистически сильно связаны с определенными категориями документов, и использования этих связей для улучшения ранжирования.
Запатентована система автоматической генерации ключевых слов, ассоциированных с категориями документов. Система анализирует корпус документов и логи поисковых запросов для выявления пар (Keyword, Category), которые имеют сильную статистическую корреляцию (высокий F-measure). Эта корреляция рассчитывается на основе частоты использования ключевого слова в запросах и частоты его появления в документах определенной категории.
Система работает в два этапа: генерация ключевых слов (офлайн) и применение в ранжировании (онлайн).
F-measure), которая учитывает, насколько часто слово используется в запросах и насколько оно специфично для данной категории (сильная корреляция внутри категории и слабая корреляция между категориями).Высокая. Описанный механизм является фундаментальным для понимания того, как Google интерпретирует интент запроса через призму категорий. Это особенно актуально для локального поиска (Local SEO), электронной коммерции и любых ниш, где существует четкая таксономия. Понимание связи между запросами и категориями сущностей является ключевым элементом современного поиска.
Патент имеет высокое значение для SEO, особенно в стратегиях, связанных с Local SEO и E-commerce. Он демонстрирует механизм, при котором правильная категоризация документа может привести к значительному повышению ранжирования по специфическим запросам, которые Google статистически связал с этой категорией. Это подчеркивает важность обеспечения четких сигналов, позволяющих Google корректно классифицировать контент и сущности (например, бизнес или продукт).
Claim 1 (Независимый пункт): Описывает метод идентификации и использования ключевых слов на основе категорий для приоритезации результатов поиска.
Keyword Candidate из документа. Кандидат должен присутствовать как в документе, так и в предыдущих поисковых запросах.Keyword с документом, если выполняются условия: Keyword и категорией.Claim 6 и 7 (Зависимые): Детализируют механизм оценки связи с помощью расчета Score.
Score для Keyword Candidate на основе рассчитанных частот.Keyword, если Score превышает пороговое значение.Score (F-measure): , где 'a' — константа между 0 и 1, P(keyword) — вероятность появления кандидата в предыдущих запросах, P(category) — вероятность появления кандидата в документах категории, и P(keyword, category) — совместная вероятность.Claim 20 (Независимый пункт): Описывает метод применения сгенерированных данных в процессе ранжирования.
Keyword Candidate в каждой категории.Keyword с категорией на основе рассчитанных частот.Keyword. Это включает повышение рангов документов, которые принадлежат к категории, ассоциированной с Keyword, по сравнению с документами, не принадлежащими к этой категории.Изобретение охватывает несколько этапов поисковой архитектуры, разделяя процесс на офлайн-подготовку данных и онлайн-применение в ранжировании.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна извлечь Document Information (например, данные бизнес-листинга) и определить или присвоить категории документам. Эта информация сохраняется для последующего анализа.
QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основная часть работы по генерации ключевых слов происходит офлайн. Система анализирует логи поисковых запросов (user behavior data) и корпус проиндексированных документов для выявления статистических связей между запросами и категориями. Результатом является база данных пар (Keyword, Category) с рассчитанными оценками (Scores).
RANKING – Ранжирование (Онлайн-применение)
Механизм применяется во время выполнения запроса для корректировки ранжирования.
Keyword, для которого существует сильная связь с Category.Keyword, документы, принадлежащие к соответствующей Category, получают повышение в ранжировании (Prioritizing/Rank documents based on Keyword/Category).Входные данные:
Document Information).Search Queries/User behavior data).Document Information и Categories.Выходные данные:
Scores).Keyword, который был предварительно идентифицирован как статистически значимый для определенной Category (т.е. имеет высокий Score/F-measure).Score.Процесс А: Генерация ключевых слов, связанных с категориями (Офлайн)
Keyword Candidates из корпуса документов и логов поисковых запросов. Кандидаты часто берутся из документов, содержащих специфическую информацию (например, бизнес-листинги).Keyword Candidate и связанную с ним Document Information.Keyword Candidate в логах поисковых запросов.Document Information с определенными Categories (например, название бизнеса соотносится с бизнес-категорией). Создание пар (Кандидат/Категория).Score (например, F-measure) для каждой пары (Кандидат/Категория).Keywords для данной категории.Keywords и их связи с категориями и документами.Процесс Б: Применение в ранжировании (Онлайн)
Keywords.Category, соответствующей Keyword.Search Queries). Они используются для определения Keyword Candidates и расчета частоты их использования (P(keyword)). Также упоминаются User behavior data, включающие навигационные действия (клики, выбранные ссылки/категории), язык пользователя, интересы.Document Information — текст или метаданные в документе. В патенте особо выделяются бизнес-листинги (название, адрес, телефон).Categories. Они могут быть получены из самих документов, определены на основе Document Information или получены от третьих сторон.Keyword Candidate в логах запросов.F-measure, а также пороги для определения сильной корреляции «внутри» и слабой «между» категориями.F-measure для балансировки популярности запроса и его специфичности для категории. Недостаточно просто часто встречаться в категории; нужно также редко встречаться вне ее (слабая корреляция «между» категориями).User behavior data) для определения кандидатов и их популярности. Это означает, что система адаптируется к тому, как пользователи ищут информацию в разных категориях.Keyword для определенной Category, то принадлежность документа к этой категории становится сильным сигналом ранжирования для данного запроса.Product с категорией).F-measure), вы получите преимущество.Document Information (бизнес-листингов) для маппинга документов в категории.Этот патент подтверждает стратегическую важность entity-based SEO и корректной классификации контента. Google стремится понять не только текст на странице, но и то, к какому классу объектов этот текст относится. В долгосрочной стратегии необходимо фокусироваться на том, чтобы сайт или бизнес однозначно и авторитетно представлял свою категорию. Это обеспечивает устойчивое ранжирование по запросам, которые подразумевают эту категорию.
Сценарий: Оптимизация сайта автомастерской (Local SEO)
F-measure).Keyword, связанный с категорией «Авторемонт». Сайт автомастерской, корректно классифицированный в этой категории, получает повышение в ранжировании по сравнению с информационным сайтом, пишущим о замене масла.Сценарий: Оптимизация интернет-магазина (E-commerce)
Как система определяет категорию документа?
Патент указывает несколько способов. Категория может быть предоставлена самим документом, определена из информации, содержащейся в документе (Document Information), или получена от третьих сторон. В примерах патента часто используется информация из бизнес-листингов (название, адрес) для определения бизнес-категории.
Что такое F-measure и почему это важно?
F-measure — это статистическая оценка, которая определяет силу связи между ключевым словом и категорией. Она важна, потому что учитывает баланс между точностью (Precision) и полнотой (Recall). Высокий F-measure означает, что ключевое слово часто встречается в этой категории И редко встречается в других, что делает его надежным индикатором интента пользователя.
Что важнее: популярность запроса или его специфичность для категории?
Важны оба фактора. Система рассчитывает P(keyword) (популярность в запросах) и анализирует корреляцию внутри/между категориями (специфичность). Ключевое слово должно быть достаточно популярным, чтобы его стоило оптимизировать, и достаточно специфичным, чтобы надежно указывать на категорию.
Как этот патент влияет на Local SEO?
Он имеет критическое значение для Local SEO. Патент описывает, как Google связывает общие запросы услуг (например, «стрижка», «замена масла», «доставка цветов») с конкретными бизнес-категориями («Салон красоты», «Авторемонт», «Цветочный магазин»). Корректная настройка категорий в GBP напрямую влияет на ранжирование по этим запросам.
Может ли этот механизм понизить мой сайт в выдаче?
Да, косвенно. Если ваш сайт не принадлежит к категории, с которой сильно связан запрос, он будет ранжироваться ниже, чем сайты, которые к ней принадлежат. Например, если вы пишете информационную статью о суши, она, скорее всего, уступит в ранжировании локальным ресторанам по запросу «суши-бар», так как этот запрос имеет сильный категориальный интент.
Как я могу узнать, какие ключевые слова Google связал с моей категорией?
Патент не предоставляет интерфейса для этого, но вы можете провести анализ выдачи. Изучите, какие типы сайтов ранжируются по вашим целевым запросам. Если в топе доминируют сайты определенной категории, это сильный индикатор того, что Google установил связь между этим запросом и категорией.
Откуда берутся кандидаты в ключевые слова?
Кандидаты извлекаются из реальных поисковых запросов пользователей (Search Queries/User behavior data), которые также встречаются в проиндексированных документах. Это гарантирует, что система оптимизирует выдачу под реальное поведение пользователей.
Влияет ли этот патент на ранжирование информационных сайтов?
Да, хотя примеры в патенте фокусируются на бизнесе, механизм применим к любым категориям (например, Наука, Искусство, Новости). Если информационный сайт четко позиционируется в определенной тематической категории, он может получать преимущество по запросам, связанным с этой категорией.
Что означает параметр 'a' в формуле F-measure?
Параметр 'a' (константа от 0 до 1) используется для настройки баланса между Precision и Recall. Если a=1, используется чистый Recall (P(category|keyword)). Если a=0, используется чистая Precision (P(keyword|category)). Патент предполагает, что 'a' выбирается для наилучшей эмпирической производительности, часто близко к 1 (приоритет Recall).
Как часто обновляются эти ассоциации между ключевыми словами и категориями?
Патент указывает, что процесс генерации ключевых слов выполняется периодически в офлайн-режиме, так как поведение пользователей постоянно меняется. Система может учитывать возраст поисковых запросов при определении кандидатов, что позволяет адаптироваться к изменениям в языке и трендах.

Семантика и интент
SERP

Семантика и интент
SERP

Local SEO
Семантика и интент
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы

Knowledge Graph
Семантика и интент
Персонализация

Поведенческие сигналы
SERP
Семантика и интент

Ссылки
Антиспам
Краулинг

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
EEAT и качество
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Ссылки
Поведенческие сигналы
EEAT и качество

Семантика и интент
Персонализация
Поведенческие сигналы
