
Google использует запатентованный метод для автоматической генерации описаний документов (сниппетов) в результатах поиска. Система анализирует предложения в документе и ранжирует их на основе наличия трех элементов: самой фразы из запроса, семантически связанных фраз (определенных через Information Gain) и расширений фразы запроса. Наиболее релевантные предложения выбираются для формирования сниппета.
Патент решает задачу создания релевантных и информативных описаний документов (сниппетов) для отображения в результатах поиска. Вместо использования фиксированного текста (например, meta description) или простого извлечения текста вокруг ключевого слова, система стремится предоставить пользователю краткое изложение содержания документа, контекстуально связанное с поисковым запросом. Также рассматривается возможность персонализации сниппета.
Запатентован метод автоматической генерации описания документа в ответ на запрос. Суть изобретения заключается в ранжировании предложений документа на основе статистического подсчета трех типов фраз: 1) фраз из запроса (Query Phrases), 2) связанных фраз (Related Phrases), и 3) расширений фраз запроса (Phrase Extensions). Предложения с наибольшим количеством этих элементов выбираются для формирования описания.
Система функционирует на основе предварительно созданного фразового индекса, где определены связи между фразами (Related Phrases и Extensions).
Query Phrases (Qp), Related Phrases (Qr) и Phrase Extensions (Qe).Высокая. Генерация динамических, релевантных запросу сниппетов остается критически важной функцией поисковых систем для повышения CTR. Описанные в патенте принципы использования семантически связанных концепций (Related Phrases) для выбора наиболее информативных предложений лежат в основе современных подходов к генерации сниппетов, хотя конкретные реализации, вероятно, эволюционировали в сторону более сложных нейросетевых моделей (BERT/MUM).
Патент имеет высокое значение (8.5/10). Он напрямую описывает механизм, который определяет, какой именно текст будет показан пользователю в SERP. Понимание этого механизма позволяет SEO-специалистам оптимизировать структуру и контент страниц таким образом, чтобы влиять на выбор предложений для сниппета. Это подчеркивает важность использования не только целевых ключевых слов, но и семантически связанных фраз (Related Phrases) в ключевых предложениях контента.
Information Gain между ними превышает определенный порог. Это фразы, которые часто используются для обсуждения одной и той же темы.Good Phrase, идентифицированная в поисковом запросе пользователя.Патент фокусируется на методе генерации описания документа (сниппета).
Claim 1 (Независимый пункт): Описывает основной метод генерации описания документа.
Query Phrase.Query Phrase.Related Phrases (определенных через Information Gain выше порога).Phrase Extensions.Claim 2 (Зависимый от 1): Уточняет механизм выбора.
Предложения сортируются в порядке убывания их соответствующих подсчетов, и выбирается определенное количество предложений с наивысшими показателями.
Claim 3 (Зависимый от 2): Определяет строгую иерархию сортировки.
Query Phrase).Related Phrases).Phrase Extensions).Это определяет приоритеты системы: сначала точное соответствие запросу, затем семантический контекст, и в последнюю очередь — уточнения (расширения).
Claim 4 (Зависимый от 1): Уточняет формирование описания.
Описание формируется путем конкатенации (объединения) выбранных предложений в блок текста.
Изобретение затрагивает несколько этапов поисковой архитектуры, опираясь на данные, сгенерированные во время индексации, и применяясь после основного ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная работа: идентификация Good Phrases, расчет Information Gain, определение Related Phrases и Phrase Extensions. Эти данные сохраняются в индексе и базе данных фраз (Phrase Data).
QUNDERSTANDING – Понимание Запросов
При получении запроса система идентифицирует в нем Query Phrases и извлекает для них соответствующие Related Phrases и Phrase Extensions из Phrase Data.
RERANKING / METASEARCH (Presentation System)
Основное применение патента. После того как основной поиск (Search System) вернул набор ранжированных результатов, система презентации (Presentation System) генерирует сниппеты. Этот процесс происходит динамически для каждого запроса.
Входные данные:
Query Phrases (Qp).User Model для персонализации.Выходные данные:
User Model.Процесс А: Стандартная генерация сниппета (Claims 1-3)
Процесс Б: Персонализированная генерация сниппета (Description)
User Model (Ur).Система использует данные, сгенерированные на этапе индексирования, и данные, получаемые в реальном времени.
Good Phrase List: Список значимых фраз в корпусе.Related Phrases: Предварительно рассчитанные связи на основе Information Gain.Phrase Extensions: Предварительно идентифицированные расширения фраз.User Model: История фраз из ранее посещенных пользователем документов.Ключевые метрики для генерации сниппета (рассчитываются в реальном времени):
Метрики, используемые для подготовки данных (на этапе индексирования):
Related Phrases.Методы сортировки: Используется многоуровневая сортировка (Multi-key Sort) для ранжирования предложений на основе Count 1, Count 2 и Count 3 в строгом порядке приоритета.
Related Phrases) определяется статистически через Information Gain, что указывает на data-driven подход к пониманию семантической близости.User Model, получают приоритет, делая сниппет более релевантным интересам конкретного пользователя.Related Phrases), приведет к генерации менее информативных сниппетов.Этот патент подтверждает стратегическую важность семантической оптимизации контента. Для Google важно не просто наличие ключевых слов, но и контекст, в котором они используются, определяемый наличием связанных фраз. Это влияет не только на ранжирование (как описано в смежных патентах этого семейства), но и критически важно для представления документа в выдаче (CTR). Стратегия должна быть направлена на создание контента, который демонстрирует глубокое понимание темы, используя богатый набор связанных концепций.
Сценарий: Оптимизация сниппета для статьи о породе собак "Австралийская овчарка".
Целевой запрос (Qp): "Австралийская овчарка"
Предполагаемые связанные фразы (Qr): "блю мерль" (blue merle), "ред мерль" (red merle), "аусси" (aussie), "пастушья собака" (herding dog).
Предполагаемые расширения (Qe): "Австралийская овчарка стандарт породы".
Анализ предложений в документе:
Предложение А: "Австралийская овчарка – это порода собак."
Score: Qp=1, Qr=0, Qe=0.
Предложение Б: "Многие любят породу Австралийская овчарка, также известную как аусси."
Score: Qp=1, Qr=1, Qe=0.
Предложение В (Оптимизированное): "Австралийская овчарка (аусси) – это энергичная пастушья собака, часто имеющая окрас блю мерль или ред мерль."
Score: Qp=1, Qr=4, Qe=0.
Результат: Предложение В имеет наивысший совокупный рейтинг. При равном Qp (первичный ключ), оно выигрывает за счет более высокого Qr (вторичный ключ). Оно с наибольшей вероятностью будет выбрано системой для генерации сниппета.
Как система определяет, какие фразы являются «Связанными фразами» (Related Phrases) для данного запроса?
Патент указывает, что связь определяется на этапе индексирования с помощью метрики Information Gain (Прирост информации). Если фактическая частота совместной встречаемости двух фраз значительно превышает ожидаемую (т.е. Information Gain выше порога), они считаются связанными. Это статистический метод определения семантической близости.
В каком порядке система учитывает наличие фраз при выборе предложения для сниппета?
Патент (Claim 3) четко определяет порядок сортировки предложений. Первичный ключ — количество вхождений самой фразы запроса (Query Phrase). Вторичный ключ — количество связанных фраз (Related Phrases). Третичный ключ — количество расширений фразы (Phrase Extensions). Предложение с наилучшей комбинацией этих трех показателей будет выбрано.
Что такое «Расширение фразы» (Phrase Extension) и почему оно важно?
Phrase Extension — это более длинная фраза, которая начинается с базовой фразы (например, "SEO аудит сайта" является расширением для "SEO аудит"). Их наличие в предложении является третьим по важности фактором при выборе сниппета. Это показывает, что система ценит более полные и точные формулировки концепций.
Означает ли этот патент, что Meta Description больше не используется?
Нет, не означает. Патент описывает механизм автоматической генерации описания на основе контента страницы. Поисковые системы могут использовать этот механизм, когда Meta Description отсутствует, плохо заполнен или когда система считает, что динамически сгенерированный сниппет будет более релевантен запросу пользователя, чем статический Meta Description.
Как SEO-специалисту использовать знание этого патента для улучшения CTR?
Необходимо оптимизировать ключевые предложения на странице так, чтобы они были максимально информативными и семантически насыщенными. Включайте в одно предложение и целевой запрос, и связанные с ним сущности или LSI-фразы (потенциальные Related Phrases). Это повышает вероятность выбора именно этого предложения для сниппета, делая его более привлекательным для пользователя.
Влияет ли этот механизм на ранжирование документа?
Конкретно этот патент (US7584175B2) описывает только генерацию описаний (Presentation System) и не описывает влияния на ранжирование. Однако он является частью целого семейства патентов Анны Паттерсон (Phrase-Based Indexing/Searching), которые используют Related Phrases и Information Gain также и для ранжирования документов.
Что делать, если Google выбирает для сниппета нежелательный текст со страницы?
Проанализируйте выбранный текст на предмет наличия Query Phrases и Related Phrases. Вероятно, этот текст имеет более высокий совокупный рейтинг по этим показателям, чем тот текст, который вы хотели бы видеть. Чтобы изменить сниппет, нужно переписать желаемый текст, сделав его более семантически насыщенным, или деоптимизировать нежелательный текст.
Как работает персонализация сниппетов, описанная в патенте?
Система может использовать User Model (историю интересов пользователя, выраженную во фразах). При генерации сниппета приоритет отдается тем предложениям, которые содержат фразы, присутствующие как в запросе, так и в модели пользователя. Это делает сниппет более адаптированным под интересы конкретного человека.
Стоит ли использовать очень длинные предложения, чтобы вместить больше связанных фраз?
Хотя семантическая насыщенность важна, читабельность и структура также имеют значение. Слишком длинные и сложные предложения могут плохо восприниматься пользователями и могут быть обрезаны в SERP. Лучше стремиться к балансу между насыщенностью ключевыми и связанными фразами и ясностью изложения.
Как определить, какие именно фразы Google считает связанными (Related Phrases) с моим запросом?
Патент не предоставляет инструментов для этого, так как это внутренние данные Google, основанные на статистическом анализе всего корпуса. SEO-специалисты могут предполагать это, анализируя семантическое ядро, используя инструменты для анализа сущностей (Entities), изучая выдачу по смежным запросам и анализируя блок "People Also Ask".

SERP
Семантика и интент

SERP
Семантика и интент
Структура сайта

Персонализация
SERP
Семантика и интент

Семантика и интент
SERP

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Local SEO
Ссылки
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Ссылки
Краулинг
Техническое SEO

Поведенческие сигналы
SERP
Семантика и интент

Поведенческие сигналы
SERP
EEAT и качество

Персонализация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Семантика и интент
Антиспам

Local SEO
Поведенческие сигналы
