
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
Патент решает несколько ключевых проблем, связанных с использованием Больших Языковых Моделей (LLM) в поиске:
inaccurate responses) путем "заземления" (grounding) ответов LLM на актуальном контенте из результатов поиска.LLM выдает одинаковый ответ разным пользователям, что приводит к избыточной (over-specified) или недостаточной (under-specified) детализации. Система адаптирует ответы под контекст и знания пользователя.Запатентована система для генерации натурально-языковых сводок (NL based summary) в ответ на запрос с использованием LLM. Ключевым изобретением является процесс, при котором для генерации сводки LLM обрабатывает дополнительный контент (additional content), извлеченный из отобранных документов результатов поиска (Search Result Documents, SRDs). Это обеспечивает фактологическую основу для ответа. Также запатентованы механизмы итеративного уточнения сводки на основе взаимодействия пользователя и механизмы верификации с добавлением ссылок (linkifying).
Система работает в несколько этапов:
SRDs. Это могут быть результаты по исходному, связанным (related queries), недавним (recent queries) или подразумеваемым (implied queries) запросам. Отбор основан на различных метриках (зависящих от запроса, независимых от запроса, зависящих от пользователя).SRDs извлекается контент (текст, изображения, видео). Этот контент формирует входные данные для LLM.LLM обрабатывает входные данные и генерирует NL based summary.SRDs. Также рассчитываются меры уверенности (confidence measures).Критически высокая. Патент подан и опубликован в 2023 году и описывает фундаментальные механизмы, лежащие в основе современных генеративных функций в поиске, таких как Search Generative Experience (SGE) или AI Overviews. Решение проблем точности, актуальности и проверяемости генеративного контента является главной задачей поисковых систем в настоящее время.
Влияние на SEO критическое (10/10). Этот патент описывает новую парадигму поиска, где позиция №0 (генеративная сводка) формируется на основе контента из SRDs. Это радикально меняет стратегии по видимости и кликабельности. SEO-специалистам необходимо понимать, как контент их сайтов может быть выбран, извлечен, суммаризирован и атрибутирован в этих сводках. Попадание в набор SRDs, используемых для генерации, становится ключевой задачей.
LLM в ответ на запрос (аналог SGE ответа).LLM помимо самого запроса. В основном извлекается из SRDs.NL based summary, которые ведут на SRDs, подтверждающие эти утверждения (атрибуция/цитирование).NL based summary.SRD, зависящие от конкретного запроса (например, позиция в ранжировании, CTR для этого запроса, локальность, язык).SRD, не зависящие от запроса (например, общая популярность, авторитетность/trustworthiness measure, свежесть).SRD, зависящие от пользователя (например, соответствие интересам в профиле, история посещений).SRDs.Патент содержит несколько ключевых независимых пунктов, описывающих разные аспекты системы.
Claim 1 (Независимый пункт): Динамическое обновление сводки на основе взаимодействия (Итеративное уточнение).
Описывает метод реагирования на взаимодействие пользователя с результатами поиска после генерации первоначальной сводки.
NL based summary с помощью LLM на основе входных данных (input).SRDs отображаются пользователю.SRD (например, клик и просмотр).revised input). Revised input отражает факт произошедшего взаимодействия (т.е. учитывает, что пользователь ознакомился с контентом).LLM (тот же или другой) обрабатывает revised input и генерирует пересмотренную сводку (revised NL based summary), которая затем отображается.Это механизм для эволюции генеративного ответа в реальном времени. Система интерпретирует взаимодействие с источником как сигнал о получении пользователем информации и адаптирует последующую сводку, чтобы сделать ее более полезной (например, убрав уже известное или углубив тему).
Claim 13 (Независимый пункт): Генерация сводки на основе SRDs и аннотации уверенности (Grounded Generation).
Описывает основной процесс генерации сводки с акцентом на использовании результатов поиска и оценке качества ответа.
SRDs.LLM, обрабатывая контент из каждого SRD в наборе.NL based summary.Confidence Measure) для части этой сводки.confidence annotation), соответствующей рассчитанной мере.Это фундаментальный механизм "заземления" (grounding). LLM обязан использовать контент из отобранных веб-источников, а не только свои внутренние знания. Кроме того, система обязана оценивать уверенность в сгенерированном тексте.
Зависимые пункты (Детализация механизмов):
revised prompt) для того же LLM (указывая на знакомство пользователя с контентом), либо использованием другого LLM, специально настроенного (fine-tuned) для учета известных фактов.SRDs выбираются на основе различных признаков (query-dependent, query-independent, user-dependent). Также могут включаться SRDs по связанным запросам (related queries), если корреляция достаточно сильна.SRDs к тем частям сводки, которые подтверждаются (verifiable) контентом этих SRDs.Изобретение затрагивает несколько ключевых этапов поиска, интегрируя генеративные модели с традиционным ранжированием и формированием выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе рассчитываются Query-independent measures (например, авторитетность/trustworthiness, свежесть), которые критичны для последующего отбора источников.
RANKING – Ранжирование
На этом этапе происходит отбор кандидатов (SRDs) и расчет Query-dependent measures (например, позиция, релевантность) и User-dependent measures.
QUNDERSTANDING – Понимание Запросов
Система идентифицирует связанные, недавние или подразумеваемые запросы для расширения контекста. Также может происходить выбор конкретной LLM для использования (Model Routing).
METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Это основной этап применения патента. Здесь происходит:
SRDs.LLM.NL based summary.Confidence Measures и Linkifying.Входные данные:
SRDs и их контент (текст, изображения, видео).SRDs (Query/User/Independent measures).Выходные данные:
NL based summary (первоначальная или пересмотренная).YMYL-тематиках, где авторитетность источников (trustworthiness) и возможность верификации играют ключевую роль.SRDs.SRD в течение порогового времени).Процесс А: Генерация первоначальной сводки (на основе FIG. 2)
Query-responsive SRDs на основе всех трех типов метрик.SRDs из связанных, недавних или подразумеваемых запросов, если корреляция высока.SRD.LLM для создания NL based summary.SRDs, которые подтверждают части сводки (например, с помощью сравнения эмбеддингов - FIG. 3).Confidence Measures.NL based summary пользователю, включая ссылки (Linkifying) и аннотации уверенности.Процесс Б: Динамическое обновление сводки (на основе FIG. 4, Claim 1)
SRDs.SRD.LLM, отражающих факт ознакомления пользователя с контентом. Это достигается через измененный промпт (например, "Учитывая, что пользователь уже знает X...") или использование специально настроенного LLM.Revised Input для создания Revised NL based summary.Система использует разнообразные данные для отбора источников и генерации сводки:
SRDs. Система извлекает релевантные фрагменты текста.SRDs. Для изображений: автогенерируемые подписи (image captioning model), распознанный текст, дескрипторы объектов (object detection model). Для видео: автоматически сгенерированные транскрипции.SRDs используются: Query-dependent measures: Позиция в ранжировании, CTR для запроса, локальность, язык.Query-independent measures: Авторитетность (trustworthiness measure), общая популярность, свежесть (freshness measure).User-dependent measures: Соответствие профилю пользователя, истории поиска.SRDs, dwell time) используется для запуска динамического обновления сводки. Логи запросов используются для определения related queries.LLM.SRD с помощью модели-энкодера (encoder model).LLM, метриках авторитетности (trustworthiness) подтверждающих источников и/или количестве подтверждающих источников.LLM. Система активно использует контент из актуальных результатов поиска (SRDs) в качестве входных данных для LLM. Это критически важно для обеспечения точности, актуальности и снижения галлюцинаций.SRDs для генерации сводки напрямую зависит от метрик ранжирования (Query-dependent, Query-independent, User-dependent). Чтобы участвовать в генеративной сводке, сайт должен сначала высоко ранжироваться по релевантным запросам и быть авторитетным.SRDs).LLM извлекается не только из текста, но и из изображений и видео на страницах SRDs, подчеркивая важность оптимизации всех типов медиа.SRD), он должен быть отобран системой на основе стандартных метрик, включая авторитетность (trustworthiness measure). Работа над E-E-A-T критически важна.Linkifying). Используйте явные ответы на вопросы, четкие определения и структурированные данные. Контент должен быть написан так, чтобы его эмбеддинг точно соответствовал потенциальному утверждению в сводке.LLM.SRDs из связанных и недавних запросов, важно полностью покрывать тему. Это увеличивает вероятность того, что ваш сайт будет использован как источник для широкого спектра запросов в рамках кластера.LLM или не пройдет этап верификации.SRD для генерации сводки.Этот патент описывает архитектуру генеративного поиска (SGE/AI Overviews). Стратегическое значение для SEO заключается в переходе от борьбы за позиции к борьбе за «цитирование» (linkifying) внутри генеративного ответа. Видимость теперь означает не только позицию в списке ссылок, но и присутствие контента и атрибуции в NL based summary. Долгосрочная стратегия должна быть направлена на создание наиболее авторитетного, четкого и легко извлекаемого контента в нише.
Сценарий 1: Оптимизация статьи для верификации (Linkifying)
LLM, и получит ссылку.Сценарий 2: Адаптация контента под динамическое обновление
Как этот патент связан с Google SGE (Search Generative Experience) или AI Overviews?
Патент описывает базовую архитектуру и ключевые механизмы, которые используются в SGE и AI Overviews. Он объясняет, как Google использует LLM для генерации ответов, как обеспечивает точность за счет использования контента веб-сайтов (grounding), как добавляет ссылки на источники (linkifying) и как планирует развивать диалоговый поиск через итеративное уточнение.
Что самое важное для SEO, чтобы сайт цитировался в генеративной сводке?
Ключевыми являются два этапа: отбор в качестве источника (SRD) и успешная верификация контента. Для отбора необходимы высокие показатели по всем трем типам метрик: релевантность запросу, авторитетность сайта (E-E-A-T) и персонализация. Для верификации контент должен быть четким, фактически точным и легко извлекаемым, чтобы его эмбеддинг совпал с утверждением в сводке.
Как работает механизм верификации и добавления ссылок (Linkifying)?
Система сравнивает контент сводки с источниками (FIG. 3). Она создает эмбеддинги (векторные представления) для утверждения в сводке и для текста источника и измеряет расстояние между ними. Если расстояние мало (семантическая близость высока), утверждение считается верифицированным, и система добавляет кликабельную ссылку (citation) на источник.
Использует ли LLM только контент с сайтов или свои собственные знания?
Патент указывает, что LLM в первую очередь обрабатывает контент, извлеченный из SRDs. Однако также упоминается, что сводка может включать контент, который не выводится напрямую из предоставленного контента, а генерируется на основе общих знаний LLM (полученных в ходе обучения). Тем не менее, фокус патента именно на grounding в SRDs для повышения точности.
Что такое «Итеративное уточнение» или динамическое обновление сводки?
Это механизм (Claim 1, FIG. 4), который обновляет сводку после того, как пользователь кликнул на один из источников и изучил его. Система предполагает, что пользователь теперь знаком с этой информацией, и генерирует пересмотренную сводку (часто с измененным промптом, например, "предположим, пользователь уже знает X"). Это делает поиск более диалоговым.
Как оптимизировать изображения и видео для этого алгоритма?
Система извлекает информацию из мультимедиа для использования в LLM. Для изображений это могут быть автогенерируемые подписи, распознанный текст или дескрипторы объектов. Для видео используются транскрипции. SEO-специалистам следует предоставлять четкие, фактические текстовые эквиваленты (alt-тексты, субтитры, окружающий текст), чтобы помочь системе интерпретировать мультимедийный контент.
Что такое «Аннотации уверенности» (Confidence Annotations)?
Это индикаторы (Claim 13), которые Google может отображать рядом с утверждениями в сводке, чтобы показать степень уверенности системы в их точности. Confidence Measure может зависеть от внутренних оценок LLM, а также от качества (авторитетности) и количества источников (SRDs), которые подтверждают это утверждение.
Как Google решает, какую LLM использовать для ответа?
Патент описывает механизм выбора, где система может выбрать одну, несколько или ни одной генеративной модели из кандидатов (например, информационная LLM, креативная LLM, модель генерации изображений). Выбор основан на классификации интента запроса и/или анализе результатов поиска.
Влияет ли персонализация на генеративные сводки?
Да, значительно. Во-первых, при отборе SRDs используются User-dependent measures и контент из недавних запросов. Во-вторых, система может адаптировать сводку, если определит по профилю пользователя (FIG. 6), что он уже знаком с частью темы, и соответствующим образом скорректировать промпт для LLM.
Что важнее для попадания в сводку: авторитетность сайта или релевантность страницы?
Оба фактора критически важны, так как они используются при отборе SRDs. Релевантность страницы (Query-dependent measures) необходима, чтобы попасть в рассмотрение. Авторитетность сайта (Query-independent measures, например, trustworthiness) используется для выбора лучших источников среди релевантных и также влияет на расчет уверенности.

SERP
EEAT и качество
Персонализация

Мультимедиа
EEAT и качество
Ссылки

Мультимедиа
EEAT и качество
Семантика и интент

Персонализация
Семантика и интент

Семантика и интент
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Персонализация
SERP
Семантика и интент

Ссылки
SERP
EEAT и качество

Ссылки
Структура сайта
Семантика и интент

Структура сайта
Техническое SEO
Ссылки

Ссылки
SERP
Индексация

Персонализация
Ссылки

Свежесть контента
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP
