SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы

GENERATIVE SUMMARIES FOR SEARCH RESULTS (Генеративные сводки для результатов поиска)
  • US11769017B1
  • Google LLC
  • 2023-03-20
  • 2023-09-26
  • EEAT и качество
  • Ссылки
  • SERP
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.

Описание

Какую проблему решает

Патент решает несколько ключевых проблем, связанных с использованием Больших Языковых Моделей (LLM) в поиске:

  • Точность и Галлюцинации: Устраняет риск генерации недостоверной или устаревшей информации (inaccurate responses) путем "заземления" (grounding) ответов LLM на актуальном контенте из результатов поиска.
  • Проверяемость (Verifiability): Повышает доверие к генеративным ответам путем предоставления механизмов для проверки утверждений и указания источников.
  • Статичность Ответов и Детализация: Решает проблему, когда LLM выдает одинаковый ответ разным пользователям, что приводит к избыточной (over-specified) или недостаточной (under-specified) детализации. Система адаптирует ответы под контекст и знания пользователя.
  • Итеративное взаимодействие: Преобразует поиск в диалог, где сводка обновляется по мере того, как пользователь изучает источники.

Что запатентовано

Запатентована система для генерации натурально-языковых сводок (NL based summary) в ответ на запрос с использованием LLM. Ключевым изобретением является процесс, при котором для генерации сводки LLM обрабатывает дополнительный контент (additional content), извлеченный из отобранных документов результатов поиска (Search Result Documents, SRDs). Это обеспечивает фактологическую основу для ответа. Также запатентованы механизмы итеративного уточнения сводки на основе взаимодействия пользователя и механизмы верификации с добавлением ссылок (linkifying).

Как это работает

Система работает в несколько этапов:

  1. Выбор Источников (SRD Selection): В ответ на запрос система отбирает набор SRDs. Это могут быть результаты по исходному, связанным (related queries), недавним (recent queries) или подразумеваемым (implied queries) запросам. Отбор основан на различных метриках (зависящих от запроса, независимых от запроса, зависящих от пользователя).
  2. Генерация Входных Данных: Из отобранных SRDs извлекается контент (текст, изображения, видео). Этот контент формирует входные данные для LLM.
  3. Генерация Сводки: LLM обрабатывает входные данные и генерирует NL based summary.
  4. Верификация и Линковка (Linkifying): Система проверяет утверждения в сводке, сравнивая их с источниками (например, используя эмбеддинги), и добавляет ссылки на подтверждающие SRDs. Также рассчитываются меры уверенности (confidence measures).
  5. Динамическое Обновление: Если пользователь взаимодействует с одним из источников, система может перегенерировать сводку (Claim 1), используя новый промпт, который учитывает, что пользователь теперь знаком с контентом этого источника.

Актуальность для SEO

Критически высокая. Патент подан и опубликован в 2023 году и описывает фундаментальные механизмы, лежащие в основе современных генеративных функций в поиске, таких как Search Generative Experience (SGE) или AI Overviews. Решение проблем точности, актуальности и проверяемости генеративного контента является главной задачей поисковых систем в настоящее время.

Важность для SEO

Влияние на SEO критическое (10/10). Этот патент описывает новую парадигму поиска, где позиция №0 (генеративная сводка) формируется на основе контента из SRDs. Это радикально меняет стратегии по видимости и кликабельности. SEO-специалистам необходимо понимать, как контент их сайтов может быть выбран, извлечен, суммаризирован и атрибутирован в этих сводках. Попадание в набор SRDs, используемых для генерации, становится ключевой задачей.

Детальный разбор

Термины и определения

LLM (Large Language Model)
Большая языковая модель. Генеративная модель (например, PaLM, LaMDA), используемая для обработки входных данных и генерации сводки.
NL based summary (Сводка на естественном языке)
Генеративный ответ, созданный LLM в ответ на запрос (аналог SGE ответа).
SRD (Search Result Document)
Документ результата поиска. Веб-страница или ресурс, используемый как источник для генерации сводки.
Additional Content (Дополнительный контент)
Контент, который подается на вход LLM помимо самого запроса. В основном извлекается из SRDs.
Linkifying (Линковка)
Процесс добавления ссылок к частям NL based summary, которые ведут на SRDs, подтверждающие эти утверждения (атрибуция/цитирование).
Confidence Measure (Мера уверенности)
Метрика, оценивающая достоверность или точность части или всей NL based summary.
Query-dependent measures
Метрики SRD, зависящие от конкретного запроса (например, позиция в ранжировании, CTR для этого запроса, локальность, язык).
Query-independent measures
Метрики SRD, не зависящие от запроса (например, общая популярность, авторитетность/trustworthiness measure, свежесть).
User-dependent measures
Метрики SRD, зависящие от пользователя (например, соответствие интересам в профиле, история посещений).
Related/Recent/Implied Queries
Связанные (часто задаваемые вместе), недавние (в истории пользователя) или подразумеваемые (автоматически сгенерированные на основе контекста) запросы, используемые для расширения набора SRDs.

Ключевые утверждения (Анализ Claims)

Патент содержит несколько ключевых независимых пунктов, описывающих разные аспекты системы.

Claim 1 (Независимый пункт): Динамическое обновление сводки на основе взаимодействия (Итеративное уточнение).

Описывает метод реагирования на взаимодействие пользователя с результатами поиска после генерации первоначальной сводки.

  1. Система генерирует первоначальную NL based summary с помощью LLM на основе входных данных (input).
  2. Сводка и ссылки на SRDs отображаются пользователю.
  3. Система обнаруживает взаимодействие пользователя с конкретным SRD (например, клик и просмотр).
  4. В ответ система генерирует пересмотренные входные данные (revised input). Revised input отражает факт произошедшего взаимодействия (т.е. учитывает, что пользователь ознакомился с контентом).
  5. LLM (тот же или другой) обрабатывает revised input и генерирует пересмотренную сводку (revised NL based summary), которая затем отображается.

Это механизм для эволюции генеративного ответа в реальном времени. Система интерпретирует взаимодействие с источником как сигнал о получении пользователем информации и адаптирует последующую сводку, чтобы сделать ее более полезной (например, убрав уже известное или углубив тему).

Claim 13 (Независимый пункт): Генерация сводки на основе SRDs и аннотации уверенности (Grounded Generation).

Описывает основной процесс генерации сводки с акцентом на использовании результатов поиска и оценке качества ответа.

  1. В ответ на запрос система выбирает набор SRDs.
  2. Система генерирует вывод LLM, обрабатывая контент из каждого SRD в наборе.
  3. Генерируется NL based summary.
  4. Система генерирует меру уверенности (Confidence Measure) для части этой сводки.
  5. Сводка отображается пользователю с аннотацией уверенности (confidence annotation), соответствующей рассчитанной мере.

Это фундаментальный механизм "заземления" (grounding). LLM обязан использовать контент из отобранных веб-источников, а не только свои внутренние знания. Кроме того, система обязана оценивать уверенность в сгенерированном тексте.

Зависимые пункты (Детализация механизмов):

  • Механизм обновления (Claims 8, 9): Обновление достигается либо путем изменения промпта (revised prompt) для того же LLM (указывая на знакомство пользователя с контентом), либо использованием другого LLM, специально настроенного (fine-tuned) для учета известных фактов.
  • Выбор SRDs (Claims 14-17): SRDs выбираются на основе различных признаков (query-dependent, query-independent, user-dependent). Также могут включаться SRDs по связанным запросам (related queries), если корреляция достаточно сильна.
  • Линковка (Claims 18-20): Система добавляет кликабельные ссылки на SRDs к тем частям сводки, которые подтверждаются (verifiable) контентом этих SRDs.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска, интегрируя генеративные модели с традиционным ранжированием и формированием выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе рассчитываются Query-independent measures (например, авторитетность/trustworthiness, свежесть), которые критичны для последующего отбора источников.

RANKING – Ранжирование
На этом этапе происходит отбор кандидатов (SRDs) и расчет Query-dependent measures (например, позиция, релевантность) и User-dependent measures.

QUNDERSTANDING – Понимание Запросов
Система идентифицирует связанные, недавние или подразумеваемые запросы для расширения контекста. Также может происходить выбор конкретной LLM для использования (Model Routing).

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Это основной этап применения патента. Здесь происходит:

  • Финальный отбор набора SRDs.
  • Извлечение и подготовка контента для LLM.
  • Генерация NL based summary.
  • Верификация, расчет Confidence Measures и Linkifying.
  • Обработка взаимодействий и динамическое обновление сводки в реальном времени.

Входные данные:

  • Исходный запрос (и связанные/недавние запросы).
  • Набор ранжированных SRDs и их контент (текст, изображения, видео).
  • Метрики SRDs (Query/User/Independent measures).
  • Данные профиля пользователя и контекст.
  • Сигналы взаимодействия пользователя с выдачей (клики, dwell time).

Выходные данные:

  • NL based summary (первоначальная или пересмотренная).
  • Ссылки на источники (атрибуция).
  • Аннотации уверенности.

На что влияет

  • Типы контента: Влияет на все типы контента. Система извлекает информацию из текста, изображений (через подписи, распознавание объектов) и видео (через транскрипции).
  • Специфические запросы: Наибольшее влияние на информационные и сложные запросы, требующие синтеза информации из нескольких источников.
  • Конкретные ниши: Критическое влияние в YMYL-тематиках, где авторитетность источников (trustworthiness) и возможность верификации играют ключевую роль.

Когда применяется

  • Триггеры активации (Генерация): Применяется, когда система решает использовать генеративную модель для ответа. Это может зависеть от типа запроса и качества доступных SRDs.
  • Триггеры активации (Обновление): Механизм обновления (Claim 1) активируется при обнаружении взаимодействия пользователя (например, просмотр SRD в течение порогового времени).
  • Условия для Linkifying: Применяется, когда система может верифицировать утверждение в сводке, сравнив его с источником (например, если расстояние между эмбеддингами ниже порога).

Пошаговый алгоритм

Процесс А: Генерация первоначальной сводки (на основе FIG. 2)

  1. Получение запроса.
  2. Отбор набора SRDs:
    • Выбор Query-responsive SRDs на основе всех трех типов метрик.
    • (Опционально) Расширение набора за счет SRDs из связанных, недавних или подразумеваемых запросов, если корреляция высока.
  3. Подготовка входных данных для LLM:
    • Извлечение контента (текст, изображения, видео) из каждого отобранного SRD.
    • (Опционально) Суммаризация контента, если он слишком велик.
    • (Опционально) Добавление идентификаторов источников (Source Identifiers) к контенту.
  4. Генерация сводки (LLM Processing): Обработка подготовленных входных данных с помощью LLM для создания NL based summary.
  5. Постобработка (Верификация и Аннотация):
    • Определение SRDs, которые подтверждают части сводки (например, с помощью сравнения эмбеддингов - FIG. 3).
    • Расчет финальных Confidence Measures.
  6. Рендеринг: Отображение NL based summary пользователю, включая ссылки (Linkifying) и аннотации уверенности.

Процесс Б: Динамическое обновление сводки (на основе FIG. 4, Claim 1)

  1. Мониторинг взаимодействия: После Процесса А система отслеживает взаимодействие пользователя с SRDs.
  2. Обнаружение взаимодействия: Фиксация факта просмотра конкретного SRD.
  3. Подготовка пересмотренных входных данных (Revised Input): Создание новых входных данных для LLM, отражающих факт ознакомления пользователя с контентом. Это достигается через измененный промпт (например, "Учитывая, что пользователь уже знает X...") или использование специально настроенного LLM.
  4. Генерация пересмотренной сводки: Обработка Revised Input для создания Revised NL based summary.
  5. Рендеринг обновления: Замена первоначальной сводки на пересмотренную в интерфейсе пользователя.

Какие данные и как использует

Данные на входе

Система использует разнообразные данные для отбора источников и генерации сводки:

  • Контентные факторы: Текст из SRDs. Система извлекает релевантные фрагменты текста.
  • Мультимедиа факторы: Данные из изображений и видео в SRDs. Для изображений: автогенерируемые подписи (image captioning model), распознанный текст, дескрипторы объектов (object detection model). Для видео: автоматически сгенерированные транскрипции.
  • Сигналы Ранжирования (Метрики SRD): Для отбора SRDs используются:
    • Query-dependent measures: Позиция в ранжировании, CTR для запроса, локальность, язык.
    • Query-independent measures: Авторитетность (trustworthiness measure), общая популярность, свежесть (freshness measure).
    • User-dependent measures: Соответствие профилю пользователя, истории поиска.
  • Поведенческие факторы: Взаимодействие пользователя с выдачей в реальном времени (клики на SRDs, dwell time) используется для запуска динамического обновления сводки. Логи запросов используются для определения related queries.
  • Пользовательские факторы: Профиль пользователя используется для определения знакомства с контентом (FIG. 6), что влияет на генерацию первоначальной сводки (персонализация промпта).

Какие метрики используются и как они считаются

  • Метрики для отбора SRD: Используются стандартные метрики ранжирования (описанные выше) для фильтрации и выбора наилучших источников для подачи в LLM.
  • Magnitude of Correlation (Величина корреляции): Метрика для определения связанных запросов. Основана на частоте совместного появления запросов в сессиях.
  • Метрики Верификации (для Linkifying):
    • Сравнение Эмбеддингов: Система генерирует эмбеддинги для утверждения в сводке и для контента SRD с помощью модели-энкодера (encoder model).
    • Distance Measure (Мера расстояния): Рассчитывается расстояние между эмбеддингами. Если расстояние меньше порога, утверждение считается верифицированным.
  • Confidence Measure (Мера уверенности): Рассчитывается для частей сводки. Может основываться на внутренних оценках LLM, метриках авторитетности (trustworthiness) подтверждающих источников и/или количестве подтверждающих источников.

Выводы

  1. "Заземление" (Grounding) LLM на результатах поиска: Ключевой вывод – Google не полагается только на внутренние знания LLM. Система активно использует контент из актуальных результатов поиска (SRDs) в качестве входных данных для LLM. Это критически важно для обеспечения точности, актуальности и снижения галлюцинаций.
  2. Ранжирование определяет генерацию: Отбор SRDs для генерации сводки напрямую зависит от метрик ранжирования (Query-dependent, Query-independent, User-dependent). Чтобы участвовать в генеративной сводке, сайт должен сначала высоко ранжироваться по релевантным запросам и быть авторитетным.
  3. Верификация и Атрибуция (Linkifying): Система использует технические методы (сравнение эмбеддингов) для проверки того, подтверждает ли источник утверждение в сводке. Только верифицированные утверждения могут получать атрибуцию (ссылку). Это подчеркивает важность четкости и фактологичности контента.
  4. Меры уверенности (Confidence Measures): Google активно рассчитывает и может отображать уровень уверенности в сгенерированном контенте. Уверенность зависит от качества и авторитетности используемых источников (SRDs).
  5. Динамическое и Итеративное обновление: Генеративная сводка не статична. Патент описывает механизм (Claim 1), где сводка переписывается в реальном времени по мере того, как пользователь кликает на источники. Система адаптирует ответ, предполагая, что пользователь усвоил информацию из просмотренного источника.
  6. Мультимодальность ввода: Контент для LLM извлекается не только из текста, но и из изображений и видео на страницах SRDs, подчеркивая важность оптимизации всех типов медиа.

Практика

Best practices (это мы делаем)

  • Обеспечение высокого ранжирования и авторитетности (E-E-A-T): Это фундаментальная задача. Чтобы контент был рассмотрен как источник (SRD), он должен быть отобран системой на основе стандартных метрик, включая авторитетность (trustworthiness measure). Работа над E-E-A-T критически важна.
  • Фокус на четкости, структуре и фактологичности контента: Оптимизируйте контент для верификации (Linkifying). Используйте явные ответы на вопросы, четкие определения и структурированные данные. Контент должен быть написан так, чтобы его эмбеддинг точно соответствовал потенциальному утверждению в сводке.
  • Оптимизация мультимедиа контента: Поскольку система извлекает данные из изображений и видео, необходимо оптимизировать эти активы. Предоставляйте детальные текстовые описания (alt-текст, подписи) для изображений и точные транскрипции для видео, так как эта информация используется как входные данные для LLM.
  • Построение тематического авторитета (Topical Authority): Поскольку система может использовать SRDs из связанных и недавних запросов, важно полностью покрывать тему. Это увеличивает вероятность того, что ваш сайт будет использован как источник для широкого спектра запросов в рамках кластера.
  • Анализ поискового пути и итераций: Учитывайте механизм итеративного уточнения. Предоставляйте как базовую информацию (для первичной сводки), так и контент для углубленного изучения (для пересмотренной сводки после взаимодействия пользователя).

Worst practices (это делать не надо)

  • Создание контента без четкой структуры («Вода»): Контент, из которого сложно извлечь конкретные факты или ответы, будет игнорироваться при формировании входных данных для LLM или не пройдет этап верификации.
  • Использование двусмысленных или неподтвержденных утверждений: Система верификации, основанная на сравнении эмбеддингов, требует высокой степени семантического соответствия. Двусмысленный контент не получит атрибуции.
  • Игнорирование технической оптимизации для извлечения контента: Блокировка или затруднение извлечения основного контента (включая изображения и видео) помешает системе использовать сайт в качестве источника для сводки.
  • Фокус только на тексте, игнорируя мультимедиа: Пренебрежение оптимизацией изображений и видео снижает общий объем контента, который система может извлечь из SRD для генерации сводки.

Стратегическое значение

Этот патент описывает архитектуру генеративного поиска (SGE/AI Overviews). Стратегическое значение для SEO заключается в переходе от борьбы за позиции к борьбе за «цитирование» (linkifying) внутри генеративного ответа. Видимость теперь означает не только позицию в списке ссылок, но и присутствие контента и атрибуции в NL based summary. Долгосрочная стратегия должна быть направлена на создание наиболее авторитетного, четкого и легко извлекаемого контента в нише.

Практические примеры

Сценарий 1: Оптимизация статьи для верификации (Linkifying)

  • Задача: Добиться, чтобы статья о пользе кофе получила ссылку из генеративной сводки.
  • Действия: Вместо общего текста вроде "Многие считают кофе полезным...", использовать четкие утверждения: "Кофе повышает уровень энергии и способствует снижению веса благодаря содержанию кофеина и антиоксидантов".
  • Обоснование (Патент): Система верификации (FIG. 3) сравнивает эмбеддинг утверждения в сводке с эмбеддингом текста источника. Четкое утверждение с большей вероятностью будет иметь близкий эмбеддинг к тому, что сгенерирует LLM, и получит ссылку.

Сценарий 2: Адаптация контента под динамическое обновление

  • Задача: Удержать пользователя при изучении сложной темы (например, настройка роутера).
  • Действия: Разделить контент на логические блоки: (1) Вход в систему, (2) Базовые настройки, (3) Расширенные настройки.
  • Обоснование (Патент): Если пользователь кликнет на источник по блоку (1), система может обновить сводку (FIG. 4, Claim 1), убрав информацию о входе и сделав акцент на блоках (2) и (3). Система перегенерирует промпт, предполагая, что пользователь уже знает, как войти в систему.

Вопросы и ответы

Как этот патент связан с Google SGE (Search Generative Experience) или AI Overviews?

Патент описывает базовую архитектуру и ключевые механизмы, которые используются в SGE и AI Overviews. Он объясняет, как Google использует LLM для генерации ответов, как обеспечивает точность за счет использования контента веб-сайтов (grounding), как добавляет ссылки на источники (linkifying) и как планирует развивать диалоговый поиск через итеративное уточнение.

Что самое важное для SEO, чтобы сайт цитировался в генеративной сводке?

Ключевыми являются два этапа: отбор в качестве источника (SRD) и успешная верификация контента. Для отбора необходимы высокие показатели по всем трем типам метрик: релевантность запросу, авторитетность сайта (E-E-A-T) и персонализация. Для верификации контент должен быть четким, фактически точным и легко извлекаемым, чтобы его эмбеддинг совпал с утверждением в сводке.

Как работает механизм верификации и добавления ссылок (Linkifying)?

Система сравнивает контент сводки с источниками (FIG. 3). Она создает эмбеддинги (векторные представления) для утверждения в сводке и для текста источника и измеряет расстояние между ними. Если расстояние мало (семантическая близость высока), утверждение считается верифицированным, и система добавляет кликабельную ссылку (citation) на источник.

Использует ли LLM только контент с сайтов или свои собственные знания?

Патент указывает, что LLM в первую очередь обрабатывает контент, извлеченный из SRDs. Однако также упоминается, что сводка может включать контент, который не выводится напрямую из предоставленного контента, а генерируется на основе общих знаний LLM (полученных в ходе обучения). Тем не менее, фокус патента именно на grounding в SRDs для повышения точности.

Что такое «Итеративное уточнение» или динамическое обновление сводки?

Это механизм (Claim 1, FIG. 4), который обновляет сводку после того, как пользователь кликнул на один из источников и изучил его. Система предполагает, что пользователь теперь знаком с этой информацией, и генерирует пересмотренную сводку (часто с измененным промптом, например, "предположим, пользователь уже знает X"). Это делает поиск более диалоговым.

Как оптимизировать изображения и видео для этого алгоритма?

Система извлекает информацию из мультимедиа для использования в LLM. Для изображений это могут быть автогенерируемые подписи, распознанный текст или дескрипторы объектов. Для видео используются транскрипции. SEO-специалистам следует предоставлять четкие, фактические текстовые эквиваленты (alt-тексты, субтитры, окружающий текст), чтобы помочь системе интерпретировать мультимедийный контент.

Что такое «Аннотации уверенности» (Confidence Annotations)?

Это индикаторы (Claim 13), которые Google может отображать рядом с утверждениями в сводке, чтобы показать степень уверенности системы в их точности. Confidence Measure может зависеть от внутренних оценок LLM, а также от качества (авторитетности) и количества источников (SRDs), которые подтверждают это утверждение.

Как Google решает, какую LLM использовать для ответа?

Патент описывает механизм выбора, где система может выбрать одну, несколько или ни одной генеративной модели из кандидатов (например, информационная LLM, креативная LLM, модель генерации изображений). Выбор основан на классификации интента запроса и/или анализе результатов поиска.

Влияет ли персонализация на генеративные сводки?

Да, значительно. Во-первых, при отборе SRDs используются User-dependent measures и контент из недавних запросов. Во-вторых, система может адаптировать сводку, если определит по профилю пользователя (FIG. 6), что он уже знаком с частью темы, и соответствующим образом скорректировать промпт для LLM.

Что важнее для попадания в сводку: авторитетность сайта или релевантность страницы?

Оба фактора критически важны, так как они используются при отборе SRDs. Релевантность страницы (Query-dependent measures) необходима, чтобы попасть в рассмотрение. Авторитетность сайта (Query-independent measures, например, trustworthiness) используется для выбора лучших источников среди релевантных и также влияет на расчет уверенности.

Похожие патенты

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
  • US20250005303A1
  • 2025-01-02
  • SERP

  • EEAT и качество

  • Персонализация

Как Google использует визуальные цитаты и обратную связь для генерации и уточнения ответов в мультимодальном поиске
Google генерирует ответы на мультимодальные запросы (изображение + текст), находя визуально похожие изображения в интернете и используя текст с их исходных страниц как основу для LLM. Система показывает эти изображения как «визуальные цитаты» для подтверждения ответа и позволяет пользователям исключать нерелевантные источники, чтобы мгновенно уточнить сгенерированный результат.
  • US20240378236A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Ссылки

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google использует архитектуру «Generative Companion» для ведения диалогового поиска с сохранением контекста и выбора специализированных LLM (SGE)
Google патентует архитектуру диалогового поиска («Generative Companion»), которая поддерживает состояние пользователя (контекст, историю запросов и взаимодействий) на протяжении всей сессии. Система использует начальную LLM для генерации «синтетических запросов», классифицирует намерение пользователя на основе текущего состояния и динамически выбирает специализированные «Downstream LLM» (для суммаризации, креатива или уточнения) для формирования финального генеративного ответа.
  • US20240289407A1
  • 2024-08-29
  • Персонализация

  • Семантика и интент

Как Google использует LLM для декомпозиции сложных запросов на подзапросы и синтеза генеративного ответа (Основа AI Overviews)
Google использует LLM для анализа сложных, многоаспектных или "шумных" запросов. Система разбивает такой запрос на несколько простых подзапросов, эффективно проверяет их релевантность и разнообразие с помощью эмбеддингов, выполняет поиск по каждому, а затем синтезирует единый ответ (например, AI Overview). Это позволяет отвечать на сложные пользовательские задачи за один шаг.
  • US20250117381A1
  • 2025-04-10
  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов
Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.
  • US20140372873A1
  • 2014-12-18
  • Структура сайта

  • Техническое SEO

  • Ссылки

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.
  • US9128993B2
  • 2015-09-08
  • Ссылки

  • SERP

  • Индексация

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
  • US8412699B1
  • 2013-04-02
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore