
Google использует механизм оценки новизны информации для динамической корректировки поисковой выдачи во время сессии пользователя. Система вычисляет «Information Gain Score» для непросмотренных документов, определяя, сколько новой информации они содержат по сравнению с уже посещенными сайтами. Результаты с уникальной информацией повышаются, а повторяющийся контент понижается, чтобы уменьшить избыточность.
Патент решает проблему избыточности информации (redundancy) в результатах поиска. Когда пользователь исследует определенную тему, многие релевантные документы часто содержат схожую или идентичную информацию. Это снижает эффективность поиска, так как пользователю приходится тратить время на просмотр повторяющегося контента. Проблема особенно критична для голосового поиска и автоматизированных ассистентов (Automated Assistant), где вывод информации линеен и занимает много времени.
Запатентована система для динамической оценки и использования «Прироста Информации» (Information Gain) во время поисковой сессии. Система отслеживает, какую информацию пользователь уже потребил из просмотренных документов по теме, и вычисляет Information Gain Score для оставшихся (непросмотренных) документов. Этот показатель определяет количество новой (novel) информации в документе относительно уже увиденного. Система использует этот показатель для переранжирования результатов и приоритизации контента с максимальной новизной.
Механизм работает в контексте текущей поисковой сессии или диалога:
first set), которые пользователь уже просмотрел по определенной теме.second set) релевантных, но еще не просмотренных документов.machine learning model), которая принимает на вход семантические представления (например, embeddings или semantic feature vectors) как просмотренных, так и новых документов.Information Gain Score. В интерфейсе поиска (SERP) ссылки могут быть переупорядочены после возврата пользователя. В голосовом поиске система может извлечь и озвучить только ту часть документа, которая содержит новую информацию, пропуская уже известное.Высокая. Улучшение эффективности поиска, уменьшение избыточности и понимание поискового пути пользователя являются ключевыми направлениями развития Google. Этот патент описывает конкретный механизм персонализации на уровне сессии, направленный на повышение «плотности информации». Технологии семантического анализа (embeddings) и динамического переранжирования активно используются в современных поисковых системах.
Патент имеет высокое значение (8/10) для SEO, особенно в области контент-стратегии. Он показывает, что Google может динамически изменять ранжирование в зависимости от того, какие сайты пользователь уже посетил в рамках текущей сессии. Это подчеркивает критическую важность уникального ценного предложения и глубины контента. Сайты, которые просто повторяют информацию, доступную у конкурентов, рискуют быть пониженными в выдаче для пользователя, который уже видел эту информацию в другом месте.
novel) информация, содержащаяся в документе, помимо информации, уже известной пользователю из ранее просмотренных документов.Information Gain Score, часто с использованием моделей машинного обучения.Information Gain Score.Claim 1 (Независимый пункт): Описывает метод применения Information Gain в контексте автоматизированного ассистента.
first set) по теме, информация из которых уже была представлена пользователю ассистентом в ответ на ввод на естественном языке (free form natural language input).second set) документов по той же теме, которые еще не были представлены.Information Gain Score. Оценка основана на количестве новой информации в документе, которая отличается от информации, извлеченной из первого набора.Claim 3 (Зависимый от 1): Детализирует метод расчета Information Gain Score.
Расчет включает применение первых данных (представляющих первый набор) и вторых данных (представляющих новый документ) к модели машинного обучения (machine learning model) для генерации выходных данных, на основе которых определяется оценка.
Claim 4 (Зависимый от 3): Уточняет тип входных данных.
Первые и вторые данные представляют собой векторы семантических признаков (semantic feature vectors), сгенерированные из информации, извлеченной из соответствующих документов.
Claim 5 (Независимый пункт): Описывает метод в более общем контексте поиска (не только ассистенты).
Information Gain Score для новых документов (на основе количества отличающейся информации).Information Gain Scores (например, ранжирование).Claim 7 (Зависимый от 5): Описывает сценарий использования в интерфейсе результатов поиска (SERP).
Изобретение применяется во время активной сессии пользователя и затрагивает финальные этапы обработки поисковой выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно обработать контент для генерации семантических представлений (semantic representations или embeddings) документов. Эти данные необходимы для быстрого сравнения содержания документов в реальном времени.
RANKING – Ранжирование
На этом этапе генерируется первоначальный набор результатов для запроса пользователя.
RERANKING – Переранжирование
Основное применение патента. Система работает как динамический твидлер (Twiddler), который корректирует выдачу в реальном времени на основе действий пользователя в текущей сессии.
Information Gain Scoring Engine активируется.embeddings, система сравнивает содержание просмотренных документов (first set) с кандидатами (second set).Information Gain Score.Входные данные:
embeddings) просмотренных документов (first set).second set).Выходные данные:
Information Gain Score для каждого документа второго набора.Алгоритм применяется в рамках активной сессии пользователя при выполнении следующих условий:
Процесс А: Обработка во время сессии (на примере веб-поиска)
first set.second set (Документы 2, 3, 4...).embeddings) для first set (Документ 1) и для каждого документа в second set.Information Gain Score для Документа 2, оценивая количество новой информации.second set, основываясь на их Information Gain Scores (возможно, в комбинации с исходными оценками релевантности).Процесс Б: Обработка в диалоговой системе (Ассистент/TTS)
first set.Information Gain Score для кандидатов (Документы 2, 3...) и выбирает документ с наивысшей оценкой (например, Документ 2).Патент фокусируется на сравнении содержания документов и действиях пользователя в рамках сессии.
semantic feature vectors или embeddings. Это основной материал для сравнения.accessed) или прослушал (presented) в рамках текущего исследования темы. Отслеживание кликов и возвратов к SERP.natural language input) пользователя, используемый для определения темы и инициации поиска или диалога.Information Gain Score — метрики, оценивающей количество новой информации. В рамках сессии эта метрика может стать доминирующей для обеспечения эффективности поиска.embeddings, semantic vectors) для сравнения содержания документов на смысловом уровне, а не просто по ключевым словам.Information Gain, обучается на данных, размеченных людьми или собранных через обратную связь. Это подчеркивает важность пользовательского восприятия новизны и полезности контента.Information Gain Score будет низким для пользователя, который уже посетил эти источники.Information Gain.embeddings и идентифицировать отдельные информационные элементы. Это особенно важно для голосового поиска, где система может извлекать и озвучивать только новые фрагменты.Information Gain Score и рискуют быть отфильтрованными во время сессии пользователя.Information Gain Score, так как система оценивает семантическое содержание через embeddings.Этот патент подтверждает движение Google к более динамичному и контекстуальному поиску, который адаптируется к действиям пользователя в реальном времени. Стратегически это означает, что оценка качества и релевантности контента становится всё более сложной и выходит за рамки статического анализа страницы. Для SEO-специалистов это подчеркивает переход от оптимизации отдельных страниц к оптимизации всего процесса поиска информации пользователем (User Journey Optimization). Уникальность и добавленная ценность контента становятся технической необходимостью для поддержания видимости.
Сценарий: Поиск инструкции по устранению неполадок
Information Gain Score для Сайта 2 снижается (так как информация о драйверах повторяется), но остается выше нуля за счет упоминания сброса настроек.Information Gain Score для Сайта 3 значительно повышается, так как он предлагает совершенно новый угол зрения (оборудование).Что такое «Information Gain Score» в контексте этого патента?
Это динамическая метрика, которая рассчитывается в реальном времени во время поисковой сессии. Она количественно определяет, сколько новой (novel) информации содержит непросмотренный документ по сравнению с контентом, который пользователь уже потребил по этой теме. Чем выше показатель, тем больше уникальных данных пользователь получит, перейдя по ссылке.
Как Google определяет, что информация является «новой», а что «уже просмотренной»?
Система отслеживает, какие документы пользователь посетил в рамках текущей сессии. Для понимания содержания этих документов используются семантические представления (embeddings или semantic feature vectors). Сравнивая векторы просмотренных и непросмотренных документов с помощью модели машинного обучения, система оценивает степень семантического пересечения и идентифицирует уникальную информацию.
Означает ли это, что Google отслеживает пользователей и персонализирует выдачу?
Да, но это специфический тип персонализации на уровне сессии (session-based personalization). Патент фокусируется на немедленном контексте текущего исследования темы, а не на долгосрочной истории поиска. Цель состоит в том, чтобы уменьшить избыточность информации в рамках конкретной задачи, которую пользователь решает прямо сейчас.
Как этот механизм влияет на стандартный веб-поиск (SERP)?
В патенте описан конкретный сценарий (Claim 7): когда пользователь кликает на результат, а затем возвращается к SERP (pogo-sticking). В этот момент система может переранжировать оставшиеся результаты, повышая те, которые содержат больше новой информации (высокий Information Gain Score), и понижая те, которые повторяют уже увиденное.
Какое значение это имеет для контент-стратегии?
Это критически важно. Стратегия создания контента, который просто переписывает информацию конкурентов из ТОПа (даже качественно), становится проигрышной. Необходимо фокусироваться на добавлении уникальной ценности, новых данных, экспертного анализа или покрытии аспектов темы, которые упускают конкуренты, чтобы максимизировать Information Gain.
Особенно ли это важно для голосового поиска?
Да, патент подчеркивает, что для автоматизированных ассистентов и голосового вывода (TTS) это крайне важно, так как прослушивание избыточной информации занимает много времени. В патенте даже описан механизм, когда ассистент может выборочно озвучить только новые фрагменты из следующего документа, пропуская то, что уже было сказано ранее.
Как обучается модель, предсказывающая Information Gain?
Патент предлагает два основных метода. Первый — использование ручной разметки данных людьми-кураторами, которые оценивают степень новизны одного документа относительно другого. Второй — сбор обратной связи от пользователей во время их обычного поиска, например, через вопросы типа «Был ли этот документ полезен в свете того, что вы уже прочитали?».
Может ли этот алгоритм полностью убрать мой сайт из выдачи?
Если ваш сайт не предлагает никакой новой информации по сравнению с сайтом, который пользователь только что посетил, его позиции в обновленном SERP могут значительно снизиться. Это делает его фактически невидимым для пользователя в рамках данной сессии, хотя он может оставаться в индексе.
Как можно оптимизировать контент под высокий Information Gain Score?
Необходимо проводить глубокий анализ конкурентов, чтобы понять, какая информация уже доступна. Затем нужно сосредоточиться на заполнении пробелов (Content Gaps), добавлении уникальных данных, инсайтов или представлении информации под новым углом. Чем меньше семантическое пересечение с конкурентами при сохранении релевантности теме, тем выше будет потенциальный Information Gain.
Влияет ли этот механизм на все типы запросов?
Наибольшее влияние он оказывает на информационные запросы с интентом исследования (research intent), где пользователи склонны изучать несколько источников для формирования полного понимания темы. Для навигационных или простых транзакционных запросов этот механизм менее релевантен.

Персонализация
Поведенческие сигналы
Свежесть контента

Индексация
SERP
Краулинг

Семантика и интент
Индексация

Семантика и интент
SERP

Персонализация
Семантика и интент
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Структура сайта
SERP
Ссылки

Мультимедиа
Поведенческие сигналы
SERP

Семантика и интент
Мультимедиа
Персонализация

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Структура сайта

Семантика и интент
Поведенческие сигналы
Персонализация

Персонализация
Семантика и интент
Мультимедиа
