
Google может оптимизировать размер и скорость своего индекса, анализируя, какие части документа использовались для ответа на запросы пользователей. Части, которые редко используются, удаляются из индекса, а сохраняются только наиболее востребованные фрагменты.
Патент решает проблему неэффективного использования вычислительных ресурсов (памяти и процессорной мощности), вызванную индексированием документов целиком. Зачастую только определенные части документа необходимы для удовлетворения запросов пользователей. Индексирование и хранение неиспользуемого контента замедляет работу поиска и увеличивает затраты на инфраструктуру.
Запатентована система для выборочного сохранения в поисковом индексе только наиболее полезных частей (portions) контентных файлов. Система отслеживает, какие именно части документа удовлетворяют запросы пользователей, присваивает им оценки (values) на основе частоты использования и периодически очищает индекс от частей с низкой оценкой.
Система работает в несколько этапов:
portions), например, по параграфам или на основе сниппетов.inclusive portions).retained portions).Высокая. Оптимизация индекса критически важна для Google, особенно с учетом экспоненциального роста веба и необходимости быстрого поиска (L1 Ranking). Технологии частичного индексирования (Partial Indexing) и понимания отдельных пассажей (Passage Understanding) крайне актуальны в 2025 году. Этот патент описывает фундаментальный механизм для такой оптимизации.
Патент имеет значительное влияние на стратегию индексирования. Он описывает механизм, из-за которого контент, не удовлетворяющий запросы пользователей достаточно часто, может быть исключен из первичного (быстрого) индекса. SEO-специалисты должны гарантировать, что ключевой контент четко соответствует реальному поисковому поведению и интенту пользователей, чтобы обеспечить его сохранение в индексе.
Inclusive Portions и присваивает им оценки (values).Retained Portions, используя пороговое значение.value) и остается в индексе после оптимизации.Portions.Claim 1 (Независимый пункт): Описывает основной процесс оптимизации индекса.
portions).Inclusive Portions — части документов, которые отвечают на запрос.values) для этих частей. Уточняется, что обновленная оценка для конкретной части представляет собой количество раз, когда эта часть была признана отвечающей на запросы пользователей.Retained Portions.Retained Portions.Claim 7 (Зависимый): Уточняет, как могут определяться Inclusive Portions. Поисковая система предоставляет результаты поиска, включающие сниппеты (snippets). Эти сниппеты могут использоваться для определения Inclusive Portions.
Claim 8 (Зависимый): Уточняет механизм обновления оценок. Оценка обновляется путем увеличения соответствующего значения для каждой Inclusive Portion при каждом случае предоставления документа в ответ на запрос.
Claim 12 (Зависимый): Уточняет механизм выбора. Retained Portions выбираются путем сравнения их оценок с пороговым значением (threshold value).
Claim 15 (Зависимый): Описывает возможность использования двухъярусной системы индексирования. Оптимизированный индекс (где документы заменены на Retained Portions) является первым индексом. Система также включает второй индекс, который сохраняет полные версии документов даже после обновления первого индекса.
Изобретение в первую очередь относится к этапу INDEXING (Индексирование и извлечение признаков), конкретно к оптимизации хранения данных в индексе.
INDEXING – Индексирование и извлечение признаков
Index Builder может выполнять начальную фильтрацию или усечение документов перед индексацией (например, на основе TF-IDF или шаблонов).Portion Evaluator определяет границы частей (Portions) внутри документов.Index Updater периодически перестраивает индекс, удаляя неиспользуемые части для экономии места и ускорения доступа.RANKING – Ранжирование
Система использует данные, генерируемые на этапе ранжирования, для оптимизации индекса. Request Monitor отслеживает, какие документы и, что более важно, какие части этих документов (Inclusive Portions) используются для удовлетворения запросов на этапе Retrieval (L1).
Взаимодействие компонентов:
Index Manager (управляющий индексом) тесно взаимодействует с Search Manager (управляющим поиском). Request Monitor наблюдает за активностью Search Manager (какие запросы поступают и какие результаты возвращаются). Portion Evaluator использует эти данные для обновления Portion Value Repository. Portion Selector и Index Updater используют эти оценки для модификации Index.
Входные данные:
Content Files).User Requests) и ключевых слов (Keywords).Выходные данные:
Retained Portions для обработанных документов.Процесс можно разделить на две фазы: непрерывный мониторинг и периодическая оптимизация.
Фаза А: Предварительная подготовка (Однократно или редко)
Index Builder получает документы. Может применяться предварительная фильтрация (усечение длинных документов, удаление boilerplate по шаблонам, фильтрация по TF-IDF). Оставшийся контент индексируется.Portion Evaluator определяет границы частей (Portions) в индексированных документах (например, по параграфам, предложениям или фиксированному числу слов).Фаза Б: Непрерывный мониторинг (Постоянно)
Search Manager получает запрос и предоставляет результаты. Request Monitor отслеживает этот процесс.Portion Evaluator определяет, какие части возвращенных документов содержат ключевые слова запроса (Inclusive Portions). Это может быть сделано на основе того, откуда был взят сниппет.Portion Evaluator увеличивает счетчик (value) для каждой идентифицированной Inclusive Portion в Portion Value Repository.Фаза В: Периодическая оптимизация (По расписанию)
Portion Selector устанавливает пороговое значение (threshold) для оценок. Порог может быть динамическим и корректироваться для контроля размера индекса.Retained Portions.Index Updater обновляет индекс, заменяя исходные индексированные документы только их Retained Portions. Несохраняемые части удаляются из этого индекса.Portions.User Requests) и ключевые слова (Keywords).Snippets) – используются как способ определения Inclusive Portions (Claim 7).Portion Selector для определения того, какие части следует сохранить. Если Portion Value > Threshold Value, часть сохраняется (Claim 12).Portions), которые оцениваются системой.Retained Portions.Portions) и точно оценить их полезность.Inclusive Portions (Claim 7). Если важная часть контента никогда не попадает в сниппет, её ценность может быть недооценена.Этот патент подтверждает движение Google в сторону понимания контента на уровне пассажей (Passage Understanding) и критическую важность соответствия реальному поисковому поведению. Он подчеркивает, что индексирование всей страницы не гарантировано. Стратегия должна фокусироваться на создании контента, где каждая часть имеет четкую цель и соответствует определенному набору интентов. Это инфраструктурный патент, но он напрямую влияет на то, какой контент будет доступен для ранжирования.
Сценарий: Оптимизация индекса для длинного руководства
Inclusive Portions для большинства запросов и постоянно увеличивает их оценки (values).Inclusive Portions, их оценки остаются низкими.Retained Portions.Означает ли этот патент, что Google не индексирует страницы целиком?
Патент описывает механизм оптимизации, при котором Google может удалить из индекса части ранее проиндексированного документа, если они редко используются для ответов на запросы. Также упоминается возможность предварительной фильтрации еще до индексации. Кроме того, в патенте описана возможность двухъярусного индекса (Claim 15): быстрый индекс содержит только полезные части (Retained Portions), а медленный индекс может содержать полные документы.
Как система определяет, на какие части (Portions) разделить документ?
Патент предлагает несколько методов. Это могут быть структурные элементы документа (предложения, параграфы), блоки фиксированного размера (например, каждые N слов). Также важным методом является определение частей на основе сниппетов (Snippets), которые генерируются в результатах поиска (Claim 7).
Как рассчитывается ценность (Value) части документа?
Основной метод, описанный в патенте, — это счетчик. Каждый раз, когда часть документа используется для ответа на запрос пользователя (становится Inclusive Portion), её счетчик увеличивается (Claim 8). Оценка представляет собой общее количество таких случаев (Claim 1).
Влияет ли этот патент на ранжирование?
Прямо на ранжирование он не влияет, так как не описывает расчет Ranking Score. Однако он имеет критическое косвенное влияние: если часть документа удалена из индекса в процессе оптимизации, она не сможет ранжироваться вообще. Этот патент о том, что доступно для ранжирования, а не о том, как оно ранжируется.
Что произойдет, если контент полезен, но его ищут очень редко (низкочастотные запросы)?
Это главный риск, вытекающий из патента. Если контент не достигает порогового значения (threshold value) по частоте использования, он может быть удален из индекса, даже если он качественный и релевантный для узкого круга запросов. Для SEO это означает необходимость связывать такой контент с более частыми запросами или обеспечивать его высокую авторитетность иными способами.
Как часто происходит обновление индекса и удаление неиспользуемых частей?
Патент не указывает конкретных временных рамок. Указано, что процесс запускается после того, как прошло "достаточно времени" или было обработано достаточное количество запросов для накопления надежной статистики. Это периодический процесс оптимизации.
Использует ли система клики (CTR) для определения ценности части?
В одном из вариантов реализации (Claim 11) упоминается, что обновление оценок может основываться на выборе индексированного документа пользователем (клике) в ответ на предоставление результатов. Это указывает на то, что поведенческие факторы могут учитываться при оценке полезности части контента.
Что такое предварительная фильтрация (Initial Filtering), упомянутая в патенте?
Это процесс, который может происходить еще до начала мониторинга использования. Index Builder может изначально решить не индексировать определенные части документа. Примеры включают усечение слишком длинных документов, игнорирование комментариев с помощью шаблонов или фильтрацию частей с низким соотношением TF-IDF.
Как этот патент связан с Passage Ranking (или Passage Indexing)?
Они тесно связаны концептуально. Passage Ranking фокусируется на ранжировании отдельных пассажей. Этот патент предоставляет инфраструктурную основу для того, чтобы это стало возможным и эффективным. Он описывает, как Google может хранить и управлять индексом, состоящим из пассажей (Retained Portions), вместо целых документов.
Как защитить свой контент от удаления из индекса по этому алгоритму?
Необходимо обеспечить, чтобы контент был востребован. Это достигается путем тщательного исследования ключевых слов, понимания реального интента пользователей и создания четко структурированного контента, который напрямую отвечает на запросы и часто используется Google для формирования сниппетов.

Индексация
Поведенческие сигналы

Индексация
Техническое SEO
Свежесть контента

Индексация

EEAT и качество
Свежесть контента
Семантика и интент

Краулинг

Knowledge Graph
Семантика и интент
Ссылки

Семантика и интент
Поведенческие сигналы
Local SEO

Семантика и интент
SERP
Поведенческие сигналы

EEAT и качество
Ссылки
SERP

Поведенческие сигналы
Семантика и интент
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Индексация
Ссылки
Техническое SEO

Поведенческие сигналы
Персонализация
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Персонализация
Семантика и интент
Мультимедиа
