
Патент описывает инфраструктуру Google для оценки различных стратегий отбора документов в индекс. Система поддерживает актуальный набор данных (Query-to-Resource Mapping), периодически добавляя свежий контент и новые запросы. Это позволяет Google сравнивать разные алгоритмы индексации через A/B тесты и оценку асессорами, чтобы определить, какая стратегия обеспечивает более качественную выдачу.
Патент решает две взаимосвязанные инфраструктурные задачи. Первая — как эффективно оценивать и сравнивать различные автоматизированные процессы отбора ресурсов (automated resource selection processes) для включения в индекс поисковой системы, учитывая, что объем индекса ограничен. Вторая — как поддерживать актуальность тестовой среды (Query-to-Resource Mapping), необходимой для этой оценки, в условиях постоянного появления нового контента (fresh resources) и изменения паттернов запросов.
Запатентована система и метод для инкрементного обновления Query-to-Resource Mapping — структуры данных, которая связывает набор тестовых запросов с соответствующими им ресурсами. Эта структура используется как основа для системы оценки выбора индекса (Index Selection Evaluation System). Система периодически идентифицирует свежие ресурсы, оценивает их и добавляет лучшие в маппинг, а также периодически обновляет сам набор тестовых запросов. Это позволяет непрерывно тестировать и сравнивать различные стратегии индексации на актуальных данных.
Система функционирует в двух основных режимах: обновление маппинга и оценка стратегий индексации.
Обновление маппинга:
fresh resources, обнаруженные за этот период (по discovery time).query-specific score.Query-to-Resource Mapping.Оценка стратегий:
query-independent index selection score для каждого ресурса. Ресурсы, удовлетворяющие критериям Стратегии А (например, превышающие порог), формируют Группу А (to-be-indexed).Средняя. Патент описывает внутреннюю инфраструктуру тестирования. Хотя конкретные методы тестирования и сигналы Google эволюционировали с развитием ML, базовая необходимость систематической оценки критериев включения документов в индекс и поддержания актуальности тестовых данных остается критически важной. Этот патент дает представление о фундаментальных процессах оценки качества индекса.
Умеренное (5/10). Патент не описывает конкретные алгоритмы ранжирования или индексации, используемые в продакшене. Однако он подтверждает существование query-independent index selection scores — оценок качества ресурса, не зависящих от запроса, которые определяют, будет ли ресурс вообще включен в индекс. Понимание того, что Google систематически тестирует и выбирает стратегии индексации на основе пользовательских метрик (например, CTR) и оценок асессоров, подчеркивает важность общего качества ресурса и вовлеченности пользователей для обеспечения индексации.
query-specific score. Используется для оптимизации вычислений при построении маппинга.Index Selection Signals.Fresh Resources.Automated Resource Selection Processes путем анализа групп ресурсов, которые были бы проиндексированы каждым процессом.Index Selection Signals. Используется для классификации ресурса как to-be-indexed или not-to-be-indexed.Automated Resource Selection Process.Патент имеет два основных аспекта: инкрементное обновление тестовой среды (QRM) и использование этой среды для оценки стратегий индексации.
Claim 1 (Независимый пункт): Описывает метод инкрементного обновления Query-to-Resource Mapping с фокусом на свежий контент.
Query-to-Resource Mapping.fresh resources, соответствующие запросу (те, чье discovery time попадает в текущий интервал).query-specific score для каждого свежего ресурса.highest scoring).Claim 2 (Зависимый): Описывает обновление самого набора запросов.
После истечения нескольких периодических интервалов (т.е. реже, чем обновление контента) система обновляет группу запросов, добавляя новые и удаляя существующие, и затем обновляет маппинг для этого нового набора.
Claim 3 (Зависимый): Связывает обновление маппинга с его целью — оценкой процессов индексации.
Query-to-Resource Mapping для поиска всех соответствующих ресурсов.to-be-indexed или not-to-be-indexed. Группа 1 состоит из всех to-be-indexed.Claim 4 (Зависимый): Детализирует механизм классификации to-be-indexed.
Для каждого ресурса выводится query-independent index selection score в соответствии с критериями тестируемого процесса. Классификация ресурса основывается на этой оценке.
Claims 5 и 6 (Зависимые): Описывают два варианта использования query-independent index selection score для классификации.
to-be-indexed.to-be-indexed.Этот патент описывает инфраструктуру для тестирования и улучшения поисковой системы (Index Selection Evaluation System), а не компонент, непосредственно обрабатывающий запросы пользователей в продакшене. Он взаимодействует со следующими этапами:
CRAWLING – Сканирование и Сбор данных
Система оценки использует данные, полученные в результате сканирования. В патенте упоминается, что для целей тестирования система может сканировать ресурсы на большую глубину, чем это обычно делается для построения продакшн-индекса. Система отслеживает discovery time ресурсов для идентификации свежести.
INDEXING – Индексирование и извлечение признаков
Это центральный этап. Система предназначена для оценки Automated Resource Selection Processes — алгоритмов, которые на этапе индексации решают, включать ли ресурс в индекс. Для этого используются Index Selection Signals (признаки качества, извлекаемые на этом этапе) и вычисляются Query-Independent Index Selection Scores.
QUNDERSTANDING – Понимание Запросов
Система использует логи запросов (query logs) для выбора репрезентативного набора тестовых запросов для включения в Query-to-Resource Mapping.
RANKING – Ранжирование
Система использует механизмы ранжирования для получения Query-Specific Scores. Эти оценки необходимы для отбора лучших ресурсов в маппинг и для упорядочивания результатов внутри тестовых групп (А и Б) при проведении оценки.
Входные данные:
discovery time.Index Selection Signals для каждого ресурса.Выходные данные:
Query-to-Resource Mapping.Патент описывает чисто технический инфраструктурный процесс. Он не оказывает прямого влияния на конкретные типы контента, запросы, ниши или географию в продакшн-выдаче. Он влияет на то, как Google внутренне принимает решения о том, какие алгоритмы индексации использовать в будущем.
Алгоритмы обновления и оценки применяются непрерывно в рамках внутренней инфраструктуры тестирования Google.
fresh resources.Процесс А: Инкрементное обновление маппинга свежими ресурсами
fresh resources, чье discovery time попадает в это окно и которые соответствуют одному или нескольким тестовым запросам из маппинга.query-specific score для каждого соответствующего свежего ресурса.Query-to-Resource Mapping обновляется, чтобы включить данные, связывающие запрос с ресурсами из N-best списка.Процесс Б: Обновление набора запросов
discovery time.query-specific score.Процесс В: Оценка двух стратегий индексации
Query-to-Resource Mapping, система находит все ресурсы, соответствующие запросу.query-independent index selection score согласно эвристике Стратегии 1 (используя Index Selection Signals).to-be-indexed, если оценка удовлетворяет критерию (например, порогу или попаданию в Top-N).to-be-indexed.query-specific score) асессорам в формате side-by-side и сбор их предпочтений.Патент фокусируется на инфраструктуре тестирования и упоминает следующие типы данных:
Discovery time ресурса (время сканирования) критически важно для идентификации fresh resources и инкрементного обновления.query logs) используются для выбора тестовых запросов.user assessment), такая как click-through-rate (CTR), используется для сравнения эффективности различных стратегий индексации в ходе live-экспериментов.feedback) и предпочтения асессоров при сравнении side-by-side результатов.Index Selection Signals ресурса. Конкретные формулы не приводятся, так как система тестирует разные формулы.query-specific score с меньшими затратами. Используется для предварительной фильтрации ресурсов перед полным скорингом.Патент описывает внутренние процессы Google, связанные с инфраструктурой тестирования критериев индексации. Он не содержит прямых рекомендаций для SEO, но дает важное понимание принципов работы системы.
Query-Independent Index Selection Score. Эта оценка определяет, достоин ли ресурс включения в индекс вообще, независимо от его релевантности конкретному запросу. Она базируется на Index Selection Signals (качество контента, ссылки, поведение пользователей).Automated Resource Selection Processes), чтобы оптимизировать качество своего индекса при ограниченных ресурсах.Query-to-Resource Mapping), регулярно обновляя ее свежим контентом (fresh resources) и актуальными запросами.discovery time каждого ресурса, что подчеркивает важность временных меток и скорости обнаружения контента.Патент скорее инфраструктурный и описывает, как Google тестирует свои системы, а не то, что именно они тестируют. Прямых практических выводов для SEO немного, но есть стратегические инсайты.
Query-Independent Index Selection Score. Хотя точная формула неизвестна, патент упоминает длину контента, заголовки, ссылки и поведение пользователей как примеры Index Selection Signals. Улучшение этих показателей (E-E-A-T, техническое качество) повышает шансы на индексацию страницы.fresh resources на основе discovery time, критически важно обеспечить быстрое сканирование нового и обновленного контента (через Sitemaps, внутреннюю перелинковку, техническую оптимизацию скорости).Index Selection Signals, он может быть не включен в индекс, даже если он хорошо отвечает на конкретный запрос. Стратегии, игнорирующие общее качество в пользу узкой оптимизации под ключ, рискованны с точки зрения индексации.discovery time или извлекать Index Selection Signals, ресурс не попадет в обработку должным образом.Патент подчеркивает, что индексация — это не данность, а привилегия. В условиях ограниченности ресурсов Google постоянно ищет способы отсеять менее ценный контент еще до этапа ранжирования. Существование Query-Independent Index Selection Score означает, что SEO-стратегия должна включать работу над общим качеством и авторитетностью ресурса не только для повышения позиций, но и для гарантии присутствия в индексе.
Практических примеров применения для SEO нет, так как патент описывает внутреннюю тестовую инфраструктуру Google.
Что такое Query-Independent Index Selection Score, и почему это важно для SEO?
Это оценка, которую Google присваивает ресурсу на основе его общих сигналов качества (Index Selection Signals), независимо от какого-либо конкретного запроса. Эта оценка используется, чтобы определить, следует ли вообще включать ресурс в индекс. Для SEO это критически важно: если ваша страница не преодолеет порог этой оценки, она не будет ранжироваться ни по каким запросам, потому что ее просто не будет в индексе.
Какие факторы влияют на Query-Independent Index Selection Score?
Патент не раскрывает точных формул, но приводит примеры Index Selection Signals, которые используются для расчета этой оценки. К ним относятся внутренние факторы (например, количество слов, длина заголовка) и внешние факторы (например, ссылочные сигналы и данные о поведении пользователей). Это подтверждает необходимость комплексного подхода к качеству сайта (E-E-A-T).
Как Google решает, какая стратегия индексации лучше?
Google сравнивает результаты работы разных стратегий. Если Стратегия А индексирует один набор документов, а Стратегия Б — другой, Google смотрит, какой набор генерирует лучшую поисковую выдачу. Лучшая выдача определяется двумя основными способами: оценками асессоров при side-by-side сравнении и пользовательскими метриками (например, CTR) в ходе A/B тестов на живом трафике.
Подтверждает ли этот патент, что CTR является фактором ранжирования?
Не напрямую. Патент показывает, что CTR используется как метрика успеха для оценки и выбора различных стратегий индексации. Если новая стратегия индексации приводит к повышению CTR в выдаче, она считается лучшей. Хотя это не делает CTR прямым фактором ранжирования, это демонстрирует его важность как ключевой метрики обратной связи для валидации алгоритмических изменений Google.
Что такое Query-to-Resource Mapping?
Это внутренняя база данных Google, используемая для тестирования. Она содержит набор тестовых запросов и для каждого запроса хранит список соответствующих ему ресурсов, их оценки и сигналы качества. Это позволяет инженерам моделировать, как изменения в алгоритмах индексации повлияют на выдачу, без запуска изменений в продакшн.
Что означает «инкрементное обновление» в контексте патента?
Это означает, что Google постоянно поддерживает актуальность своей тестовой среды. Они регулярно (например, ежедневно) добавляют в нее недавно обнаруженный контент (fresh resources) и периодически (например, еженедельно) обновляют набор тестовых запросов. Это гарантирует, что тестирование алгоритмов происходит на данных, отражающих текущее состояние интернета.
Что такое Discovery Time и как оно используется?
Discovery Time — это время, когда ресурс был впервые просканирован. Система использует эту метку для идентификации «свежих ресурсов», которые были обнаружены в течение последнего временного интервала. Это позволяет системе быстро интегрировать новый контент в тестовую среду.
Может ли Google сканировать мой сайт, но не индексировать его?
Да, абсолютно. Патент явно описывает процесс, в котором просканированные ресурсы оцениваются с помощью Automated Resource Selection Process. Если ресурс не соответствует критериям качества (получает низкий Query-Independent Index Selection Score), он классифицируется как not-to-be-indexed.
В патенте упоминается, что система может сканировать «глубже». Что это значит?
Это означает, что для целей тестирования Google может сканировать больше страниц сайта или следовать по ссылкам дальше от главной страницы, чем это делается для построения основного продакшн-индекса. Это позволяет им оценить потенциальное качество ресурсов, которые в данный момент не индексируются, и проверить, не упускают ли они ценный контент.
Как этот патент влияет на мою стратегию работы со свежим контентом?
Патент подчеркивает, что Google имеет специализированные процессы для быстрого обнаружения и оценки свежего контента. Для SEO это означает, что крайне важно не только создавать качественный новый контент, но и обеспечивать его максимально быстрое обнаружение (оптимизация краулингового бюджета, sitemaps), чтобы он своевременно попал в обработку системами Google.

Индексация
SERP

Семантика и интент
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
Семантика и интент
EEAT и качество

Краулинг
Индексация
Свежесть контента

Ссылки
SERP
Структура сайта

Семантика и интент
Мультимедиа
Персонализация

Ссылки
Антиспам
SERP

Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы
Свежесть контента

Персонализация
Поведенческие сигналы
Антиспам

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
SERP
Мультимедиа

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Local SEO
Персонализация
