
Google использует систему для эффективного тестирования и оценки различных критериев отбора ресурсов для включения в индекс. Вместо затратного перестроения индекса для каждого эксперимента, система симулирует, как разные процессы отбора повлияют на выдачу. Это позволяет сравнивать гипотетические индексы с помощью A/B тестов или асессоров, ускоряя разработку и улучшение качества индекса.
Патент решает проблему высокой стоимости и низкой эффективности оценки различных автоматизированных процессов отбора ресурсов (Automated Resource Selection Process) для включения в индекс поисковой системы. Традиционные методы оценки требовали построения и поддержания отдельных индексов для каждого тестируемого процесса, что крайне затратно по ресурсам. Изобретение позволяет оценить качество различных критериев индексации без накладных расходов на построение множества индексов.
Запатентована система и метод для оценки и сравнения различных процессов отбора ресурсов (критериев индексации) без необходимости построения отдельных индексов для каждого из них. Система симулирует, какие ресурсы были бы включены в индекс каждым процессом, используя предварительно вычисленную таблицу результатов запросов (Query Results Table). Затем система генерирует гипотетические поисковые выдачи (SERP) для тестовых запросов на основе этих симулированных индексов и сравнивает их качество.
Система работает путем симуляции и сравнения:
Query Results Table, которая связывает тестовые запросы с релевантными ресурсами, их оценками ранжирования и сигналами выбора индекса (Index Selection Signals).Index Selection Signals каждого ресурса и проверки, превышает ли результат пороговое значение.Высокая (с точки зрения методологии). Эффективное тестирование изменений является критически важным для эволюции поисковых систем. Описанная инфраструктура позволяет Google быстро итерировать и оценивать изменения в критериях индексации (например, новые пороги качества или фильтры спама), не затрагивая основной продакшн-индекс и не требуя огромных вычислительных ресурсов для перестроения индекса при каждом тесте.
Влияние на SEO минимальное и инфраструктурное (2/10). Этот патент описывает внутреннюю методологию тестирования Google (R&D). Он не раскрывает конкретные факторы ранжирования или критерии индексации (Index Selection Signals). Он объясняет, как Google решает, какие критерии использовать, но не какие именно критерии он использует. Для SEO-специалистов патент важен для понимания того, насколько эффективно Google может тестировать и внедрять изменения, влияющие на то, какой контент попадает в индекс.
Index Selection Signals.Index Selection Signals ресурса. Эта оценка сравнивается с порогом для принятия решения об индексации.Resource Source), которая связывает тестовые запросы с релевантными ресурсами. Для каждого ресурса хранит его Query-specific Score и необходимые Index Selection Signals. Позволяет симулировать различные процессы отбора без построения реальных индексов.Automated Resource Selection Process на основе сравнения Index Selection Score с порогом.Index Selection Signals.Ranking Score). Используется для упорядочивания результатов в гипотетических SERP во время оценки.Query Results Table для предварительной фильтрации ресурсов, прежде чем вычислять точный Final Ranking Score.Патент фокусируется на методологии оценки, а не на конкретных алгоритмах отбора.
Claim 1 (Независимый пункт): Описывает основной метод симуляции для сравнения двух процессов отбора (Процесс 1 и Процесс 2).
to-be-indexed. Все такие ресурсы формируют Группу 1.to-be-indexed. Все такие ресурсы формируют Группу 2.Claim 7 (Зависимый от 1): Детализирует механизм принятия решения об индексации внутри процесса отбора.
Определение классификации ресурса (to-be-indexed или not-to-be-indexed) включает вычисление Index Selection Score для ресурса. Если эта оценка удовлетворяет пороговому значению (threshold), ресурс классифицируется как to-be-indexed.
Claim 8 (Зависимый от 1): Уточняет источник данных для симуляции.
Идентификация релевантных ресурсов может происходить из Query Results Table. Эта таблица связывает запросы с ресурсами и включает query-independent quality score для каждого ресурса.
Claim 9 (Зависимый от 1): Описывает процесс оценки на основе сравнения групп.
Система получает обратную связь (feedback) для каждого тестового запроса, которая выбирает либо Группу 1, либо Группу 2. На основе агрегированной обратной связи выбирается лучший процесс отбора (Процесс 1 или Процесс 2).
Claim 10 и 11 (Зависимые): Детализируют метод оценки с помощью асессоров (Human Evaluators).
Результаты для Группы 1 и Группы 2 представляются асессорам. Получается обратная связь (предпочтение). Результаты упорядочиваются с использованием Query-specific score перед представлением.
Claim 12 (Зависимый): Детализирует метод оценки через A/B тестирование на живом трафике.
Тестовый запрос принимается от пользователей. Части пользователей (Первые пользователи) показываются результаты Группы 1. Другой части (Вторые пользователи) показываются результаты Группы 2. Сравнивается оценка пользователей (user assessment, например, CTR) для обеих групп. Анализ сравнения используется для выбора лучшего процесса.
Этот патент описывает инфраструктуру для исследований и разработки (R&D), а не компонент живой поисковой системы, обслуживающей пользователей. Он применяется для оценки потенциальных изменений в конвейере индексирования.
CRAWLING – Сканирование и Сбор данных
На этом этапе собираются ресурсы и вычисляются их атрибуты, которые затем используются для генерации Index Selection Signals. Патент упоминает, что при построении Query Results Table система может сканировать ресурсы глубже, чем обычно делает поисковая система для построения живого индекса, чтобы включить в оценку ресурсы, которые в настоящее время не проиндексированы.
INDEXING – Индексирование и извлечение признаков (R&D/Оценка)
Основная область применения. Система Index Selection Evaluation System оценивает различные Automated Resource Selection Processes, которые являются частью этапа индексирования. Она использует Index Selection Signals, извлеченные на этом этапе, для симуляции того, как разные процессы повлияют на состав индекса.
RANKING – Ранжирование (R&D/Оценка)
Система использует алгоритмы ранжирования для вычисления Query-specific scores. Эти оценки необходимы для упорядочивания результатов в гипотетических SERP, которые затем представляются для оценки (асессорам или в A/B тесте).
Входные данные:
Test Queries).Resource Source или Query Results Table, содержащая ресурсы, их Index Selection Signals и Query-specific scores.Выходные данные:
Automated Resource Selection Process.Патент не описывает влияние на конкретные типы контента, запросы, ниши или географию. Он описывает универсальную методологию тестирования, которая может быть применена для оценки процессов отбора в любых сегментах (например, тестирование критериев индексации для новостного контента, YMYL-тематик или специфических языков).
Алгоритм применяется во время циклов исследований и разработки (R&D), когда инженеры хотят протестировать изменения в критериях индексации. Например:
Процесс А: Генерация Query Results Table (Офлайн)
score threshold), используя подмножество ресурсов.Approximate Ranking Score.Query-specific score (Final Ranking Score).Index Selection Signals.Query Results Table, связывая запросы с ресурсами, их точными оценками и сигналами.Процесс Б: Симуляция и Сравнение Процессов Отбора
Query Results Table извлекаются все ресурсы, релевантные запросу, вместе с их сигналами.Index Selection Score. Если оценка превышает порог Процесса 1, ресурс классифицируется как to-be-indexed. Формируется Группа 1.Процесс В: Оценка Асессорами (Side-by-Side)
Query-specific scores. Они представляются асессорам (например, бок о бок).Процесс Г: Оценка A/B Тестированием (Live Traffic)
user assessment (например, CTR) для обеих SERP.Система использует данные, необходимые для принятия решения об индексации (Index Selection Signals) и данные для ранжирования (для упорядочивания SERP при оценке).
number of words), длина заголовка (length of the title).attributes derived from resources that link to a given resource).attributes derived from user behavior toward the resource), например, click-through-rate.Query-independent quality score (оценка качества ресурса, не зависящая от запроса).Важно отметить, что патент перечисляет эти типы данных как примеры Index Selection Signals. Он не утверждает, что все они используются в конкретном процессе отбора.
Index Selection Signals. Эвристика специфична для каждого тестируемого Automated Resource Selection Process.Index Selection Score. Может быть фиксированным или определяться динамически на основе желаемого размера индекса и распределения оценок.Query Results Table. Должна быть оптимизирована для сравнения одного запроса со многими документами.click-through-rate, время взаимодействия пользователя с результатами.Resource Selection) и процесс ранжирования (Ranking). Ресурс должен сначала пройти критерии отбора, чтобы попасть в индекс.Index Selection Signals (включая query-independent quality scores), которые агрегируются в Index Selection Score и сравниваются с порогом (Threshold).Query Results Table.Query Results Table ресурсы, которые в настоящее время отсутствуют в живом индексе (например, путем более глубокого сканирования). Это позволяет оценить, не упускает ли текущий процесс отбора качественный контент.Поскольку патент описывает внутреннюю инфраструктуру тестирования Google, он не дает прямых практических рекомендаций по SEO. Однако он подтверждает фундаментальные принципы:
Index Selection Criteria). Патент подтверждает, что существуют query-independent quality scores и пороги, которые ресурс должен преодолеть, чтобы быть рассмотренным для ранжирования.Index Selection Signals. Работа над этими фундаментальными аспектами повышает вероятность индексации.Resource Selection) и не попадет в индекс.Стратегическое значение патента заключается в понимании инфраструктуры Google. Он показывает, насколько быстро и эффективно Google может тестировать и внедрять изменения, влияющие на состав индекса. Если Google решит ужесточить критерии качества для индексации (например, повысить порог для query-independent quality score), они могут точно смоделировать влияние этого изменения до его внедрения. Это подчеркивает важность постоянного поддержания высокого качества контента, чтобы не оказаться за пределами индекса после очередного обновления критериев отбора.
Практических примеров применения для SEO нет, так как патент описывает внутренние процессы Google. Однако можно привести пример того, как Google может использовать эту систему.
Сценарий: Тестирование нового порога качества для индексации
Query-independent quality score.Query Results Table, система симулирует, какие ресурсы попадут в индекс при Пороге 0.5 (Группа А) и Пороге 0.7 (Группа Б) для тысяч тестовых запросов.Что такое Automated Resource Selection Process?
Это алгоритм, который решает, следует ли включать конкретный документ в индекс поисковой системы после его сканирования. Это фильтр качества и релевантности, который определяет состав индекса. Патент описывает систему для тестирования и сравнения различных версий таких алгоритмов.
Раскрывает ли этот патент факторы, которые Google использует для решения, индексировать ли страницу?
Нет. Патент описывает инфраструктуру для тестирования этих факторов (называемых Index Selection Signals), но не раскрывает, какие именно сигналы используются или какие у них веса. Он упоминает примеры, такие как длина контента, ссылки и поведение пользователей, но фокусируется на методологии оценки.
В чем разница между Index Selection Score и Ranking Score?
Index Selection Score — это оценка, используемая для принятия бинарного решения: индексировать ресурс или нет. Она часто не зависит от запроса и базируется на общих сигналах качества. Ranking Score (или Query-specific score) — это оценка, определяющая позицию уже проиндексированного ресурса в ответ на конкретный запрос пользователя.
Что такое Query Results Table и зачем она нужна?
Это ключевой компонент системы. Это предварительно созданная база данных, которая содержит тестовые запросы, релевантные им ресурсы, оценки ранжирования и все необходимые сигналы (Index Selection Signals). Она позволяет симулировать работу разных алгоритмов отбора на лету, без необходимости строить реальный индекс для каждого эксперимента.
Может ли эта система оценивать контент, которого нет в индексе Google?
Да. Патент упоминает, что при создании Query Results Table система может использовать данные краулинга, которые включают ресурсы, не попавшие в текущий живой индекс. Это позволяет оценить, не упускает ли текущий процесс отбора ценный контент и как новые процессы отбора могут это исправить.
Как Google сравнивает два разных процесса отбора?
Патент описывает два основных метода. Первый — оценка асессорами (Human Evaluators), которым показывают две гипотетические выдачи (side-by-side) и просят выбрать лучшую. Второй — A/B тестирование на живом трафике, где разным группам пользователей показывают результаты, сгенерированные разными процессами, и сравнивают их поведение (например, CTR).
Что означает Threshold (порог) в контексте этого патента?
Это пороговое значение для Index Selection Score. Если оценка ресурса превышает этот порог, он классифицируется как to-be-indexed. Если нет — он отбрасывается. Google использует описанную систему для тестирования различных значений этих порогов.
Какое практическое значение этот патент имеет для SEO?
Прямое практическое значение минимально, так как это инфраструктурный патент. Однако он подчеркивает, что попадание в индекс не гарантировано и зависит от прохождения определенных порогов качества. Он также показывает, что Google обладает инструментами для быстрого и точного тестирования изменений в этих порогах.
Упоминается ли в патенте Query-independent quality score?
Да, он упоминается как один из возможных Index Selection Signals, который хранится в Query Results Table. Это подтверждает использование общих оценок качества (не зависящих от конкретного запроса) для принятия решения о включении документа в индекс.
Кто такие Paul Haahr и Adam Sadovsky, указанные среди изобретателей?
Это ключевые инженеры Google Search. Paul Haahr известен своей работой над алгоритмами ранжирования и часто выступает на конференциях, объясняя принципы работы поиска. Adam Sadovsky также является старшим инженером. Их участие подчеркивает важность описанной инфраструктуры для разработки поисковых технологий.

Индексация
Свежесть контента

SERP
EEAT и качество

Поведенческие сигналы
Семантика и интент
EEAT и качество

SERP
Поведенческие сигналы

SERP

EEAT и качество
SERP
Ссылки

Семантика и интент
Поведенческие сигналы

Структура сайта
Техническое SEO
Индексация

Персонализация
Поведенческие сигналы
SERP

Ссылки
Поведенческие сигналы
Антиспам

Поведенческие сигналы
SERP

Поведенческие сигналы
Ссылки
SERP

Персонализация
Поведенческие сигналы
SERP

EEAT и качество
Поведенческие сигналы
SERP

Семантика и интент
Ссылки
SERP
