SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google тестирует изменения в критериях индексации без перестроения всего индекса

AUTOMATED RESOURCE SELECTION PROCESS EVALUATION (Автоматизированная оценка процесса отбора ресурсов)
  • US8489604B1
  • Google LLC
  • 2010-10-26
  • 2013-07-16
  • Индексация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для эффективного тестирования и оценки различных критериев отбора ресурсов для включения в индекс. Вместо затратного перестроения индекса для каждого эксперимента, система симулирует, как разные процессы отбора повлияют на выдачу. Это позволяет сравнивать гипотетические индексы с помощью A/B тестов или асессоров, ускоряя разработку и улучшение качества индекса.

Описание

Какую проблему решает

Патент решает проблему высокой стоимости и низкой эффективности оценки различных автоматизированных процессов отбора ресурсов (Automated Resource Selection Process) для включения в индекс поисковой системы. Традиционные методы оценки требовали построения и поддержания отдельных индексов для каждого тестируемого процесса, что крайне затратно по ресурсам. Изобретение позволяет оценить качество различных критериев индексации без накладных расходов на построение множества индексов.

Что запатентовано

Запатентована система и метод для оценки и сравнения различных процессов отбора ресурсов (критериев индексации) без необходимости построения отдельных индексов для каждого из них. Система симулирует, какие ресурсы были бы включены в индекс каждым процессом, используя предварительно вычисленную таблицу результатов запросов (Query Results Table). Затем система генерирует гипотетические поисковые выдачи (SERP) для тестовых запросов на основе этих симулированных индексов и сравнивает их качество.

Как это работает

Система работает путем симуляции и сравнения:

  • Подготовка данных: Создается Query Results Table, которая связывает тестовые запросы с релевантными ресурсами, их оценками ранжирования и сигналами выбора индекса (Index Selection Signals).
  • Симуляция: Для тестового запроса система определяет, какие ресурсы были бы проиндексированы Процессом А (Группа А) и Процессом Б (Группа Б). Это делается путем применения логики каждого процесса к Index Selection Signals каждого ресурса и проверки, превышает ли результат пороговое значение.
  • Генерация SERP: Формируются две гипотетические поисковые выдачи, одна только из ресурсов Группы А, другая только из Группы Б, упорядоченные по оценкам ранжирования.
  • Оценка: Гипотетические SERP сравниваются либо путем представления их асессорам (Human Evaluators) для получения обратной связи (Side-by-Side), либо через A/B тестирование на живом трафике.

Актуальность для SEO

Высокая (с точки зрения методологии). Эффективное тестирование изменений является критически важным для эволюции поисковых систем. Описанная инфраструктура позволяет Google быстро итерировать и оценивать изменения в критериях индексации (например, новые пороги качества или фильтры спама), не затрагивая основной продакшн-индекс и не требуя огромных вычислительных ресурсов для перестроения индекса при каждом тесте.

Важность для SEO

Влияние на SEO минимальное и инфраструктурное (2/10). Этот патент описывает внутреннюю методологию тестирования Google (R&D). Он не раскрывает конкретные факторы ранжирования или критерии индексации (Index Selection Signals). Он объясняет, как Google решает, какие критерии использовать, но не какие именно критерии он использует. Для SEO-специалистов патент важен для понимания того, насколько эффективно Google может тестировать и внедрять изменения, влияющие на то, какой контент попадает в индекс.

Детальный разбор

Термины и определения

Automated Resource Selection Process (Автоматизированный процесс отбора ресурсов)
Алгоритм или эвристика, определяющая, следует ли включать конкретный ресурс (документ) в индекс поисковой системы. Использует один или несколько Index Selection Signals.
Index Selection Signals (Сигналы выбора индекса)
Метрики качества ресурса, получаемые из его атрибутов (внутренних или внешних). Используются для принятия решения об индексации. Примеры: длина ресурса, длина заголовка, количество ссылок, данные о поведении пользователей.
Index Selection Score (Оценка выбора индекса)
Единое (обычно скалярное) значение, получаемое путем применения эвристики к Index Selection Signals ресурса. Эта оценка сравнивается с порогом для принятия решения об индексации.
Query Results Table (Таблица результатов запросов)
Предварительно созданная структура данных (Resource Source), которая связывает тестовые запросы с релевантными ресурсами. Для каждого ресурса хранит его Query-specific Score и необходимые Index Selection Signals. Позволяет симулировать различные процессы отбора без построения реальных индексов.
To-be-indexed / Not-to-be-indexed (К индексации / Не к индексации)
Классификация ресурса, присваиваемая Automated Resource Selection Process на основе сравнения Index Selection Score с порогом.
Query-independent quality score (Оценка качества, не зависящая от запроса)
Метрика качества ресурса, которая не зависит от конкретного запроса (например, общая оценка качества сайта/документа). Упоминается как один из возможных Index Selection Signals.
Query-specific score (Оценка, специфичная для запроса)
Оценка ранжирования ресурса относительно конкретного запроса (Ranking Score). Используется для упорядочивания результатов в гипотетических SERP во время оценки.
Approximate Ranking Score (Приблизительная оценка ранжирования)
Быстро вычисляемая оценка, используемая при построении Query Results Table для предварительной фильтрации ресурсов, прежде чем вычислять точный Final Ranking Score.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методологии оценки, а не на конкретных алгоритмах отбора.

Claim 1 (Независимый пункт): Описывает основной метод симуляции для сравнения двух процессов отбора (Процесс 1 и Процесс 2).

  1. Система получает множество тестовых запросов.
  2. Для каждого запроса генерируются две группы ресурсов (Группа 1 и Группа 2). Этот процесс включает:
    • Идентификацию всех ресурсов, релевантных запросу.
    • Для каждого ресурса: определение, классифицирует ли его Процесс 1 как to-be-indexed. Все такие ресурсы формируют Группу 1.
    • Для каждого ресурса: определение, классифицирует ли его Процесс 2 как to-be-indexed. Все такие ресурсы формируют Группу 2.
  3. Ключевое утверждение: Решение Процесса 1 о классификации ресурса принимается независимо от решения Процесса 2 для того же ресурса.

Claim 7 (Зависимый от 1): Детализирует механизм принятия решения об индексации внутри процесса отбора.

Определение классификации ресурса (to-be-indexed или not-to-be-indexed) включает вычисление Index Selection Score для ресурса. Если эта оценка удовлетворяет пороговому значению (threshold), ресурс классифицируется как to-be-indexed.

Claim 8 (Зависимый от 1): Уточняет источник данных для симуляции.

Идентификация релевантных ресурсов может происходить из Query Results Table. Эта таблица связывает запросы с ресурсами и включает query-independent quality score для каждого ресурса.

Claim 9 (Зависимый от 1): Описывает процесс оценки на основе сравнения групп.

Система получает обратную связь (feedback) для каждого тестового запроса, которая выбирает либо Группу 1, либо Группу 2. На основе агрегированной обратной связи выбирается лучший процесс отбора (Процесс 1 или Процесс 2).

Claim 10 и 11 (Зависимые): Детализируют метод оценки с помощью асессоров (Human Evaluators).

Результаты для Группы 1 и Группы 2 представляются асессорам. Получается обратная связь (предпочтение). Результаты упорядочиваются с использованием Query-specific score перед представлением.

Claim 12 (Зависимый): Детализирует метод оценки через A/B тестирование на живом трафике.

Тестовый запрос принимается от пользователей. Части пользователей (Первые пользователи) показываются результаты Группы 1. Другой части (Вторые пользователи) показываются результаты Группы 2. Сравнивается оценка пользователей (user assessment, например, CTR) для обеих групп. Анализ сравнения используется для выбора лучшего процесса.

Где и как применяется

Этот патент описывает инфраструктуру для исследований и разработки (R&D), а не компонент живой поисковой системы, обслуживающей пользователей. Он применяется для оценки потенциальных изменений в конвейере индексирования.

CRAWLING – Сканирование и Сбор данных
На этом этапе собираются ресурсы и вычисляются их атрибуты, которые затем используются для генерации Index Selection Signals. Патент упоминает, что при построении Query Results Table система может сканировать ресурсы глубже, чем обычно делает поисковая система для построения живого индекса, чтобы включить в оценку ресурсы, которые в настоящее время не проиндексированы.

INDEXING – Индексирование и извлечение признаков (R&D/Оценка)
Основная область применения. Система Index Selection Evaluation System оценивает различные Automated Resource Selection Processes, которые являются частью этапа индексирования. Она использует Index Selection Signals, извлеченные на этом этапе, для симуляции того, как разные процессы повлияют на состав индекса.

RANKING – Ранжирование (R&D/Оценка)
Система использует алгоритмы ранжирования для вычисления Query-specific scores. Эти оценки необходимы для упорядочивания результатов в гипотетических SERP, которые затем представляются для оценки (асессорам или в A/B тесте).

Входные данные:

  • Набор тестовых запросов (Test Queries).
  • Resource Source или Query Results Table, содержащая ресурсы, их Index Selection Signals и Query-specific scores.
  • Определения (эвристики и пороги) тестируемых процессов отбора (Процесс А, Процесс Б).

Выходные данные:

  • Агрегированная обратная связь (от асессоров) или сравнение пользовательских оценок (из A/B тестов).
  • Решение о выборе лучшего Automated Resource Selection Process.

На что влияет

Патент не описывает влияние на конкретные типы контента, запросы, ниши или географию. Он описывает универсальную методологию тестирования, которая может быть применена для оценки процессов отбора в любых сегментах (например, тестирование критериев индексации для новостного контента, YMYL-тематик или специфических языков).

Когда применяется

Алгоритм применяется во время циклов исследований и разработки (R&D), когда инженеры хотят протестировать изменения в критериях индексации. Например:

  • При тестировании нового сигнала качества для определения того, стоит ли индексировать ресурс.
  • При корректировке пороговых значений (thresholds) для существующих сигналов.
  • При оценке эффективности новых фильтров спама на этапе индексации.

Пошаговый алгоритм

Процесс А: Генерация Query Results Table (Офлайн)

  1. Выбор запросов: Выбирается набор тестовых запросов для включения в таблицу (например, путем сэмплирования из логов запросов).
  2. Идентификация ресурсов: Система идентифицирует ресурсы (например, из краулинговых данных), которые соответствуют одному или нескольким тестовым запросам.
  3. Определение порога оценки (Опционально): Для оптимизации размера таблицы система может оценить порог ранжирования (score threshold), используя подмножество ресурсов.
  4. Вычисление приблизительной оценки: Для каждой пары (ресурс, запрос) вычисляется Approximate Ranking Score.
  5. Вычисление точной оценки: Если приблизительная оценка удовлетворяет порогу, вычисляется точный Query-specific score (Final Ranking Score).
  6. Получение сигналов: Для отобранных ресурсов извлекаются все необходимые Index Selection Signals.
  7. Сохранение данных: Данные сохраняются в Query Results Table, связывая запросы с ресурсами, их точными оценками и сигналами.

Процесс Б: Симуляция и Сравнение Процессов Отбора

  1. Получение тестового запроса: Система получает тестовый запрос.
  2. Идентификация ресурсов: Из Query Results Table извлекаются все ресурсы, релевантные запросу, вместе с их сигналами.
  3. Симуляция Процесса 1: Для каждого ресурса система применяет эвристику Процесса 1 к его сигналам для вычисления Index Selection Score. Если оценка превышает порог Процесса 1, ресурс классифицируется как to-be-indexed. Формируется Группа 1.
  4. Симуляция Процесса 2: Аналогично, для каждого ресурса применяется эвристика Процесса 2. Формируется Группа 2.
  5. Сравнение: Процессы 1 и 2 сравниваются путем сравнения Группы 1 и Группы 2 (см. Процесс В или Г).

Процесс В: Оценка Асессорами (Side-by-Side)

  1. Представление результатов: Генерируются две SERP (для Группы 1 и Группы 2), упорядоченные по Query-specific scores. Они представляются асессорам (например, бок о бок).
  2. Получение обратной связи: Асессоры указывают, какую SERP они предпочитают (опционально указывая степень предпочтения).
  3. Агрегация: Обратная связь от разных асессоров агрегируется.
  4. Выбор процесса: Выбирается процесс отбора, чьи результаты получили более высокие оценки.

Процесс Г: Оценка A/B Тестированием (Live Traffic)

  1. Получение запроса от пользователей: Тестовый запрос поступает от реальных пользователей через интерфейс поисковой системы.
  2. Разделение трафика: Пользователи разделяются на две группы.
  3. Представление SERP 1: Первой группе пользователей представляется SERP, соответствующая Группе 1.
  4. Представление SERP 2: Второй группе пользователей представляется SERP, соответствующая Группе 2.
  5. Сравнение оценок пользователей: Сравниваются метрики user assessment (например, CTR) для обеих SERP.
  6. Анализ и выбор: Анализируются результаты сравнения для выбора лучшего процесса отбора.

Какие данные и как использует

Данные на входе

Система использует данные, необходимые для принятия решения об индексации (Index Selection Signals) и данные для ранжирования (для упорядочивания SERP при оценке).

  • Контентные/Структурные факторы: Внутренние атрибуты ресурса, такие как количество слов в ресурсе (number of words), длина заголовка (length of the title).
  • Технические факторы: Длина идентификатора ресурса (например, URL).
  • Ссылочные факторы: Внешние атрибуты, полученные из ресурсов, ссылающихся на данный ресурс (attributes derived from resources that link to a given resource).
  • Поведенческие факторы: Атрибуты, полученные из поведения пользователей по отношению к ресурсу (attributes derived from user behavior toward the resource), например, click-through-rate.
  • Системные метрики качества: Query-independent quality score (оценка качества ресурса, не зависящая от запроса).

Важно отметить, что патент перечисляет эти типы данных как примеры Index Selection Signals. Он не утверждает, что все они используются в конкретном процессе отбора.

Какие метрики используются и как они считаются

  • Index Selection Score: Вычисляется путем применения определенной эвристики (формулы) к одному или нескольким Index Selection Signals. Эвристика специфична для каждого тестируемого Automated Resource Selection Process.
  • Threshold (Порог индексации): Значение, с которым сравнивается Index Selection Score. Может быть фиксированным или определяться динамически на основе желаемого размера индекса и распределения оценок.
  • Approximate Ranking Score: Быстро вычисляемая оценка релевантности пары (ресурс, запрос). Используется для предварительной фильтрации при построении Query Results Table. Должна быть оптимизирована для сравнения одного запроса со многими документами.
  • Query-specific Score (Final Ranking Score): Точная оценка ранжирования, вычисляемая стандартными алгоритмами поисковой системы. Используется для финального упорядочивания результатов при оценке.
  • User Assessment (Оценка пользователей): Метрики, используемые в A/B тестировании для сравнения качества SERP. Примеры: агрегированный click-through-rate, время взаимодействия пользователя с результатами.

Выводы

  1. Индексация — это селективный процесс, отдельный от ранжирования: Патент четко разделяет процесс отбора ресурсов для индекса (Resource Selection) и процесс ранжирования (Ranking). Ресурс должен сначала пройти критерии отбора, чтобы попасть в индекс.
  2. Критерии отбора основаны на сигналах и порогах: Решение об индексации принимается на основе Index Selection Signals (включая query-independent quality scores), которые агрегируются в Index Selection Score и сравниваются с порогом (Threshold).
  3. Эффективность тестирования — приоритет Google: Основная цель патента — позволить Google тестировать изменения в критериях индексации быстро и дешево, без необходимости перестраивать весь индекс для каждого эксперимента. Это указывает на высокую скорость итераций и изменений в поисковых алгоритмах.
  4. Симуляция гипотетических индексов: Google обладает инфраструктурой для симуляции того, как выглядел бы индекс и поисковая выдача, если бы использовались другие критерии отбора. Это достигается за счет Query Results Table.
  5. Использование стандартных методов оценки: Для оценки качества симулированных индексов используются проверенные методы: оценка асессорами (Side-by-Side Evaluation) и A/B тестирование на живом трафике.
  6. Возможность оценки непроиндексированного контента: Система может включать в Query Results Table ресурсы, которые в настоящее время отсутствуют в живом индексе (например, путем более глубокого сканирования). Это позволяет оценить, не упускает ли текущий процесс отбора качественный контент.

Практика

Best practices (это мы делаем)

Поскольку патент описывает внутреннюю инфраструктуру тестирования Google, он не дает прямых практических рекомендаций по SEO. Однако он подтверждает фундаментальные принципы:

  • Обеспечение прохождения порогов качества для индексации: Необходимо сосредоточиться на повышении качества ресурсов, чтобы они соответствовали критериям отбора Google (Index Selection Criteria). Патент подтверждает, что существуют query-independent quality scores и пороги, которые ресурс должен преодолеть, чтобы быть рассмотренным для ранжирования.
  • Фокус на атрибутах, упомянутых как примеры сигналов: Хотя конкретные сигналы не раскрыты, патент упоминает внутренние (длина контента, заголовки) и внешние (ссылки, поведение пользователей) атрибуты как основу для Index Selection Signals. Работа над этими фундаментальными аспектами повышает вероятность индексации.

Worst practices (это делать не надо)

  • Игнорирование базового качества в надежде на краулинг: Недостаточно просто добиться сканирования ресурса. Если его сигналы качества низкие, он не пройдет этап отбора (Resource Selection) и не попадет в индекс.
  • Создание большого количества низкокачественных страниц: Такие страницы с высокой вероятностью будут отфильтрованы на этапе отбора. Google активно тестирует и корректирует пороги (Thresholds), чтобы управлять размером индекса и его качеством, используя описанную в патенте методологию.

Стратегическое значение

Стратегическое значение патента заключается в понимании инфраструктуры Google. Он показывает, насколько быстро и эффективно Google может тестировать и внедрять изменения, влияющие на состав индекса. Если Google решит ужесточить критерии качества для индексации (например, повысить порог для query-independent quality score), они могут точно смоделировать влияние этого изменения до его внедрения. Это подчеркивает важность постоянного поддержания высокого качества контента, чтобы не оказаться за пределами индекса после очередного обновления критериев отбора.

Практические примеры

Практических примеров применения для SEO нет, так как патент описывает внутренние процессы Google. Однако можно привести пример того, как Google может использовать эту систему.

Сценарий: Тестирование нового порога качества для индексации

  1. Задача: Google хочет уменьшить количество низкокачественного контента в индексе, повысив порог (Threshold) для Query-independent quality score.
  2. Процесс А (Текущий): Использует текущий порог качества (например, 0.5).
  3. Процесс Б (Новый): Использует повышенный порог качества (например, 0.7).
  4. Симуляция: Используя Query Results Table, система симулирует, какие ресурсы попадут в индекс при Пороге 0.5 (Группа А) и Пороге 0.7 (Группа Б) для тысяч тестовых запросов.
  5. Оценка: Генерируются гипотетические SERP. Асессоры сравнивают SERP А и SERP Б.
  6. Результат: Если асессоры стабильно предпочитают SERP Б (более чистая выдача, меньше спама), Google может принять решение о внедрении нового порога 0.7 в продакшн. Все это происходит без необходимости строить реальный индекс с порогом 0.7.

Вопросы и ответы

Что такое Automated Resource Selection Process?

Это алгоритм, который решает, следует ли включать конкретный документ в индекс поисковой системы после его сканирования. Это фильтр качества и релевантности, который определяет состав индекса. Патент описывает систему для тестирования и сравнения различных версий таких алгоритмов.

Раскрывает ли этот патент факторы, которые Google использует для решения, индексировать ли страницу?

Нет. Патент описывает инфраструктуру для тестирования этих факторов (называемых Index Selection Signals), но не раскрывает, какие именно сигналы используются или какие у них веса. Он упоминает примеры, такие как длина контента, ссылки и поведение пользователей, но фокусируется на методологии оценки.

В чем разница между Index Selection Score и Ranking Score?

Index Selection Score — это оценка, используемая для принятия бинарного решения: индексировать ресурс или нет. Она часто не зависит от запроса и базируется на общих сигналах качества. Ranking Score (или Query-specific score) — это оценка, определяющая позицию уже проиндексированного ресурса в ответ на конкретный запрос пользователя.

Что такое Query Results Table и зачем она нужна?

Это ключевой компонент системы. Это предварительно созданная база данных, которая содержит тестовые запросы, релевантные им ресурсы, оценки ранжирования и все необходимые сигналы (Index Selection Signals). Она позволяет симулировать работу разных алгоритмов отбора на лету, без необходимости строить реальный индекс для каждого эксперимента.

Может ли эта система оценивать контент, которого нет в индексе Google?

Да. Патент упоминает, что при создании Query Results Table система может использовать данные краулинга, которые включают ресурсы, не попавшие в текущий живой индекс. Это позволяет оценить, не упускает ли текущий процесс отбора ценный контент и как новые процессы отбора могут это исправить.

Как Google сравнивает два разных процесса отбора?

Патент описывает два основных метода. Первый — оценка асессорами (Human Evaluators), которым показывают две гипотетические выдачи (side-by-side) и просят выбрать лучшую. Второй — A/B тестирование на живом трафике, где разным группам пользователей показывают результаты, сгенерированные разными процессами, и сравнивают их поведение (например, CTR).

Что означает Threshold (порог) в контексте этого патента?

Это пороговое значение для Index Selection Score. Если оценка ресурса превышает этот порог, он классифицируется как to-be-indexed. Если нет — он отбрасывается. Google использует описанную систему для тестирования различных значений этих порогов.

Какое практическое значение этот патент имеет для SEO?

Прямое практическое значение минимально, так как это инфраструктурный патент. Однако он подчеркивает, что попадание в индекс не гарантировано и зависит от прохождения определенных порогов качества. Он также показывает, что Google обладает инструментами для быстрого и точного тестирования изменений в этих порогах.

Упоминается ли в патенте Query-independent quality score?

Да, он упоминается как один из возможных Index Selection Signals, который хранится в Query Results Table. Это подтверждает использование общих оценок качества (не зависящих от конкретного запроса) для принятия решения о включении документа в индекс.

Кто такие Paul Haahr и Adam Sadovsky, указанные среди изобретателей?

Это ключевые инженеры Google Search. Paul Haahr известен своей работой над алгоритмами ранжирования и часто выступает на конференциях, объясняя принципы работы поиска. Adam Sadovsky также является старшим инженером. Их участие подчеркивает важность описанной инфраструктуры для разработки поисковых технологий.

Похожие патенты

Как Google тестирует и выбирает, какие документы включать в индекс, используя инкрементно обновляемую тестовую среду
Патент описывает инфраструктуру Google для оценки различных стратегий отбора документов в индекс. Система поддерживает актуальный набор данных (Query-to-Resource Mapping), периодически добавляя свежий контент и новые запросы. Это позволяет Google сравнивать разные алгоритмы индексации через A/B тесты и оценку асессорами, чтобы определить, какая стратегия обеспечивает более качественную выдачу.
  • US20140059062A1
  • 2014-02-27
  • Индексация

  • Свежесть контента

Как Google подмешивает результаты из альтернативных запросов, чтобы вытеснить низкокачественные сайты из топа выдачи
Google использует механизм улучшения качества поисковой выдачи. Если по исходному запросу в топе ранжируется слишком много низкокачественных сайтов, система находит связанный альтернативный запрос, который возвращает высококачественные результаты. Затем эти результаты агрессивно повышаются в ранжировании и подмешиваются в исходную выдачу, чтобы гарантировать пользователю доступ к качественному контенту.
  • US9135307B1
  • 2015-09-15
  • SERP

  • EEAT и качество

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google тестирует, сравнивает и выбирает лучшие алгоритмы ранжирования
Патент описывает инфраструктуру Google для сравнения и оценки различных алгоритмов ранжирования (Scoring Functions). Система выбирает два алгоритма, которые дают максимально разные результаты (Diversity Score), показывает обе выдачи для сравнения (Side-by-Side) и собирает данные для определения лучшего алгоритма, фильтруя при этом ненадежную обратную связь.
  • US8060497B1
  • 2011-11-15
  • SERP

Популярные патенты

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
  • US7933890B2
  • 2011-04-26
  • Структура сайта

  • Техническое SEO

  • Индексация

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)
Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.
  • US9558233B1
  • 2017-01-31
  • Ссылки

  • Поведенческие сигналы

  • Антиспам

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

seohardcore