
Патент описывает математический метод, который Google использует для оценки качества поиска на основе попарных сравнений результатов людьми (асессорами). Система собирает данные о предпочтениях (Side-by-Side тесты) и использует модель, аналогичную PageRank (основанную на Марковских процессах), для агрегации этих оценок в единый, устойчивый к шуму рейтинг качества (Preference Ranking). Эти данные служат эталоном для обучения и валидации алгоритмов ранжирования.
Патент решает проблему надежной агрегации субъективных, часто противоречивых и зашумленных оценок качества, полученных от пользователей (асессоров), в единый глобальный рейтинг. Традиционные методы, такие как анализ ссылок (PageRank), уязвимы для спама и отражают мнение авторов, а не пользователей. Анализ кликов (click-tracking) слишком зашумлен, а прямые опросы сложно агрегировать. Изобретение предлагает устойчивый метод для определения "эталона качества" (Ground Truth) на основе человеческих предпочтений.
Запатентован метод генерации рейтинга предпочтений (Preference Ranking) на основе попарных сравнений (Pairwise Comparisons) элементов (например, результатов поиска). Суть заключается в использовании математического аппарата, аналогичного PageRank, – вычислении доминирующего собственного вектора (Dominant Eigenvector) матрицы смежности (Adjacency Matrix). Однако матрица смежности строится не на основе ссылок, а на основе агрегированных данных о предпочтениях пользователей.
Система работает следующим образом:
Rating Matrix, содержащую количество побед/проигрышей/ничьих (W/L/T) для каждой пары.Rating Matrix преобразуется в Adjacency Matrix с использованием формулы взвешенного соотношения проигрышей (weighted loss ratio).Dominant Eigenvector этой матрицы (используя Markov process). Значения в векторе определяют итоговый Preference Ranking элементов.Высокая. Хотя патент подан в 2006 году, описанная методология остается фундаментальной для оценки качества поиска. Попарное сравнение (Side-by-Side) является стандартным инструментом для асессоров Google (Quality Raters). Агрегация этих оценок для создания эталонных данных (Ground Truth), используемых для обучения и валидации алгоритмов машинного обучения (включая системы, связанные с E-E-A-T и Helpful Content), критически важна.
Влияние на SEO значительное, но косвенное (7.5/10). Патент не описывает алгоритм ранжирования в реальном времени. Он описывает, как Google *оценивает* качество результатов поиска, используя человеческие суждения. Полученный Preference Ranking служит эталоном качества, на который настраиваются основные алгоритмы ранжирования. Для SEO это подтверждает необходимость фокусироваться на качестве контента, которое удовлетворит асессора при прямом сравнении с конкурентами.
weighted loss ratio) между элементом i и элементом j.Adjacency Matrix. Значения этого вектора определяют итоговый Preference Ranking. Это дает более точное различие в качестве (числа с плавающей запятой), чем простая сортировка.Claim 1 (Независимый пункт): Описывает основной процесс создания рейтинга предпочтений для набора элементов (где каждый элемент является результатом поиска).
Adjacency Matrix.Adjacency Matrix, система вычисляет Preference Ranking.Claim 4 (Зависимый от 3): Детализирует способ вычисления Adjacency Matrix (размером nxn для n элементов). Это ядро изобретения.
Элемент вычисляется следующим образом:
Claim 5 (Зависимый от 1): Уточняет, что вычисление Preference Ranking включает вычисление Dominant Eigenvector для Adjacency Matrix.
Claim 6 (Зависимый от 1): Уточняет, что вычисление Dominant Eigenvector использует итеративный процесс с применением Damping Factor.
Этот патент описывает инфраструктуру оценки качества, а не компонент системы ранжирования в реальном времени. Он не встраивается напрямую в стандартный конвейер обработки запросов (Crawling-Indexing-Ranking).
Оценка качества и генерация обучающих данных (Evaluation & Training Data Generation)
Основное применение патента — это офлайн-процессы, направленные на оценку эффективности работы поисковой системы и создание эталонных наборов данных (Ground Truth).
Preference Ranking. Этот рейтинг затем сравнивается с рейтингом, сгенерированным поисковой системой, для оценки ее качества (например, при A/B тестировании обновлений).Preference Ranking служит в качестве "идеального" ранжирования (Ground Truth). Эти данные используются для обучения и тонкой настройки моделей машинного обучения (например, на этапе L2/L3 Ranking), чтобы они лучше соответствовали человеческим предпочтениям.Входные данные:
Выходные данные:
Dominant Eigenvector (Preference Ranking) — вектор числовых оценок качества для каждого элемента.YMYL-тематиках, где точность оценки качества имеет решающее значение для валидации алгоритмов, отвечающих за E-E-A-T.Процесс генерации рейтинга предпочтений:
progressive-refinement technique).Rating Matrix данными W/L/T (Wins/Losses/Ties).Adjacency Matrix из Rating Matrix, используя формулу Weighted Loss Ratio и нормализацию (см. Метрики).Dominant Eigenvector для Adjacency Matrix с использованием Damping Factor (например, 0.85).Preference Ranking.Preference Ranking используется для оценки качества результатов поиска или как обучающие данные.Патент фокусируется исключительно на использовании данных о предпочтениях.
Rating Matrix. Для набора из n элементов, элемент определяется по формулам: Adjacency Matrix (A) и Damping Factor (d): E-E-A-T, Needs Met). Алгоритмы Google обучаются воспроизводить эти оценки.Патент подчеркивает фундаментальную роль человеческой оценки в экосистеме поиска Google. Несмотря на развитие ИИ, именно агрегированные предпочтения людей (асессоров) формируют эталон, к которому стремятся алгоритмы. Это подтверждает стратегическую необходимость инвестиций в качество контента, экспертность и пользовательский опыт (E-E-A-T и Helpful Content), так как именно эти параметры оцениваются в ходе попарных сравнений (Human-Centric SEO).
Сценарий: Внутренний аудит качества контента с использованием методологии попарного сравнения
Rating Matrix (W/L/T), вычислить Adjacency Matrix по формуле взвешенного соотношения проигрышей и рассчитать Dominant Eigenvector (можно использовать специализированное ПО или библиотеки Python).Является ли это алгоритмом ранжирования, который Google использует в реальном времени?
Нет. Этот патент описывает метод для *оценки* качества результатов поиска и агрегации человеческих суждений. Он используется офлайн для генерации эталонных данных (Ground Truth), которые затем применяются для обучения и валидации основных алгоритмов ранжирования.
Использует ли этот алгоритм клики реальных пользователей из поиска (CTR)?
Патент не использует данные о кликах. Более того, в описании изобретения прямо говорится, что пассивные методы наблюдения, такие как анализ кликов (click-tracking), являются "зашумленными и сложными для интерпретации". Этот метод предложен как более надежная альтернатива.
Кто эти "пользователи", которые выражают предпочтения?
Хотя патент использует общий термин "users", в контексте оценки качества поиска Google это почти наверняка относится к асессорам (Quality Raters). Именно они выполняют задачи попарного сравнения (Side-by-Side) для оценки качества выдачи.
В чем ключевое отличие этого метода от PageRank?
Математический аппарат схож – оба метода используют Марковский процесс и вычисляют доминирующий собственный вектор матрицы смежности. Однако входные данные принципиально разные: PageRank анализирует ссылки (мнение авторов), а этот метод анализирует предпочтения пользователей/асессоров (мнение пользователей).
Почему Google предпочитает попарное сравнение (Side-by-Side) другим методам оценки?
Патент указывает, что прямые опросы удовлетворенности сложно агрегировать из-за различий в мнениях. Попарное сравнение проще для пользователя (нужно выбрать лучший из двух вариантов) и предоставляет данные, которые можно эффективно и устойчиво к шуму агрегировать с помощью описанного математического метода.
Что такое "Матрица смежности" (Adjacency Matrix) в этом патенте?
Это матрица, где каждый элемент рассчитывается по специальной формуле "взвешенного соотношения проигрышей" (weighted loss ratio). Эта формула учитывает количество побед, проигрышей и ничьих, а также общее количество элементов, обеспечивая нормализацию и равный вес для каждого сравнения.
Как система справляется с противоречивыми оценками (например, A>B, B>C, но C>A)?
Именно для решения этой проблемы используется вычисление собственного вектора. Этот математический метод (Markov process) позволяет найти глобальный оптимальный рейтинг, который наилучшим образом согласуется со всеми имеющимися данными, даже если они содержат локальные противоречия или шум.
Что означает, что система выдает "рейтинг", а не "упорядочивание"?
Традиционная сортировка выдает порядковые номера (1, 2, 3). Этот метод выдает числовые оценки (например, 0.52, 0.29, 0.18). Это позволяет не только понять, что А лучше B, но и насколько именно А лучше B в контексте данного набора данных, что дает более точное представление о качестве.
Какое практическое значение этот патент имеет для моей SEO-стратегии?
Стратегически он подтверждает, что вы должны стремиться к явному превосходству над конкурентами. Так как асессоры сравнивают ваш сайт с другими в формате Side-by-Side, ваша цель – быть предпочтительным выбором. Это подчеркивает важность глубокого понимания интента и предоставления максимально полезного контента (Helpful Content).
Актуален ли этот патент, учитывая развитие ИИ и машинного обучения?
Да, абсолютно актуален. Человеческие оценки, агрегированные с помощью этой методологии, служат "золотым стандартом" (ground truth) для обучения и валидации современных моделей машинного обучения и ИИ-систем ранжирования. ИИ учится предсказывать, какой результат предпочел бы человек.

Поведенческие сигналы
SERP

SERP

Ссылки
Мультимедиа
Поведенческие сигналы

Поведенческие сигналы

EEAT и качество
Knowledge Graph
SERP

Поведенческие сигналы
Индексация
Семантика и интент

Поведенческие сигналы
EEAT и качество
SERP

Ссылки
SERP
Свежесть контента

SERP
Поведенческие сигналы

Индексация
Техническое SEO
Структура сайта

Поведенческие сигналы
Мультимедиа
Семантика и интент

Поведенческие сигналы
Ссылки
SERP

EEAT и качество
Ссылки
SERP

Персонализация
Семантика и интент
Мультимедиа

Семантика и интент
Поведенческие сигналы
