
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
Патент решает фундаментальную проблему информационного поиска: разрыв между объективными сигналами релевантности (совпадение терминов, ссылочный вес) и субъективным восприятием релевантности и качества пользователем. Цель изобретения — автоматизировать и масштабировать процесс оценки качества поиска, обучив систему имитировать суждения людей-асессоров (human evaluators) для более точного ранжирования результатов.
Запатентована система и метод машинного обучения, известный как Learning to Rank (LTR). Суть заключается в обучении статистической модели (statistical model), которая использует человеческие оценки релевантности (human relevance evaluations) как эталон (ground truth). Модель учится предсказывать эти оценки на основе набора объективных сигналов (objective signals), извлеченных из пары запрос/документ и других источников данных (например, логов кликов).
Система работает в два этапа:
IR score, поведенческие данные). Затем используется метод машинного обучения (например, регрессионный анализ), чтобы научить модель связывать сигналы с человеческими оценками.predicted relevance evaluations) для каждого кандидата. Эти прогнозы используются для финального ранжирования или переранжирования результатов.Критически высокая. Хотя патент был подан в 2005 году и описывает относительно простые методы (например, линейную регрессию), заложенная в нем концепция Learning to Rank является фундаментом всех современных поисковых систем. Современные реализации (включая модели на основе глубокого обучения) используют ту же базовую идею: объединение сотен сигналов с помощью машинного обучения для оптимизации под человеческое восприятие качества.
Патент имеет критическое значение (10/10). Он формализует переход от оптимизации под отдельные алгоритмы (например, PageRank или плотность ключевых слов) к оптимизации под сложную машину, обученную комбинировать множество факторов. Патент явно подтверждает использование как статических (контент, ссылки), так и динамических (поведенческих) сигналов в ранжировании. Это подчеркивает, что для успеха в SEO необходимо фокусироваться на общем качестве, удовлетворении интента пользователя и метриках вовлеченности.
Dynamic Signals.Click Logs. Примеры: доля пользователей, кликнувших на документ первыми; время до клика; время изучения документа (dwell time).human evaluators) паре запрос/документ. Служат эталоном (ground truth) для обучения модели.Static Signals и Dynamic Signals. Являются входными данными для статистической модели.link-based value (например, PageRank или оценка авторитетности сайта).Objective Signals с Human Relevance Evaluations.IR Score, совпадение запроса с URL, Query-Independent Quality Measure.Патент охватывает как процесс обучения модели (Training), так и процесс ее применения в поиске (Usage) и для оценки качества (Evaluation).
Claim 1 (Независимый пункт) – Процесс Обучения: Описывает метод создания модели LTR, с фокусом на локальный поиск.
business listings).objective data) для каждой пары. Указаны конкретные сигналы: prefix portion of a name of a business).exactly matches the name).evaluation model) на основе полученных оценок и объективных данных для прогнозирования человеческой оценки релевантности, которая используется для ранжирования.Claim 12 (Независимый пункт) – Процесс Использования в Поиске: Описывает применение обученной модели.
suffix portion).predicted human relevance evaluations) из статистической модели.Claims, связанные с поведенческими факторами (например, 10, 21, 23, 46): Эти пункты детализируют типы объективных данных, включая поведенческие (Dynamic Signals).
Изобретение является ключевым компонентом этапа ранжирования, интегрируя данные, рассчитанные на предыдущих этапах.
CRAWLING & Data Acquisition (Сбор данных)
Система собирает логи пользовательской активности (Click logs), которые служат источником для расчета динамических сигналов.
INDEXING – Индексирование и извлечение признаков
На этом этапе извлекаются и сохраняются статические сигналы (Static Signals), необходимые для LTR модели: контентные факторы (для расчета IR Score), структурные данные (URL), а также рассчитываются независимые от запроса меры качества (Query-Independent Quality Measure, например, PageRank).
RANKING – Ранжирование (L2/L3) / RERANKING
Основное место применения патента. На продвинутых стадиях ранжирования (L2/L3) или на этапе переранжирования система использует обученную статистическую модель для комбинирования множества сигналов.
Objective Signals (статические и динамические).predicted human relevance rating для каждой пары запрос/документ.refine ranking) на основе этих прогнозируемых оценок.Входные данные:
Objective Signals для этой пары: статические (контент, ссылки, структура) и динамические (поведенческие данные из Click Logs).Выходные данные:
Predicted Human Relevance Rating – оценка, прогнозирующая, насколько релевантным документ сочтет человек.general web search engine), так и для локального поиска (local search engine) с использованием бизнес-листингов. Упоминается возможность применения для поиска товаров, новостей или email. Подход LTR универсален.Процесс А: Обучение Модели (Offline)
Human Relevance Evaluations (рейтингов или ранжирований) от асессоров для этих пар.Objective Signals (статических и динамических) для каждой пары в корпусе.weights), определяющие, как комбинировать сигналы для прогнозирования оценки.Процесс Б: Применение Модели в Ранжировании (Online)
Objective Signals, который использовался при обучении.Predicted Human Relevance Ratings.Патент явно перечисляет множество типов объективных сигналов, которые используются в качестве входных данных для модели LTR.
Контентные и Структурные факторы (Static Signals):
Ссылочные факторы / Авторитетность (Static Signals):
link-based value, т.е. PageRank или аналогичный показатель авторитетности).Поведенческие факторы (Dynamic Signals):
Сигналы, извлекаемые из Click Logs, основанные на агрегированном поведении пользователей:
Click Logs (CTR, время до клика, последовательность кликов, аппроксимация Dwell Time) в качестве входных сигналов (Dynamic Signals) для прогнозирования релевантности.Dynamic Signals, необходимо фокусироваться на метриках вовлеченности. Query-Independent Quality Measure) и текстовая релевантность (IR Score) являются важными входами в модель. Соответствие QRG критически важно, так как модель обучается на данных асессоров.Dynamic Signals (например, короткий Dwell Time) приведут к понижению позиций моделью LTR.IR Score лишь как один из множества сигналов, и его вес может быть нивелирован другими факторами.Этот патент является фундаментальным для понимания современного SEO. Он подтверждает, что Google отказался от фиксированных формул ранжирования в пользу гибких, самообучающихся систем (Learning to Rank). Стратегическое значение заключается в необходимости смещения фокуса SEO с технической оптимизации под отдельные факторы на обеспечение реальной ценности и удовлетворенности пользователей. Поведенческие данные являются неотъемлемой частью ранжирования, и оптимизация под них должна быть центральным элементом долгосрочной стратегии.
Сценарий: Переранжирование на основе поведенческих сигналов
Query-Independent Quality Measure, высокий IR Score. Но Dynamic Signals показывают короткое время изучения (короткий Dwell Time) и частый возврат к выдаче (Pogo-sticking), так как текст сложный.Dynamic Signals показывают длительное время изучения и низкий процент возврата к выдаче, так как объяснение простое и есть видео.Predicted Human Relevance Rating, и он ранжируется выше Документа А.Что такое Learning to Rank (LTR) и как он используется в этом патенте?
Learning to Rank — это применение машинного обучения для построения моделей ранжирования. В контексте патента, LTR используется для обучения статистической модели, которая комбинирует различные объективные сигналы (факторы ранжирования) таким образом, чтобы итоговое ранжирование максимально соответствовало оценкам людей-асессоров. Система учится этому автоматически, без ручного подбора весов.
Как этот патент связан с Google Quality Rater Guidelines (Инструкциями для асессоров)?
Связь прямая. Патент описывает необходимость получения Human Relevance Evaluations для обучения модели. Эти оценки предоставляются асессорами, которые следуют Quality Rater Guidelines. Таким образом, модель LTR учится алгоритмически применять принципы (включая E-E-A-T), изложенные в этих инструкциях.
Подтверждает ли патент использование поведенческих факторов (CTR, dwell time) в ранжировании?
Да, абсолютно. Патент явно описывает использование Dynamic Signals, извлеченных из Click Logs. Конкретно упоминаются такие сигналы, как доля пользователей, кликнувших на результат первыми, и использование времени между кликами как аппроксимации времени изучения документа (dwell time). Это прямое подтверждение использования поведенческих данных в модели ранжирования.
Патент подан в 2005 году. Актуален ли он сегодня?
Концептуально патент критически актуален. Идея Learning to Rank является фундаментом современного поиска. Хотя конкретные методы машинного обучения, упомянутые в патенте (например, простая линейная регрессия), устарели, и сегодня используются более сложные модели (нейронные сети), базовая архитектура осталась прежней.
Как этот патент влияет на Локальное SEO (Local SEO)?
Патент уделяет значительное внимание применению LTR в локальном поиске. Он выделяет специфические сигналы для бизнес-листингов, такие как точное, префиксное, суффиксное совпадение запроса с названием компании, а также сравнение совпадения с названием или категорией. Это подчеркивает важность точности данных в Google Business Profile.
Заменяет ли эта система PageRank?
Нет, не заменяет. PageRank (или его аналоги) используется как один из входных сигналов для модели LTR. В патенте он упоминается как Query-Independent Quality Measure (независимая от запроса мера качества) и описывается как link-based value. LTR модель объединяет его с другими сигналами.
В чем разница между статическими (Static) и динамическими (Dynamic) сигналами?
Статические сигналы основаны на контенте, структуре и ссылках документа (например, текстовая релевантность, URL, PageRank). Динамические сигналы основаны на агрегированном поведении пользователей и извлекаются из логов кликов (например, CTR, время на сайте, паттерны кликов).
Как SEO-специалисту оптимизировать сайт под эту систему?
Ключевая стратегия — фокусироваться на удовлетворении интента пользователя и обеспечении положительного пользовательского опыта. Необходимо создавать контент, который удерживает пользователя и решает его задачу, генерируя положительные Dynamic Signals. Также важно поддерживать сильные статические сигналы (релевантность и авторитетность).
Может ли эта модель использоваться не только для ранжирования, но и для оценки качества поиска?
Да, патент явно упоминает, что прогнозируемые человеческие оценки могут использоваться для оценки эффективности (assessing the effectiveness) поисковой системы. Это позволяет Google автоматически тестировать новые алгоритмы ранжирования, сравнивая их результаты с прогнозами модели, без масштабного привлечения асессоров.
Что означает термин "Objective Signals" (Объективные сигналы)?
Это измеримые признаки или фичи, которые можно автоматически извлечь из пары запрос/документ или из логов поведения пользователей. Несмотря на то, что они используются для прогнозирования субъективной человеческой оценки, сами сигналы являются объективными данными (например, количество совпадений слов, время в секундах, наличие ссылки).

Семантика и интент

Мультимедиа
SERP

Семантика и интент
SERP
Персонализация

Индексация
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Персонализация
Поведенческие сигналы
SERP

Свежесть контента
Ссылки
Техническое SEO

Knowledge Graph
Свежесть контента
Семантика и интент

Поведенческие сигналы
SERP

Ссылки
Поведенческие сигналы
Антиспам

Ссылки
Поведенческие сигналы
Мультимедиа

Поведенческие сигналы
Семантика и интент
SERP

Семантика и интент
SERP
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
SERP

Индексация
Техническое SEO
Структура сайта
