
Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.
Патент решает фундаментальное ограничение классической модели PageRank («модель случайного серфера»), которая предполагает, что пользователь с равной вероятностью перейдет по любой ссылке на странице. В реальности пользователи игнорируют многие ссылки (например, рекламу, ссылки в футере, «Условия использования»). Изобретение внедряет «модель разумного серфера» (reasonable surfer model), которая взвешивает ссылки на основе прогнозируемой вероятности их выбора, повышая точность сигналов ранжирования, получаемых из ссылочного графа.
Запатентована система и метод модификации алгоритмов ранжирования на основе ссылок (таких как PageRank) путем присвоения динамических весов ссылкам. Эти веса определяются моделью машинного обучения, которая прогнозирует вероятность клика по ссылке. Модель обучается на User Behavior Data (реальные клики пользователей) и Feature Data (характеристики ссылки, исходного и целевого документов). Предсказанная вероятность используется как вес () в расчете ранга.
Система работает следующим образом:
Feature Data (позиция ссылки, размер шрифта, анкорный текст и т.д.) и User Behavior Data (какие ссылки пользователи реально выбирают).Model Generating Unit использует эти данные для обучения модели машинного обучения (например, логистической регрессии). Модель учится определять, какие признаки коррелируют с высокой вероятностью клика.Model Applying Unit применяет обученную модель к ссылкам в вебе для определения их веса (Link Weight), который отражает вероятность их выбора пользователем.Чрезвычайно высокая. Этот патент описывает эволюцию PageRank от теоретической модели к модели, основанной на эмпирических данных и предиктивном моделировании. Концепция взвешивания ссылок на основе их заметности, контекста и вероятности клика является фундаментальной для современного анализа ссылок в Google.
Патент имеет критическое значение (95/100) для SEO. Он фундаментально меняет стратегии внутреннего и внешнего линкбилдинга. Он доказывает, что расположение, представление и контекст ссылки напрямую влияют на то, сколько ранжирующего веса она передает. Ссылки, которые визуально заметны, контекстуально релевантны и полезны для пользователя, передают значительно больше ценности, чем игнорируемые ссылки.
source document) и признаки целевого документа (target document).Feature Data для конкретной ссылки, используемое в качестве входных данных для модели машинного обучения.Claim 1 (Независимый пункт): Описывает основной метод ранжирования.
Feature Data для набора ссылок (включая признаки исходного документа, самой ссылки и целевого документа).User Behavior Data (навигационная активность и клики пользователей по этим ссылкам).training a model), которая предсказывает вероятность выбора ссылки пользователем. Обучение включает анализ признаков выбранных и невыбранных ссылок для генерации правил.Feature Data.Feature Data ссылки в модель.Ядром изобретения является использование комбинации User Behavior Data и детализированных Feature Data для обучения предиктивной модели, которая затем используется для взвешивания ссылок при расчете ранга.
Claim 12 (Независимый пункт): Аналогичен Claim 1, но более явно описывает промежуточный шаг присвоения веса.
Feature Data и User Behavior Data.assigning a weight) ссылке на основе этой вероятности.Claim 16 (Независимый пункт): Описывает систему и детализирует типы используемых признаков (Feature Data).
Система включает средства для хранения Feature Data, которые включают данные о признаках исходных документов, самих ссылок и целевых документов. Патент приводит конкретные примеры этих признаков, подтверждая, что физическое представление (шрифт, позиция) и контекст (анкор, тематика) ссылки являются входами для модели взвешивания.
Изобретение применяется в основном на этапе индексирования, в частности, во время анализа ссылок и расчета авторитетности.
CRAWLING – Сканирование и Сбор данных
На этом этапе собираются «сырые» данные о поведении пользователей (User Behavior Data). Патент упоминает, что эти данные могут быть получены от веб-браузера или помощника браузера (например, тулбара).
INDEXING – Индексирование и извлечение признаков
Это ключевой этап применения патента.
Feature Data для каждой ссылки: ее позицию, размер шрифта, анкорный текст, URL-адреса и т.д.Feature Data каждой ссылки.Link Weight), отражающий вероятность клика.RANKING – Ранжирование
Рассчитанные ранги документов (модифицированный PageRank) используются как один из сигналов ранжирования для определения авторитетности и качества документов.
(Фоновый процесс / Offline):
Система периодически анализирует собранные User Behavior Data и Feature Data для обучения и обновления модели машинного обучения. Это динамическая модель, которая адаптируется к изменениям в поведении пользователей.
periodically update the weights) по мере поступления новых данных о поведении пользователей и изменениях в ссылочном графе.Процесс можно разделить на три фазы: сбор данных, обучение модели и применение модели.
Фаза А: Сбор данных (Постоянный процесс)
Фаза Б: Обучение модели (Периодический/Офлайн процесс)
User Behavior Data. Клик по ссылке = положительный пример. Отсутствие клика по другим ссылкам на странице = отрицательные примеры.Feature Data.Фаза В: Применение модели (Индексирование/Анализ ссылок)
Feature Data этой ссылки.Патент детально описывает типы Feature Data, используемые для обучения модели. Это критически важная информация для SEO.
Признаки Ссылки (Link Features):
commerciality) анкорного текста.Признаки Исходного Документа (Source Document Features):
Признаки Целевого Документа (Target Document Features):
Данные о поведении пользователей (User Behavior Data) - используются для обучения:
Feature Data ссылки.naive bayes), дерево решений (decision tree) или логистическая регрессия (logistic regression) для формирования модели.User Behavior Data (фактические клики) используются как эталонные данные (ground truth) для обучения модели, которая затем определяет, сколько веса передает каждая ссылка в вебе.General rules), так и правила, специфичные для конкретных документов или сайтов (Document-specific rules), что повышает точность оценки.main content), как можно выше на странице. Ссылки, расположенные на видном месте, имеют более высокую прогнозируемую вероятность клика и, следовательно, передают больше веса.context of a few words before and/or after the link).same color as background), имеют мелкий шрифт или скрыты от пользователя, получат минимальный вес.sidebar, footer) для распределения ранга неэффективно. Эти ссылки обычно имеют низкую вероятность клика и, соответственно, низкий вес.Этот патент аннулирует представление о том, что «ссылка есть ссылка». Он требует целостного подхода, в котором UX, дизайн и релевантность контента объединяются для максимизации ценности ссылочного графа. Стратегия линкбилдинга должна быть сосредоточена на получении редакционно ценных размещений, с которыми взаимодействуют реальные пользователи. Это изобретение является основой для понимания того, почему контекстные ссылки в качественном контенте ценятся значительно выше, чем любые другие типы ссылок.
Сценарий: Оптимизация внутренней перелинковки интернет-магазина
Link Weight согласно модели «разумного серфера». Это приведет к более эффективной передаче PageRank на ключевые страницы фильтров, улучшая их ранжирование.Что такое «Модель разумного серфера» (Reasonable Surfer Model) и чем она отличается от классического PageRank?
Классический PageRank использует «Модель случайного серфера», предполагая, что пользователь с равной вероятностью кликнет на любую ссылку на странице. «Модель разумного серфера» признает, что это не так. Она использует машинное обучение для прогнозирования вероятности клика по каждой конкретной ссылке на основе ее характеристик (например, заметности, позиции, анкора) и присваивает ей соответствующий вес. Ссылки, которые, вероятно, будут проигнорированы, передают меньше веса.
Означает ли этот патент, что CTR ссылки напрямую влияет на ее вес в PageRank?
Не совсем напрямую. Фактические данные о кликах пользователей (User Behavior Data) используются как обучающие данные для модели машинного обучения. Эта модель учится предсказывать вероятность клика на основе признаков ссылки (Feature Data). Именно эта предсказанная вероятность, а не сырой CTR конкретной ссылки, используется как вес () в расчете PageRank.
Передают ли ссылки в футере или сайдбаре вес?
Да, но значительно меньше, чем ссылки в основном контенте. Патент явно указывает позицию ссылки (включая footer и sidebar) как один из признаков (Feature Data). Поскольку пользователи реже кликают на такие ссылки, модель машинного обучения присвоит им низкий вес. Полагаться на них для распределения авторитета неэффективно.
Какие характеристики ссылки наиболее важны для передачи максимального веса?
Патент перечисляет множество признаков. Наиболее важными, исходя из логики «разумного серфера», являются: позиция (в основном контенте, высоко на странице), визуальная заметность (размер шрифта, цвет, атрибуты), релевантность анкорного текста и контекст (слова вокруг ссылки). Ссылка должна выглядеть как естественная и полезная рекомендация.
Как этот патент влияет на внутреннюю перелинковку?
Он имеет огромное значение. Он подчеркивает, что архитектура сайта должна быть ориентирована на пользователя. Важные страницы должны быть доступны через заметные ссылки (например, основная навигация или контекстные ссылки в контенте), которые пользователи действительно используют. Механическое добавление блоков ссылок может быть неэффективным, если эти блоки игнорируются.
Влияет ли дизайн страницы (UX/UI) на вес ссылок?
Да, напрямую. Патент упоминает признаки, связанные с представлением: размер шрифта, цвет, расположение относительно первого экрана, расположение в списках. Если дизайн страницы затрудняет поиск или использование ссылки (плохой UX), модель предскажет низкую вероятность клика и присвоит ей низкий вес.
Что такое "Общие правила" и "Специфичные для документов правила" в контексте этой модели?
Общие правила применимы ко всему интернету, например: "ссылки вверху документа обычно важнее, чем внизу". Специфичные правила касаются конкретных сайтов или шаблонов, например: "на сайте Wikipedia ссылки в основном контенте имеют высокую вероятность клика" или правила, касающиеся конкретных URL-паттернов, которые пользователи обычно игнорируют.
Учитывает ли модель коммерческий характер анкорного текста?
Да, патент явно указывает "коммерческий характер анкорного текста" (commerciality of the anchor text) как один из признаков (Feature Data), используемых при обучении модели. Это означает, что модель может научиться по-разному взвешивать ссылки с явно коммерческими анкорами по сравнению с информационными.
Как Google собирает данные о поведении пользователей (User Behavior Data)?
Патент упоминает получение данных от «веб-браузера или помощника браузера» (web browser or a browser assistant), например, Google Toolbar. В современных условиях Google может собирать агрегированные и анонимизированные данные через Chrome, Android и другие сервисы для понимания общих паттернов поведения пользователей и обучения модели.
Может ли модель быть персонализированной для конкретного пользователя?
Да, патент допускает такую возможность. В нем указано, что User Behavior Data могут быть связаны с одним пользователем или классом пользователей (например, по языку или интересам). В этом случае веса, присваиваемые ссылкам, могут быть адаптированы к этому пользователю или классу, что приведет к персонализированному расчету рангов.

Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Ссылки
SERP

Семантика и интент
Поведенческие сигналы
Local SEO

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
Индексация
Техническое SEO

Поведенческие сигналы
EEAT и качество

SERP
Ссылки
Структура сайта

Knowledge Graph
EEAT и качество
Семантика и интент

Ссылки
Семантика и интент
SERP

Knowledge Graph
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Семантика и интент
Антиспам
