Как Google модифицирует PageRank, используя модель «Разумного серфера» для взвешивания ссылок на основе вероятности клика

RANKING DOCUMENTS BASED ON USER BEHAVIOR AND/OR FEATURE DATA (Ранжирование документов на основе поведения пользователей и/или признаков данных)

US7716225B1
Google LLC
2004-06-17
2010-05-11

Google использует машинное обучение для прогнозирования вероятности клика по ссылкам на основе их характеристик (позиция, размер шрифта, анкор) и реального поведения пользователей. Эта модель («Разумный серфер») модифицирует алгоритм PageRank, придавая больший вес ссылкам, которые с большей вероятностью будут использованы, и уменьшая вес игнорируемых ссылок.

Какую проблему решает

Патент решает фундаментальное ограничение классической модели PageRank («модель случайного серфера»), которая предполагает, что пользователь с равной вероятностью перейдет по любой ссылке на странице. В реальности пользователи игнорируют многие ссылки (например, рекламу, ссылки в футере, «Условия использования»). Изобретение внедряет «модель разумного серфера» (reasonable surfer model), которая взвешивает ссылки на основе прогнозируемой вероятности их выбора, повышая точность сигналов ранжирования, получаемых из ссылочного графа.

Что запатентовано

Запатентована система и метод модификации алгоритмов ранжирования на основе ссылок (таких как PageRank) путем присвоения динамических весов ссылкам. Эти веса определяются моделью машинного обучения, которая прогнозирует вероятность клика по ссылке. Модель обучается на User Behavior Data (реальные клики пользователей) и Feature Data (характеристики ссылки, исходного и целевого документов). Предсказанная вероятность используется как вес ( $w_n$ ) в расчете ранга.

Как это работает

Система работает следующим образом:

Сбор данных: Собираются Feature Data (позиция ссылки, размер шрифта, анкорный текст и т.д.) и User Behavior Data (какие ссылки пользователи реально выбирают).
Обучение модели: Model Generating Unit использует эти данные для обучения модели машинного обучения (например, логистической регрессии). Модель учится определять, какие признаки коррелируют с высокой вероятностью клика.
Присвоение весов: Model Applying Unit применяет обученную модель к ссылкам в вебе для определения их веса (Link Weight), который отражает вероятность их выбора пользователем.
Расчет ранга: Ранги документов рассчитываются с использованием модифицированной формулы (например, PageRank, Eqn. 1), которая учитывает эти веса. Ссылки с более высокой вероятностью клика передают больше ранга.

Актуальность для SEO

Чрезвычайно высокая. Этот патент описывает эволюцию PageRank от теоретической модели к модели, основанной на эмпирических данных и предиктивном моделировании. Концепция взвешивания ссылок на основе их заметности, контекста и вероятности клика является фундаментальной для современного анализа ссылок в Google.

Важность для SEO

Патент имеет критическое значение (95/100) для SEO. Он фундаментально меняет стратегии внутреннего и внешнего линкбилдинга. Он доказывает, что расположение, представление и контекст ссылки напрямую влияют на то, сколько ранжирующего веса она передает. Ссылки, которые визуально заметны, контекстуально релевантны и полезны для пользователя, передают значительно больше ценности, чем игнорируемые ссылки.

Термины и определения

Feature Data (Признаки данных): Характеристики, связанные со ссылкой. Включают признаки самой ссылки (например, размер шрифта, позиция, анкорный текст), признаки исходного документа (source document) и признаки целевого документа (target document).
Feature Vector (Вектор признаков): Структурированное представление Feature Data для конкретной ссылки, используемое в качестве входных данных для модели машинного обучения.
Link Weight (Вес ссылки, $w_n$ ): Значение, присваиваемое ссылке на основе модели машинного обучения. Отражает прогнозируемую вероятность того, что ссылка будет выбрана пользователем.
Model (Модель): Динамическая модель машинного обучения (например, логистическая регрессия, дерево решений), обученная прогнозировать вероятность выбора ссылки.
Positive/Negative Instances (Положительные/Отрицательные примеры): Данные для обучения модели. Выбор ссылки считается положительным примером для этой ссылки. Отсутствие выбора других ссылок на той же странице считается отрицательными примерами для них.
Reasonable Surfer Model (Модель разумного серфера): Модель поведения пользователя, которая предполагает, что при доступе к документу серфер будет переходить по некоторым ссылкам с более высокой вероятностью, чем по другим, основываясь на их характеристиках и контексте.
User Behavior Data (Данные о поведении пользователей): Информация о действиях пользователей, используемая для обучения модели. Включает навигационные действия (клики по ссылкам), язык пользователя, интересы, поисковые запросы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ранжирования.

Система хранит Feature Data для набора ссылок (включая признаки исходного документа, самой ссылки и целевого документа).
Система хранит User Behavior Data (навигационная активность и клики пользователей по этим ссылкам).
На основе этих двух наборов данных система обучает модель (training a model), которая предсказывает вероятность выбора ссылки пользователем. Обучение включает анализ признаков выбранных и невыбранных ссылок для генерации правил.
Система идентифицирует новые ссылки и определяет их Feature Data.
Система использует обученную модель для определения вероятности выбора каждой новой ссылки. Это делается путем ввода Feature Data ссылки в модель.
Рассчитывается ранг целевого документа на основе вероятности, связанной со ссылками, указывающими на него.
Документ упорядочивается на основе этого ранга.

Ядром изобретения является использование комбинации User Behavior Data и детализированных Feature Data для обучения предиктивной модели, которая затем используется для взвешивания ссылок при расчете ранга.

Claim 12 (Независимый пункт): Аналогичен Claim 1, но более явно описывает промежуточный шаг присвоения веса.

Обучение модели на основе Feature Data и User Behavior Data.
Определение вероятности выбора новой ссылки с использованием модели.
Присвоение веса (assigning a weight) ссылке на основе этой вероятности.
Присвоение ранга целевому документу на основе весов ссылок, указывающих на него.

Claim 16 (Независимый пункт): Описывает систему и детализирует типы используемых признаков (Feature Data).

Система включает средства для хранения Feature Data, которые включают данные о признаках исходных документов, самих ссылок и целевых документов. Патент приводит конкретные примеры этих признаков, подтверждая, что физическое представление (шрифт, позиция) и контекст (анкор, тематика) ссылки являются входами для модели взвешивания.

Где и как применяется

Изобретение применяется в основном на этапе индексирования, в частности, во время анализа ссылок и расчета авторитетности.

CRAWLING – Сканирование и Сбор данных
На этом этапе собираются «сырые» данные о поведении пользователей (User Behavior Data). Патент упоминает, что эти данные могут быть получены от веб-браузера или помощника браузера (например, тулбара).

INDEXING – Индексирование и извлечение признаков
Это ключевой этап применения патента.

Извлечение признаков (Feature Extraction): Во время индексирования система извлекает Feature Data для каждой ссылки: ее позицию, размер шрифта, анкорный текст, URL-адреса и т.д.
Анализ ссылок (Link Analysis):
- Система использует предварительно обученную модель машинного обучения для анализа Feature Data каждой ссылки.
- На основе этого анализа каждой ссылке присваивается вес (Link Weight), отражающий вероятность клика.
- Система рассчитывает ранги документов (например, PageRank) с использованием модифицированной формулы, которая включает эти веса.

RANKING – Ранжирование
Рассчитанные ранги документов (модифицированный PageRank) используются как один из сигналов ранжирования для определения авторитетности и качества документов.

(Фоновый процесс / Offline):
Система периодически анализирует собранные User Behavior Data и Feature Data для обучения и обновления модели машинного обучения. Это динамическая модель, которая адаптируется к изменениям в поведении пользователей.

На что влияет

Типы контента и Структура сайта: Влияет на все типы контента, которые используют ссылки для ранжирования. Особенно сильно влияет на стратегии внутренней перелинковки (архитектуру сайта) и внешнего линкбилдинга. Ценность навигационных ссылок, контекстных ссылок, футерных ссылок и рекламных баннеров рассчитывается по-разному.
Ниши и тематики: Влияние универсально.

Когда применяется

Расчет рангов: Алгоритм применяется постоянно в процессе расчета PageRank или аналогичных показателей авторитетности на основе ссылок.
Обновление модели: Модель машинного обучения обновляется периодически (periodically update the weights) по мере поступления новых данных о поведении пользователей и изменениях в ссылочном графе.

Пошаговый алгоритм

Процесс можно разделить на три фазы: сбор данных, обучение модели и применение модели.

Фаза А: Сбор данных (Постоянный процесс)

Сбор Feature Data: Во время сканирования и индексирования извлекаются характеристики ссылок, исходных и целевых документов.
Сбор User Behavior Data: Через браузеры или другие механизмы собираются данные о навигации пользователей (клики по ссылкам).

Фаза Б: Обучение модели (Периодический/Офлайн процесс)

Определение Положительных и Отрицательных примеров: Анализируются User Behavior Data. Клик по ссылке = положительный пример. Отсутствие клика по другим ссылкам на странице = отрицательные примеры.
Генерация Векторов признаков (Feature Vectors): Для каждой ссылки создается вектор, содержащий ее Feature Data.
Обучение Модели: Используются векторы признаков и положительные/отрицательные примеры для обучения модели машинного обучения (например, наивный Байес, дерево решений, логистическая регрессия). Модель генерирует правила (общие и специфичные для документов), которые предсказывают вероятность клика на основе признаков.

Фаза В: Применение модели (Индексирование/Анализ ссылок)

Генерация Весов ссылок (Link Weights): Обученная модель применяется к ссылкам в веб-графе. Вес ссылки ( $w_n$ ) рассчитывается как функция правил, применимых к Feature Data этой ссылки.
Расчет Рангов документов: Ранги документов определяются с использованием модифицированной формулы PageRank, которая учитывает веса ссылок. Патент приводит пример формулы (Eqn. 1): $r(A) = \frac{a}{N} + (1-a)(\frac{w_{1}r(B_{1})}{|B_{1}|} + ... + \frac{w_{n}r(B_{n})}{|B_{n}|})$ , где $w_n$ — это вес ссылки, $r(B_{n})$ — ранг ссылающегося документа, а $|B_{n}|$ — количество исходящих ссылок из него.

Какие данные и как использует

Данные на входе

Патент детально описывает типы Feature Data, используемые для обучения модели. Это критически важная информация для SEO.

Признаки Ссылки (Link Features):

Контентные факторы:
- Анкорный текст (количество слов, сами слова).
- Коммерциализация (commerciality) анкорного текста.
- Контекст (несколько слов до и/или после ссылки).
- Тематический кластер, связанный с анкорным текстом.
Структурные и Визуальные факторы (Presentation):
- Размер шрифта анкорного текста.
- Позиция ссылки (в списке HTML, в основном тексте, выше/ниже первого экрана, сбоку, в футере, в сайдбаре).
- Если ссылка в списке — позиция ссылки в этом списке.
- Цвет шрифта и атрибуты (курсив, серый, тот же цвет, что и фон).
Технические и Мультимедиа факторы:
- Тип ссылки (например, текстовая или изображение).
- Если ссылка является изображением — соотношение сторон изображения.
- Встраивает ли URL ссылки другой URL (редирект).

Признаки Исходного Документа (Source Document Features):

Технические факторы: URL документа, веб-сайт.
Структурные факторы: Количество ссылок в документе.
Контентные факторы: Присутствие слов в документе или в заголовке. Тематический кластер документа. Степень соответствия тематического кластера документа тематическому кластеру анкорного текста ссылки.

Признаки Целевого Документа (Target Document Features):

Технические факторы: URL документа, веб-сайт, длина URL, слова в URL. Находится ли целевой URL на том же хосте/домене, что и исходный.

Данные о поведении пользователей (User Behavior Data) - используются для обучения:

Поведенческие факторы: Навигационные действия (выбор ссылок, введенные адреса). Поисковые запросы, введенные пользователем.
Пользовательские факторы: Язык пользователя. Интересы пользователя.

Какие метрики используются и как они считаются

Link Weight ( $w_n$ ): Прогнозируемая вероятность того, что ссылка будет выбрана пользователем. Рассчитывается моделью машинного обучения на основе Feature Data ссылки.
Document Rank ( $r(A)$ ): Вероятность того, что «разумный серфер» окажется на документе. Рассчитывается по модифицированной формуле PageRank (Eqn. 1).
Алгоритмы машинного обучения: Патент упоминает использование стандартных техник, таких как наивный Байес (naive bayes), дерево решений (decision tree) или логистическая регрессия (logistic regression) для формирования модели.

Эволюция PageRank: От Случайного к Разумному Серферу: Патент подтверждает отказ от предположения, что все ссылки равны. Алгоритмы ранжирования взвешивают ссылки пропорционально вероятности того, что реальный пользователь перейдет по ним.
Взвешивание ссылок основано на прогнозировании кликов с помощью ML: Вес ссылки определяется не эвристиками, а динамической моделью машинного обучения, которая прогнозирует вероятность клика.
Реальное поведение пользователей обучает модель весов: User Behavior Data (фактические клики) используются как эталонные данные (ground truth) для обучения модели, которая затем определяет, сколько веса передает каждая ссылка в вебе.
Визуальные, структурные и контекстные признаки критичны: Визуальное представление (шрифт, цвет), расположение (позиция на странице, в основном контенте или футере) и контекст (анкор, околоссылочный текст, тематика) ссылки напрямую определяют, сколько ранжирующего значения она передает.
Индивидуализация правил: Модель может изучать как общие правила (General rules), так и правила, специфичные для конкретных документов или сайтов (Document-specific rules), что повышает точность оценки.

Best practices (это мы делаем)

Приоритет заметному размещению ссылок: Размещайте важные внутренние и внешние ссылки в основном контенте (main content), как можно выше на странице. Ссылки, расположенные на видном месте, имеют более высокую прогнозируемую вероятность клика и, следовательно, передают больше веса.
Оптимизация анкорного текста и контекста: Используйте четкий, описательный и контекстуально релевантный анкорный текст. Модель учитывает слова в анкоре, их коммерциализацию и слова вокруг ссылки (context of a few words before and/or after the link).
Интеграция UX и SEO для перелинковки: Убедитесь, что внутренние ссылки полезны и действительно используются посетителями. Модель обучается на реальном поведении. Если пользователи игнорируют вашу навигацию или контекстные ссылки, их вес будет снижен. Дизайн страницы напрямую влияет на веса ссылок.
Качественный линкбилдинг: Приобретайте внешние ссылки, которые расположены в основном теле релевантного контента на авторитетных сайтах. Ссылка внутри абзаца тематической статьи получит значительно больший вес, чем ссылка в сайдбаре или списке партнеров.

Worst practices (это делать не надо)

Использование скрытых или незаметных ссылок: Ссылки, которые сливаются с фоном (патент упоминает признак same color as background), имеют мелкий шрифт или скрыты от пользователя, получат минимальный вес.
Зависимость от сквозных ссылок в футере/сайдбаре: Полагаться на ссылки в футере или боковых колонках (sidebar, footer) для распределения ранга неэффективно. Эти ссылки обычно имеют низкую вероятность клика и, соответственно, низкий вес.
Приобретение низкокачественных ссылок: Покупка ссылок, которые пользователи игнорируют (очевидные платные ссылки, нерелевантные баннеры, ссылки в некачественном контенте), не принесет значительной пользы, даже если они followed.
Игнорирование архитектуры страницы: Размещение ключевых ссылок ниже первого экрана или в перегруженных блоках снижает их эффективность в передаче веса.

Стратегическое значение

Этот патент аннулирует представление о том, что «ссылка есть ссылка». Он требует целостного подхода, в котором UX, дизайн и релевантность контента объединяются для максимизации ценности ссылочного графа. Стратегия линкбилдинга должна быть сосредоточена на получении редакционно ценных размещений, с которыми взаимодействуют реальные пользователи. Это изобретение является основой для понимания того, почему контекстные ссылки в качественном контенте ценятся значительно выше, чем любые другие типы ссылок.

Практические примеры

Сценарий: Оптимизация внутренней перелинковки интернет-магазина

Ситуация: Ключевые страницы категорий доступны через мега-меню, но также дублируются ссылками в футере. Страницы фильтров доступны только через блок фасетной навигации в сайдбаре.
Анализ на основе патента:
- Ссылки в мега-меню, вероятно, имеют высокий вес (заметны, часто используются).
- Ссылки в футере имеют низкий вес (низкая вероятность клика).
- Ссылки в сайдбаре могут иметь низкий или средний вес, в зависимости от UX.
Действия:
- Для продвижения ключевых страниц фильтров добавить контекстные ссылки на них из основного контента страниц категорий (например, в описании категории или блоках «Популярные подборки»).
Ожидаемый результат: Контекстные ссылки в основном контенте получат высокий Link Weight согласно модели «разумного серфера». Это приведет к более эффективной передаче PageRank на ключевые страницы фильтров, улучшая их ранжирование.

Что такое «Модель разумного серфера» (Reasonable Surfer Model) и чем она отличается от классического PageRank?

Классический PageRank использует «Модель случайного серфера», предполагая, что пользователь с равной вероятностью кликнет на любую ссылку на странице. «Модель разумного серфера» признает, что это не так. Она использует машинное обучение для прогнозирования вероятности клика по каждой конкретной ссылке на основе ее характеристик (например, заметности, позиции, анкора) и присваивает ей соответствующий вес. Ссылки, которые, вероятно, будут проигнорированы, передают меньше веса.

Означает ли этот патент, что CTR ссылки напрямую влияет на ее вес в PageRank?

Не совсем напрямую. Фактические данные о кликах пользователей (User Behavior Data) используются как обучающие данные для модели машинного обучения. Эта модель учится предсказывать вероятность клика на основе признаков ссылки (Feature Data). Именно эта предсказанная вероятность, а не сырой CTR конкретной ссылки, используется как вес ( $w_n$ ) в расчете PageRank.

Передают ли ссылки в футере или сайдбаре вес?

Да, но значительно меньше, чем ссылки в основном контенте. Патент явно указывает позицию ссылки (включая footer и sidebar) как один из признаков (Feature Data). Поскольку пользователи реже кликают на такие ссылки, модель машинного обучения присвоит им низкий вес. Полагаться на них для распределения авторитета неэффективно.

Какие характеристики ссылки наиболее важны для передачи максимального веса?

Патент перечисляет множество признаков. Наиболее важными, исходя из логики «разумного серфера», являются: позиция (в основном контенте, высоко на странице), визуальная заметность (размер шрифта, цвет, атрибуты), релевантность анкорного текста и контекст (слова вокруг ссылки). Ссылка должна выглядеть как естественная и полезная рекомендация.

Как этот патент влияет на внутреннюю перелинковку?

Он имеет огромное значение. Он подчеркивает, что архитектура сайта должна быть ориентирована на пользователя. Важные страницы должны быть доступны через заметные ссылки (например, основная навигация или контекстные ссылки в контенте), которые пользователи действительно используют. Механическое добавление блоков ссылок может быть неэффективным, если эти блоки игнорируются.

Влияет ли дизайн страницы (UX/UI) на вес ссылок?

Да, напрямую. Патент упоминает признаки, связанные с представлением: размер шрифта, цвет, расположение относительно первого экрана, расположение в списках. Если дизайн страницы затрудняет поиск или использование ссылки (плохой UX), модель предскажет низкую вероятность клика и присвоит ей низкий вес.

Что такое "Общие правила" и "Специфичные для документов правила" в контексте этой модели?

Общие правила применимы ко всему интернету, например: "ссылки вверху документа обычно важнее, чем внизу". Специфичные правила касаются конкретных сайтов или шаблонов, например: "на сайте Wikipedia ссылки в основном контенте имеют высокую вероятность клика" или правила, касающиеся конкретных URL-паттернов, которые пользователи обычно игнорируют.

Учитывает ли модель коммерческий характер анкорного текста?

Да, патент явно указывает "коммерческий характер анкорного текста" (commerciality of the anchor text) как один из признаков (Feature Data), используемых при обучении модели. Это означает, что модель может научиться по-разному взвешивать ссылки с явно коммерческими анкорами по сравнению с информационными.

Как Google собирает данные о поведении пользователей (User Behavior Data)?

Патент упоминает получение данных от «веб-браузера или помощника браузера» (web browser or a browser assistant), например, Google Toolbar. В современных условиях Google может собирать агрегированные и анонимизированные данные через Chrome, Android и другие сервисы для понимания общих паттернов поведения пользователей и обучения модели.

Может ли модель быть персонализированной для конкретного пользователя?

Да, патент допускает такую возможность. В нем указано, что User Behavior Data могут быть связаны с одним пользователем или классом пользователей (например, по языку или интересам). В этом случае веса, присваиваемые ссылкам, могут быть адаптированы к этому пользователю или классу, что приведет к персонализированному расчету рангов.

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов

Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.

US7231399B1
2007-06-12

Поведенческие сигналы

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей

Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.

US20210125108A1
2021-04-29

Поведенческие сигналы
SERP

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя

Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.

US8645390B1
2014-02-04

Персонализация
Поведенческие сигналы
SERP

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)

Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.

US8386495B1
2013-02-26

Поведенческие сигналы
Ссылки
SERP

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов

Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.

US9015152B1
2015-04-21

Семантика и интент
Поведенческие сигналы
Local SEO

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"

Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.

US8244749B1
2012-08-14

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией

Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.

US9223897B1
2015-12-29

Поведенческие сигналы
Индексация
Техническое SEO

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика

Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.

US9031929B1
2015-05-12

Поведенческие сигналы
EEAT и качество

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню

Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.

US9053177B1
2015-06-09

SERP
Ссылки
Структура сайта

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах

Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.

US7953720B1
2011-05-31

Knowledge Graph
EEAT и качество
Семантика и интент

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок

Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.

US12353458B2
2025-07-08

Ссылки
Семантика и интент
SERP

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

US10922326B2
2021-02-16

Knowledge Graph
SERP
Семантика и интент

Как Google проактивно уведомляет пользователей об изменении цен или доступности товаров на основе их предполагаемого намерения покупки

Google анализирует действия пользователя (поисковые запросы, посещения сайтов), чтобы выявить намерение в отношении сущностей (например, продуктов или авиабилетов). Если намерение сильное и происходит значительное изменение (падение цены или изменение доступности), Google проактивно отправляет уведомление со ссылками для завершения действия (например, покупки).

US20180357238A1
2018-12-13

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует историю навигации и клики по рекламе для генерации ключевых слов, гео-таргетинга и выявления MFA-сайтов

Патент Google, описывающий три механизма, основанных на анализе поведения пользователей (selection data). Система использует путь навигации пользователя для генерации новых ключевых слов для рекламы, улучшает гео-таргетинг объявлений на основе предпочтений пользователей, а также выявляет низкокачественные сайты (MFA/манипулятивные) по аномально высокому CTR рекламных блоков.

US8005716B1
2011-08-23

Поведенческие сигналы
Семантика и интент
Антиспам