Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя

REORDERING SEARCH QUERY RESULTS IN ACCORDANCE WITH SEARCH CONTEXT SPECIFIC PREDICTED PERFORMANCE FUNCTIONS (Переупорядочивание результатов поискового запроса в соответствии с функциями прогнозируемой эффективности, специфичными для контекста поиска)

US8645390B1
Google LLC
2008-08-07
2014-02-04

Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.

Какую проблему решает

Патент решает фундаментальную проблему ограничений универсальных моделей ранжирования ("one-size-fits-all"), которые применяют одинаковые веса факторов независимо от ситуации. Это приводит к субоптимальной релевантности, так как важность сигналов сильно варьируется в зависимости от контекста (например, запрос [apple] от программиста и от повара). Изобретение направлено на динамическую адаптацию самой формулы ранжирования к конкретному контексту поиска для повышения качества выдачи.

Что запатентовано

Запатентована система для генерации и применения контекстно-зависимых моделей ранжирования. Система использует машинное обучение для анализа исторических данных о кликах (actual user selections) и определяет, как различные сигналы ранжирования (Scoring Primitives) коррелируют с поведением пользователей в конкретных контекстах (Search Contexts). В результате создается множество Predicted Performance Functions (Функций прогнозируемой эффективности), каждая из которых оптимизирована для определенного сценария поиска.

Как это работает

Система работает в двух режимах:

Офлайн-обучение: Система анализирует исторические данные, группируя их по контекстам. Для каждого контекста оценивается корреляция между различными Scoring Primitives и фактическими кликами пользователей (CTR). На основе этих данных ML создает специализированную модель ранжирования (Predicted Performance Function) для этого контекста.
Онлайн-применение: Когда пользователь вводит запрос, система определяет его Search Context (комбинация контекста пользователя и запроса), выбирает соответствующую модель ранжирования из таблицы соответствия (Context Correlation Table) и использует ее для переранжирования результатов с целью максимизации прогнозируемого CTR.

Актуальность для SEO

Крайне высокая. Контекстное ранжирование, персонализация и динамическое взвешивание факторов на основе машинного обучения являются ядром современного поиска Google. Этот патент описывает фундаментальную архитектуру, позволяющую поисковой системе адаптировать алгоритмы на лету в зависимости от ситуации (интент, локация, язык), что критически важно для работы современных систем ИИ.

Важность для SEO

Патент имеет критическое значение (9.5/10) для понимания современной SEO-стратегии. Он подтверждает, что не существует универсальных весов факторов ранжирования. Важность любого сигнала (ссылки, контент, скорость) меняется динамически в зависимости от контекста запроса и пользователя. SEO-стратегии должны фокусироваться на глубоком анализе контекстов и удовлетворении интента пользователя в этих контекстах, а не на оптимизации под статические факторы.

Термины и определения

Search Context (Контекст поиска): Значение или набор значений, характеризующих ситуацию поиска. Включает User Context и/или Query Context.
User Context (Контекст пользователя): Аспекты контекста, связанные с пользователем. Примеры: язык, страна, демография, геолокация (по IP), недавняя история поиска (запросы и клики), параметры профиля пользователя (интересы).
Query Context (Контекст запроса): Аспекты контекста, связанные с самим запросом. Примеры: количество терминов в запросе (мера неопределенности), классификация запроса (например, коммерческий, информационный).
Scoring Primitive (Примитив оценки): Базовый сигнал ранжирования (фактор) или функция, которая выдает значение, предполагающее релевантность результата. Примеры: PageRank, базовая оценка IR (Information Retrieval), длина запроса, совпадение результата с интересами пользователя.
Predicted Performance Function (PPF) (Функция прогнозируемой эффективности): Специализированная модель ранжирования, созданная с помощью машинного обучения для конкретного Search Context. Представляет собой взвешенное подмножество Scoring Primitives, которое лучше всего предсказывает клики пользователей.
Relevance Factor (Фактор релевантности): Весовой коэффициент, присваиваемый конкретному Scoring Primitive в рамках PPF. Определяет значимость сигнала в данном контексте.
Actual User Selections (Фактические выборы пользователя): Действия пользователя в отношении результатов поиска. В основном это клики, но может также включать Dwell Time (время пребывания на документе), наведение курсора (hovering) или добавление в закладки (bookmarking).
Click Through Rate (CTR): Показатель кликабельности. Используется как основная метрика для обучения моделей (корреляция с фактическим CTR) и как целевая метрика для оптимизации (прогнозируемый CTR).
Context Correlation Table (Таблица корреляции контекстов): Структура данных, которая связывает каждый Search Context с соответствующей ему Predicted Performance Function.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод, состоящий из двух фаз: предварительной подготовки моделей (офлайн) и их применения в реальном времени (онлайн).

Фаза 1: Подготовка моделей (Офлайн)

Система итерирует по множеству контекстов поиска (plurality of search contexts).
Для каждого контекста итерирует по множеству сигналов ранжирования (plurality of scoring primitives).
Анализируются ранее выполненные запросы, соответствующие данному контексту.
Определяется корреляция между значениями сигнала и фактическими кликами пользователей (actual user selections).
Для каждого контекста выполняется машинное обучение на основе этих корреляций.
Результат обучения — идентификация Predicted Performance Function (PPF) для данного контекста. Эта функция является взвешенным подмножеством сигналов, которые соответствуют предопределенным критериям качества прогнозирования.

Фаза 2: Обработка запроса (Онлайн)

Система получает и выполняет запрос пользователя.
Запрос ассоциируется с конкретным Search Context.
По крайней мере часть результатов упорядочивается в соответствии с PPF, которая была заранее определена для этого контекста.

Claim 2, 3, 4, 5, 6 (Зависимые): Уточняют определение контекста. Контекст может быть связан с группой пользователей (например, по языку или стране) и/или с классом запросов (например, по количеству слов или типу интента).

Claim 7, 8 (Зависимые): Указывают на интеграцию персонализации. Определение контекста и упорядочивание результатов могут включать использование параметров профиля пользователя.

Claim 9, 10, 11 (Зависимые): Детализируют процесс упорядочивания. PPF используется для прогнозирования CTR для результата на разных потенциальных позициях (Claim 9). Система сравнивает прогнозируемые CTR для разных вариантов порядка выдачи и выбирает тот порядок (пользовательски-зависимый), который увеличивает прогнозируемый CTR по сравнению с предварительным (пользовательски-независимым) порядком (Claim 10, 11).

Claim 12, 13 (Зависимые): Уточняют данные для обучения. Машинное обучение может использовать не только клики, но и другие действия пользователя, такие как Dwell Time, hovering и bookmarking.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска, соединяя офлайн-анализ данных с онлайн-ранжированием.

INDEXING / QUNDERSTANDING (Офлайн-процессы)
На этих этапах происходит подготовка данных. Training Data Collector анализирует исторические данные. Machine Learning Module обучается, генерирует множество PPF и сохраняет их в Context Correlation Table.

QUNDERSTANDING (Онлайн)
В реальном времени Query Analyzer определяет Query Context. Параллельно извлекаются данные из User Profile Database для определения User Context. Вместе они формируют текущий Search Context.

RANKING
Search Engine генерирует начальный набор результатов (Initial Search Results) с базовыми оценками ранжирования.

RERANKING (Переранжирование)
Основное место применения патента. Search Result Ranker получает начальные результаты и текущий Search Context. Он использует Context Correlation Table для выбора специализированной PPF. Затем эта функция применяется для пересчета оценок (прогнозирования CTR) и переупорядочивания результатов.

Входные данные:

Запрос пользователя и UserID.
Начальные результаты поиска (документы, базовые оценки).
Параметры профиля пользователя и запроса (для определения контекста).
Предварительно рассчитанная Context Correlation Table.

Выходные данные:

Переранжированный список результатов (Re-ranked Search Results), оптимизированный для данного контекста.

На что влияет

Специфические запросы: Наибольшее влияние на неоднозначные запросы (где контекст критичен для определения интента, например, [apple]), локальные запросы (где User Context включает местоположение) и запросы, подверженные персонализации (где User Context включает интересы).
Языковые и географические ограничения: Патент явно указывает язык и страну как часть User Context. Это означает, что формула ранжирования может существенно отличаться для одного и того же запроса в разных регионах.
Конкретные ниши или тематики: Влияет на все ниши, так как классификация запросов (например, коммерческие vs информационные) является частью контекста и активирует разные модели ранжирования.

Когда применяется

Алгоритм применяется в реальном времени на этапе переранжирования для каждого запроса, для которого система может определить Search Context и для которого существует соответствующая предварительно обученная Predicted Performance Function. Система спроектирована для постоянного использования контекстно-зависимых моделей.

Пошаговый алгоритм

Процесс А: Офлайн-обучение и генерация моделей

Инициализация Сбора Данных: Определение множества контекстов (Search Contexts) и сигналов (Scoring Primitives).
Итерация по Контекстам: Выбор контекста (например, "Коммерческий запрос, США, Английский язык").
Сбор Исторических Данных: Извлечение прошлых запросов, результатов, показов (impressions) и кликов (user selections), соответствующих этому контексту.
Итерация по Сигналам: Выбор сигнала (например, "PageRank").
Расчет Корреляций: Анализ, как значения этого сигнала коррелируют с фактическим CTR в данном контексте на разных позициях выдачи.
Повторение: Шаги 4-5 повторяются для всех сигналов.
Машинное Обучение: Обработка всех корреляций для данного контекста. Определение, какие сигналы лучше всего предсказывают клики и с какими весами (Relevance Factors).
Генерация Модели (PPF): Создание Predicted Performance Function — специализированной модели ранжирования для этого контекста, соответствующей критериям качества прогнозирования.
Сохранение: Сохранение PPF в Context Correlation Table в связке с контекстом.
Повторение: Шаги 2-9 повторяются для всех определенных контекстов.

Процесс Б: Онлайн-обработка запроса и переранжирование

Получение Запроса: Система получает запрос и UserID.
Генерация Начальных Результатов: Search Engine вычисляет начальный набор результатов.
Определение Контекста: Анализ запроса (Query Context) и данных пользователя (User Context) для формирования Search Context.
Выбор Модели Ранжирования: Search Result Ranker использует Search Context для запроса к Context Correlation Table и получает соответствующую PPF.
Применение Модели и Переранжирование: Выбранная PPF применяется к начальным результатам. Система оценивает прогнозируемый CTR для различных вариантов порядка выдачи.
Выбор Оптимального Порядка: Выбирается порядок, который максимизирует прогнозируемый CTR для топовых позиций.
Возврат Результатов: Переупорядоченные результаты возвращаются пользователю.

Какие данные и как использует

Данные на входе

Система использует разнообразные данные как для обучения, так и для выполнения ранжирования.

Поведенческие факторы (Критические для обучения): Исторические данные о фактических действиях пользователей: клики (user selections), показы (impressions). Также явно упоминаются (Claim 13): Dwell Time (время пребывания на документе), hovering (наведение курсора), bookmarking (добавление в закладки).
Пользовательские факторы (Для определения User Context): Язык, страна, IP-адрес (для геолокации), недавняя история поиска (запросы и клики непосредственно перед текущим запросом), параметры профиля пользователя (интересы).
Факторы запроса (Для определения Query Context): Термины запроса, длина запроса (количество терминов), классификация типа запроса.
Базовые факторы ранжирования: Любые сигналы, используемые как Scoring Primitives. Патент упоминает исходные оценки поисковой системы (Information Retrieval Scores) и Page Ranks как примеры.

Какие метрики используются и как они считаются

Click-Through Rate (CTR): Основная метрика эффективности. Используется для обучения (фактический CTR) и для оценки ранжирования (прогнозируемый CTR).
Корреляция (Correlation): Метрика, измеряемая во время обучения между значениями Scoring Primitive и фактическим CTR в рамках определенного контекста.
Relevance Factors (Веса): Числовые значения, определяющие важность каждого Scoring Primitive в рамках PPF. Являются результатом машинного обучения.
Критерии качества прогнозирования (Predictive Quality Criteria): Пороговые значения, используемые во время ML, чтобы определить, достаточно ли полезен Scoring Primitive для включения в модель ранжирования.

Не существует единой модели ранжирования: Патент описывает архитектуру, позволяющую Google обучать и развертывать множество различных моделей ранжирования (Predicted Performance Functions), каждая из которых оптимизирована для определенного контекста (Search Context).
Веса факторов динамичны и зависят от контекста: Важность (вес) любого фактора ранжирования (Scoring Primitive) не фиксирована. Она полностью зависит от текущего контекста, включающего как характеристики пользователя (язык, местоположение, интересы), так и характеристики запроса (тип, длина).
Оптимизация на основе поведения пользователей (CTR как эталон): Модели ранжирования обучаются для оптимизации удовлетворенности пользователей, измеряемой через поведенческие сигналы (CTR, Dwell Time). Исторические данные о кликах диктуют веса ранжирования для конкретных контекстов.
Цель ранжирования — максимизация прогнозируемого CTR: Финальное переранжирование направлено на выбор такого порядка результатов, который, по прогнозам модели, приведет к наибольшему CTR.
Интеграция персонализации и локализации на уровне архитектуры: Персонализация и локализация интегрированы глубоко в систему. Они используются для определения контекста (выбор модели ранжирования) и потенциально внутри самой модели (как входные данные).

Best practices (это мы делаем)

Оптимизация под контекст и интент, а не только ключевые слова: Необходимо глубоко понимать различные контексты, в которых пользователи ищут ваш контент (интенты, местоположение, типы запросов). Признайте, что факторы ранжирования меняются в зависимости от этих контекстов, и адаптируйте контент для удовлетворения специфических потребностей пользователя в каждом сценарии.
Фокус на удовлетворении пользователя и метриках вовлеченности (CTR и Dwell Time): Поскольку модели обучаются на исторических данных CTR и времени пребывания (Dwell Time), критически важно создавать привлекательные сниппеты (Title, Description), стимулирующие клики, и контент, который удерживает пользователя на странице и удовлетворяет его интент.
Стратегия международного SEO: Четко осознавайте, что разные страны и языки (явные примеры User Context) используют разные модели ранжирования, обученные на местных данных. Требуется локализованное исследование и адаптация стратегии под местные особенности и поведение пользователей, а не просто перевод контента.
Развитие Topical Authority для разнообразных интентов: Стройте авторитет, который удовлетворяет различные контексты запросов (информационные, коммерческие, навигационные) в вашей нише, поскольку модели, применяемые к каждому из них, будут взвешивать факторы по-разному.

Worst practices (это делать не надо)

Применение универсальных шаблонов и "правил SEO": Использование устаревших предположений о фиксированных весах факторов ранжирования. Этот патент доказывает, что веса зависят от контекста и динамичны.
Игнорирование классификации интента (Query Context): Создание контента без учета того, как Google классифицирует запрос. Модель ранжирования для коммерческого запроса будет сильно отличаться от модели для информационного.
Кликбейт и игнорирование качества взаимодействия: Использование вводящих в заблуждение заголовков для повышения CTR контрпродуктивно, если система также учитывает Dwell Time (что явно упомянуто в патенте). Низкое качество взаимодействия приведет к негативным данным для обучения моделей.
Слепое копирование международных стратегий: Копирование подходов из другого региона без адаптации. User Context отличается, следовательно, применяется другая модель ранжирования.

Стратегическое значение

Этот патент описывает инфраструктуру для высокоадаптивного ранжирования, управляемого данными и машинным обучением. Он подтверждает стратегический сдвиг в сторону пользователь-центричного и контекстно-зависимого SEO. Успех зависит от способности понять, как Google интерпретирует контекст конкретного поиска и предоставить наиболее удовлетворительный результат для этого специфического сценария. Это подчеркивает критическую важность поведенческих данных в формировании ландшафта ранжирования.

Практические примеры

Сценарий 1: Разрешение неоднозначности запроса с учетом контекста (на основе примера из патента)

Запрос: [nola].
Определение контекста:
- Query Context: Высокая неоднозначность.
- User Context: Пользователь находится в Пало-Альто (Калифорния), его недавние запросы связаны со Стэнфордом и местными услугами. Профиль интересов: "Bay Area".
Начальные результаты (без учета контекста): В топе доминируют сайты о Новом Орлеане (NOLA.com).
Выбор модели (PPF): Система выбирает PPF, обученную для контекста "Неоднозначный запрос + Сильная локальная привязка пользователя в Bay Area".
Переранжирование: Эта модель повышает вес сигналов, связанных с локацией пользователя. Сайт ресторана "Nola Restaurant" в Пало-Альто получает значительный буст.
Результат: В переупорядоченной выдаче локальный ресторан занимает первую позицию, вытесняя глобально более авторитетные сайты о Новом Орлеане.

Сценарий 2: Адаптация весов для коммерческого запроса

Запрос: "Купить iPhone 15 Pro".
Контекст: Query Context = Коммерческий; User Context = Локация: Москва.
Выбор модели (PPF): Система выбирает PPF, обученную для коммерческих запросов в этом регионе.
Переранжирование: В этой модели Scoring Primitives, связанные с локальной доступностью, ценой, надежностью магазина и отзывами, получают значительно больший вес, чем, например, общая ссылочная масса домена или длина текста на странице.

Что такое Scoring Primitive в контексте SEO?

Scoring Primitive — это технический термин для любого базового сигнала ранжирования, который использует Google. Это может быть PageRank, оценка релевантности текста (IR score), наличие ключевого слова в Title, сигнал свежести или сигнал о том, что пользователь ранее посещал этот сайт. Патент описывает, как система определяет важность каждого из этих сигналов в разных контекстах.

Означает ли этот патент, что веса факторов ранжирования постоянно меняются?

Да, именно так. Патент описывает механизм, который позволяет Google использовать разные наборы весов (Relevance Factors) для разных контекстов поиска (Search Contexts). Вес PageRank может быть высоким в одном контексте (например, академический поиск) и низким в другом (например, поиск свежих новостей). Веса динамичны.

Как система определяет, какая модель ранжирования (Predicted Performance Function) лучше?

Модели обучаются с помощью машинного обучения на исторических данных. Цель обучения — максимально точно предсказывать поведение пользователей, в первую очередь клики (CTR). Та модель, которая лучше всего предсказывает, на какие результаты пользователи будут кликать в данном контексте, считается лучшей и сохраняется для использования в этом контексте.

Подтверждает ли этот патент важность CTR как фактора ранжирования?

Да, но с важным уточнением. CTR здесь используется не как прямой сигнал ранжирования в реальном времени, а как основная метрика для офлайн-обучения моделей ранжирования. Система учится на исторических данных о кликах, чтобы понять, какие сигналы коррелируют с высоким CTR в разных контекстах, и затем использует эти сигналы (с соответствующими весами) для ранжирования.

Что важнее для определения контекста: запрос или пользователь?

Система использует оба компонента: Query Context (тип запроса, его неоднозначность) и User Context (локация, язык, интересы, история). Search Context — это комбинация этих факторов. В зависимости от ситуации, один из компонентов может доминировать (например, локация при поиске пиццы), но оба анализируются для выбора оптимальной модели ранжирования.

Упоминается ли в патенте Dwell Time и как он используется?

Да, Dwell Time (время пребывания на документе) упоминается в Claim 13 как один из видов пользовательской активности (помимо кликов), который может использоваться для обучения моделей ранжирования. Это означает, что качество взаимодействия пользователя с контентом после клика может влиять на то, как Google оценивает эффективность различных сигналов ранжирования.

Как этот патент связан с персонализацией поиска?

Патент описывает архитектуру, которая делает персонализацию возможной на фундаментальном уровне. User Context включает профиль пользователя, его интересы и недавнюю историю. Это позволяет системе выбирать модели ранжирования, которые оптимизированы специально для данного пользователя или группы пользователей, что и приводит к персонализированной выдаче.

Если Google использует разные модели для разных стран и языков, как это влияет на международное SEO?

Это критически важно для международного SEO. Патент явно указывает язык и страну как примеры User Context. Это означает, что модель ранжирования для одного и того же запроса в США и Германии может быть разной. Нельзя просто переводить контент; необходимо адаптировать стратегию под локальные особенности и поведение пользователей, так как Google учится на их кликах отдельно для каждого региона.

Может ли система создать совершенно новую формулу ранжирования на лету?

Согласно патенту, Predicted Performance Functions генерируются заранее в ходе офлайн-процесса машинного обучения. В реальном времени система выбирает наилучшую из существующих функций для данного контекста, а не создает новую с нуля. Это обеспечивает необходимую скорость ответа.

Как SEO-специалисту адаптироваться к этой системе динамического ранжирования?

Необходимо сместить фокус с попыток "взломать" единый алгоритм на глубокое понимание интентов и контекстов вашей аудитории. Создавайте контент, который максимально полно удовлетворяет потребностям пользователя в конкретной ситуации. Работайте над привлекательностью сниппетов (CTR) и качеством взаимодействия на сайте (Dwell Time), так как именно эти метрики используются для обучения моделей.

Как Google персонализирует результаты поиска в зависимости от сайта, с которого отправлен запрос

Google анализирует совокупные поисковые запросы и последующие клики пользователей, инициирующих поиск с определенного веб-сайта. На основе этих данных создается «Профиль Веб-сайта», отражающий коллективные интересы его аудитории. Этот профиль используется для переранжирования будущих результатов: один и тот же запрос, отправленный с разных сайтов, даст разную выдачу, адаптированную под контекст источника.

US8078607B2
2011-12-13

Персонализация
Поведенческие сигналы
SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи

Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.

US9623119B1
2017-04-18

EEAT и качество
Поведенческие сигналы
SERP

Как Google использует машинное обучение для ранжирования в Поиске по Картинкам, динамически взвешивая сигналы изображения и посадочной страницы

Google использует модель машинного обучения для ранжирования изображений, которая совместно обрабатывает признаки запроса, самого изображения и посадочной страницы, на которой оно размещено. Это позволяет системе динамически определять важность визуальных характеристик изображения и контекста страницы в зависимости от конкретного запроса, улучшая релевантность выдачи.

US20200201915A1
2020-06-25

Мультимедиа
SERP

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов

Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.

US7231399B1
2007-06-12

Поведенческие сигналы

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента

Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).

US8095876B1
2012-01-10

EEAT и качество
Техническое SEO
Ссылки

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории

Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.

US8788490B1
2014-07-22

Local SEO
Ссылки
SERP

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов

Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.

US7925657B1
2011-04-12

Поведенческие сигналы

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)

Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.

US8417697B2
2013-04-09

Персонализация
Поведенческие сигналы
Антиспам

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс

Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.

US8255386B1
2012-08-28

Индексация
Поведенческие сигналы

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP

Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.

US9275421B2
2016-03-01

Семантика и интент
SERP
Ссылки

Как Google персонализирует Sitelinks и сниппеты, используя интересы пользователя и тренды для прямого перехода на нужные страницы

Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. При совпадении Google отображает персонализированные прямые ссылки (например, динамические Sitelinks) на эти конкретные разделы или товары прямо в выдаче.

US20140188927A1
2014-07-03

Персонализация
SERP
Ссылки

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность

Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.

US7870147B2
2011-01-11

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта

Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.

US9195944B1
2015-11-24

Поведенческие сигналы
Индексация
SERP

Как Google определяет язык и языковую релевантность страницы, анализируя контекст входящих и исходящих ссылок

Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.

US9098582B1
2015-08-04

Ссылки
Мультиязычность
Семантика и интент