Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

SYSTEMS AND METHODS FOR WEIGHTING A SEARCH QUERY RESULT (Системы и методы взвешивания результата поискового запроса)

US8631001B2
Google LLC
2004-03-31
2014-01-14

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

Какую проблему решает

Патент решает задачу повышения релевантности поисковой выдачи путем адаптации алгоритмов ранжирования к индивидуальным предпочтениям пользователя. Основная цель — научиться определять, какие источники информации (например, типы запросов, конкретные ключевые слова, темы или даже конкретные сайты) генерируют наиболее полезные результаты для данного пользователя, и использовать эту информацию для улучшения будущих результатов.

Хотя патент часто использует примеры имплицитных запросов (автоматически сгенерированных на основе контекста), описанные механизмы обучения на основе обратной связи являются фундаментальными для персонализации поиска в целом.

Что запатентовано

Запатентована система динамической корректировки весов (Query Factors или Weighting Factors), присваиваемых различным источникам данных (Sources), на основе сигналов интереса пользователя (Input Signals). Когда пользователь взаимодействует с результатом поиска (например, кликает по нему), система определяет источник этого результата и корректирует вес этого источника. Это позволяет персонализировать ранжирование, отдавая предпочтение источникам, которые ранее оказались полезными для пользователя.

Как это работает

Система работает как механизм обратной связи для обучения ранжированию (Learning-to-Rank):

Сбор данных и Ранжирование: Система генерирует результаты из нескольких источников. Ранжирование учитывает текущие веса (Query Factors) этих источников.
Отслеживание взаимодействия: Отслеживается взаимодействие пользователя с выдачей (клики, время просмотра, прокрутка и т.д.) — это Input Signals.
Атрибуция: Когда пользователь проявляет интерес к результату (Article A), система определяет, какой источник (Source X) привел к показу этого результата.
Корректировка весов: Вес (Query Factor) для Источника X корректируется (повышается при положительном взаимодействии, понижается при отрицательном).
Применение: При последующем ранжировании результаты, поступающие из Источника X (например, Article B), получают скорректированную оценку на основе нового веса.

Актуальность для SEO

Высокая. Персонализация и машинное обучение на основе поведенческих данных (Learning-to-Rank) являются фундаментальными компонентами современных поисковых систем. Принципы, описанные в патенте, — использование кликов и других сигналов взаимодействия для корректировки весов факторов ранжирования — повсеместно применяются для адаптации выдачи под конкретного пользователя, например, в Google Поиске и Google Discover.

Важность для SEO

Значительное влияние (7/10). Патент описывает базовый механизм персонализации на основе поведенческих факторов. Он подчеркивает, что вовлеченность пользователя (клики, время просмотра) напрямую влияет на его будущую выдачу, подтверждая релевантность базовых источников (ключевых слов, тем, сайтов). Для SEO это означает, что успешное удовлетворение интента пользователя не только помогает в моменте, но и улучшает видимость сайта для этого пользователя в будущем.

Термины и определения

Article Identifier (Идентификатор статьи): Ссылка (например, URL или путь к файлу), идентифицирующая документ или ресурс в результатах поиска.
Implicit Query (Имплицитный запрос): Запрос, сгенерированный системой автоматически на основе контекста пользователя (например, текст, который он читает или пишет), без явного ввода запроса пользователем.
Input Signal / Interest Signal (Входной сигнал / Сигнал интереса): Сигнал, указывающий на интерес пользователя к определенному результату. Может быть положительным (клик, длительное время просмотра, сохранение) или отрицательным (отсутствие клика в течение времени, быстрое покидание страницы).
Merged Query Result (Объединенный результат запроса): Единый набор результатов, сформированный путем слияния выдачи от нескольких независимо выполненных поисковых запросов.
Query Factor / Weighting Factor (Фактор запроса / Весовой коэффициент): Вес, присвоенный конкретному источнику (Source). Используется при расчете итоговой оценки релевантности и динамически корректируется на основе Input Signals.
Relevance Score (Оценка релевантности): Итоговая числовая оценка, определяющая позицию результата в выдаче. Рассчитывается с учетом базовой оценки из индекса и Query Factor.
Source (Источник): Происхождение результата поиска. Может включать тип запроса, конкретные ключевые слова, тему, приложение или даже конкретный веб-сайт.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной механизм обратной связи для корректировки ранжирования.

Система получает несколько наборов результатов от отдельно отправленных поисковых запросов.
Результаты объединяются в Merged Query Result.
Определяется первая последовательность ранжирования (Rank 1) и представляется пользователю.
Идентифицируется Input Signal (сигнал интереса) от пользователя к первому элементу информации (Article A).
Идентифицируется конкретный поисковый запрос (и его источник), который привел к показу Article A.
Корректируется Query Factor (вес), связанный с этим источником, в ответ на Input Signal.
Находится второй элемент информации (Article B) в результатах того же источника.
Определяется новая оценка для Article B на основе скорректированного Query Factor.
Определяется вторая последовательность ранжирования (Rank 2) на основе новой оценки, и результаты переупорядочиваются.

Это механизм обучения ранжированию (Learning-to-Rank), применяемый к источникам результатов. Система персонализирует функцию ранжирования, адаптируя веса различных сигналов на основе обратной связи пользователя. Цель — продвигать результаты из источников, которые исторически оказались полезными для данного пользователя.

Claim 2 (Зависимый): Детализирует процесс атрибуции, если результат был найден несколькими запросами (источниками).

Если Article A был найден как Запросом 1, так и Запросом 2.
Система определяет базовые индексные оценки (index scores) для Article A в контексте каждого запроса (насколько хорошо результат соответствует запросу).
Корректировка весов (Query Factors) для Запроса 1 и Запроса 2 производится пропорционально их соответствующим индексным оценкам.

Если Запрос 1 внес больший вклад в первоначальную оценку Article A, чем Запрос 2, то при положительном сигнале от пользователя вес Запроса 1 будет увеличен сильнее. Это позволяет системе точнее атрибутировать успех к наиболее релевантному источнику.

Claims 3-6 (Зависимые): Определяют, что является сигналом интереса (Input Signal): отсутствие выбора в течение времени (Claim 3, негативный сигнал), время просмотра, скроллинг, сохранение, печать (Claim 5, позитивные сигналы).

Где и как применяется

Изобретение является ключевым компонентом систем персонализации и обучения ранжированию.

INDEXING / Аналитика (Обработка данных)
На этом этапе (или в рамках отдельной системы аналитики) логируются и обрабатываются поведенческие данные (Input Signals: клики, время просмотра) и их связь с источниками результатов (Sources). Эта информация используется для расчета и обновления персонализированных весов (Query Factors).

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента. Во время расчета оценок релевантности система использует персонализированные веса (Query Factors) для корректировки Relevance Scores результатов. Если пользователь ранее положительно взаимодействовал с результатами из определенного источника (например, конкретного сайта или темы), вес этого источника увеличивается, и его результаты ранжируются выше в текущей выдаче.

Входные данные:

Наборы результатов поиска (часто объединенные из нескольких источников).
Ассоциация между каждым результатом и его источником (Source).
Сигналы интереса пользователя (Input Signals) в реальном времени или исторические.
Текущие весовые коэффициенты (Query Factors) для различных источников.

Выходные данные:

Скорректированные весовые коэффициенты (Query Factors).
Переранжированный список результатов с адаптированными Relevance Scores.

На что влияет

Персонализация выдачи: Основное влияние. Выдача адаптируется под интересы конкретного пользователя на основе его предыдущего поведения.
Специфические запросы: Особенно сильно влияет на широкие или неоднозначные запросы, где история поведения пользователя помогает уточнить интент.
Типы контента и источники: Влияет на все типы контента и сайты. Пользователь может "научить" систему предпочитать определенные сайты, темы или типы документов (например, PDF или видео).
Проактивный поиск: Критически важен для систем типа Google Discover, которые полагаются на неявные запросы и обратную связь для формирования ленты.

Когда применяется

Триггер активации (Обучение): Механизм корректировки весов активируется каждый раз, когда пользователь взаимодействует (положительно или отрицательно) с результатом поиска.
Применение (Ранжирование): Скорректированные веса применяются при выполнении последующих поисковых запросов этим пользователем для персонализации ранжирования.

Пошаговый алгоритм

Процесс можно разделить на два этапа: Ранжирование и Обучение.

Этап 1: Ранжирование и Отображение

Генерация запросов: Система генерирует несколько запросов из разных источников (например, Запрос А из Источника 1, Запрос Б из Источника 2). Это могут быть как явные, так и неявные запросы.
Получение результатов: Запросы выполняются, возвращаются наборы результатов.
Расчет оценок: Для каждого результата рассчитывается Relevance Score. Эта оценка учитывает базовую релевантность (например, TF-IDF) и текущий вес источника (Query Factor). $Score = BaseScore * QueryFactor(Source)$ .
Слияние и Ранжирование: Результаты из всех источников объединяются (Merged Query Result) и сортируются по итоговой оценке.
Отображение: Топ-N результатов показываются пользователю.

Этап 2: Обучение (Обратная связь)

Сбор обратной связи: Пользователь взаимодействует с выдачей (например, кликает на Результат А и проводит там время). Система получает Input Signal.
Идентификация источника: Система определяет, какой источник (или источники) привели к показу Результата А.
Атрибуция (если источников несколько): Определяется вклад каждого источника в итоговую оценку Результата А (Claim 2).
Корректировка весов: Query Factor для идентифицированных источников корректируется. При положительном сигнале вес увеличивается, при отрицательном — уменьшается. Корректировка пропорциональна вкладу источника.
Обновление модели: Новые веса сохраняются (например, в профиле пользователя) для использования на Этапе 1 при будущих запросах.

Какие данные и как использует

Данные на входе

Ключевыми данными в этом патенте являются поведенческие сигналы и атрибуты источников.

Поведенческие факторы: Критически важны. Используются Input Signals, которые включают (Claims 3-6):
- Клик по результату (Selection).
- Отсутствие клика в течение определенного времени (Lack of selection).
- Время просмотра страницы (Viewing duration / Dwell Time).
- Активность на странице (Scrolling, mouse movement).
- Дальнейшие действия (Selection of links from the article, saving, printing, bookmarking).
- Явные оценки пользователя (User rating).
Атрибуты источника (Source Attributes): Данные, определяющие происхождение результата (Claim 9):
- Ключевые слова (query terms) или темы.
- Тип запроса (query type).
- Приложение-источник (application).
- Тип контента (article type).

Какие метрики используются и как они считаются

Query Factor (Весовой коэффициент источника): Метрика, определяющая значимость конкретного источника для пользователя. Она обновляется итеративно на основе обратной связи. В патенте приводится пример: при положительной реакции вес может умножаться на 2.0; при отрицательной — на 0.5.
Relevance Score (Оценка релевантности): Итоговая оценка документа. Рассчитывается путем взвешивания базовой оценки релевантности (index score) на Query Factor источника.
Index Score (Базовая индексная оценка): Стандартная оценка релевантности (например, на основе TF-IDF, BM25), показывающая, насколько хорошо документ соответствует ключевым словам запроса.
Attribution Metric (Метрика атрибуции): Используется, когда результат получен из нескольких источников. Определяет пропорциональный вклад каждого источника в итоговую оценку результата (Claim 2). Корректировка Query Factor происходит пропорционально этому вкладу.

Персонализация через поведенческую обратную связь: Патент описывает четкий механизм использования данных о взаимодействии пользователя (Input Signals) для валидации релевантности базовых сигналов ранжирования (Sources). Это механизм прямой персонализации выдачи.
Вовлеченность как сигнал для обучения ранжированию (LTR): Положительное взаимодействие (клики, длительное время просмотра) усиливает сигналы ранжирования, которые привели к показу результата. Это повышает будущую эффективность этих сигналов для данного пользователя.
Важность отрицательной обратной связи: Патент явно указывает, что отсутствие взаимодействия (игнорирование результата) или негативные сигналы (например, короткое время просмотра) приводят к понижению веса соответствующих источников.
Точная атрибуция успеха: Система стремится атрибутировать успех (клик) к правильному базовому фактору (например, конкретной теме или сайту), даже если результаты объединены из нескольких входных потоков. Это достигается за счет пропорциональной корректировки весов (Claim 2).
Обучение в реальном времени: Описан механизм итеративного обучения, который позволяет системе постоянно адаптироваться к меняющимся предпочтениям пользователя.

Best practices (это мы делаем)

Хотя патент фокусируется на персонализации для конкретного пользователя, агрегированные поведенческие данные часто используются в глобальных моделях Learning-to-Rank. Поэтому рекомендации актуальны как для персонализированной, так и для общей выдачи, а также для Google Discover.

Максимизация вовлеченности пользователя (Engagement): Создавайте привлекательные заголовки и сниппеты, которые точно отражают содержание страницы. Это повышает CTR и вероятность положительного Input Signal.
Оптимизация под удовлетворение интента (Intent Satisfaction): Контент должен немедленно удовлетворять интент пользователя, чтобы минимизировать быстрые отказы (pogo-sticking) и увеличить время пребывания на странице (Dwell Time). Положительный опыт укрепляет релевантность сайта как источника (Source) для этих запросов в глазах системы.
Улучшение пользовательского опыта (UX): Обеспечьте быструю загрузку, чистый дизайн и удобную навигацию. Хороший UX способствует положительным поведенческим сигналам (длительное взаимодействие, прокрутка, переходы по внутренним ссылкам, как указано в Claim 5).
Построение тематического авторитета (Topical Authority): Последовательно удовлетворяя пользователей по всей теме, сайт становится валидированным источником для этой темы. В персонализированной выдаче и в Google Discover такой сайт будет получать преимущество.

Worst practices (это делать не надо)

Использование кликбейта и вводящих в заблуждение сниппетов: Генерация кликов, которые приводят к быстрым отказам (негативный Input Signal), приведет к тому, что система понизит вес сайта как релевантного источника для этих запросов для данного пользователя (и потенциально в агрегированных моделях).
Игнорирование поведенческих метрик: Фокус исключительно на традиционных факторах (ключи, ссылки) без анализа CTR, показателя отказов и времени на сайте опасен. Если пользователи не взаимодействуют с контентом положительно, его позиции будут снижаться.
Создание поверхностного контента: Контент, который не удерживает внимание пользователя и не приводит к длительному взаимодействию, генерирует слабые или отрицательные сигналы интереса.

Стратегическое значение

Патент подчеркивает критическую важность поведенческих факторов в современном SEO. Он описывает конкретный механизм, с помощью которого Google может измерять удовлетворенность пользователя и использовать эту информацию для корректировки ранжирования (Learning-to-Rank). Стратегия SEO должна ставить во главу угла удовлетворение интента пользователя и обеспечение положительного опыта взаимодействия, поскольку это напрямую влияет на то, как система оценивает релевантность сайта.

Практические примеры

Сценарий: Персонализация выдачи на основе предыдущего выбора

Действие пользователя: Пользователь ищет "установка Python". В выдаче есть Сайт А (подробное руководство) и Сайт Б (краткая справка).
Взаимодействие: Пользователь кликает на Сайт А и проводит там 5 минут (сильный положительный Input Signal). Затем возвращается в выдачу, кликает на Сайт Б и уходит через 10 секунд (отрицательный Input Signal).
Действие системы (Обучение): Система идентифицирует Источники. Источник 1: (Сайт А + Тема: Python). Источник 2: (Сайт Б + Тема: Python). Система повышает Query Factor для Источника 1 и понижает для Источника 2 для этого пользователя.
Результат (Будущее ранжирование): Через неделю пользователь ищет "отладка кода Python". Система применяет обновленные веса. Руководство по отладке с Сайта А будет ранжироваться выше, чем аналогичное руководство с Сайта Б, поскольку Сайт А теперь является более валидированным источником контента по Python для этого пользователя.

Описывает ли этот патент глобальное ранжирование или только персонализацию?

Патент в первую очередь описывает механизм персонализации. Корректировка весов (Query Factors) происходит на основе поведения конкретного пользователя и влияет на его будущую выдачу. Однако принципы Learning-to-Rank, описанные здесь, часто применяются и в глобальном масштабе, используя агрегированные поведенческие данные всех пользователей для обучения общих моделей ранжирования.

Какие конкретные действия пользователя считаются "Сигналами интереса" (Input Signals)?

Патент перечисляет широкий спектр сигналов (Claims 5, 6): клик по результату (selection), продолжительность просмотра (viewing duration), прокрутка (scrolling), движение мыши, сохранение, печать, добавление в закладки и явные оценки пользователя. Также учитывается отсутствие клика в течение определенного времени (Claim 3). Это соответствует современным концепциям Dwell Time и User Engagement.

Как этот патент связан с важностью CTR и Dwell Time в SEO?

Он напрямую подтверждает их важность. Высокий CTR (клик) является первичным положительным сигналом, а длительный Dwell Time (viewing duration) усиливает его. Если пользователи часто кликают на ваш сайт и остаются на нем, система повышает вес вашего сайта как релевантного источника (Source) для этих запросов, улучшая ваши позиции в будущем (особенно в персонализированной выдаче).

Что такое "Источник" (Source) в контексте веб-поиска?

В контексте веб-поиска Source может быть комбинацией различных атрибутов. Это может быть конкретный домен, определенная тема (Topic/Entity), набор ключевых слов, тип контента (например, видео или новости). Система учится, какие из этих источников наиболее полезны для пользователя.

Как система обрабатывает ситуацию, когда результат был найден несколькими способами (из нескольких источников)?

Система использует механизм атрибуции (Claim 2). Она определяет, какой источник внес наибольший вклад в первоначальную оценку релевантности результата (на основе Index Score). Корректировка веса (Query Factor) для каждого источника происходит пропорционально его вкладу. Это позволяет избежать чрезмерного усиления менее значимых источников.

Влияет ли отрицательная обратная связь (например, быстрый отказ или pogo-sticking) на ранжирование?

Да. Патент описывает как положительную, так и отрицательную корректировку весов. Если пользователь быстро покидает страницу (pogo-sticking) или игнорирует результат, это интерпретируется как отрицательный сигнал. Query Factor для соответствующего источника будет понижен, что ухудшит его ранжирование в будущем для этого пользователя.

Применяется ли этот механизм только к имплицитным (автоматическим) запросам?

Хотя многие примеры в патенте касаются имплицитных запросов (например, в контексте локального поиска), описанный механизм обучения на обратной связи универсален. Он может применяться для корректировки весов как для имплицитных (например, Google Discover), так и для явных (введенных пользователем) поисковых запросов.

Может ли этот механизм привести к "пузырю фильтров" (Filter Bubble)?

Да, это естественное следствие сильной персонализации. Если система постоянно повышает вес источников, с которыми пользователь уже взаимодействовал, это может привести к снижению разнообразия выдачи. Современные поисковые системы стараются балансировать персонализацию с механизмами обеспечения разнообразия (Diversity) и новизны.

Как SEO-специалист может использовать знание этого патента на практике?

Ключевой вывод — фокус на удовлетворении пользователя. Необходимо анализировать поведенческие метрики (CTR, отказы, время на сайте) в разрезе ключевых запросов и страниц входа. Если страница имеет хорошие позиции, но плохие поведенческие факторы, необходимо срочно улучшать контент и UX, чтобы избежать понижения веса сайта как релевантного источника.

Является ли этот механизм основным алгоритмом ранжирования Google?

Нет, это не основной алгоритм, а скорее система корректировки или слой поверх базового ранжирования, отвечающий за адаптацию и персонализацию. Базовое ранжирование опирается на релевантность контента, авторитетность (ссылки, E-E-A-T) и другие факторы, но поведенческие данные используются для тонкой настройки весов этих факторов через механизмы Learning-to-Rank.

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования

Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.

US8832083B1
2014-09-09

Поведенческие сигналы
SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте

Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.

US9037581B1
2015-05-19

Персонализация
Поведенческие сигналы
SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

US11157488B2
2021-10-26

Индексация
Поведенческие сигналы
Семантика и интент

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов

Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.

US7231399B1
2007-06-12

Поведенческие сигналы

Как Google динамически корректирует веса факторов ранжирования для каждого запроса на основе анализа выдачи

Google использует этот механизм для динамической адаптации алгоритма ранжирования к специфике конкретного запроса. Система анализирует, какие факторы оказали наибольшее влияние на формирование первичной выдачи по сравнению с историческими данными. Если влияние факторов отличается от нормы, система корректирует их веса и проводит повторное ранжирование (Re-scoring) для обеспечения оптимального результата.

US10339144B1
2019-07-02

SERP

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации

Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.

US7565358B2
2009-07-21

EEAT и качество
Ссылки

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)

Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.

US7996391B2
2011-08-09

Ссылки
Поведенческие сигналы
SERP

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)

Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.

US20150154610A1
2015-06-04

Local SEO
Антиспам
Поведенческие сигналы

Как Google персонализирует поисковые подсказки (Autocomplete) на основе недавно просмотренного медиаконтента

Google использует информацию о недавно потребленном пользователем медиаконтенте (видео, аудио, книги, игры) для персонализации поисковых подсказок. Система извлекает атрибуты (аспекты) из этого контента, такие как названия, имена актеров или артистов, и повышает в ранжировании те подсказки, которые соответствуют этим атрибутам. Влияние потребления медиа на подсказки зависит от времени, прошедшего с момента просмотра, типа контента и того, делился ли им пользователь.

US9268880B2
2016-02-23

Персонализация
Семантика и интент
Мультимедиа

Как Google использует анализ сущностей в результатах поиска для подтверждения интента и продвижения авторитетного контента

Google анализирует сущности (Topics/Entities) и их типы, общие для топовых результатов поиска, чтобы определить истинный интент запроса. Если интент подтверждается этим тематическим консенсусом выдачи, система продвигает "авторитетные кандидаты" (например, полные фильмы). Если консенсуса нет, продвижение блокируется для предотвращения показа нерелевантных результатов.

US9213745B1
2015-12-15

Семантика и интент
EEAT и качество
SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи

Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.

US9623119B1
2017-04-18

EEAT и качество
Поведенческие сигналы
SERP

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату

Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.

US9305102B2
2016-04-05

Персонализация
Поведенческие сигналы

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями

Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.

US20110295842A1
2011-12-01

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google идентифицирует, оценивает и ранжирует «Глубокие статьи» (In-Depth Articles) и «Вечнозеленый контент»

Google использует систему для идентификации и ранжирования высококачественного лонгрид-контента (In-Depth Articles). Система определяет авторитетные сайты на основе внешних наград и ссылочных паттернов. Контент оценивается по критериям «вечнозелености» (Evergreen Score), структуры (Article Score), отсутствия коммерческого интента и авторитетности автора (Author Score). Ранжирование основано на комбинации качества (IDA Score) и релевантности запросу (Topicality Score).

US9996624B2
2018-06-12

EEAT и качество
Индексация
Семантика и интент

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам

Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.

US8209330B1
2012-06-26

Поведенческие сигналы
SERP
Мультимедиа