Как Google использует сигналы вовлеченности пользователей для ранжирования контента в системах без поискового запроса (например, Google Discover)

RESOURCE RECOMMENDATIONS FOR A DISPLAYED RESOURCE (Рекомендации ресурсов для отображаемого ресурса)

US10152521B2
Google LLC
2016-06-22
2018-12-11

Патент описывает механизм генерации рекомендаций контента на основе того, что пользователь просматривает в данный момент, без ввода поискового запроса. Система анализирует текущий контент, находит связанные ресурсы и ранжирует их, основываясь преимущественно на метриках вовлеченности пользователей (трендовость, частота просмотров, совместные просмотры), а не только на текстовой релевантности.

Какую проблему решает

Патент решает проблему предоставления пользователю релевантной контекстной информации без необходимости вручную формулировать и вводить поисковый запрос (текстом или голосом). Традиционные модели требуют от пользователя прервать текущую задачу (например, чтение статьи), чтобы найти дополнительную информацию. Изобретение направлено на создание интуитивного и быстрого способа получения рекомендаций на основе текущего контекста просмотра (active resource) с помощью простого действия (например, долгого нажатия кнопки).

Что запатентовано

Запатентована система, которая генерирует рекомендации контента в ответ на query-independent request (запрос, не зависящий от введенных пользователем ключевых слов). Система анализирует контент, который пользователь активно просматривает, идентифицирует связанные ресурсы и, что критически важно, выбирает финальные рекомендации на основе measures of user engagement (метрик вовлеченности пользователей). Это позволяет продвигать контент, который является трендовым, часто выбираемым или часто просматриваемым совместно с текущим контентом.

Как это работает

Механизм активируется, когда пользователь совершает определенное действие (например, долгое нажатие), сигнализирующее о желании получить контекстную информацию. Это инициирует query-independent request.

Анализ контекста: Система анализирует active resource (например, веб-страницу, приложение, переписку), чтобы понять его содержание.
Идентификация кандидатов: Определяются связанные ресурсы. Это может происходить через идентификацию сущностей (search items) в контенте или через анализ данных о совместном просмотре (какие еще ресурсы просматривают пользователи, видевшие этот контент).
Оценка вовлеченности: Для каждого кандидата вычисляется measure of user engagement. Примеры включают частоту запросов ресурса, высокие показатели кликабельности (selection rates) в логах поиска или трендовость.
Выбор и ранжирование: Ресурсы выбираются и сортируются на основе их метрик вовлеченности (и, возможно, релевантности).
Предоставление: Пользователю показывается user interface element (например, карточка) с навигационными ссылками на выбранные ресурсы.

Актуальность для SEO

Критически высокая. Патент описывает базовые принципы работы систем queryless search (поиска без запроса), таких как Google Discover. Учитывая экспоненциальный рост трафика из рекомендательных систем, понимание роли вовлеченности пользователей (user engagement) как основного фактора ранжирования в этих системах является ключевым для современной SEO-стратегии.

Важность для SEO

Влияние на SEO — критическое (90/100). Этот патент напрямую описывает алгоритмы ранжирования для значительного сегмента трафика, который не зависит от традиционных поисковых запросов. Он подтверждает, что для видимости в рекомендательных системах (например, Discover) метрики вовлеченности (трендовость, CTR, совместные просмотры) могут быть важнее, чем классическая текстовая оптимизация. SEO-стратегия должна включать оптимизацию под вовлеченность и понимание сущностей, чтобы максимизировать этот канал трафика.

Термины и определения

Active Resource (Активный ресурс): Контент, который в данный момент отображается на устройстве пользователя и находится в фокусе внимания (например, веб-страница, открытое приложение, текстовая переписка). Является источником контекста для генерации рекомендаций.
Contextual Information Server (Сервер контекстной информации): Серверная система, которая обрабатывает query-independent requests, анализирует активные ресурсы и предоставляет рекомендации.
Measure of User Engagement (Метрика вовлеченности пользователей): Ключевая метрика для выбора и ранжирования рекомендаций. Количественно определяет, как часто пользователи взаимодействуют с ресурсом. Примеры включают частоту запросов ресурса, высокие показатели выбора (selection rates) в логах поиска, а также данные о совместном просмотре (co-viewed resources).
Query-Independent Request (Запрос, не зависящий от поисковой фразы): Запрос на получение контекстной информации, который не содержит ключевых слов, введенных пользователем (текстом или голосом). Активируется действием пользователя (например, долгим нажатием кнопки) на основе отображаемого контента.
Resource Identification Engine (Механизм идентификации ресурсов): Компонент системы, отвечающий за определение контента активного ресурса и поиск релевантных ресурсов-кандидатов.
Resource Selection Engine (Механизм выбора ресурсов): Компонент системы, который ранжирует ресурсы-кандидаты на основе measures of user engagement и relevance scores и выбирает финальный набор рекомендаций.
Search Item (Элемент поиска / Сущность): Концепция, сущность, ключевое слово или объект в графе знаний, идентифицированный в активном ресурсе. Используется для поиска связанных ресурсов.
Relevance Score (Оценка релевантности): Метрика, отражающая степень уверенности в том, что ресурс будет интересен пользователю, просматривающему активный ресурс.
User Engagement Engine (Механизм оценки вовлеченности): Компонент, вычисляющий Measure of User Engagement для ресурсов-кандидатов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления контекстной информации без явного запроса.

Система получает от устройства query-independent request для информации, релевантной active resource, отображаемому на устройстве. (Важно: запрос не содержит введенных пользователем параметров).
Определяется содержание active resource.
Идентифицируются множественные ресурсы, релевантные этому содержанию.
Для каждого идентифицированного ресурса определяется соответствующая measure of user engagement.
Один или несколько ресурсов выбираются на основе этих measures of user engagement.
Устройству предоставляется user interface element (например, карточка) с навигационными ссылками на выбранные ресурсы.

Ядро изобретения — использование метрик вовлеченности пользователей для выбора (ранжирования) контента, предоставляемого в ответ на контекстный, а не явный поисковый запрос.

Claim 2 (Зависимый от 1): Детализирует один из методов идентификации релевантных ресурсов.

Идентификация включает определение множества search items (сущностей/концепций) из контента активного ресурса и последующий поиск ресурсов, релевантных этим search items.

Claim 3 (Зависимый от 1): Детализирует альтернативный метод идентификации релевантных ресурсов.

Идентификация включает определение ресурсов, которые часто просматриваются пользователями, просматривающими активный ресурс (механизм совместного просмотра или co-viewing).

Claim 5 (Зависимый от 1): Уточняет, как определяется measure of user engagement.

Метрика основывается на количестве запросов (requests) данного ресурса (т.е. его популярности или трендовости).

Claim 6 (Зависимый от 1): Уточняет критерии выбора ресурсов.

Выбор ресурсов основывается как минимум на measures of user engagement и relevance scores ресурсов, идентифицированных на основе контента активного ресурса.

Claim 8 (Зависимый от 1): Уточняет определение measure of user engagement.

Метрика основывается, по крайней мере частично, на том, как часто пользователи взаимодействуют с ресурсом, когда он им показывается (например, CTR).

Где и как применяется

Изобретение описывает работу рекомендательных систем, которые функционируют параллельно с традиционным поиском, но активируются контекстом, а не запросом (например, Google Discover, Google Now on Tap).

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных, необходимых для работы системы:

Извлечение сущностей (search items) из ресурсов и их связь с графом знаний.
Анализ логов (поисковых, браузерных) для вычисления глобальных measures of user engagement для ресурсов (трендовость, популярность, CTR).
Расчет связей совместного просмотра (co-viewing) между ресурсами.

Real-Time Context Analysis (Аналог QUNDERSTANDING для контекста)
Когда пользователь инициирует query-independent request, система в реальном времени анализирует active resource. Это включает:

Получение данных об активном ресурсе (скриншот, DOM-модель, URL, текст).
Извлечение текста (например, с помощью OCR из скриншота или парсинга DOM).
Идентификация ключевых search items (сущностей) в контенте.

RANKING (Ранжирование рекомендаций)
Процесс отбора и сортировки рекомендаций:

Retrieval (Отбор кандидатов): Поиск ресурсов, связанных с идентифицированными сущностями, ИЛИ поиск ресурсов, часто просматриваемых совместно с активным ресурсом.
Scoring (Оценка): Получение measures of user engagement и расчет relevance scores для кандидатов.
Selection (Выбор): Финальный выбор и ранжирование ресурсов на основе комбинации этих оценок, с акцентом на вовлеченность.

Входные данные:

Query-independent request.
Данные об Active Resource (URL, скриншот, DOM-модель, извлеченный текст).
Опционально: метаданные (местоположение пользователя, идентификатор пользователя).
База данных ресурсов с предварительно рассчитанными метриками вовлеченности и связями сущностей.

Выходные данные:

User interface element (например, карточка или карусель).
Набор отсортированных навигационных ссылок на рекомендованные ресурсы.

На что влияет

Типы контента: Влияет на все типы индексируемого контента, включая веб-страницы, страницы приложений и даже контент текстовых переписок (упомянуто в патенте). Особенно сильно влияет на контент, который быстро набирает популярность (тренды).
Специфические запросы: Применяется в сценариях без запроса. Влияет на трафик, основанный на интересах пользователя и его текущем контексте.
Ниши и тематики: Влияет на все тематики, но особенно заметно в новостях, развлечениях, хобби, где пользователи часто ищут дополнительную информацию по теме, которую изучают.

Когда применяется

Триггеры активации: Система активируется явным действием пользователя, которое интерпретируется как query-independent request (например, долгое нажатие кнопки, специальный жест).
Условия работы: Применяется, когда система может определить содержание active resource и найти для него релевантные ресурсы с достаточными measures of user engagement.

Пошаговый алгоритм

Этап 1: Инициация и сбор контекста

Пользователь взаимодействует с устройством (например, долгое нажатие), просматривая active resource.
Клиентский модуль фиксирует это действие и генерирует query-independent request.
К запросу прикрепляются данные об active resource (например, скриншот, DOM-модель, URL) и опциональные метаданные (например, местоположение).
Запрос отправляется на Contextual Information Server.

Этап 2: Анализ ресурса и идентификация кандидатов

Сервер получает запрос и анализирует контент active resource (например, применяет OCR к скриншоту или парсит DOM).
Система идентифицирует ресурсы-кандидаты, используя один или несколько методов:
1. Метод сущностей: Идентифицируются search items (сущности) в контенте. Система ищет ресурсы, релевантные этим сущностям.
2. Метод совместного просмотра: Система определяет URL активного ресурса и ищет другие ресурсы, которые часто просматриваются пользователями, посещавшими этот URL.
Для кандидатов могут быть рассчитаны предварительные Relevance Scores.

Этап 3: Оценка вовлеченности и выбор

User Engagement Engine определяет Measure of User Engagement для каждого ресурса-кандидата. Это может включать проверку трендовости, частоты запросов или CTR из логов.
Resource Selection Engine выбирает финальный набор ресурсов. Выбор основывается на Measures of User Engagement (возможно, с учетом пороговых значений) и может также учитывать Relevance Scores.
Система может применять весовые коэффициенты к вовлеченности и релевантности, возможно, в зависимости от источника активного ресурса (например, развлекательный сайт против образовательного).

Этап 4: Предоставление результатов

Система генерирует User Interface Element (карточку) с навигационными ссылками на выбранные ресурсы.
Карточка отправляется на устройство пользователя и отображается поверх active resource.

Какие данные и как использует

Данные на входе

Система использует несколько типов данных, как получаемых в реальном времени, так и предварительно рассчитанных.

Контентные факторы (Active Resource): Текст активного ресурса (извлеченный через OCR или DOM), изображения (для визуального анализа), структура документа (DOM-модель). Используются для понимания контекста и извлечения search items.
Технические факторы: URL активного ресурса. Используется для идентификации ресурса и анализа данных о совместном просмотре.
Поведенческие факторы (User Engagement): Это критически важные данные для ранжирования.
- Логи запросов (Search query logs): Используются для определения популярности ресурсов и показателей выбора (selection rates / CTR).
- Логи приложений/браузеров: Используются для определения частоты запросов ресурса и выявления трендов.
- Данные о совместном просмотре (Co-viewing data): Логи, показывающие, какие ресурсы пользователи просматривают последовательно или в рамках одной сессии.
Пользовательские факторы: Местоположение устройства и идентификатор пользователя упоминаются как возможные дополнительные данные для уточнения рекомендаций.

Какие метрики используются и как они считаются

Measure of User Engagement (Метрика вовлеченности пользователей): Основная метрика ранжирования. Рассчитывается на основе:
- Частоты запросов ресурса (популярность/трендовость).
- Показателей выбора (Selection Rates / CTR) – как часто пользователи взаимодействуют с ресурсом, когда он им показан.
- Совместного просмотра (Co-occurrence) – частота просмотра ресурса относительно активного ресурса.
Relevance Score (Оценка релевантности): Метрика, определяющая степень соответствия ресурса-кандидата контексту активного ресурса (например, через связь с извлеченными search items).
Engagement Threshold (Порог вовлеченности): Пороговое значение Measure of User Engagement, необходимое для того, чтобы ресурс был рассмотрен для рекомендации.
Взвешивание метрик: Система может комбинировать Measure of User Engagement и Relevance Score, применяя к ним весовые коэффициенты, которые могут зависеть от источника (source) активного ресурса.

Вовлеченность — ключевой фактор ранжирования для Queryless Search: Патент явно указывает, что финальный выбор рекомендаций в системах без явного запроса (как Google Discover) основывается на measures of user engagement. Это фундаментальное отличие от традиционного поиска, где релевантность запросу играет первостепенную роль.
Многогранность метрик вовлеченности: Вовлеченность не является единой метрикой. Она включает популярность (количество запросов), трендовость, показатели кликабельности (CTR / Selection Rates) и данные о совместном просмотре (co-viewing).
Контекст вместо запроса: Система использует active resource как источник контекста. Понимание того, как Google интерпретирует контент страницы (через извлечение search items/сущностей), критично для попадания в рекомендации, связанные с этой страницей.
Два пути идентификации контента: Google может находить связанный контент двумя основными способами: (1) через общие сущности (Entity-based matching) и (2) через поведенческие паттерны (Co-viewing). Это означает, что контент может быть рекомендован, даже если он не идеально совпадает по сущностям, но часто потребляется той же аудиторией.
Релевантность по-прежнему важна, но вторична: Хотя вовлеченность является ключевой, Relevance Scores также используются в процессе выбора (Claim 6). Контент должен быть одновременно и релевантным контексту, и привлекательным для пользователей.

Best practices (это мы делаем)

Оптимизация под вовлеченность (Engagement Optimization): Сосредоточьтесь на создании контента, который вызывает высокий интерес у пользователей. Это включает работу над заголовками и изображениями для максимизации CTR, а также над качеством контента для увеличения времени взаимодействия. Метрики user engagement являются прямым фактором ранжирования в этой системе.
Создание трендового и вирального контента: Поскольку популярность (количество запросов) является компонентом measure of user engagement, создание актуального, своевременного контента, который быстро распространяется, увеличивает шансы на попадание в рекомендации.
Оптимизация под сущности (Entity Optimization): Убедитесь, что Google четко понимает основные сущности (search items) вашего контента. Используйте структурированные данные и ясный язык. Это помогает системе на этапе идентификации кандидатов (Claim 2).
Построение поведенческих связей (Co-viewing): Развивайте сайт так, чтобы пользователи потребляли несколько единиц контента за сессию. Качественная перелинковка и блоки рекомендаций помогают формировать паттерны совместного просмотра, которые Google использует для идентификации связанных ресурсов (Claim 3).
Анализ аудитории и интересов: Понимайте, какой еще контент потребляет ваша целевая аудитория. Создание контента, который соответствует этим смежным интересам, может привести к рекомендациям через механизм co-viewing.

Worst practices (это делать не надо)

Исключительный фокус на ключевых словах: В системах, описанных этим патентом, ключевые слова пользователя отсутствуют. Оптимизация только под традиционный поиск игнорирует механизмы ранжирования, основанные на вовлеченности и сущностях.
Кликбейт низкого качества: Использование кликбейта для искусственного завышения CTR при низком качестве контента может дать краткосрочный эффект, но в долгосрочной перспективе приведет к низким общим метрикам вовлеченности (например, короткое время взаимодействия) и пессимизации.
Игнорирование визуальной привлекательности: В рекомендательных системах (например, Discover) визуальное представление (изображения, превью) критично для привлечения клика. Пренебрежение качеством визуальных активов снижает selection rates.
Создание изолированного контента: Публикация статей, которые слабо связаны с остальным контентом сайта или интересами аудитории, затрудняет формирование сильных сигналов совместного просмотра.

Стратегическое значение

Этот патент подтверждает стратегическую важность диверсификации источников трафика за пределы традиционного поиска. SEO-стратегия должна явно включать оптимизацию под рекомендательные системы (Queryless Search). Это требует смещения фокуса с технической и текстовой оптимизации на глубокое понимание интересов аудитории, оптимизацию вовлеченности (Engagement Optimization) и построение авторитетности вокруг сущностей. Успех в этой области зависит от способности генерировать контент, который пользователи активно выбирают и потребляют.

Практические примеры

Сценарий: Оптимизация статьи для попадания в Google Discover (Queryless Recommendation)

Задача: Увеличить трафик на новостную статью о запуске нового смартфона "Phone X".

Оптимизация сущностей (Claim 2): Убедиться, что "Phone X" четко идентифицируется как основная сущность (search item). Использовать разметку Schema.org (Product/NewsArticle).
Оптимизация под вовлеченность (Claims 1, 8):
- Заголовок: Создать интригующий, но честный заголовок для максимизации CTR (selection rate). Например, "Phone X запущен: 5 функций, которые меняют правила игры".
- Изображение: Использовать высококачественное, уникальное изображение (минимум 1200px) для привлечения внимания в ленте рекомендаций.
Стимулирование популярности (Claim 5): Максимально быстро распространить статью через социальные сети, email-рассылки и пуш-уведомления сразу после публикации. Резкий рост запросов к ресурсу увеличит его measure of user engagement (трендовость).
Формирование совместного просмотра (Claim 3): Разместить в статье блоки ссылок на связанные материалы, которые часто просматривают читатели обзоров смартфонов (например, "Сравнение Phone X и Phone Y", "Лучшие аксессуары для Phone X"). Это помогает Google установить поведенческую связь между этими ресурсами.

Ожидаемый результат: Система идентифицирует статью как релевантную сущности "Phone X" и фиксирует высокие метрики вовлеченности (высокий CTR и трендовость), что приводит к ее активному показу в лентах рекомендаций пользователей, интересующихся смартфонами.

Описывает ли этот патент работу Google Discover?

Хотя название "Google Discover" не упоминается, патент описывает базовые механизмы, которые идеально соответствуют функциональности Discover: предоставление рекомендаций контента без явного поискового запроса (query-independent), основанное на контексте и интересах пользователя, с ранжированием по метрикам вовлеченности (user engagement). Это один из ключевых патентов для понимания алгоритмов Discover.

Что является главной метрикой ранжирования согласно патенту?

Главной метрикой является Measure of User Engagement (Метрика вовлеченности пользователей). Патент указывает (Claim 1), что выбор финальных рекомендаций основывается на этих метриках. Хотя релевантность (Relevance Score) также учитывается (Claim 6), акцент сделан на вовлеченности.

Какие конкретно сигналы входят в "Метрику вовлеченности пользователей"?

Патент перечисляет несколько конкретных сигналов: (1) Количество запросов ресурса (популярность или трендовость, Claim 5); (2) Частота взаимодействия с ресурсом, когда он показан (Selection Rates или CTR, Claim 8); (3) Данные о совместном просмотре (Co-viewing) – как часто ресурс просматривается вместе с другими ресурсами.

Как Google определяет, какой контент связан между собой, если не по ключевым словам?

Патент описывает два основных метода. Первый – через идентификацию общих сущностей (search items) в контенте (Claim 2). Второй, более интересный, – через анализ поведенческих паттернов (Claim 3): система находит ресурсы, которые часто просматриваются теми же пользователями, что и исходный ресурс (Co-viewing).

Означает ли этот патент, что CTR является фактором ранжирования?

Да, для систем, описанных в этом патенте (рекомендательные системы без запроса, такие как Discover). Claim 8 прямо указывает, что measure of user engagement основывается на том, как часто пользователи взаимодействуют с ресурсом, когда он им показан, что является определением CTR (или Selection Rate). Это не обязательно означает, что CTR используется таким же образом в традиционном поиске (SERP).

Как можно оптимизировать контент для повышения "Measure of User Engagement"?

Необходимо сосредоточиться на трех направлениях: (1) Максимизация CTR за счет привлекательных заголовков и изображений; (2) Увеличение трендовости путем быстрого распространения актуального контента; (3) Повышение качества контента для удержания пользователя и стимулирования дальнейшего взаимодействия с сайтом (формирование паттернов co-viewing).

Как механизм совместного просмотра (Co-viewing) влияет на SEO-стратегию?

Он подчеркивает важность построения сильной внутренней структуры сайта и качественной перелинковки. Если пользователи часто переходят со статьи А на статью Б, Google устанавливает между ними связь. Это также означает, что важно понимать смежные интересы аудитории, чтобы создавать кластеры контента, которые потребляются совместно.

Влияет ли источник контента на ранжирование рекомендаций?

Да, патент упоминает, что система может учитывать источник (source) активного ресурса при выборе рекомендаций (Claim 4). Также упоминается возможность разного взвешивания релевантности и вовлеченности в зависимости от типа сайта (например, развлекательный сайт против образовательного).

Как система узнает, о чем мой контент, если нет запроса?

Система анализирует active resource, который просматривает пользователь, чтобы понять контекст. Она извлекает текст (используя парсинг DOM или даже OCR из скриншота) и идентифицирует ключевые сущности (search items), связанные с графом знаний. Этот контекст заменяет традиционный поисковый запрос.

Применяется ли этот патент только к веб-страницам?

Нет. Патент указывает, что active resource может быть веб-страницей, страницей приложения или даже текстовой перепиской (Claim 7). Это означает, что Google может анализировать контекст и предоставлять рекомендации практически в любой среде на устройстве пользователя.

Как Google анализирует контент на экране пользователя для генерации и рекомендации контекстных поисковых запросов

Google использует систему для анализа контента, который пользователь просматривает в данный момент (веб-страница, приложение). Система генерирует потенциальные поисковые запросы на основе этого контента, оценивает их качество (популярность, качество результатов, визуальное выделение терминов) и предлагает пользователю лучшие запросы для быстрого контекстного поиска без необходимости вручную вводить текст.

US10489459B1
2019-11-26

Семантика и интент

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа

Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.

US8307005B1
2012-11-06

Поведенческие сигналы
Ссылки
SERP

Как Google использует поведенческие сигналы и совместные просмотры для генерации рекомендаций контента (например, "Похожие видео" на YouTube)

Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.

US8055655B1
2011-11-08

Поведенческие сигналы
Персонализация

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса

Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).

US9195703B1
2015-11-24

Персонализация
Поведенческие сигналы
Семантика и интент

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента

Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.

US9098511B1
2015-08-04

Поведенческие сигналы
Мультимедиа
SERP

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей

Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.

US9244972B1
2016-01-26

EEAT и качество
Семантика и интент
SERP

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов

Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.

US8001118B2
2011-08-16

Поведенческие сигналы
SERP

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента

Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.

US8595619B1
2013-11-26

Поведенческие сигналы
SERP

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню

Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.

US9053177B1
2015-06-09

SERP
Ссылки
Структура сайта

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"

Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.

US8244749B1
2012-08-14

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи

Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.

US9092529B1
2015-07-28

Поведенческие сигналы
Персонализация
EEAT и качество

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов

Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.

US7536408B2
2009-05-19

Индексация
Семантика и интент
Ссылки

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц

Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.

US9208232B1
2015-12-08

Ссылки
Структура сайта
Семантика и интент

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток

Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.

US9465871B1
2016-10-11

Антиспам
SERP
Ссылки

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность

Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.

US7870147B2
2011-01-11

Семантика и интент
Поведенческие сигналы
SERP