Как Google использует поведенческие данные (Dwell Time) для оценки качества страниц и генерации превью в поиске

Google патентует систему «вспомогательного браузинга», которая активируется на странице результатов поиска (SERP) при проявлении интереса к ссылке. Система показывает текстовый сниппет и оценку интереса предыдущих пользователей, рассчитанную на основе имплицитных поведенческих сигналов, таких как время пребывания на странице (Linger Time/Dwell Time), повторные визиты и клики.

Описание

Какую задачу решает

Патент решает проблему «слепой» навигации по гиперссылкам, особенно на странице результатов поиска (SERP). Пользователи часто тратят время, загружая нерелевантные страницы, так как информации в стандартном сниппете недостаточно, а данные от издателей могут быть предвзятыми или устаревшими. Изобретение направлено на предоставление объективной информации от третьей стороны (Google) по требованию, чтобы помочь пользователю принять обоснованное решение о клике до загрузки страницы.

Что запатентовано

Запатентована система вспомогательного браузинга, которая активируется, когда пользователь проявляет интерес к гиперссылке (например, наводит курсор) в наборе результатов поиска (search engine result set). Клиентское устройство автоматически запрашивает у поисковой системы дополнительную информацию о целевой странице. Поисковая система возвращает Text Extract (сниппет) и Implicitly derived past-user information — оценку качества/интереса, основанную на агрегированном поведении предыдущих посетителей (включая Linger Time).

Как это работает

Система функционирует через взаимодействие между клиентом и сервером поисковой системы:

Триггер: Пользователь взаимодействует с результатом на SERP (например, наводит курсор), генерируя Interest Signal.
Запрос: Клиент автоматически отправляет Request Signal поисковой системе.
Обработка на сервере: Поисковая система извлекает заранее подготовленный текстовый сниппет и оценку интереса прошлых пользователей. Эта оценка основана на имплицитных (неявных) сигналах: Linger Time (время пребывания/Dwell Time), повторные визиты, повторные запросы и клики.
Ответ и отображение: Сервер отправляет Information Signal обратно клиенту, который отображает данные в виде оверлея (например, tooltip), не покидая SERP.
Логирование: Система логирует эти взаимодействия (наведение, продолжительность, последующий клик) для улучшения моделей поиска.

Актуальность для SEO

Высокая. Хотя конкретная реализация UI (превью по наведению курсора) может меняться и менее актуальна для мобильных устройств, концептуальное ядро патента — использование имплицитных поведенческих факторов (Dwell Time, повторные визиты) для оценки качества контента — критически важно для современных поисковых систем. Патент явно подтверждает методологию сбора и использования этих метрик Google.

Важность для SEO

Патент имеет высокое значение для SEO (85/100). Он предоставляет одно из самых четких описаний того, как Google определяет и использует имплицитные поведенческие сигналы для оценки удовлетворенности пользователей. Это напрямую подтверждает важность оптимизации контента для удержания пользователя (улучшения Dwell Time) и стимулирования повторных визитов как ключевых показателей качества.

Детальный разбор

Термины и определения

First Document / Search Engine Result Set (Первый документ / Набор результатов поисковой системы): Исходная страница, содержащая гиперссылку. В ключевых Claims патента это конкретно страница поисковой выдачи (SERP).
Second Document (Второй документ): Целевая страница, на которую ведет гиперссылка.
Interest Signal (Сигнал интереса): Действие пользователя, указывающее на потенциальный интерес к гиперссылке (например, наведение курсора (hovering), правый клик).
Request Signal (Сигнал запроса): Сигнал, автоматически генерируемый клиентом в ответ на Interest Signal, запрашивающий информацию о Second Document у поисковой системы.
Third-party-provided information (Информация, предоставленная третьей стороной): Информация о целевом документе, предоставляемая не автором/издателем исходного или целевого сайта, а поисковой системой (Google).
Text Extract (Текстовый экстракт): Сниппет или фрагмент текста, предварительно извлеченный из Second Document и хранящийся в индексе поисковой системы.
Implicitly Derived Past-User Information (Имплицитно полученная информация о прошлых пользователях): Оценка интереса или качества документа, основанная на агрегированном поведении предыдущих посетителей. Ключевой термин, охватывающий поведенческие факторы.
Linger Time (Время пребывания): Метрика, используемая для имплицитного измерения интереса пользователя. Аналог Dwell Time. Явно указана как один из способов расчета Implicitly Derived Past-User Information.
Other Implicit Measures (Другие имплицитные метрики): Количество повторных визитов (repeat visits), количество кликов (click-throughs), печать документа, сохранение документа, объем скроллинга.
Disruptiveness (Разрушительность): Метрика, упомянутая в описании патента, оценивающая тенденцию документа вызывать нежелательные действия (pop-up окна, вирусы, громкая музыка).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод, реализуемый на стороне клиента для обогащения SERP.

Отображение первого веб-документа, который является search engine result set (SERP).
Получение Interest Signal от пользователя (например, наведение курсора) относительно гиперссылки на SERP.
Автоматическая генерация и отправка Request Signal поисковой системе.
Запрос включает требование предоставить: (a) Text Extract (сниппет) и (b) Implicitly derived past-user information.
Информация (b) является рейтингом интереса предыдущих (других) пользователей ко второму документу.
Интерес выводится имплицитно (неявно) с использованием данных, логируемых поисковой системой.
Ключевые метрики для вывода включают: Linger Time (время пребывания), количество повторных визитов, количество повторных запросов, которые привели к документу, или количество кликов.
Получение сниппета и поведенческой оценки от поисковой системы.
Отображение этой информации пользователю в контексте SERP.

Claim 23 (Независимый пункт): Описывает соответствующий метод на стороне сервера (поисковой системы).

Отправка первого веб-документа (SERP) клиенту.
Получение Request Signal от клиента.
Имплицитное определение интереса предыдущих пользователей, используя логированные данные (Linger Time, повторные визиты и т.д.).
Извлечение Text Extract.
Генерация Information Signal, содержащего сниппет и имплицитно выведенную поведенческую оценку, сконфигурированного для отображения на клиенте.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные индексирования и поведенческого анализа для улучшения пользовательского интерфейса.

INDEXING – Индексирование и извлечение признаков
На этом этапе система предварительно обрабатывает контент для генерации Text Extract (сниппетов), которые сохраняются для быстрого доступа.

RANKING / RERANKING (Сбор и обработка данных)
Поисковая система собирает и обрабатывает поведенческие данные пользователей (клики, поведение после клика). Эти данные агрегируются (вероятно, офлайн) для расчета Implicitly Derived Past-User Information (основанной на Linger Time и т.д.) для каждого документа. Эти метрики критичны для оценки качества в алгоритмах ранжирования.

METASEARCH / RERANKING (Взаимодействие с SERP)
Основное применение патента. Система работает в реальном времени, когда пользователь взаимодействует с уже сгенерированным SERP. Механизм динамически улучшает SERP, предоставляя дополнительную информацию по требованию (при наведении курсора).

Входные данные:

Interest Signal от пользователя (например, наведение курсора на SERP).
Идентификатор целевого документа (URL).
Данные из индекса: Text Extract и агрегированные поведенческие логи для URL.

Выходные данные:

Information Signal, содержащий сниппет и оценку интереса.
Отображение этой информации в интерфейсе пользователя (например, tooltip).
Запись в лог о взаимодействии пользователя с SERP (сбор данных о внимании).

На что влияет

Специфические запросы и типы контента: Влияет на все типы запросов и контента, для которых генерируется стандартная поисковая выдача (SERP), так как Claims явно указывают на применение к search engine result set.
Пользовательский опыт (UX) и CTR: Напрямую влияет на принятие решения о клике, предоставляя больше контекста о качестве и релевантности результата.

Когда применяется

Триггеры активации: Активируется в момент, когда пользователь проявляет интерес к гиперссылке на SERP. Конкретные триггеры включают наведение курсора (hovering) на ссылку или правый клик по ней.
Временные рамки: Применяется в реальном времени при взаимодействии пользователя с поисковой выдачей.

Пошаговый алгоритм

Процесс А: Офлайн-подготовка данных (Сервер)

Сбор поведенческих данных: Поисковая система непрерывно логирует действия пользователей, посещающих документы из поиска (Linger Time, повторные визиты, клики, скроллинг и т.д.).
Индексирование контента: Во время сканирования система извлекает и сохраняет Text Extracts (сниппеты) для документов.
Расчет оценок интереса: Система агрегирует поведенческие данные и имплицитно выводит оценку интереса (Implicitly Derived Past-User Information) для каждого документа.
Сохранение оценок: Рассчитанные оценки и сниппеты сохраняются в базе данных для быстрого доступа.

Процесс Б: Обработка взаимодействия в реальном времени (Клиент-Сервер)

Генерация SERP: Поисковая система отправляет клиенту стандартный набор результатов поиска.
Получение сигнала интереса: Клиентское приложение фиксирует действие пользователя (например, наведение курсора) на гиперссылку (Interest Signal).
Генерация и отправка запроса: Клиент автоматически формирует Request Signal и отправляет его на сервер.
Извлечение данных: Сервер извлекает из индекса Text Extract и Implicitly Derived Past-User Information.
Генерация и отправка ответа: Сервер формирует Information Signal и отправляет его клиенту.
Отображение информации: Клиент отображает полученные данные пользователю (например, в виде tooltip).

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных и предварительно извлеченного контента.

Поведенческие факторы (Ключевые): Это основной тип данных, используемый для генерации оценки качества/интереса. В Claims 1 и 23 явно перечислены:
- Linger Time (Время пребывания/Dwell Time).
- Quantity of repeat visits (Количество повторных визитов).
- Quantity of click-throughs (Количество кликов на странице).
- Quantity of repeat queries that led to the document (Количество повторных запросов, приведших к документу).
Дополнительные поведенческие факторы (в описании):
- Amount of scrolling (объем скроллинга).
- Printing (печать документа).
- Saving (сохранение документа).
Контентные факторы:
- Text Extract: Предварительно извлеченный текст документа (сниппет).
Пользовательские факторы:
- История запросов пользователя (может использоваться для выбора наиболее релевантного сниппета – query-related content snippet).
Технические факторы (в описании):
- Liveness (доступность документа, дата последнего обновления).
- Disruptiveness (наличие pop-up окон, вирусов, навязчивой музыки).

Какие метрики используются и как они считаются

Implicitly Derived Past-User Information: Агрегированная метрика, оценивающая интерес предыдущих пользователей к документу. Рассчитывается путем анализа логов поведенческих факторов (Linger Time, повторные визиты и т.д.). Патент не приводит конкретных формул, но четко описывает входные данные.
Метрики взаимодействия с SERP: Система логирует взаимодействие с самим механизмом превью: частота активации для ссылки, продолжительность наведения курсора, следовал ли клик после просмотра информации.

Выводы

Прямое подтверждение использования Dwell Time (Linger Time): Патент явно указывает, что Linger Time (время пребывания пользователя на странице) является одной из ключевых метрик для имплицитного определения интереса пользователей к документу. Это фундаментальное подтверждение важности поведенческих факторов.
Использование комплекса поведенческих сигналов: Система оценивает качество контента комплексно, учитывая не только время пребывания, но и повторные визиты, клики, а также действия на странице (скроллинг, печать).
Имплицитные сигналы как оценка качества: Google использует агрегированные поведенческие данные (Implicitly Derived Past-User Information) как независимую оценку качества или релевантности документа (Third-party-provided information).
Важность Post-Click Experience: Для SEO критически важно не только получить клик, но и обеспечить положительный опыт после клика. Удовлетворенность пользователя напрямую измеряется и используется системой.
Сбор детализированных данных о внимании: Механизм позволяет Google собирать данные не только о том, что пользователи кликают, но и о том, что они рассматривают (hovering), что дает более глубокое понимание их намерений.
Оценка негативного UX (Disruptiveness): Патент упоминает измерение «разрушительности» страницы (например, pop-up окна). Это согласуется с современными факторами Page Experience.

Практика

Best practices (это мы делаем)

Оптимизация под Dwell Time (Linger Time): Создавайте высококачественный, вовлекающий контент, который полностью отвечает на интент пользователя и удерживает его на странице. Это включает глубокое раскрытие темы, использование мультимедиа и высокую читабельность. Длительное время пребывания является сигналом интереса.
Стимулирование повторных визитов: Развивайте лояльность аудитории и силу бренда. Регулярно обновляемый контент и полезные инструменты способствуют повторным посещениям (repeat visits), что учитывается как implicit measure качества.
Улучшение UX и устранение «Disruptiveness»: Обеспечьте отличный пользовательский опыт. Избегайте элементов, которые могут раздражать пользователей (всплывающие окна, автовоспроизведение аудио со звуком). Плохой UX сокращает Linger Time и может быть классифицирован как «разрушительный».
Оптимизация сниппетов (Text Extract): Убедитесь, что контент структурирован так, чтобы система могла сгенерировать релевантный и привлекательный Text Extract. Сниппет должен точно отражать содержание страницы.
Поощрение взаимодействия на странице: Используйте внутреннюю перелинковку, интерактивные элементы и четкую структуру, чтобы стимулировать скроллинг и клики (click-throughs на странице), которые также учитываются как сигналы вовлеченности.

Worst practices (это делать не надо)

Кликбейт и обман ожиданий: Создание привлекательных заголовков, которые не соответствуют содержанию. Это приведет к короткому Linger Time (Pogo-sticking), что негативно скажется на оценке Implicitly Derived Past-User Information.
Тонкий или поверхностный контент: Страницы, которые не предоставляют ценности, будут иметь плохие метрики вовлеченности и низкий рейтинг интереса.
Игнорирование технического качества и скорости: Медленные страницы или страницы с ошибками увеличивают вероятность отказа и сокращают Linger Time.

Стратегическое значение

Этот патент стратегически важен, так как он детально описывает философию оценки качества через поведение пользователей. Он подтверждает, что для Google критически важно удовлетворение интента пользователя, измеряемое имплицитными сигналами. Долгосрочная SEO-стратегия должна фокусироваться на создании контента, который действительно полезен и интересен аудитории, что естественным образом приведет к положительным поведенческим сигналам (длительный Linger Time, повторные визиты).

Практические примеры

Сценарий: Улучшение поведенческих факторов для статьи

Задача: Увеличить Linger Time и вовлеченность для информационной статьи «Как выбрать палатку для зимнего похода».

Действия:

Анализ текущего поведения: Изучить карту скроллинга и время на странице. Обнаружить, что пользователи уходят после прочтения введения (низкий Linger Time).
Улучшение структуры и UX: Добавить четкое оглавление в начале статьи. Разбить длинные абзацы, использовать списки и выделения для улучшения читабельности и стимулирования скроллинга.
Добавление ценности и интерактивности: Внедрить интерактивную сравнительную таблицу популярных моделей палаток и видеообзор. Это удерживает внимание и увеличивает время взаимодействия.
Устранение Disruptiveness: Убрать всплывающее окно с предложением подписки, которое появлялось сразу при загрузке страницы.

Ожидаемый результат: Увеличение среднего времени пребывания на странице (Linger Time) и глубины скроллинга. Это приводит к улучшению Implicitly Derived Past-User Information, что положительно влияет на оценку качества страницы поисковой системой.

Вопросы и ответы

Является ли этот патент доказательством того, что Dwell Time является фактором ранжирования?

Да, это одно из самых сильных подтверждений. Патент явно использует термин Linger Time (синоним Dwell Time) как ключевую метрику для расчета Implicitly Derived Past-User Information — оценки интереса пользователей к документу. Хотя эта оценка в патенте используется для отображения в превью на SERP, очевидно, что метрика, отражающая удовлетворенность пользователей, используется и в основных алгоритмах ранжирования.

Какие именно поведенческие факторы упоминаются в патенте?

Патент перечисляет несколько имплицитных (неявных) метрик. В основных Claims упомянуты: Linger Time (время пребывания), количество повторных визитов, количество кликов (click-throughs), количество повторных запросов, которые привели к этому документу. В описании также упоминаются: печать документа, его сохранение и объем скроллинга.

Что такое «Implicitly Derived Past-User Information»?

Это агрегированная оценка, которая отражает, насколько интересным или полезным был документ для предыдущих посетителей. Она рассчитывается не на основе прямых отзывов, а на основе анализа их поведения (например, если многие пользователи долго оставались на странице, оценка будет высокой). Это способ Google измерить качество контента через действия пользователей.

Патент описывает всплывающие подсказки при наведении на ссылку. Значит ли это, что Google должен показывать их в поиске?

Не обязательно. Патент защищает сам механизм: получение сигнала интереса, запрос к серверу, возврат поведенческих данных и сниппета. Хотя в качестве примера приводится tooltip или оверлей на SERP (что напоминает функцию Google Instant Previews), Google может использовать эти данные и другими способами, например, для внутреннего ранжирования, не обязательно показывая их пользователю.

Как этот патент связан с концепцией Pogo-sticking?

Pogo-sticking (быстрый возврат пользователя из результата поиска обратно в выдачу) напрямую связан с метрикой Linger Time. Pogo-sticking приводит к очень низкому Linger Time, что, согласно патенту, интерпретируется системой как низкий интерес пользователя к документу или его низкое качество/релевантность.

Как защититься от негативных поведенческих факторов?

Главная защита — это соответствие ожиданиям пользователя. Если ваш сниппет на SERP обещает решение проблемы, страница должна немедленно начать ее решать. Избегайте кликбейта, медленной загрузки и агрессивной рекламы (disruptiveness), так как это приводит к быстрому уходу со страницы и снижению Linger Time.

Что означает «Disruptiveness» (разрушительность) страницы, упомянутая в патенте?

Это показатель того, насколько страница может помешать пользователю при загрузке. Примеры включают: тенденцию вызывать нежелательные всплывающие окна (pop-up windows), воспроизводить раздражающую музыку или содержать вирусы. Это указывает на важность чистого и безопасного UX (Page Experience).

Как SEO-специалисту использовать информацию о повторных визитах?

Повторные визиты явно указаны как метрика интереса. Это подчеркивает важность построения бренда и лояльности аудитории. Необходимо фокусироваться на создании ресурса, к которому пользователи захотят вернуться, а не только на оптимизации отдельных страниц для привлечения разового трафика.

Как система отличает полезное длительное пребывание от того, что пользователь просто забыл закрыть вкладку?

Хотя патент не детализирует механизмы фильтрации шума, он упоминает использование дополнительных сигналов, таких как скроллинг, печать или сохранение документа. Отсутствие активности (движения мышью, скроллинга) в течение длительного времени, вероятно, не будет засчитано как положительный Linger Time.

Может ли система логировать, на какие ссылки я навожу курсор?

Да. Патент явно описывает возможность логирования Interest Signal. Система может записывать, какие ссылки пользователь рассматривал, как долго он это делал, и кликнул ли он по ним после просмотра дополнительной информации. Это используется для улучшения поисковых моделей и понимания поведения пользователей.