
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
Патент решает проблему неоптимальной релевантности стандартных поисковых систем, которые опираются преимущественно на анализ ключевых слов. Основные проблемы, которые устраняет изобретение:
"keyword spamming" (перенасыщение ключевыми словами), когда частота слов не отражает реальную ценность контента для пользователей.Запатентована система и метод использования информации об использовании электронных документов (Electronic Document Usage Information) для улучшения результатов поиска. Система собирает данные о том, как пользователи взаимодействуют с контентом внутри документов (время просмотра разделов, закладки, печать), агрегирует эти данные от множества пользователей и использует их как сигнал для оценки ценности и релевантности конкретных частей документа. Поисковая система использует эти сигналы для корректировки ранжирования.
Система работает путем сбора и анализа поведенческих данных на уровне документа:
Usage Tracking Module), который может быть интегрирован в программы для чтения документов (Document Reader, например, браузеры, Adobe Reader), отслеживает активность пользователя: время, проведенное на конкретной странице/разделе, создание закладок, печать. Система фильтрует неактивное время (Active Viewing).Aggregator Server), который суммирует информацию от множества пользователей для каждого документа, создавая профиль использования (Document Utilization Information).Высокая. Принципы использования поведенческих факторов (user engagement, dwell time) для оценки качества и релевантности контента являются фундаментальными для современных поисковых систем. Концепция оценки релевантности не всего документа целиком, а его отдельных частей (связано с Passage Ranking), крайне актуальна в 2025 году. Хотя реализация сбора данных могла эволюционировать (например, через браузер Chrome вместо сторонних модулей), базовая идея остается критически важной.
Патент имеет высокое значение (8/10). Он описывает конкретный механизм, при котором поведенческие сигналы, такие как время взаимодействия с контентом (dwell time) и активность пользователя (закладки), напрямую используются для оценки релевантности и корректировки позиций в выдаче. Это подчеркивает важность оптимизации пользовательского опыта, структуры контента и удержания внимания пользователя на ключевых разделах страницы или документа.
Usage Information от множества пользователей и обрабатывает ее для создания Document Utilization Information.Claim 1 (Независимый пункт): Описывает метод использования данных о поведении пользователей в поисковой системе.
Document Utilization Information для документов, подлежащих поиску. Эта информация определена как данные о том, сколько времени пользователи провели за доступом к определенным разделам (particular sections) этих документов.Document Utilization Information.improving the position), если система определяет, что ключевое слово из запроса включено в раздел документа, к которому пользователи обращались в течение более длительного периода времени (accessed by users a longer period of time), чем к другим разделам этого документа.Ядро изобретения — использование метрики времени доступа (вовлеченности) к конкретным разделам для корректировки ранжирования. Если ключевое слово находится в разделе, который пользователи долго читали, это сильный сигнал релевантности.
Claim 5 (Независимый пункт): Описывает архитектуру поискового сервера (систему), реализующего этот метод.
Aggregator Server.Search Algorithm Module генерирует результаты, используя запрос и Document Utilization Information.Изобретение затрагивает этапы сбора данных, индексирования и ранжирования, используя поведенческие сигналы для уточнения релевантности.
CRAWLING / INDEXING – Сбор данных и Индексирование
Система предполагает инфраструктуру для сбора поведенческих данных (Usage Tracking Modules и Aggregator Servers), отличную от стандартного краулинга. На этапе индексирования Indexer Module может использовать эти данные для:
designating keywords) на основе частоты, взвешенной по использованию раздела, содержащего это ключевое слово. Слово в часто используемом разделе получает больший вес.RANKING – Ранжирование
Основное применение патента. Search Algorithm Module использует Document Utilization Information как фактор ранжирования. Система оценивает не только наличие ключевых слов, но и контекст их расположения относительно "ценных" (наиболее используемых) частей документа, как описано в Claim 1.
RERANKING – Переранжирование
На этапе формирования выдачи система может использовать эти данные для улучшения представления результатов, например, указывая в сниппете ссылку непосредственно на наиболее используемую часть документа (deep linking).
Входные данные:
Document Utilization Information (агрегированные данные о времени просмотра разделов, закладках) от Aggregator Server.Выходные данные:
"keyword spamming", так как простое наличие ключевых слов в неиспользуемых разделах не даст преимущества.Алгоритм применяется во время выполнения поискового запроса.
Document Utilization Information) для релевантных документов.Процесс состоит из трех основных фаз: Сбор данных, Агрегация и Выполнение поиска.
Фаза А: Сбор данных (Клиентская сторона)
Usage Tracking Module обнаруживает использование электронного документа (время просмотра страницы, печать).Usage Information передается на Aggregator Server.Фаза Б: Агрегация (Aggregator Server)
Document Utilization Information, отражающая относительную ценность различных частей документа (например, гистограмма времени просмотра по страницам).Search Engine Server.Фаза В: Выполнение поиска (Search Engine Server)
Document Utilization Information.Search Algorithm Module генерирует результаты. Ранжирование корректируется: система повышает рейтинг документа, если ключевые слова запроса находятся в разделах, которые пользователи просматривают дольше всего (согласно Claim 1).Основной фокус патента – на поведенческих факторах, собираемых на уровне взаимодействия с документом.
Active Viewing.Active Viewing.user engagement, dwell time) используются как прямой индикатор ценности контента для корректировки ранжирования.Active Viewing для исключения времени простоя.Патент подтверждает стратегический приоритет Google на использовании поведенческих факторов для оценки качества и релевантности. Он демонстрирует, что оценка контента становится все более гранулярной, переходя от уровня домена и страницы к уровню отдельных разделов и пассажей. Внимание пользователя (Attention) является измеримым сигналом ценности. Долгосрочная SEO-стратегия должна фокусироваться на создании контента, который не просто соответствует интенту запроса, но и обеспечивает глубокое вовлечение пользователя.
Сценарий 1: Оптимизация длинной статьи (HTML-документа)
longer period of time). Согласно Claim 1, позиция документа по этому запросу улучшается.Сценарий 2: Ранжирование технического руководства в формате PDF
Что такое "Document Utilization Information" и чем она отличается от стандартных поведенческих факторов?
Document Utilization Information — это агрегированные данные о том, как множество пользователей взаимодействуют с конкретным документом. Ключевое отличие от стандартных метрик (вроде CTR или общего времени на сайте) заключается в гранулярности. Она показывает не просто факт использования документа, а то, какие именно страницы или разделы внутри него оказались наиболее ценными (дольше просматривались, чаще добавлялись в закладки).
Как именно время, проведенное на разделе документа, влияет на ранжирование согласно патенту?
В патенте (Claim 1) прямо указан механизм: если ключевое слово из поискового запроса находится в том разделе документа, который пользователи просматривают в течение более длительного периода времени, чем другие разделы, то позиция этого документа в результатах поиска улучшается. Это означает, что система использует время взаимодействия (dwell time) как прокси для оценки ценности и релевантности этого конкретного раздела.
Применяется ли этот патент только к PDF и DOC файлам?
Нет. Хотя PDF и DOC часто упоминаются в качестве примеров, патент определяет Electronic Document очень широко, включая HTML, JPEG, GIF, TIFF, электронные книги и веб-страницы. Описанные принципы в равной степени применимы к обычным веб-страницам (HTML), особенно к длинным статьям или сложным страницам, где можно выделить отдельные разделы и отслеживать взаимодействие с ними.
Как Google может собирать эти данные? Нужно ли устанавливать специальный софт?
Патент описывает инфраструктуру, включающую Usage Tracking Module на стороне клиента, и предлагает вознаграждение (Usage Credits) за участие. В современных условиях Google может собирать аналогичные данные через свои продукты: браузер Chrome (включая встроенный просмотрщик PDF), приложения Google Docs/Drive, а также через данные Google Analytics. Установка дополнительного стороннего ПО сейчас, скорее всего, не требуется.
Как этот патент связан с Passage Ranking (Индексированием пассажей)?
Патент тесно связан с концепцией Passage Ranking. Passage Ranking позволяет Google оценивать релевантность отдельных пассажей (частей) страницы. Этот патент предоставляет один из механизмов для определения того, какие именно пассажи являются наиболее ценными, используя для этого поведенческие данные. Если пассаж долго изучается пользователями, он является сильным кандидатом для ранжирования.
Учитывает ли система разницу между активным и пассивным просмотром (Active Viewing)?
Да. В патенте описан механизм проверки того, активно ли пользователь просматривает документ. Система может использовать тайм-ауты при отсутствии ввода, отслеживать активность в других приложениях или активацию скринсейвера, чтобы исключить время простоя из расчета Document Utilization Information. Это повышает точность данных об использовании.
Влияет ли добавление страницы в закладки на ранжирование?
Да, согласно описанию патента, создание закладок (Bookmarks) является одним из типов Usage Information, который собирается и агрегируется. Закладка рассматривается как явное свидетельство того, что пользователь находит информацию в данном месте ценной. Это используется как один из сигналов для повышения релевантности раздела или документа.
Может ли этот механизм бороться с Keyword Spamming?
Да, это одна из заявленных целей патента. Поскольку система придает вес только тем ключевым словам, которые находятся в активно используемых разделах, простое перенасыщение текста ключевыми словами в разделах, которые пользователи пропускают (например, в футере или в "водянистых" абзацах), не даст эффекта. Ценность ключевого слова определяется контекстом его использования.
Что такое «Определение ключевых слов» (Designating Keywords), основанное на использовании документа?
Это процесс определения важных терминов документа не только по их частоте (как в TF-IDF), но и с учетом популярности раздела, где они встречаются. Слово, которое появляется 5 раз на самой просматриваемой странице, может быть признано более важным ключевым словом, чем слово, которое появляется 10 раз на страницах, которые пользователи пропускают.
Какое влияние этот патент оказывает на стратегию создания лонгридов?
Лонгриды должны быть структурированы так, чтобы постоянно поддерживать вовлеченность пользователя. Если пользователи читают только введение, а основную часть пролистывают, ценность контента будет оценена низко. Важно использовать качественное форматирование, мультимедиа и сильное повествование, чтобы максимизировать время активного чтения ключевых разделов.

Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
Персонализация
Семантика и интент

Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Мультиязычность
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Local SEO

Knowledge Graph
Семантика и интент
EEAT и качество

Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
SERP

EEAT и качество
Техническое SEO
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация
