Google отслеживает, какой текст пользователи выделяют на веб-страницах и как они читают контент (включая скорость прокрутки и потенциально отслеживание взгляда). Эта информация используется для глубокой персонализации будущих поисковых запросов: система аннотирует знакомые результаты, использует содержание выделенного текста для подбора другого релевантного контента и автоматически возвращает пользователя к последнему просмотренному фрагменту.
Описание
Какую задачу решает
Патент решает проблему неэффективного повторного использования контента, с которым пользователь ранее взаимодействовал. Существующие системы (например, стандартные закладки) не интегрируют историю гранулярного взаимодействия (например, выделение конкретного абзаца) в процесс будущего поиска интеллектуальным образом. Изобретение направлено на улучшение пользовательского опыта путем автоматического отображения ранее важного контента в контексте новых поисковых задач и упрощения навигации при повторных визитах.
Что запатентовано
Запатентована система, которая фиксирует детальные взаимодействия пользователя с веб-страницей — как явные (выделение текста), так и пассивные (поведение чтения, last viewed portion). Эти данные используются для модификации последующих поисковых выдач для этого пользователя. Система не только напоминает о предыдущих взаимодействиях, но и использует содержание выделенного текста для определения и отображения других релевантных результатов поиска.
Как это работает
Система работает в несколько этапов:
- Сбор данных (T1): Отслеживаются действия пользователя на странице. Явные действия (выделение текста) сохраняются. Пассивное поведение (медленный скроллинг, задержка на фрагменте, данные eye-tracking) может генерировать Automatic Bookmarks. Фиксируется Last viewed portion.
- Хранение: Данные о взаимодействии сохраняются в привязке к профилю пользователя.
- Персонализация Поиска (T2): При последующем поиске система модифицирует SERP. Она аннотирует результаты, с которыми пользователь взаимодействовал ранее. Кроме того, она использует содержание выделенного текста для идентификации и включения в выдачу других релевантных результатов.
- Навигация и Версионирование: При возврате на страницу система автоматически переходит к Last viewed portion и отображает индикаторы выделений. Если страница изменилась, система предлагает выбор между старой версией (с выделениями) и актуальной.
Актуальность для SEO
Высокая. Патент подан в 2020 году и отражает ключевые тенденции в развитии поиска: гиперперсонализацию и интеграцию данных между продуктами Google (например, Chrome/Google App и Поиск). Механизмы тесно связаны с технологиями типа «Link to Text Fragment» и подчеркивают важность сигналов вовлеченности для понимания интента пользователя.
Важность для SEO
Патент имеет высокое значение для SEO (80/100). Хотя он не описывает сигналы глобального ранжирования, он детально раскрывает механизмы глубокой персонализации. Он подтверждает, что взаимодействие пользователя с контентом (чтение, выделение) напрямую влияет на его будущую поисковую выдачу. Это критически важно для стратегий удержания пользователей и построения авторитета: создание контента, стимулирующего глубокое вовлечение, становится фактором будущей видимости сайта для этого пользователя.
Детальный разбор
Термины и определения
- First User Input (Первый пользовательский ввод)
- Действие пользователя в момент T1, направленное на часть веб-страницы. Основной пример в патенте — выделение текстового сегмента (selection of a text segment).
- Second User Input (Второй пользовательский ввод)
- Поисковый запрос, введенный пользователем в момент T2 (позже T1).
- Last Viewed Portion (Последняя просмотренная часть)
- Часть веб-страницы, которую пользователь просматривал последней. Система сохраняет эти данные для автоматического возврата к этому месту при повторном посещении.
- Automatic Bookmark (Автоматическая закладка)
- Закладка, создаваемая системой автоматически на основе пассивного поведения пользователя. Триггеры: медленная прокрутка (ниже threshold scrolling speed), длительный статический просмотр фрагмента (static viewing) или данные отслеживания взгляда (eye-tracking).
- Indicators (Индикаторы)
- Визуальные элементы в интерфейсе (например, на полях или полосе прокрутки), указывающие относительное положение выделенных фрагментов или Automatic Bookmarks. Включают on-screen и off-screen индикаторы.
- First Version / Second Version (Первая версия / Вторая версия)
- Различные состояния веб-страницы. Первая версия — на момент взаимодействия пользователя. Вторая версия — обновленное состояние, обнаруженное при повторном посещении.
- User Data (Пользовательские данные)
- Сохраненная информация, описывающая First User Input и Last Viewed Portion, привязанная к профилю пользователя.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной цикл: отслеживание взаимодействия, использование его для персонализации поиска и улучшение навигации.
- Система получает первый ввод (T1): выделение текстового сегмента на веб-странице.
- Система сохраняет User Data, описывающие выделение и Last viewed portion.
- Система получает второй ввод (T2): поисковый запрос.
- Система предоставляет результаты поиска (SERP), включающие:
- Результат для исходной веб-страницы с данными о выделенном фрагменте.
- Ключевой момент: Один или несколько других результатов поиска, которые определены на основе содержания выделенного фрагмента.
- Система получает третий ввод: запрос на отображение исходной веб-страницы.
- Система отображает Last viewed portion и Indicators для навигации по выделениям.
Claim 7 (Зависимый от 1): Уточняет механизм влияния на другие результаты.
На основе выделенного фрагмента система выбирает дополнительную веб-страницу (отличную от исходной) и отображает ее в ответ на поисковый запрос. Это подтверждает использование выделений как контекста для расширения поиска.
Claim 10 и 11 (Зависимые от 1): Детализируют создание Automatic Bookmarks.
Система генерирует автоматические закладки на основе поведения: скорость прокрутки ниже порога или статический просмотр (Claim 10), или на основе данных отслеживания взгляда (focal point), полученных с камеры (Claim 11).
Claim 19 (Независимый пункт): Интегрирует механизм персонализации из Claim 1 с управлением версиями контента.
В дополнение к процессам персонализации поиска, система обнаруживает, что страница была обновлена (Second version) после взаимодействия пользователя с First version. Система предоставляет интерфейс для переключения между версиями, сохраняя при этом навигационные Indicators.
Где и как применяется
Изобретение функционирует на стыке клиентского приложения (браузера/приложения) и поисковой системы.
CRAWLING / Сбор данных (Client-Side)
Браузер или приложение пользователя отслеживает и записывает гранулярные взаимодействия: выделения текста, скорость скроллинга, время задержки, данные взгляда.
INDEXING (Персональный индекс и Кэш)
Данные о взаимодействиях (User Data) индексируются и хранятся в привязке к профилю пользователя. Также система должна иметь доступ к кэшированным/архивным версиям страниц для реализации функции управления версиями (Claim 19).
QUNDERSTANDING / RANKING (Слой Персонализации)
Ключевой этап для SEO. История взаимодействий используется как контекст на этапе обработки запроса и ранжирования. Содержание выделенного текста используется для определения и включения других релевантных результатов (Claim 1, 7).
RERANKING / METASEARCH (Презентация SERP)
Система модифицирует внешний вид SERP. Она улучшает сниппеты ранее посещенных страниц (показывая выделенный текст или аннотации о предыдущем взаимодействии) и может внедрять специальные блоки.
Входные данные:
- Действия пользователя на странице (выделение, скроллинг, время просмотра).
- Опционально: данные с камеры (eye-tracking).
- Текущий поисковый запрос.
- Профиль пользователя (User Data).
- Различные версии веб-страницы (кэш).
Выходные данные:
- Персонализированная SERP с модифицированными сниппетами и дополнительными результатами.
- Интерфейс просмотра страницы с автоматической навигацией и индикаторами.
На что влияет
- Типы контента: Информационный контент, лонгриды, исследования, образовательные материалы — контент, предполагающий глубокое изучение и сохранение фрагментов.
- Специфические запросы: Информационные и исследовательские запросы (research intent), особенно при продолжении ранее начатой задачи.
- Персонализация: Влияет только на результаты поиска конкретного пользователя, основываясь на его личной истории взаимодействия в экосистеме Google.
Когда применяется
- Триггеры активации (Поиск): Когда пользователь вводит запрос, И система обнаруживает релевантную историю взаимодействий (либо посещенные страницы релевантны, либо содержание выделений дает контекст для поиска нового контента).
- Триггеры активации (Навигация): Когда пользователь повторно открывает страницу, для которой сохранены User Data.
- Триггеры активации (Автоматические закладки): Когда поведение чтения пользователя соответствует пороговым значениям (медленная прокрутка, задержка, данные взгляда).
Пошаговый алгоритм
Фаза 1: Сбор данных (Во время просмотра — T1)
- Мониторинг взаимодействий: Система отслеживает действия пользователя на веб-странице.
- Запись явных действий: Сохранение сегментов текста, выделенных пользователем (First user input).
- Анализ поведения чтения: Мониторинг скорости скроллинга, времени задержки и/или данных eye-tracking.
- Генерация автоматических закладок: Если поведение соответствует порогам, система создает Automatic Bookmark.
- Сохранение контекста: Сохранение всех данных и Last viewed portion в профиле пользователя.
Фаза 2: Персонализированный поиск (T2)
- Получение запроса: Система получает поисковый запрос (Second user input).
- Анализ User Data: Система извлекает и анализирует релевантную историю взаимодействий.
- Персонализация и Расширение SERP:
- Идентификация и аннотирование ранее посещенных страниц в результатах (например, добавление выделенного текста в сниппет).
- Определение других результатов поиска (дополнительных веб-страниц) на основе содержания предыдущих выделений (Claims 1, 7).
- Отображение SERP: Предоставление персонализированной выдачи.
Фаза 3: Возвратная навигация и контроль версий
- Запрос страницы: Пользователь запрашивает ранее посещенную страницу.
- Проверка обновлений: Система сравнивает текущую версию страницы с версией на момент взаимодействия.
- Управление версиями (Опционально): Если страница изменилась, система предлагает выбор между версиями (Claim 19).
- Автоматическая навигация: Система автоматически прокручивает страницу к Last viewed portion (например, с уведомлением «Продолжить с того места, где вы остановились»).
- Отображение индикаторов: Отображение визуальных Indicators для навигации по выделениям и закладкам.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании детальных поведенческих данных и контента, с которым взаимодействовал пользователь.
- Контентные факторы: Текстовые сегменты (text segment), выделенные пользователем. Содержание этого текста используется для подбора других результатов поиска.
- Поведенческие факторы (Гранулярные):
- Явные выделения текста (highlighting).
- Скорость прокрутки (scrolling speed).
- Время задержки / статический просмотр (static viewing, lingered).
- Last viewed portion страницы.
- Пользовательские факторы: Данные привязываются к профилю пользователя (user profile).
- Технические / Мультимедиа факторы: Опционально, данные с камеры для отслеживания взгляда (eye-tracking) и определение точки фокусировки (focal point).
Какие метрики используются и как они считаются
Патент упоминает использование пороговых значений для активации функций автоматического сохранения (конкретные значения не указаны):
- Threshold Scrolling Speed (Пороговая скорость прокрутки): Скорость ниже этого порога может инициировать создание Automatic Bookmark.
- Threshold Period of Time (Пороговый период времени): Статический просмотр фрагмента дольше этого порога может инициировать создание Automatic Bookmark.
- Threshold criteria for eye-tracking (Пороговые критерии для отслеживания взгляда): Определенные параметры продолжительности или локации взгляда для создания Automatic Bookmark.
Выводы
- Гиперперсонализация на основе реального интереса: Ключевой вывод — Google использует гранулярные взаимодействия (выделение текста, медленное чтение) как сильные сигналы интереса пользователя. Эти сигналы напрямую используются для модификации будущих поисковых выдач для этого пользователя.
- Выделенный контент как контекст для нового поиска: Система не просто напоминает о старом контенте, но активно использует содержание выделенного текста для поиска и включения в выдачу других релевантных результатов (Claim 1, 7). Это превращает историю взаимодействий в инструмент для уточнения интента.
- Гранулярное отслеживание вовлеченности: Патент детализирует отслеживание поведения внутри страницы (скорость прокрутки, задержка, eye-tracking) для автоматического определения важного контента (Automatic Bookmarks), даже без явных действий пользователя.
- Интеграция браузера и поиска: Реализация этих функций требует тесной интеграции между средой просмотра (браузер/приложение) и поисковой системой, подчеркивая преимущества экосистемы Google (Chrome, Android) в сборе и использовании данных о поведении.
- Управление версиями контента: Система учитывает изменения на веб-страницах и предлагает пользователю выбор между актуальной версией и сохраненной копией с его пометками, что важно для динамического веба.
Практика
Best practices (это мы делаем)
- Создание контента, достойного выделения (Highlight-worthy content): Разрабатывайте глубокий, информативный контент, содержащий ключевые выводы, определения, цитаты и данные, которые пользователи захотят сохранить. Это увеличивает вероятность того, что ваш контент (и связанный с ним контент) будет повторно показан пользователю.
- Оптимизация под глубокое вовлечение (Engagement Optimization): Структурируйте контент так, чтобы стимулировать вдумчивое, медленное чтение. Длительное взаимодействие и задержка на фрагментах могут привести к созданию Automatic Bookmarks, улучшая UX при возврате пользователя.
- Улучшение читабельности и UX: Используйте чистый дизайн, удобную типографику и избегайте агрессивных всплывающих окон (CLS). Техническая реализация не должна мешать выделению текста. Хороший UX способствует генерации позитивных сигналов вовлеченности.
- Построение тематического авторитета (Topical Authority): Поскольку выделения на одной странице могут влиять на ранжирование других страниц, важно создавать кластеры качественного контента. Если пользователь проявил интерес к теме на вашем сайте, система может предложить ему другие ваши страницы по смежным запросам.
Worst practices (это делать не надо)
- Блокировка выделения и копирования текста: Использование скриптов, препятствующих взаимодействию с текстом, напрямую контрпродуктивно для механизмов, описанных в патенте.
- Фокус на кликбейте и поверхностном контенте (Thin Content): Контент, который быстро просматривается и не предоставляет ценности для глубокого изучения, не активирует эти механизмы персонализации.
- Игнорирование сигналов вовлеченности: Стратегии, основанные только на привлечении трафика без работы над удержанием и вовлечением, упускают возможность закрепиться в персональной поисковой истории пользователя.
Стратегическое значение
Патент подчеркивает стратегический сдвиг в сторону оценки качества взаимодействия (Quality of Engagement) и оптимизации пути пользователя (User Journey). В персонализированном поиске вовлеченность пользователя с контентом становится фактором, влияющим на будущую видимость. Это механизм усиления: авторитетные сайты, с которыми пользователи глубоко взаимодействуют, становятся еще более видимыми в их персональной выдаче. Для SEO это означает, что важно не только то, на что пользователь кликает, но и то, что он читает и считает важным.
Практические примеры
Сценарий: Использование вовлеченности для персонализации SERP в информационной нише
- Действие пользователя (T1): Пользователь читает на Сайте А подробную статью об «Интервальном голодании». Он медленно изучает раздел о «Влиянии на метаболизм» (система создает Automatic Bookmark) и явно выделяет абзац, описывающий протокол 16/8.
- Последующий поиск (T2): Через несколько дней пользователь ищет «планирование питания».
- Персонализация SERP:
- Система распознает контекст предыдущего интереса. Статья с Сайта А может появиться в выдаче с аннотацией: «Вы читали об интервальном голодании на этом сайте ранее».
- Система анализирует содержание выделенного текста (протокол 16/8) и использует его для подбора других результатов (Claim 1, 7). В выдаче могут быть повышены результаты с Сайта Б и В, предлагающие планы питания, специфичные для интервального голодания 16/8.
- Возврат на сайт: Если пользователь кликает на Сайт А, браузер автоматически прокручивает страницу к разделу о метаболизме или протоколу 16/8 (Last viewed portion).
Вопросы и ответы
Что самое важное в этом патенте для SEO-специалиста?
Ключевой момент — это подтверждение того, что Google использует содержание фрагментов, которые пользователь выделил на странице, для влияния на его будущие поисковые выдачи. В частности, Claims 1 и 7 указывают, что эти данные используются для определения и показа других релевантных результатов. Это означает, что вовлечение пользователя с вашим контентом напрямую влияет на его персонализированный поиск.
Являются ли выделение текста или скорость прокрутки факторами глобального ранжирования?
Нет, патент не описывает использование этих метрик для глобального ранжирования. Он сосредоточен исключительно на персонализации. Действия конкретного пользователя (выделение, медленное чтение) влияют только на его собственную будущую выдачу и опыт взаимодействия с сайтом. Это механизмы удержания и повторного вовлечения.
Что такое «Automatic Bookmark» и как система решает, когда его создать?
Это закладка, которую система создает автоматически, без явного запроса пользователя. Она генерируется, если система фиксирует поведение, указывающее на интерес: медленный скроллинг ниже пороговой скорости, длительный статический просмотр фрагмента (задержка внимания) или, опционально, на основе данных отслеживания взгляда (eye-tracking).
Упоминается ли в патенте отслеживание взгляда (eye-tracking)?
Да, в Claim 11 упоминается возможность использования камеры устройства для определения фокальной точки (focal point) взгляда пользователя. Эти данные могут использоваться для более точного создания Automatic Bookmarks в местах, куда пользователь действительно смотрел. Это показывает направление исследований Google в анализе вовлеченности.
Как система обрабатывает ситуации, когда контент на странице изменился после того, как пользователь его выделил?
Патент описывает механизм управления версиями (Claim 19). Система обнаруживает наличие новой версии страницы. Пользователю предоставляется интерфейс для выбора: просмотреть актуальную (живую) версию или старую версию (сохраненную копию), содержащую его выделения. Это позволяет не терять контекст даже на динамических сайтах.
Какие практические действия следует предпринять для оптимизации под этот патент?
Необходимо сместить фокус на создание контента, стимулирующего глубокое вовлечение. Контент должен быть структурирован так, чтобы его хотелось изучать медленно (стимулируя Automatic Bookmarks) и он содержал четкие, ценные фрагменты, которые пользователи захотят выделить (например, определения, выводы, данные).
Где собираются и хранятся эти данные о поведении?
Сбор данных происходит на стороне клиента (браузер или приложение). Патент указывает (Claim 6), что данные ассоциируются с профилем пользователя (user profile). Это подразумевает хранение в персональном индексе пользователя, доступном поисковой системе для персонализации.
Влияют ли эти механизмы на всех пользователей?
Нет. Это механизм глубокой персонализации. Он влияет только на выдачу того пользователя, который совершил взаимодействие. Для его работы пользователь, вероятно, должен использовать экосистему Google (например, Chrome/Google App) и быть авторизованным в своем аккаунте.
Как отображаются ранее выделенные результаты в SERP?
Патент предлагает несколько вариантов. Это может быть текстовая аннотация рядом с результатом (например, «Вы выделяли части этой страницы вчера»), включение самого выделенного текста в сниппет результата или отображение этих результатов в отдельном блоке SERP (например, «Ранее выделенные страницы»).
Может ли выделение контента на моем сайте помочь ранжированию других моих страниц?
Да, потенциально может в рамках персонализированной выдачи. Если система использует содержание выделенного текста для подбора других релевантных результатов, и ваш сайт является авторитетным источником по этой теме, система может предложить пользователю другие страницы вашего сайта по смежным запросам, основываясь на его предыдущем интересе.