Как Google создает приватный, доступный для поиска кэш персонализированных и динамических веб-страниц, посещенных пользователем

Google фиксирует точное персонализированное и динамическое содержимое (например, ленты социальных сетей или корзины покупок), которое видит пользователь, и сохраняет его в приватном Персональном Кэше. Это позволяет пользователям искать и просматривать историю своих посещений именно в том виде, в котором они ее видели, включая контент, недоступный в публичном индексе.

Описание

Какую задачу решает

Патент решает проблему ограничений публичного сканирования (public crawling). Публичные краулеры (например, Googlebot) не могут получить доступ к контенту, требующему авторизации, и часто упускают высоко динамический или персонализированный контент (например, ленты новостей, адаптированные под пользователя, или содержимое корзины покупок). Изобретение позволяет фиксировать веб-документы именно в том виде и в тот момент, когда их просматривал конкретный пользователь, обеспечивая возможность последующего поиска по этому специфическому контенту.

Что запатентовано

Запатентована система для создания Personal Cache (Персонального Кэша) и Personal Index (Персонального Индекса). Система получает данные непосредственно с устройства пользователя, фиксируя Document Identifier (например, URL) и Specific Content — динамический контент, адаптированный под пользователя на момент доступа. Эти данные сохраняются в защищенном хранилище и становятся доступными для поиска только для этого пользователя.

Как это работает

Механизм работает следующим образом:

Сбор данных на клиенте: Приложение на устройстве пользователя (например, браузер) фиксирует URL и отрисованный (rendered), персонализированный контент, который видит пользователь.
Передача данных: Эта информация отправляется в систему обработки контента Google (Content Processing System).
Обработка и хранение: Система идентифицирует аккаунт пользователя (Account), определяет временную метку (Timestamp information) и сохраняет данные в Personal Cache пользователя.
Конфиденциальность: Доступ к этим записям строго ограничен и привязан к аккаунту пользователя.
Поиск и отображение: Когда пользователь выполняет поиск, система проверяет его Personal Cache. Релевантные результаты из кэша внедряются в поисковую выдачу с указанием, что это персональный результат.

Актуальность для SEO

Высокая. Патент был выдан в 2023 году (являясь продолжением более ранних заявок) и напрямую связан с современными тенденциями глубокой персонализации веба и обработки динамического контента. Существующие функции Google, такие как поиск по личной истории (например, Gmail или история просмотров при включенной синхронизации), подтверждают реализацию описанных концепций.

Важность для SEO

Влияние на традиционное SEO минимальное (2/10). Этот патент описывает инфраструктуру для функций персонализированного поиска, а не алгоритмы ранжирования в публичном индексе. Он не предлагает прямых действий для SEO-специалистов по оптимизации сайтов для широкой публики. Его ценность заключается в понимании того, как Google собирает данные, недоступные Googlebot, и как функционирует разделение между публичным и персональным индексом.

Детальный разбор

Термины и определения

Personal Cache (Персональный Кэш): Приватное хранилище данных пользователя, содержащее записи о посещенных им веб-документах, включая точное содержимое, которое было ему показано.
Personal Index (Персональный Индекс): Индекс, созданный на основе содержимого Personal Cache, позволяющий пользователю эффективно искать информацию в своей личной истории посещений.
Document Identifier (Идентификатор Документа): Уникальный идентификатор веб-документа, например, URI или URL.
Specific Content (Специфическое Содержимое): Динамический контент веб-документа, который адаптирован (tailored) под конкретного пользователя в определенное время доступа и отрисован (rendered) на его устройстве. Согласно патенту (Claim 1), может включать контент, основанный на интересах пользователя, и исключает рекламу (excludes any advertisements).
Dynamic Document (Динамический документ): Электронный документ, содержимое которого часто меняется или адаптируется под конкретного пользователя или группу пользователей.
Navigation Information (Навигационная информация): Данные, указывающие на действия пользователя при переходе к веб-документу. Могут включать URL реферера (referrer URL), предыдущие поисковые запросы или информацию о ранее посещенных документах.
Account (Аккаунт): Учетная запись пользователя, используемая для идентификации и ограничения доступа к Personal Cache.
Timestamp Information (Информация о временной метке): Данные, определяющие дату и/или время доступа пользователя к веб-документу.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы сбора, хранения и поиска персональных данных.

Система получает с устройства пользователя (через приложение):
- Идентификатор динамического электронного документа.
- Specific Content этого документа. Это динамический контент, адаптированный под пользователя на момент доступа и отрисованный в это время. Уточняется, что этот контент исключает рекламу и адаптирован на основе интересов пользователя.
Система определяет Timestamp Information (дату/время доступа).
Система идентифицирует Account, в который пользователь вошел на момент доступа.
Система сохраняет запись в Personal Cache пользователя, связывая идентификатор документа, Specific Content и временную метку.
Система ограничивает доступ к Personal Cache на основе Account, разрешая доступ только этому пользователю и запрещая доступ любым другим пользователям (preventing access to the entry by any other users).
После сохранения:
- Пользователь отправляет поисковый запрос (будучи авторизованным в аккаунте).
- Система обращается к Personal Cache и определяет, что сохраненная запись релевантна запросу.
- В ответ на запрос система отображает контент из этой записи (включая Specific Content) вместе с указанием, что это персональный результат, основанный на предыдущем доступе пользователя к документу.

Claim 2 (Зависимый): Дополняет Claim 1 тем, что система также может получать Navigation Information (информацию о действиях пользователя по переходу к документу, например, с какого предыдущего документа он перешел) и сохранять ее в записи кэша.

Claim 3 (Зависимый): Дополняет Claim 2 тем, что Navigation Information может включать конкретный поисковый запрос, который привел к доступу к документу. Определение релевантности записи последующему поисковому запросу может основываться на схожести (similarity) между новым запросом и запросом, сохраненным в Navigation Information.

Где и как применяется

Этот патент описывает механизм, который функционирует параллельно стандартной архитектуре поиска, фокусируясь на сборе и использовании персональных данных.

CRAWLING – Сбор данных (Data Acquisition)
Основное применение. Система обходит традиционное сканирование (Googlebot). Вместо этого данные собираются непосредственно с клиентского устройства (браузера или приложения) пользователя. Это позволяет фиксировать контент, который невидим для публичных краулеров (персонализированный, динамический, защищенный авторизацией).

INDEXING – Индексирование
Полученный персонализированный контент обрабатывается Content Processing System. Система сохраняет его в Personal Cache и индексирует в Personal Index. На этом этапе применяются строгие ограничения доступа, привязанные к Account пользователя.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Когда пользователь выполняет поиск (будучи авторизованным), система параллельно запрашивает Personal Index. Если находятся релевантные персональные результаты, они смешиваются (METASEARCH) с публичными результатами и внедряются в SERP. Они помечаются специальным индикатором.

Входные данные:

Идентификатор документа (URL).
Specific Content (отрисованный динамический/персонализированный контент, без рекламы).
Идентификатор аккаунта пользователя (Account).
Navigation Information (опционально).

Выходные данные:

Запись в Personal Cache и Personal Index (приватная, с временной меткой).
Персонализированный результат в SERP пользователя (при последующем поиске).

На что влияет

Конкретные типы контента: В первую очередь влияет на динамический контент и контент, адаптированный под пользователя. Это включает ленты социальных сетей, персонализированные новостные ленты, корзины интернет-магазинов, списки рекомендаций, а также контент, защищенный авторизацией (например, электронные письма, личные кабинеты).
Специфические запросы: Влияет на запросы, когда пользователь ищет что-то, что он видел ранее (запросы типа «Re-finding»).

Когда применяется

Триггеры активации (Сбор данных): Активируется, когда пользователь, вошедший в свой Account, получает доступ к веб-документу через совместимое приложение (например, браузер), которое поддерживает эту функцию сбора данных.
Триггеры активации (Поиск): Механизм поиска активируется, когда пользователь выполняет запрос, будучи авторизованным в том же аккаунте.

Пошаговый алгоритм

Процесс А: Сбор и Кэширование (Во время просмотра)

Доступ к документу: Авторизованный пользователь открывает динамический веб-документ.
Клиентская фиксация: Приложение на устройстве пользователя фиксирует идентификатор документа (URL) и Specific Content (отрисованный контент, адаптированный под пользователя, исключая рекламу).
Передача данных: Приложение отправляет URL, контент и идентификатор аккаунта пользователя в Content Processing System. Опционально передается Navigation Information.
Обработка на сервере: Система проверяет аккаунт и определяет текущее время (Timestamp Information).
Сохранение в Personal Cache: Система создает новую запись в Personal Cache пользователя, связывая URL, контент и временную метку.
Индексирование в Personal Index: Контент анализируется и добавляется в Personal Index пользователя.
Применение ограничений доступа: Система гарантирует, что доступ к записи имеет только владелец аккаунта.

Процесс Б: Поиск и Извлечение (Во время поиска)

Получение запроса: Авторизованный пользователь вводит поисковый запрос.
Поиск в персональном индексе: Система выполняет поиск в Personal Index пользователя.
Определение релевантности: Система определяет, есть ли в Personal Index записи, релевантные запросу (например, сравнивая запрос с контентом или с сохраненной Navigation Information).
Смешивание и отображение: Релевантные персональные результаты объединяются с публичными результатами. Пользователю предоставляется смешанная выдача, где персональные результаты помечены специальным индикатором.

Какие данные и как использует

Данные на входе

Система использует данные, получаемые преимущественно с устройства пользователя:

Контентные факторы: Используется Specific Content — весь отрисованный контент страницы, который является динамическим и адаптированным под пользователя. Включает текст, структуру, медиа и т.д., как они были представлены пользователю. Согласно Claim 1, реклама (advertisements) исключается из этого контента.
Технические факторы: Document Identifier (URL или URI) используется для идентификации ресурса.
Пользовательские факторы: Критически важны данные об аккаунте пользователя (Account) для обеспечения конфиденциальности и привязки данных.
Временные факторы: Timestamp Information (точное время доступа к документу).
Поведенческие/Навигационные факторы (Опционально): Navigation Information — данные о том, как пользователь попал на страницу (поисковые запросы, рефереры), используются для добавления контекста к кэшированной записи.

Какие метрики используются и как они считаются

Патент сосредоточен на механизме сбора, хранения и извлечения данных, а не на алгоритмах ранжирования.

Релевантность: Система определяет, является ли запись в кэше «responsive to the search query» (релевантной поисковому запросу). Конкретные методы расчета релевантности не описаны.
Сходство запросов (Query Similarity): Если используется Navigation Information, релевантность может определяться на основе сходства (similarity) между текущим запросом пользователя и поисковым запросом, который изначально привел его на кэшированную страницу (Claim 3).

Выводы

Сбор данных за пределами Googlebot: Патент описывает механизм сбора данных непосредственно с клиентских устройств. Это позволяет Google фиксировать контент, который невидим для стандартных краулеров: динамический, глубоко персонализированный и защищенный авторизацией.
Существование Персонального Индекса: Подтверждается существование Personal Cache и Personal Index, которые отделены от публичного индекса. Данные в них строго привязаны к конкретному пользователю и защищены от доступа других лиц.
Фокус на отрисованном состоянии: Система фиксирует отрисованное (rendered) состояние документа, что критически важно для современных веб-приложений, использующих JavaScript для генерации контента.
Персонализация SERP (Re-finding): Основная цель — не улучшение публичного ранжирования, а предоставление пользователю возможности находить контент, который он видел ранее. Механизм явно предназначен для внедрения этих персональных результатов в поисковую выдачу пользователя.
Инфраструктурный характер: Это не патент о ранжировании в публичном поиске. Он описывает инфраструктуру для сбора и использования персональных данных для улучшения поискового опыта конкретного пользователя.

Практика

Этот патент носит инфраструктурный характер и описывает механизмы персонализированного поиска. Он не дает прямых практических рекомендаций для традиционного SEO, направленного на оптимизацию сайтов для публичного ранжирования.

Best practices (это мы делаем)

Понимание границ персонализации: SEO-специалистам следует понимать, что помимо публичного индекса, Google может использовать приватные данные (историю просмотров) для глубокой персонализации выдачи. Это важно учитывать при анализе позиций и видимости для авторизованных пользователей.
Обеспечение корректного рендеринга персонализации: Убедитесь, что динамический и персонализированный контент (рекомендации, личные кабинеты) корректно и быстро рендерится на клиенте. Именно это состояние будет зафиксировано системой Personal Cache.
Структурирование персонализированного контента: Убедитесь, что контент в закрытых или динамических зонах сайта четко структурирован и содержит ясные текстовые описания. Это улучшит опыт пользователя, если этот контент попадет в его Personal Index и будет позже найден через поиск.
Стимулирование повторных визитов и лояльности: Единственный способ попасть в Personal Index пользователя — это добиться того, чтобы он посетил вашу страницу. Чем чаще пользователь взаимодействует с вашим сайтом, тем больше записей о нем будет в его Personal Cache, что повышает видимость бренда для лояльной аудитории в их персональных результатах.

Worst practices (это делать не надо)

Игнорирование персонализации SERP: Не стоит оценивать видимость сайта только по публичной органической выдаче. Необходимо учитывать, что для лояльных пользователей (вошедших в Google) выдача может выглядеть иначе за счет подмешивания персональных результатов из их истории.
Блокировка рендеринга: Проблемы с рендерингом JavaScript или медленная загрузка динамических элементов могут привести к тому, что система зафиксирует неполное или некорктное состояние страницы в Personal Cache пользователя.

Стратегическое значение

Патент подтверждает стратегический приоритет Google в области глубокой персонализации поиска. Он демонстрирует инфраструктуру, позволяющую учитывать не только публичный контент, но и индивидуальный опыт пользователя. Для SEO это означает, что долгосрочная стратегия должна учитывать два уровня видимости: публичный органический поиск и персонализированный поиск для лояльных пользователей. Построение бренда и предоставление качественного персонализированного опыта важны для обеспечения видимости в персональных результатах.

Практические примеры

Практических примеров для применения в публичном SEO нет. Примеры касаются улучшения пользовательского опыта в рамках персонализированного поиска.

Сценарий: Поиск ранее просмотренного товара в персонализированной сессии

Исходное посещение: Пользователь авторизован в Google и заходит на сайт интернет-магазина. Ему отображается главная страница с блоком «Рекомендовано для вас» (динамический, персонализированный контент), где показан Синий Виджет.
Фиксация данных: Система Google фиксирует URL, отрисованный контент (включая Синий Виджет в блоке рекомендаций) и время посещения в Personal Cache пользователя.
Последующий поиск: Через неделю пользователь ищет в Google «синий виджет».
Извлечение и отображение: Система Google находит запись о Синем Виджете в Personal Cache пользователя. В поисковой выдаче, наряду с публичными результатами, пользователю показывается ссылка на интернет-магазин с пометкой о том, что он видел этот товар ранее (персональный результат).

Вопросы и ответы

Влияет ли описанный механизм на ранжирование сайта в публичном индексе Google?

Нет, напрямую не влияет. Патент описывает создание Personal Cache и Personal Index, которые являются приватными для каждого пользователя. Результаты из этого индекса подмешиваются только в персональную выдачу этого пользователя и не влияют на то, как сайт ранжируется для остальных людей в публичном поиске.

Каким образом Google получает эти данные? Это делает Googlebot?

Нет, этот механизм работает независимо от Googlebot. Данные собираются непосредственно с устройства пользователя через приложения, работающие на нем (например, браузер Chrome или приложение Google). Это позволяет фиксировать контент в том виде, в котором он был отрисован для конкретного пользователя.

Какой тип контента фиксируется в Personal Cache?

Фиксируется Specific Content — это динамический контент, адаптированный под пользователя. Примеры включают персонализированные новостные ленты, ленты социальных сетей, корзины покупок, блоки рекомендаций товаров. Патент (Claim 1) отдельно уточняет, что реклама исключается из этого контента.

Означает ли это, что Google видит и сохраняет весь персонализированный контент, который вижу я, включая закрытые разделы сайта?

Да, система предназначена для фиксации контента, недоступного публичным краулерам, если вы используете совместимые приложения, вошли в свой аккаунт Google и дали согласие на сбор истории. Однако доступ к этому кэшу строго ограничен вашим аккаунтом.

Как SEO-специалист может оптимизировать сайт для этого механизма?

Прямая оптимизация невозможна, так как это персональный индекс. Однако можно сосредоточиться на стратегиях, которые косвенно улучшают видимость: стимулировать повторные визиты, повышать лояльность пользователей и обеспечивать, чтобы динамический и персонализированный контент на вашем сайте был ценным, хорошо структурированным и корректно рендерился.

Связан ли этот патент с историей просмотров в браузере Chrome?

Да, концептуально они тесно связаны. Этот патент описывает инфраструктуру, которая позволяет не просто сохранять список посещенных URL (как базовая история браузера), но и кэшировать точное содержимое этих страниц и делать эту информацию доступной для поиска через основную поисковую строку Google.

Что такое Navigation Information и зачем она сохраняется?

Navigation Information — это данные о том, как пользователь попал на страницу (например, по какому запросу или с какого сайта). Сохранение этой информации добавляет контекст к записи в кэше и помогает системе определить релевантность этой записи будущим запросам пользователя (Claim 3).

Помогает ли этот механизм Google лучше понимать сайты на JavaScript (SPA)?

Да. Поскольку система фиксирует отрисованное (rendered) состояние документа непосредственно из браузера пользователя, она получает полное представление о контенте, сгенерированном с помощью JavaScript, именно так, как его увидел пользователь. Это дает Google данные о финальном состоянии DOM.

Как отображаются результаты из Personal Cache в выдаче?

Патент указывает (Claim 1), что эти результаты отображаются вместе с индикацией о том, что это персональный контент, основанный на предыдущем доступе пользователя к документу. На практике это может выглядеть как отдельный блок в SERP или результат со специальной пометкой.

Если мой сайт использует глубокую персонализацию, получит ли он преимущество в поиске?

Он получит преимущество только в персонализированной выдаче тех пользователей, которые его уже посещали. Если ваш персонализированный контент оказался полезен пользователю, он с большей вероятностью увидит ваш сайт в своих персональных результатах при последующих поисках по схожим темам.