Google анализирует историю поиска и поведение пользователя (длительность сессий, клики, уточнения запроса), чтобы автоматически выявить неудовлетворенные информационные потребности и долгосрочные интересы. Система периодически перезапускает эти запросы и уведомляет пользователя о появлении новых высококачественных результатов, которые он ранее не видел.
Описание
Какую задачу решает
Патент решает проблему неэффективности и неудобства ручной настройки поисковых оповещений (например, Google Alerts). Пользователи часто имеют долгосрочные интересы (continuing interests) или сталкиваются с ситуациями, когда их информационная потребность не была удовлетворена (unfulfilled information need), но они не создают оповещения вручную. Изобретение автоматизирует выявление таких ситуаций на основе анализа поведения пользователя и обеспечивает проактивную доставку нового релевантного контента.
Что запатентовано
Запатентована система автоматического генерирования персонализированных оповещений. Система анализирует данные об использовании Интернета пользователем (Internet usage data), включая историю запросов и поведение в рамках поисковых сессий, чтобы идентифицировать запросы, соответствующие неудовлетворенным потребностям. Эти запросы автоматически перезапускаются, и если обнаруживаются новые качественные результаты, система уведомляет пользователя.
Как это работает
Система работает в несколько этапов:
- Сбор данных и анализ сессий: Система собирает и группирует действия пользователя (запросы, клики, уточнения) в поисковые сессии (Query Sessions).
- Идентификация неудовлетворенности: Анализируются поведенческие сигналы. Превышение порогов по длительности сессии, количеству кликов или long clicks интерпретируется как признак неудовлетворенной потребности.
- Автоматический перезапуск: Идентифицированные запросы периодически перезапускаются системой автоматически.
- Оценка новых результатов: Новые результаты оцениваются по критериям новизны (пользователь их не видел) и качества (например, PR score – Popularity and Relevance Score).
- Оповещение: Ссылки на новые релевантные результаты отправляются пользователю (например, в ленту рекомендаций, такую как Google Discover).
Актуальность для SEO
Критически высокая. Хотя концепция была впервые подана в 2005 году, этот патент (выданный в 2019) описывает фундаментальные принципы работы современных проактивных систем рекомендаций, таких как Google Discover. Автоматическое определение интересов и удовлетворенности пользователя на основе его поведения является ключевым элементом современного поиска.
Важность для SEO
Патент имеет высокое стратегическое значение (8/10). Он не описывает алгоритмы глобального ранжирования, но детально раскрывает механизм, лежащий в основе персонализированной доставки контента (Google Discover). Он подтверждает, как Google анализирует поведенческие факторы (dwell time, pogo-sticking в рамках сессии) для оценки удовлетворенности пользователя. Для SEO это подчеркивает важность создания свежего, авторитетного контента, который полностью удовлетворяет интент, для получения трафика из рекомендательных систем.
Детальный разбор
Термины и определения
- Continuing Interest (Постоянный/Долгосрочный интерес)
- Запрос или тема, по которой пользователь заинтересован получать обновления. Система идентифицирует их автоматически.
- Query Session (Поисковая сессия)
- Все действия, связанные с исходным запросом, включая клики по результатам, просмотр следующих страниц выдачи и уточнения запроса (refinements).
- Refinement (Уточнение)
- Последующее действие пользователя в рамках сессии для сужения или изменения поиска. Включает изменение текста запроса, исправление орфографии или переход на следующую страницу результатов.
- Long Clicks (Долгие клики)
- Клик по результату с последующим просмотром страницы в течение значительного времени (аналог Dwell Time). Используется как индикатор интереса и для определения неудовлетворенности.
- Internet Usage Data (Данные об использовании Интернета)
- Собранная информация о действиях пользователя: запросы, клики, длительность сессий, просмотренные URL.
- Interest Score (Оценка интереса)
- Метрика, рассчитываемая для поисковой сессии (упоминается в описании патента), которая коррелирует с вероятностью того, что у пользователя сохраняется интерес к данной теме.
- PR Score (Popularity and Relevance Score)
- Оценка качества результата. Включает факторы релевантности запросу (например, TF-IDF, анкоры) и статические показатели популярности/авторитетности (например, PageRank).
- Navigational Queries (Навигационные запросы)
- Запросы для поиска конкретного веб-сайта. Обычно характеризуются одним кликом и отсутствием уточнений. Исключаются из анализа.
- Unfulfilled Information Need (Неудовлетворенная информационная потребность)
- Ситуация, когда пользователь не нашел искомую информацию. Выявляется по поведенческим признакам в рамках сессии.
Ключевые утверждения (Анализ Claims)
Анализ фокусируется на финальной версии патента (US10289712B2, 2019 год), где Claims сфокусированы на определении неудовлетворенной потребности.
Claim 1 (Независимый пункт): Описывает основной процесс с точки зрения пользовательского устройства (клиента).
- Устройство отправляет запрос в поисковую систему.
- Устройство получает первый набор результатов.
- Устройство отправляет данные, которые указывают на то, что пользователь не нашел искомую информацию в первом наборе результатов (свидетельство Unfulfilled Information Need).
- В ответ на последующую автоматическую вторую отправку того же запроса (выполненную системой позже), устройство получает обновленный набор результатов, содержащий новый результат.
- Устройство отображает новый результат, исходный запрос и индикацию того, что результат является новым.
Ядром изобретения является автоматическое определение неудовлетворенной потребности на основе поведенческих данных и последующее автоматическое отслеживание новых результатов.
Claims 3, 5, 6 (Зависимые от 1): Уточняют, как именно определяется, что пользователь «не нашел» информацию. Это происходит, если поведенческие метрики превышают определенные пороги:
- Claim 3: Длительность поисковой сессии (duration of a search session) превышает порог.
- Claim 5: Количество выборов (кликов) в наборе результатов превышает порог.
- Claim 6: Количество результатов, просмотренных дольше определенного времени (long clicks), превышает порог.
Высокая активность (длинная сессия, много кликов) интерпретируется как признак того, что пользователь прилагал усилия, но не был удовлетворен.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, в основном связанных с анализом поведения пользователей и персонализацией.
INDEXING – Индексирование и извлечение признаков
На этом этапе рассчитываются статические метрики качества документов (часть PR Score, например, PageRank), которые позже используются для фильтрации новых результатов.
QUNDERSTANDING – Понимание Запросов (и Пользователей)
Основная часть работы происходит здесь (в офлайн-режиме или периодически). Система анализирует Internet Usage Data пользователя (логи запросов, клики, сессии), чтобы определить Unfulfilled Information Needs и Continuing Interests.
RANKING – Ранжирование
Система периодически перезапускает (reruns) идентифицированные запросы, используя стандартные механизмы ранжирования.
RERANKING / METASEARCH – Переранжирование / Метапоиск и Смешивание
Происходит фильтрация результатов перезапущенных запросов. Система сравнивает их с историей пользователя, чтобы найти новые результаты, и применяет критерии отбора (search result selection criteria). Затем эти результаты доставляются пользователю в виде оповещений или рекомендаций (например, в ленте Discover).
Входные данные:
- История поисковых запросов и данные о кликах (click data).
- Данные о поисковых сессиях (длительность, уточнения) и long clicks (dwell time).
- Текущий поисковый индекс и метрики качества документов (PR scores).
Выходные данные:
- Список ссылок на новые документы, релевантные прошлым запросам пользователя (персонализированные оповещения/рекомендации).
На что влияет
- Специфические запросы: Наибольшее влияние на информационные и исследовательские запросы, требующие глубокого изучения или мониторинга. Навигационные запросы исключаются.
- Типы контента: Влияет на любой тип контента, особенно на новый или недавно обновленный, который может удовлетворить постоянный интерес.
- Конкретные ниши: Влияет на динамичные ниши, где часто появляется новый контент (новости, технологии, хобби, сложные коммерческие или YMYL тематики).
Когда применяется
- Триггеры активации: Алгоритм активируется для запроса, если анализ поисковой сессии показывает признаки неудовлетворенной потребности (превышение порогов по длительности сессии, количеству кликов или long clicks, согласно Claims 3, 5, 6).
- Временные рамки: Перезапуск происходит автоматически: периодически (ежедневно, еженедельно) или при наступлении событий (например, вход пользователя в систему).
Пошаговый алгоритм
Фаза А: Идентификация неудовлетворенных потребностей (Офлайн или периодически)
- Доступ к данным: Система получает доступ к Internet Usage Data пользователя.
- Группировка в сессии: Запросы и связанные действия группируются в Query Sessions.
- Анализ сессий и расчет метрик: Вычисляются длительность сессии, количество кликов, количество long clicks, количество уточнений.
- Определение неудовлетворенной потребности: Система проверяет, превышают ли метрики сессии установленные пороги (согласно Claims 3, 5, 6).
- Выбор запросов: Выбираются запросы из сессий, которые соответствуют критериям неудовлетворенности (и не являются навигационными). В описании патента также упоминается расчет Interest Score для оценки общего интереса.
Фаза Б: Генерация рекомендаций (Офлайн или периодически)
- Перезапуск запросов: Система автоматически перезапускает выбранные запросы.
- Фильтрация по новизне: Результаты сравниваются с историей пользователя. Отбираются только те URL (или домены), которые пользователь ранее не видел.
- Фильтрация по качеству: К новым результатам применяются критерии отбора. Оценивается их ранг и PR Score. Рассчитывается Quality Score.
- Выбор рекомендаций: Отбираются результаты, удовлетворяющие порогам качества.
Фаза В: Доставка оповещений
- Отправка и отображение: Ссылки отправляются на клиентское устройство и отображаются пользователю с указанием исходного запроса для контекста.
Какие данные и как использует
Данные на входе
Патент в первую очередь опирается на поведенческие факторы для идентификации неудовлетворенности, а также на стандартные факторы ранжирования для оценки качества.
- Поведенческие факторы: Критически важны для определения Unfulfilled Information Need.
- Тексты поисковых запросов и их уточнения (Refinements).
- Данные о кликах (Click-Through Data).
- Длительность просмотра страницы (Long Clicks / Dwell Time).
- Длительность поисковой сессии (Session duration).
- Факторы ранжирования (Системные данные): Используются для оценки качества новых результатов.
- Ранг документа в текущей выдаче.
- PR Score (включает сигналы популярности, например PageRank, и сигналы релевантности запросу).
Какие метрики используются и как они считаются
- Критерии неудовлетворенной потребности (Claims): Используются пороговые значения. Триггер срабатывает, если: Длительность сессии > Порог T1 (Claim 3); ИЛИ Количество кликов > Порог N1 (Claim 5); ИЛИ Количество Long Clicks > Порог N2 (Claim 6).
- Quality Score (Оценка качества нового результата): Метрика для выбора наилучших новых результатов. Примеры формул из описания патента: A*(PR score) + B*(rank) или C*(PR score) + D*(1/rank), где A, B, C, D – константы.
- Interest Score (Оценка интереса): Упоминается в описании патента как агрегированная метрика для выбора запросов, представляющих постоянный интерес. Пример формулы: a*log(#clicks + #refinements) + b*log(#repetitions) + c*(history match score), где a, b, c – константы.
Выводы
- Поведенческие данные как мера удовлетворенности: Патент явно определяет (Claims 3, 5, 6), как Google использует поведенческие метрики (длительность сессии, количество кликов, long clicks/dwell time) для оценки того, нашел ли пользователь ответ. Высокая активность интерпретируется как признак неудовлетворенной потребности.
- Автоматизация на основе имплицитных сигналов: Google автоматически определяет неудовлетворенные потребности, анализируя обычное поисковое поведение, без необходимости явной подписки пользователя на оповещения.
- Фундамент для Google Discover: Описанная технология является основой для современных персонализированных лент, которые проактивно предлагают контент на основе прошлой активности и выявленных потребностей.
- Фокус на новизне и качестве: Чтобы быть рекомендованным, контент должен быть новым для пользователя (не просмотренным ранее) и иметь высокие показатели качества (PR Score, высокий ранг).
- Анализ сессий важнее отдельных запросов: Для понимания намерений и удовлетворенности анализируется вся Query Session, а не изолированный запрос.
Практика
Best practices (это мы делаем)
- Фокус на полном удовлетворении интента: Создавайте контент, который исчерпывающе отвечает на запрос. Если пользователи вынуждены возвращаться к поиску и уточнять запрос (признаки неудовлетворенной потребности), Google может начать искать альтернативы вашему контенту для рекомендации в будущем.
- Оптимизация под Google Discover: Поскольку этот патент описывает механизмы, лежащие в основе персонализированных лент, следует применять лучшие практики для Discover: фокус на сущностях, высокое качество контента (E-E-A-T) и регулярные публикации.
- Непрерывное создание и обновление контента (Freshness): Поскольку система ищет «новые» результаты, регулярная публикация свежего контента по ключевым темам увеличивает шансы попасть в эти персонализированные оповещения.
- Построение авторитетности (E-E-A-T): Система использует PR Score (включая сигналы типа PageRank) для фильтрации новых результатов. Только качественные и авторитетные источники будут рекомендованы.
- Оптимизация вовлеченности (Dwell Time): Работайте над улучшением контента для стимулирования long clicks, так как это является ключевым сигналом, анализируемым в рамках сессии (Claim 6).
Worst practices (это делать не надо)
- Кликбейт и поверхностный контент (Pogo-sticking): Контент, который приводит к коротким кликам и возврату в поиск, генерирует сигналы неудовлетворенности. Это может стимулировать систему искать альтернативы вашему контенту.
- Прекращение работы над темой после публикации: Если сайт не обновляет информацию, он не сможет воспользоваться преимуществами этой системы, так как не будет «новых» результатов для рекомендации.
- Игнорирование качества сайта: Даже если контент новый и релевантный прошлому запросу, он не будет рекомендован, если его показатели качества (PR Score) низкие.
Стратегическое значение
Патент подтверждает стратегический сдвиг Google от реактивного поиска к проактивному и персонализированному ассистенту (Google Discover). Он демонстрирует, как поведенческие данные используются для понимания удовлетворенности пользователя и формирования его будущих информационных потоков. Для SEO это подчеркивает важность работы над качеством контента, E-E-A-T и сигналами удовлетворенности пользователей как основы для видимости в персонализированных сервисах.
Практические примеры
Сценарий: Рекомендация нового контента после неудовлетворенного поиска
- Действие пользователя: Пользователь ищет «лучшие беззеркальные камеры для путешествий 2025». Он проводит долгую сессию (превышен порог длительности), кликает на 5 разных обзоров (превышен порог кликов) и уточняет запрос.
- Анализ системы: Google интерпретирует это поведение как unfulfilled information need (согласно Claims 3 и 5). Запрос помечается для мониторинга.
- Действие SEO/Контент-команды: Авторитетный сайт о фотографии через неделю публикует новый детальный обзор камер для путешествий.
- Перезапуск и рекомендация: Система Google автоматически перезапускает запрос, обнаруживает новую статью (которая имеет высокий PR Score и ранг), определяет, что пользователь ее не видел.
- Результат: Пользователь видит рекомендацию этой статьи в своей персонализированной ленте (Discover).
Вопросы и ответы
Как этот патент связан с Google Discover?
Этот патент описывает базовую механику, лежащую в основе Google Discover. Он объясняет, как Google анализирует историю поиска и поведение пользователя (Query Sessions), чтобы автоматически определить его интересы и проактивно рекомендовать новый релевантный контент без активного поиска со стороны пользователя.
Как Google определяет, что пользователь НЕ удовлетворен результатами поиска?
Патент (в частности, Claims 3, 5, 6) описывает конкретные поведенческие триггеры. Неудовлетворенность определяется, если превышены пороги по длительности поисковой сессии, общему количеству кликов или количеству «долгих кликов» (long clicks). Высокая активность часто указывает на то, что пользователь прилагает усилия, но не находит ответа.
Влияет ли этот механизм на стандартное органическое ранжирование?
Напрямую нет. Патент описывает систему генерации персонализированных оповещений, которая работает поверх стандартного ранжирования. Однако поведенческие сигналы (удовлетворенность сессии, dwell time), которые анализируются здесь, с высокой вероятностью используются Google и в основных алгоритмах для оценки качества контента.
Что такое PR Score, упомянутый в патенте?
PR Score (Popularity and Relevance Score) – это комбинированная оценка качества и релевантности документа. Она включает как статические сигналы популярности (упоминается PageRank), так и сигналы релевантности конкретному запросу. Система использует этот показатель для фильтрации, чтобы рекомендовать только качественный новый контент.
Как SEO-специалист может оптимизировать контент, чтобы он попадал в эти оповещения (Discover)?
Необходимо фокусироваться на трех аспектах: Свежесть (регулярные публикации/обновления), Качество (сигналы E-E-A-T, влияющие на PR score) и Тематический авторитет. Создавайте контент, который глубоко прорабатывает темы, представляющие долгосрочный интерес для вашей аудитории.
Почему система исключает навигационные запросы?
Навигационные запросы (например, «facebook вход») подразумевают поиск конкретного сайта. Как только пользователь его находит, его потребность удовлетворена. Он не заинтересован в получении *новых* результатов по этому запросу в будущем, поэтому такие запросы не отслеживаются системой оповещений.
Что важнее для попадания в рекомендации: новизна контента или его качество?
Оба фактора критичны. Контент должен быть новым для конкретного пользователя (т.е. он его ранее не видел) И должен соответствовать высоким стандартам качества (PR Score, ранг). Новый, но некачественный контент рекомендован не будет.
Насколько важен Dwell Time (время на сайте) в контексте этого патента?
Он очень важен. Патент явно упоминает Long Clicks (долгие клики) как индикатор интереса. Более того, количество Long Clicks используется как один из способов определения неудовлетворенной информационной потребности (Claim 6). Это подчеркивает необходимость оптимизации контента для вовлечения пользователя.
Что такое «Query Session» и почему анализируется именно она?
Query Session – это вся последовательность действий пользователя, связанных с исходным запросом (клики, уточнения, переходы по страницам). Анализ сессии, а не отдельного запроса, дает гораздо больше контекста о реальном намерении пользователя, уровне его заинтересованности и о том, удалось ли ему найти нужную информацию.
Если мой сайт вызвал у пользователя неудовлетворенность (например, Pogo-sticking), это плохо для SEO?
Да. Если пользователи регулярно покидают ваш сайт и продолжают поиск в рамках той же сессии, это генерирует сигналы unfulfilled information need. Хотя этот патент использует эти сигналы для запуска поиска альтернатив, такие негативные поведенческие сигналы также учитываются основными системами оценки качества Google и могут негативно влиять на ранжирование.