
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
Патент решает задачу проактивного предоставления пользователю информации, которая с высокой вероятностью будет ему интересна или полезна в его текущем контексте (User Context), без необходимости формулировать и вводить поисковый запрос. Цель — предсказать информационные потребности пользователя на основе анализа больших массивов агрегированных данных о поведении других пользователей в аналогичных ситуациях.
Запатентована система прогнозирования контекстно-релевантного контента. Система собирает данные о действиях пользователей (User Activity Data) и организует их во временные Sessions (сессии). Ядром изобретения является метод статистического сравнения: система определяет, какие веб-сайты посещаются пользователями с определенным контекстом значительно чаще, чем пользователями в целом. Это позволяет выявлять контент, релевантный именно для данного контекста.
Система работает следующим образом:
User Context пользователя (местоположение, время, интересы, недавние действия, будущие события).Matching Sessions), чей контекст совпадает с текущим контекстом пользователя.Matching Sessions с частотой их посещения во всех сессиях (General Sessions).Signal S, который отражает, насколько вероятнее посещение сайта в данном контексте по сравнению с общей вероятностью.Signal S фильтруются (например, удаляются общепопулярные ресурсы) и предоставляются пользователю проактивно.Высокая. Патент описывает фундаментальные механизмы, лежащие в основе современных систем рекомендаций контента и предиктивного поиска, таких как Google Discover (ранее Google Now). Контекстуализация и персонализация пользовательского опыта остаются ключевыми направлениями развития поисковых технологий.
Патент имеет высокое стратегическое значение для SEO (85/100), особенно в контексте оптимизации под рекомендательные системы (Google Discover Optimization). Он демонстрирует механизм, при котором видимость контента определяется не традиционными факторами (ключевые слова, ссылки), а статистической популярностью контента среди определенного сегмента пользователей в специфическом контексте (локация, время, интересы). Понимание этого механизма критически важно для привлечения трафика из источников, не требующих ввода запроса.
User Context, чем пользователям в целом.User Activity Data для конкретного пользователя за определенный период времени. Позволяет находить корреляции между действиями, разделенными во времени.User Context, используемый для поиска в индексе сессий. Определяет атрибуты контекста искомых сессий.Session Query, то есть контекст которых совпадает с заданным User Context.Session Query по сравнению с вероятностью этого действия во всех сессиях. Используется для ранжирования контекстно-релевантной информации.User Activity Data для прогнозирования релевантного контента.Claim 1 (Независимый пункт): Описывает основной метод предоставления контекстно-релевантной информации.
User Context пользователя (включая местоположение устройства).User Activity Data, организованные в Sessions (каждая сессия содержит множество действий пользователя за период времени).Matching Sessions для полученного контекста (сессии, включающие посещения сайтов пользователями с совпадающим контекстом).General Sessions.likely websites) — те, которые встречаются в Matching Sessions чаще, чем в General Sessions.Claim 3 (Зависимый от 1): Уточняет процесс определения вероятных веб-сайтов.
Определение включает генерацию Session Query из User Context и идентификацию Matching Sessions из индексированной коллекции сессий, которые удовлетворяют этому запросу.
Claim 5 (Зависимый от 3): Вводит понятие метрики для оценки.
Процесс включает вычисление Signal для каждого веб-сайта, встречающегося в Matching Sessions. Этот сигнал представляет вероятность того, что пользователи, соответствующие контексту, посетят сайт, по сравнению с вероятностью того, что пользователи в целом посетят этот сайт.
Claim 6 (Зависимый от 5): Определяет формулу для вычисления Сигнала S.
Сигнал S вычисляется по формуле: . Это отношение частоты действия в контексте к базовой частоте действия.
Claim 7 (Зависимый от 1): Ключевое уточнение о способе предоставления информации.
Предоставление информации (ссылок на сайты) на устройство пользователя происходит НЕ в ответ на поисковый запрос (search query) от устройства. Это подчеркивает проактивный (предиктивный) характер системы.
Claim 8 (Зависимый от 1): Определяет состав User Context.
Контекст может включать язык, интересы пользователя, время суток, дату, сезон, домашний город, предыдущий запрос, предыдущий посещенный сайт или будущее событие.
Claim 9 (Зависимый от 1): Описывает механизм фильтрации для повышения локальной релевантности.
Система может определить вероятные сайты для второго контекста, который указывает на другое географическое местоположение (находящееся на пороговом расстоянии от текущего). Затем система модифицирует исходный список сайтов, отфильтровывая из него сайты, которые также популярны в другом местоположении. Это позволяет оставить только гиперлокальные результаты.
Изобретение применяется в системах предиктивного поиска и рекомендаций контента (например, Google Discover) и затрагивает специфические этапы обработки данных.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит сбор, обработка и индексация не веб-контента, а данных о поведении пользователей. User Activity Data агрегируются, анонимизируются и организуются в Sessions. Эти сессии индексируются (indexed collection of sessions) по множеству признаков, составляющих User Context (локация, время, интересы пользователя и т.д.). Также на этом этапе собираются данные профилей пользователей (User Profile Database).
RANKING / METASEARCH (Предиктивное ранжирование)
Основное применение патента происходит в момент, когда система должна предоставить контент пользователю без явного запроса.
User Context в реальном времени.Prediction Engine генерирует Session Query и запрашивает индекс сессий.Matching Sessions, сравнивает их с General Sessions и вычисляет Signal S для потенциальных сайтов. Сайты ранжируются на основе этого сигнала.Входные данные:
User Context пользователя (локация, время, интересы и т.д.).User Activity Database).User Profile Database).Выходные данные:
Context-relevant website presentation), например, список ссылок или карточек.Matching Sessions) для вычисления статистически значимого Signal S. Патент упоминает необходимость минимального порогового количества совпадающих сессий для снижения риска утечки информации и повышения точности.Процесс А: Офлайн-подготовка данных (Индексация поведения)
User Activity Data (запросы, клики, посещения сайтов) и данных профилей пользователей.Sessions по времени для каждого пользователя.Процесс Б: Онлайн-обработка контекста (Прогнозирование)
User Context пользователя.Session Query на основе полученного контекста.Matching Sessions в индексе, которые удовлетворяют Session Query. Проверка минимального порога количества сессий.Matching Sessions.Matching Sessions. (Кол-во совпадающих сессий с сайтом / Кол-во совпадающих сессий).General Sessions). (Кол-во всех сессий с сайтом / Кол-во всех сессий).Signal S превышает установленный порог.Патент фокусируется на использовании поведенческих и контекстуальных данных, а не на анализе контента самих веб-страниц.
User Activity Data: история поисковых запросов, история посещенных веб-сайтов, клики по результатам, действия в приложениях (карты, email). Эти данные организованы в Sessions.Matching Sessions, содержащих действие, к общему количеству Matching Sessions.Signal S, чтобы отсечь результаты, которые не являются достаточно коррелированными с контекстом или являются статистически незначимыми (например, редкие события).Matching Sessions, необходимый для того, чтобы результат считался надежным и для защиты конфиденциальности.Signal S), чем в среднем.User Context, который включает не только локацию и время, но и интересы, историю действий и даже будущие планы пользователя.Sessions позволяет системе находить не только мгновенные, но и отложенные корреляции (например, пользователь искал что-то утром, а релевантный сайт посетил вечером).Этот патент напрямую влияет на стратегии оптимизации под Google Discover (DSO) и локальное SEO.
User Interests как часть User Context). Необходимо понимать, какие темы популярны у вашей целевой аудитории, чтобы повысить вероятность попадания в Matching Sessions.Signal S для вашей локации, тем чаще сайт будет предлагаться проактивно.Time/Date/Season как часть User Context). Контент, который статистически чаще потребляется в определенное время, имеет больше шансов быть предложенным в этот период.Signal S, и усилить их.Signal S близок к 1), он не будет считаться контекстно-релевантным и может быть отфильтрован.User Context, использования порогов статистической значимости и анонимизации данных.Патент подтверждает стратегический сдвиг Google от простого ответа на запросы к пониманию намерений и контекста пользователя. Для SEO это означает необходимость перехода от оптимизации под ключевые слова к оптимизации под аудиторию, ее интересы и контекст потребления контента. Это фундаментальный документ для понимания того, как генерируется трафик из рекомендательных систем, и подчеркивает важность поведенческих факторов и анализа данных о пользователях.
Сценарий 1: Оптимизация для локального ресторана
User Context = Местоположение (рядом с рестораном), Время (19:00), Интересы (еда, рестораны).Matching Sessions (люди рядом в 19:00) частота посещения сайта ресторана (F1) значительно выше, чем общая частота (F2). Signal S растет.Сценарий 2: Оптимизация новостного сайта под Discover
User Context = Интересы (технологии, гаджеты), Недавняя активность (поиск обзоров этого гаджета).Matching Sessions (пользователи, интересующиеся гаджетами). Signal S для этого контекста увеличивается.Является ли этот патент описанием работы Google Discover?
Да, этот патент описывает базовые механизмы предиктивного поиска и предоставления контента без явного запроса пользователя, что является основой работы Google Discover (ранее Google Now). Он объясняет, как система использует контекст пользователя для прогнозирования его интересов на основе агрегированных данных о поведении.
Что такое Signal S и как он влияет на ранжирование?
Signal S — это ключевая метрика в этом патенте. Она измеряет, насколько чаще определенный сайт посещается пользователями в заданном контексте по сравнению с пользователями в целом. Чем выше Signal S, тем более контекстно-релевантным считается сайт, и тем выше он будет ранжироваться в списке проактивных рекомендаций.
Что входит в понятие "Контекст пользователя" (User Context)?
User Context — это сложная комбинация факторов. Согласно патенту (Claim 8), он включает текущее местоположение, время суток, дату, сезон, язык, домашний город, известные системе интересы пользователя, его недавнюю активность (запросы, посещенные сайты) и даже будущие события (например, данные из календаря).
Как SEO-специалисту оптимизировать сайт под этот алгоритм?
Традиционное SEO здесь не работает. Необходимо сфокусироваться на оптимизации под Google Discover (DSO): создавать контент, который вызывает высокий интерес у конкретных сегментов аудитории, а также учитывать локальный и временной контекст. Важно, чтобы ваш контент был статистически популярным среди пользователей с определенными интересами или в определенной локации.
Что такое "Сессия" (Session) в контексте этого патента?
Session — это набор действий пользователя (посещения сайтов, запросы), сгруппированных за определенный период времени. Анализ данных на уровне сессий, а не отдельных действий, позволяет Google находить корреляции между событиями, разделенными во времени (например, связь между утренним поиском и вечерним посещением сайта).
Применяется ли этот алгоритм в обычном поиске (10 синих ссылок)?
Нет. В патенте (Claim 7) явно указано, что информация предоставляется НЕ в ответ на поисковый запрос. Этот механизм предназначен для систем проактивных рекомендаций и предиктивного поиска.
Как система защищается от спама и накруток?
Патент описывает несколько механизмов обеспечения качества данных. Во-первых, используются пороговые значения для Signal S, чтобы отсечь статистически незначимые результаты. Во-вторых, система требует наличия минимального количества Matching Sessions, прежде чем считать корреляцию надежной.
Влияют ли факторы E-E-A-T на этот алгоритм?
Факторы E-E-A-T или качество сайта напрямую в патенте не упоминаются. Однако система использует интересы пользователя как часть User Context. Если пользователи с определенными интересами предпочитают авторитетные источники, то эти источники будут иметь более высокий Signal S в данном контексте. Таким образом, E-E-A-T может влиять косвенно через поведение пользователей.
Как используется информация о будущих событиях?
Информация о будущих событиях (например, предстоящий авиарейс или встреча в календаре) включается в User Context. Это позволяет системе предсказывать потребности, связанные с этим событием. Например, перед вылетом система может предложить сайт авиакомпании или информацию о маршруте до аэропорта, если другие пользователи часто обращались к этой информации перед вылетом.
Зачем нужна фильтрация результатов, описанная в Claim 9?
Фильтрация (Claim 9) используется для повышения гиперлокальной релевантности. Если сайт популярен не только в текущей локации пользователя, но и в соседних или более крупных регионах, он может быть отфильтрован. Это позволяет системе предлагать информацию, уникально полезную именно в той точке, где находится пользователь (например, сайт билетной кассы конкретного музея, а не общий туристический портал города).

Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Свежесть контента

Поведенческие сигналы
Персонализация

Персонализация
Поведенческие сигналы
SERP

Ссылки
Мультиязычность
Семантика и интент

Антиспам
Ссылки
SERP

Поведенческие сигналы
Персонализация
Local SEO

Свежесть контента
Антиспам
Ссылки

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Knowledge Graph
Семантика и интент
EEAT и качество

SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация
