Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google предсказывает релевантный контент на основе контекста пользователя (локация, время, интересы), используя агрегированные поведенческие данные

    PROVIDING CONTEXT-RELEVANT INFORMATION TO USERS (Предоставление контекстно-релевантной информации пользователям)
    • US9363634B1
    • Google LLC
    • 2016-06-07
    • 2013-06-27
    2013 Патенты Google Персонализация Поведенческие сигналы Семантика и интент

    Google использует систему для прогнозирования контента (веб-сайтов, сущностей), который будет интересен пользователю в данный момент, без явного запроса. Система анализирует текущий контекст пользователя (местоположение, время, интересы) и сравнивает его с агрегированными данными о поведении других людей в аналогичном контексте. Контент, который статистически чаще востребован в этом контексте, чем в среднем, предоставляется пользователю проактивно.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу проактивного предоставления пользователю информации, которая с высокой вероятностью будет ему полезна в его текущем контексте (местоположение, время, интересы), без необходимости ввода явного поискового запроса (так называемый «zero-query» или предиктивный поиск). Цель — предсказать потребности пользователя, анализируя, что делали другие пользователи в аналогичных обстоятельствах.

    Что запатентовано

    Запатентована система прогнозирования контекстно-релевантной информации, основанная на анализе крупномасштабных агрегированных данных о поведении пользователей (User Activity Data). Система организует активность в «сессии» (Sessions). При получении текущего контекста пользователя (User Context) система идентифицирует исторические сессии, соответствующие этому контексту (Matching Sessions), и определяет действия (например, посещенные веб-сайты), которые выполнялись в этих сессиях статистически чаще, чем в сессиях в целом.

    Как это работает

    Ключевой механизм основан на статистическом сравнении поведения:

    • Сбор данных (Офлайн): Система агрегирует анонимизированные данные о действиях пользователей и организует их в Sessions.
    • Получение контекста (Онлайн): Система получает текущий User Context (локация, время, интересы, домашний город и т.д.).
    • Поиск соответствий: Генерируется Session Query для поиска исторических Matching Sessions.
    • Вычисление релевантности (Signal S): Для действий в найденных сессиях вычисляется сигнал (Signal S или Lift). Он показывает, насколько чаще это действие встречается в данном контексте по сравнению со средним показателем.
    • Предоставление информации: Информация о действиях с высоким Signal S проактивно предоставляется пользователю.

    Актуальность для SEO

    Высокая. Патент описывает фундаментальные механизмы, лежащие в основе современных систем предиктивного поиска, таких как Google Discover (ранее Google Now) и проактивные подсказки в Google Maps. Использование контекста и агрегированных поведенческих данных для предоставления информации без запроса является ключевым направлением развития поиска.

    Важность для SEO

    Патент имеет высокое значение (7.5/10), особенно для оптимизации под Google Discover (DSO) и локального SEO. Он демонстрирует механизм, при котором видимость контента определяется не анализом ключевых слов или ссылок, а статистической вероятностью его востребованности пользователями в определенном контексте. Это подчеркивает важность реальной популярности и вовлеченности ресурса в конкретных обстоятельствах.

    Детальный разбор

    Термины и определения

    User Context (Контекст пользователя)
    Данные, представляющие текущие атрибуты пользователя. Включают местоположение, время суток, дату, сезон, язык, «домашний» город (Home City), интересы пользователя, недавние запросы или посещенные сайты, а также будущие события (например, из календаря или email).
    Context-Relevant Activity (Контекстно-релевантное действие)
    Действие (посещение сайта, запрос, покупка, бронирование), которое пользователи, соответствующие определенному контексту, выполняют статистически чаще, чем пользователи в целом.
    User Activity Data (Данные о пользовательской активности)
    Агрегированные и анонимизированные данные о действиях пользователей в различных системах (поиск, карты, email, социальные сети и т.д.).
    Session (Сессия)
    Набор данных, представляющий действия одного пользователя за определенный период времени (например, несколько дней). Используется для поиска корреляций между последовательными действиями.
    Session Query (Запрос сессии)
    Запрос, сгенерированный из User Context, используемый для поиска совпадающих исторических сессий.
    Matching Sessions (Совпадающие сессии)
    Исторические сессии, которые удовлетворяют Session Query.
    General Sessions (Общие сессии)
    Все сессии в базе данных, используемые как базовый уровень для сравнения частоты действий.
    Signal S (Сигнал S / Lift)
    Ключевая метрика, определяющая контекстную релевантность. Рассчитывается как отношение частоты действия в Matching Sessions к частоте действия в General Sessions. Измеряет статистический подъем (Lift).
    Prediction Engine (Механизм прогнозирования)
    Компонент системы, который агрегирует данные об активности и выявляет корреляции для прогнозирования контекстно-релевантной информации.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод предоставления контекстно-релевантной информации.

    1. Система получает User Context, включающий местоположение устройства.
    2. Система обращается к User Activity Data, организованным в Sessions (каждая сессия = действия пользователя за период времени).
    3. Система идентифицирует Matching Sessions — сессии пользователей, чей контекст совпадал с полученным.
    4. Система идентифицирует General Sessions (базовый набор).
    5. Система определяет Context-Relevant Activities — действия, которые встречаются в Matching Sessions чаще, чем в General Sessions.
    6. Система предоставляет информацию, связанную с этими действиями.

    Claim 10 (Зависимый от 1): Критически важное уточнение о характере системы.

    Информация предоставляется устройству пользователя, и она НЕ является ответом на поисковый запрос (search query), полученный от устройства. Это определяет изобретение как систему проактивного (предиктивного) поиска.

    Claims 2-7 (Зависимые от 1): Детализируют типы действий, которые система может идентифицировать. Это демонстрирует широту используемых данных:

    • Доступ к информации о реальных сущностях (real-world entities) (Claim 2).
    • Бронирование ресторана (Claim 3), совершение покупки (Claim 4), посещение ресторана (Claim 5), поисковые запросы о ресторанах (Claim 6).
    • Публикация постов в социальных сетях (Claim 7).

    Claims 8-9 (Зависимые от 1): Уточняют состав User Context. Он включает интересы пользователя (Claim 8) и его «домашнее» географическое местоположение (Claim 9).

    Где и как применяется

    Изобретение функционирует как система предиктивного поиска (например, Google Discover), опираясь на данные, обработанные на этапе индексирования, и активируясь при получении контекста пользователя.

    INDEXING – Индексирование (Data Acquisition & Analysis)
    На этом этапе происходит непрерывный сбор, агрегация и индексация User Activity Data. Данные анонимизируются и организуются в Sessions. Сессии индексируются по контекстуальным признакам: местоположению, времени, долгосрочным атрибутам пользователя (интересы, домашний город) и совершенным действиям.

    QUNDERSTANDING (Понимание Контекста)
    Система интерпретирует полученный User Context (локация, время, профиль пользователя) и преобразует его в структурированный Session Query для поиска в базе данных сессий.

    RANKING (Прогнозирование и Ранжирование Активностей)
    Основное применение патента. Prediction Engine активируется проактивно.

    1. Отбор кандидатов: Идентификация Matching Sessions, соответствующих контексту.
    2. Оценка: Анализ действий внутри этих сессий и вычисление Signal S для каждого действия. Это статистическая оценка того, насколько действие характерно для этого контекста по сравнению с общим фоном.
    3. Ранжирование: Действия ранжируются по значению Signal S.

    RERANKING (Фильтрация)
    Применение пороговых значений для Signal S и статистической значимости. Также может применяться фильтрация для удаления общепопулярных сайтов или сайтов, релевантных для других локаций.

    Входные данные:

    • Текущий User Context (Местоположение, время, интересы, язык, домашний город, недавняя активность, будущие события).
    • User Activity Database (Индекс анонимизированных сессий).

    Выходные данные:

    • Презентация контекстно-релевантной информации (ссылки на сайты, информация о сущностях).

    На что влияет

    • Локальный бизнес и контент (Local SEO): Наибольшее влияние на рестораны, магазины, достопримечательности. Система может проактивно предлагать информацию о них, основываясь на местоположении и времени суток.
    • Туризм: Система различает местных жителей и туристов (используя атрибут «домашний город») и предлагает разный контент (например, сайт метро для туристов vs. сайт местных новостей для жителей).
    • Информационный контент (Discover): Влияет на контент, связанный с долгосрочными интересами пользователя или предстоящими событиями.
    • Типы запросов: Влияет на сценарии без явного запроса («zero-query»).

    Когда применяется

    • Триггеры активации: Получение текущего контекста пользователя. Это может происходить при изменении местоположения, в определенное время суток или при открытии пользователем соответствующего приложения (например, Google App/Discover).
    • Условия работы: Система активируется, когда доступно достаточное количество Matching Sessions для конкретного контекста, чтобы сделать статистически значимый прогноз (Signal S выше порога).
    • Ограничения: Для защиты приватности и обеспечения надежности система требует минимального количества совпадающих сессий или пользователей.

    Пошаговый алгоритм

    Процесс А: Офлайн-подготовка данных (Индексация сессий)

    1. Сбор данных: Сбор User Activity Data из различных источников. Персональная информация удаляется.
    2. Организация в сессии: Активность пользователей группируется в Sessions фиксированной длины.
    3. Обогащение сессий: В сессии добавляются данные о долгосрочных атрибутах пользователя (интересы, домашний город).
    4. Анонимизация и Индексация: Создается инвертированный индекс сессий. Термины индекса представляют атрибуты контекста и действия.

    Процесс Б: Обработка контекста в реальном времени

    1. Получение контекста: Система получает текущий User Context.
    2. Генерация запроса сессии: User Context преобразуется в Session Query.
    3. Идентификация совпадающих сессий: Поиск Matching Sessions в индексе.
    4. Анализ действий: Извлечение действий (например, посещенных сайтов) из Matching Sessions.
    5. Вычисление частот:
      1. Вычисляется первая частота (F1): как часто действие встречается в Matching Sessions.
      2. Вычисляется вторая частота (F2): как часто действие встречается во всех сессиях (General Sessions).
    6. Расчет Сигнала S (Lift): Вычисляется сигнал S = F1 / F2. Это показывает, насколько действие более характерно для данного контекста.
    7. Применение порогов и Фильтрация: Отбор действий, у которых Signal S превышает порог. Опциональная фильтрация (например, удаление общепопулярных сайтов с высоким F2).
    8. Предоставление информации: Отправка информации об отобранных действиях на устройство пользователя.

    Какие данные и как использует

    Данные на входе

    Система фокусируется на контекстуальных и поведенческих факторах, а не на анализе контента или ссылок.

    • Поведенческие факторы (User Activity Data): Посещенные веб-сайты, отправленные запросы, выбранные результаты поиска, действия в других системах (карты, email, социальные сети, шоппинг).
    • Географические факторы (Location): Текущее местоположение пользователя. «Домашний» город пользователя (для определения статуса турист/местный).
    • Временные факторы: Время суток, день недели, дата, сезон.
    • Пользовательские факторы (User Profile/Context): Язык, долгосрочные интересы, демография (если доступна).
    • Событийные факторы: Будущие события (из календаря или email).

    Какие метрики используются и как они считаются

    Ключевая метрика — это статистическая корреляция (Lift).

    • F1 (Частота в контексте): (Количество Matching Sessions с действием) / (Общее количество Matching Sessions).
    • F2 (Общая частота): (Количество всех сессий с действием) / (Общее количество всех сессий).
    • Signal S (Сигнал контекстной релевантности / Lift): Метрика, определяющая вероятность действия в данном контексте по сравнению с вероятностью действия в целом. Формула, указанная в патенте: S = F1 / F2.
    • Пороги:
      • Порог для Signal S: Значение S должно превышать порог, чтобы действие считалось контекстно-релевантным.
      • Пороги статистической значимости и приватности: Минимальное количество вхождений действия и минимальное количество Matching Sessions.

    Выводы

    1. Проактивный поиск без запросов (Zero-Query): Патент описывает механизм для предоставления информации без явного запроса от пользователя (Claim 10). Это основа для систем типа Google Discover.
    2. Контекст как «запрос»: Текущий контекст пользователя (локация, время, интересы, история) используется как неявный запрос (Session Query) к базе данных пользовательского поведения.
    3. Релевантность через статистический подъем (Lift): Релевантность определяется не анализом контента, а статистическим анализом (Signal S). Сайт релевантен, если пользователи в аналогичном контексте посещают его значительно чаще, чем в среднем.
    4. Фильтрация общепопулярного контента: Механизм Signal S естественным образом понижает контент, который популярен повсеместно (высокий F1, но и высокий F2), фокусируясь на локальных или ситуативных интересах.
    5. Важность реального мира и локальности: Местоположение и время являются ключевыми элементами контекста. Популярность ресурса в конкретной физической локации и в определенное время имеет решающее значение для видимости в этой системе.
    6. Сессии как основа анализа: Анализ активности в рамках временных Sessions позволяет находить корреляции между действиями, разделенными во времени.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под реальную востребованность (Real-World Engagement): Ключевая стратегия — сделать сайт или бизнес реально популярным и полезным для пользователей в конкретном контексте. Это требует качественного продукта/контента, который вызывает вовлечение.
    • Усиление локальных сигналов (Local SEO): Для локального бизнеса критично стимулировать активность, связанную с физическим местоположением. Оптимизация Google Business Profile, стимулирование поиска и посещения сайта, когда пользователи находятся поблизости.
    • Создание контента для специфических контекстов (Микромоменты): Создавайте контент, отвечающий потребностям в конкретных ситуациях. Например, «Гид по метро для туристов» (контекст: Турист + Локация), «Чем заняться в [Район] в выходные» (контекст: Местный + Время). Это повышает Signal S.
    • Учет времени и сезонности: Анализируйте, когда ваш контент наиболее востребован (время суток, сезон), и усиливайте его в эти периоды.
    • Оптимизация под Discover (DSO) и интересы: Развивайте авторитетность в темах, соответствующих долгосрочным интересам пользователей. Система будет искать контент, который статистически популярен среди пользователей с этим интересом (и, возможно, в данном месте).

    Worst practices (это делать не надо)

    • Игнорирование контекста и фокус только на ключевых словах: Традиционная SEO-оптимизация неэффективна для этой системы, так как она не использует запросы и не анализирует контент для определения релевантности по Signal S.
    • Накрутка поведенческих факторов: Попытки искусственно симулировать посещения сайта в определенном контексте сложны из-за масштаба агрегации данных и использования статистических моделей (Signal S), устойчивых к простому спаму.
    • Создание слишком общего контента: Контент, популярный «везде и всегда», может быть отфильтрован (низкий Signal S из-за высокого F2), так как система ищет ресурсы, которые *непропорционально* популярны именно в данном узком контексте.

    Стратегическое значение

    Патент подтверждает стратегическую важность данных о поведении пользователей как основного источника для понимания релевантности в предиктивном поиске (Queryless Search). Для SEO это означает сдвиг фокуса с оптимизации под алгоритмы анализа контента на оптимизацию под реальные потребности и поведение пользователей в конкретных жизненных ситуациях. Долгосрочная стратегия должна включать построение продукта, который становится статистически предпочтительным выбором для целевой аудитории.

    Практические примеры

    Сценарий 1: Дифференциация контента для туриста и местного жителя

    1. Контекст А (Турист): Локация: Нью-Йорк. Домашний город: Калифорния.
    2. Контекст Б (Местный): Локация: Нью-Йорк. Домашний город: Нью-Йорк.
    3. Анализ системы:
      • Google обнаруживает, что пользователи в Контексте А часто посещают «nycmetro.example.com/tourists» (Высокий Signal S).
      • Пользователи в Контексте Б часто посещают «nypaper.example.com/local» (Высокий Signal S).
    4. Результат: Туристу будет проактивно предложен сайт о метро, а местному жителю — сайт локальных новостей, хотя они находятся в одном и том же месте в одно и то же время.

    Сценарий 2: Временной контекст для ресторана

    1. Контекст пользователя: Местоположение: Центр города. Время: 19:00.
    2. Анализ системы: Google обнаруживает, что пользователи в этом районе в это время посещают сайт ресторана «Maria’s Pizza» значительно чаще, чем пользователи в целом (например, утром или в других районах).
    3. Результат: Google проактивно предлагает пользователю ссылку на сайт «Maria’s Pizza» (например, в ленте Discover или как подсказку в Картах).

    Вопросы и ответы

    Является ли этот патент описанием работы Google Discover?

    Патент не упоминает конкретных названий продуктов. Однако он описывает базовые механизмы предиктивного поиска: предоставление информации на основе контекста пользователя (локация, время, интересы) без явного запроса, путем анализа агрегированного поведения. Эти механизмы с высокой вероятностью лежат в основе работы Google Discover и контекстных подсказок на Картах.

    Как система определяет релевантность, если нет запроса?

    Релевантность определяется статистически с помощью метрики Signal S (Lift). Действие (например, посещение сайта) считается релевантным, если оно происходит значительно чаще среди пользователей в данном контексте (F1), чем среди всех пользователей в целом (F2). Если S = F1/F2 значительно больше 1 и превышает порог, информация считается релевантной.

    Влияет ли этот механизм на классическое ранжирование в поиске?

    Нет, напрямую не влияет. Патент четко указывает (Claim 10), что предоставляемая информация не является ответом на поисковый запрос пользователя. Это отдельная система проактивного предоставления контента. Однако данные о поведении пользователей (User Activity Data), собираемые для этой системы, могут использоваться и другими алгоритмами Google.

    Как SEO-специалист может повлиять на видимость сайта в этой системе?

    Напрямую оптимизировать под Signal S невозможно. Стратегия заключается в том, чтобы сделать сайт максимально полезным и популярным для пользователей в конкретных жизненных ситуациях (контекстах). Необходимо стимулировать реальное взаимодействие пользователей с сайтом, когда они находятся в целевом контексте (например, локальный бизнес должен быть популярен у людей поблизости).

    Что такое «сессии» (sessions) и почему они важны?

    Сессии — это набор действий пользователя за ограниченный период времени (например, несколько дней). Анализ сессий позволяет Google находить корреляции между действиями, которые не происходят одновременно. Например, система может понять, что пользователи, которые посетили локацию А, через день часто посещают сайт Б, и предложить сайт Б другим посетителям локации А.

    Как система различает туристов и местных жителей?

    Патент указывает, что User Context может включать «домашний город» (Home City) пользователя, обычно получаемый из профиля. Сравнивая текущее местоположение с домашним городом, система классифицирует пользователя как местного или туриста и анализирует поведение этих групп раздельно, предлагая разный контент.

    Будет ли глобально популярный сайт (например, Wikipedia) иметь преимущество в этой системе?

    Не обязательно. Система измеряет Lift (Signal S), то есть относительное превышение популярности в контексте. Если сайт одинаково популярен везде, его общая частота (F2) будет высокой, и Lift в конкретном месте может быть низким. Система предпочитает сайты, которые необычно популярны именно в данном контексте.

    Может ли эта система предлагать что-то кроме веб-сайтов?

    Да. Патент упоминает предоставление информации о реальных сущностях (real-world entities), рекомендации запросов, информацию о ресторанах, бизнесе, а также контент из социальных сетей. Система универсальна и может предлагать любую информацию, для которой зафиксирована статистическая корреляция с контекстом.

    Насколько важен этот патент для локального SEO?

    Он критически важен. Патент описывает, как Google может проактивно продвигать локальный бизнес, основываясь на физическом присутствии пользователя и времени суток. Если ресторан статистически популярен в обеденное время в определенном районе, система будет его рекомендовать пользователям, находящимся там в это время.

    Как обеспечивается приватность пользователей при таком сборе данных?

    Патент указывает, что данные агрегируются и анонимизируются перед использованием. Кроме того, система применяет пороги на минимальное количество пользователей или сессий (Matching Sessions), необходимых для вывода информации, чтобы обеспечить статистическую значимость и предотвратить идентификацию отдельных лиц.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.