Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует историю поиска и браузера для прогнозирования физических местоположений и предварительной загрузки локального контента

    SEARCH AND RETRIEVAL OF KEYED DATA MAINTAINED USING A KEYED DATABASE (Поиск и извлечение ключевых данных, хранящихся в базе данных с ключами)
    • US10650071B2
    • Google LLC
    • 2020-05-12
    • 2016-12-14
    2016 Патенты Google Персонализация Поведенческие сигналы

    Google анализирует историю поиска и посещенных сайтов пользователя для прогнозирования его будущих географических перемещений или интересов. Система заранее извлекает и подготавливает контент (например, рекламу, данные карт, обзоры), связанный с этими местами, чтобы показать его без задержек, когда пользователь запросит информацию или окажется поблизости, или даже для использования офлайн.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему задержки (latency) при доставке гео-релевантного цифрового контента. Он также устраняет ограничения систем, полагающихся исключительно на текущие GPS-данные (которые могут быть недоступны или разрежены). Вместо этого система использует историю поиска и веб-активности как более надежный источник данных для прогнозирования будущих местоположений, интересующих пользователя, и предварительной загрузки соответствующего контента.

    Что запатентовано

    Запатентована система ускорения доставки цифрового контента (Digital Content Acceleration System). Эта система использует историю поиска и посещения веб-страниц пользователя (Keyed Data) для прогнозирования географических местоположений, контент о которых пользователь, вероятно, запросит в будущем. Система превентивно извлекает и предварительно собирает (pre-assembles) цифровой контент, связанный с этими локациями, чтобы минимизировать задержку при его доставке.

    Как это работает

    Система работает следующим образом:

    • Сбор данных: Система получает Keyed Data (например, идентификатор профиля пользователя) и извлекает связанную с ним историю поиска и веб-активности.
    • Извлечение признаков: Parsing Engine анализирует историю и извлекает атрибуты (ключевые слова, темы, временные метки).
    • Прогнозирование локаций: Используя машинное обучение (включая кластеризацию атрибутов в Topic Clusters и применение обученных моделей), система генерирует распределение вероятностей (Probability Distribution) будущих местоположений пользователя.
    • Предварительная загрузка контента: Для локаций с высокой вероятностью система запрашивает соответствующий контент (например, рекламу, данные для Карт) у поставщиков.
    • Предварительная сборка и доставка: Контент подготавливается к отображению и может быть доставлен на устройство заранее, до того как пользователь его запросит или окажется в локации.

    Актуальность для SEO

    Высокая. Персонализация, сервисы на основе местоположения и сокращение времени загрузки являются критически важными для Google. Использование поведенческих данных (поиск/браузинг) для понимания географического намерения пользователя является актуальной задачей, особенно в условиях ограничений на прямое GPS-отслеживание. Этот патент описывает инфраструктуру для высоко персонализированного и проактивного локального поиска.

    Важность для SEO

    Патент имеет значительное влияние (7/10), особенно для локального SEO (Local SEO) и понимания механизмов персонализации. Он демонстрирует, что релевантность пользователя определенной локации зависит не только от его текущих GPS-координат, но и от всей его истории поведения в Интернете. Это напрямую влияет на видимость бизнеса в персонализированных результатах, на Картах и в локализованной поисковой выдаче, даже если патент фокусируется на ускорении доставки, а не на алгоритмах ранжирования.

    Детальный разбор

    Термины и определения

    Keyed Data (Ключевые данные)
    Данные, связанные с уникальным ключом (например, идентификатором пользователя или приложения), представляющие профили пользователей. Включают историю поиска (search history), историю посещенных веб-страниц (web history) и историю местоположений (location history).
    Digital Content Acceleration System (Система ускорения доставки цифрового контента)
    Основная система, отвечающая за прогнозирование местоположений и предварительную загрузку контента для снижения задержки (latency).
    Probability Distribution (Распределение вероятностей) / Probability Data
    Выходные данные механизма прогнозирования. Указывают на вероятность того, что пользователь запросит контент, связанный с конкретными географическими точками (например, о достопримечательностях или бизнесах).
    Parsing Engine (Механизм синтаксического анализа)
    Компонент, который извлекает атрибуты (ключевые слова, темы, демографические данные, временные метки) из истории поиска и веб-активности. Может использовать matrix factorization.
    Terminal Device Network Access Engine
    Механизм прогнозирования, который использует извлеченные атрибуты и модели машинного обучения для генерации Probability Distribution.
    Topic Clusters (Тематические кластеры)
    Группы атрибутов, указывающие на определенные темы (например, кластер слов, относящихся к «вариантам завтрака»).
    Trained Model (Обученная модель)
    Модель машинного обучения, используемая для преобразования тематических кластеров в прогнозы местоположений.
    Pre-assembly (Предварительная сборка)
    Процесс подготовки цифрового контента к рендерингу до того, как система получит запрос на его отображение.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс работы системы ускорения контента.

    1. Система хранит Keyed Data (профили пользователей).
    2. Получив Keyed Data (профиль пользователя), система извлекает связанную историю поиска и/или веб-активности.
    3. Parsing Engine извлекает атрибуты, которые связывают эту историю с географическими локациями.
    4. Terminal Device Network Access Engine генерирует данные о вероятности (probability data) для этих локаций. Вероятность указывает на то, запросит ли пользователь контент о достопримечательностях или бизнесе в этой локации.
    5. Content Selection Engine извлекает контент для двух или более локаций с наивысшей вероятностью.
    6. Digital Content Assembler Engine предварительно собирает этот контент, пока устройство находится в другом месте.
    7. Система доставляет предварительно собранный контент на устройство до того, как устройство окажется в прогнозируемых локациях.

    Claim 3 (Зависимый от 1): Уточняет цель предварительной доставки. Контент отправляется на устройство, когда оно онлайн, заранее, чтобы контент был доступен пользователю, даже если позже он запросит его в режиме офлайн.

    Claim 4 (Зависимый от 1): Детализирует механизм прогнозирования (Машинное обучение).

    1. Атрибуты кластеризуются в Topic Clusters.
    2. Используется Trained Model для преобразования этих кластеров в данные о местоположении.
    3. На основе этого преобразования генерируется вероятность того, что пользователь посетит каждую локацию.

    Claim 7 (Зависимый от 1): Указывает, что временные данные (timing data), связанные с историей поиска и веб-активности, используются при генерации распределения вероятностей. Это подчеркивает важность времени и контекста.

    Claim 10 (Зависимый от 1): Указывает, что Parsing Engine извлекает атрибуты, используя методы matrix factorization (матричная факторизация) или low rank approximation (низкоранговая аппроксимация) для выявления скрытых паттернов.

    Где и как применяется

    Эта система функционирует как слой глубокой персонализации и оптимизации инфраструктуры, затрагивая несколько этапов обработки данных.

    INDEXING / QUNDERSTANDING (Офлайн-обработка и анализ поведения)
    На этих этапах происходит сбор и обработка истории активности пользователей (поиск, веб-серфинг, местоположения). Модели машинного обучения (Trained Model), используемые для прогнозирования местоположений, обучаются офлайн. Система анализирует историю пользователя в фоновом режиме, чтобы понять его интересы и предсказать будущие потребности (понимание пользователя).

    RANKING/RETRIEVAL – Ранжирование и Извлечение (Проактивное извлечение)
    Система проактивно извлекает и ранжирует контент до того, как пользователь сделает запрос. Это ранжирование основано на прогнозируемой релевантности местоположения для конкретного пользователя.

    METASEARCH / RERANKING – Метапоиск и Переранжирование (Персонализация и Доставка)
    Когда пользователь делает запрос (например, открывает приложение Карты), предварительно загруженный контент доставляется мгновенно. Этот контент персонализирован в соответствии с прогнозируемыми интересами пользователя, что влияет на финальный вид SERP или интерфейса приложения.

    Входные данные:

    • Keyed Data (Идентификатор пользователя/профиль).
    • История поиска (Search History).
    • История веб-активности (Web History).
    • История местоположений (Location History) (если доступна).
    • Текущие данные о местоположении устройства.

    Выходные данные:

    • Предварительно собранный цифровой контент (например, реклама, брендированные пины на карте, обзоры), связанный с прогнозируемыми локациями.
    • Этот контент либо доставляется в кэш устройства, либо мгновенно выдается по запросу.

    На что влияет

    • Конкретные типы контента: Локальные бизнес-листинги, отзывы, рекламные объявления, данные для карт. Патент явно упоминает branded pin для размещения на виртуальной географической карте (Claim 11).
    • Специфические запросы: Наибольшее влияние на неявные локальные запросы (например, открытие приложения карт) и явные локальные запросы (например, запрос «Sandwiches near me», показанный в патенте).
    • Конкретные ниши или тематики: Критически важно для всех локальных бизнесов (рестораны, розничная торговля, услуги), чья видимость зависит от местоположения и намерений пользователя.

    Когда применяется

    • Условия работы алгоритма: Система работает в фоновом режиме, постоянно обрабатывая активность пользователя (поиск и просмотр сайтов).
    • Триггеры активации: Доставка контента активируется, когда пользователь взаимодействует с приложениями, учитывающими местоположение, или выполняет локальные поисковые запросы.
    • Пороговые значения: Система действует, когда может сгенерировать прогнозы будущих местоположений с высокой степенью уверенности (высокой вероятностью в Probability Distribution) на основе доступной истории.

    Пошаговый алгоритм

    1. Сбор данных: Система получает Keyed Data от терминального устройства. Извлекаются связанные данные истории поиска и веб-активности.
    2. Извлечение атрибутов: Parsing Engine обрабатывает историю для извлечения атрибутов, таких как ключевые слова, темы, временные данные (timing data) и демографические признаки. Для выявления связей используются методы типа matrix factorization.
    3. Кластеризация: Извлеченные атрибуты группируются в Topic Clusters (например, атрибуты, связанные с «покупкой автомобиля» или «утренним кофе»).
    4. Генерация прогноза: Terminal Device Network Access Engine использует Trained Model для преобразования тематических кластеров в данные о местоположении. Генерируется Probability Distribution, оценивающее вероятность запроса контента для различных географических локаций.
    5. Выбор контента: Content Selection Engine определяет локации с высокой вероятностью интереса для пользователя.
    6. Извлечение контента: Цифровой контент (реклама, пины на картах, данные о бизнесе) для этих локаций запрашивается у поставщиков (Digital Content Providers).
    7. Предварительная сборка: Digital Content Assembly Engine подготавливает контент к рендерингу на устройстве (pre-assembles).
    8. Доставка/Кэширование: Предварительно собранный контент отправляется на устройство (возможно, для использования в офлайн-режиме) или сохраняется в Keyed Digital Content Cache для быстрой доставки по запросу.

    Какие данные и как использует

    Данные на входе

    Патент фокусируется на использовании поведенческих и контекстуальных данных для прогнозирования местоположения.

    • Поведенческие факторы: Являются критически важным входом. Используются Search history (поисковые запросы) и Web history (история просмотров, посещенные URL). (Claim 1).
    • Временные факторы: Временные данные (timing data), связанные с историей поиска и веб-активности (когда происходили действия). (Claim 7).
    • Географические факторы: Данные истории местоположений (Location history data) (прошлые GPS-координаты, если доступны) (Claim 8). Также могут использоваться текущие данные о местоположении устройства.
    • Пользовательские факторы: Keyed Data (идентификаторы/профили пользователей). Извлеченные демографические данные (demographic data) (Claim 6).

    Какие метрики используются и как они считаются

    • Probability Distribution (Распределение вероятностей): Основная метрика, указывающая на вероятность запроса контента для определенной локации.

    Методы расчета и анализа:

    • Машинное обучение: Для прогнозирования используются обученные модели (Trained Models) (Claim 4, 5).
    • Кластеризация: Атрибуты группируются в тематические кластеры (Topic Clusters) (Claim 4).
    • Анализ данных и выявление паттернов: Parsing Engine использует такие методы, как matrix factorization (матричная факторизация) или low rank approximation (низкоранговая аппроксимация) (Claim 10), для поиска взаимосвязей и скрытых факторов в данных истории пользователя.

    Выводы

    1. Поведенческая история как предиктор физического намерения: Google активно использует историю поиска и просмотра веб-страниц для прогнозирования намерений пользователя в физическом мире. Это позволяет определять релевантность географических локаций даже без явных локальных запросов или GPS-сигнала.
    2. Персонализация за пределами текущего контекста: Персонализация включает в себя прогнозирование будущих потребностей на основе прошлого поведения, а не только реакцию на текущий запрос или местоположение.
    3. Приоритет скорости и доступности (Latency/Offline): Система нацелена на «ускорение» за счет предварительной загрузки контента для прогнозируемых мест, подчеркивая важность скорости и доступности контента (даже в офлайн-режиме).
    4. Критичность временных сигналов: Временные сигналы (время суток, последовательность действий) имеют решающее значение для точного прогнозирования местоположения (Claim 7).
    5. Сложные методы ML для связи онлайн и офлайн: Для перевода онлайн-поведения (Topic Clusters) в вероятности физического местоположения используются сложные методы машинного обучения, включая кластеризацию и матричную факторизацию.

    Практика

    Best practices (это мы делаем)

    • Оптимизация под тематическую и сущностную релевантность (Entity Optimization): Убедитесь, что ваша бизнес-сущность (Entity) прочно ассоциируется с релевантными темами в интернете (Knowledge Graph). Это увеличивает вероятность включения вашего бизнеса в Topic Clusters, связанные с поисковыми запросами пользователей, которые система затем преобразует в прогнозы локаций.
    • Стимулирование онлайн-взаимодействия и брендового поиска: Поощряйте пользователей искать ваш бренд и посещать ваш веб-сайт. Эта активность (попадание в Search history и Web history) напрямую питает механизм прогнозирования и сигнализирует о намерении посетить вашу локацию.
    • Стратегия локального контента с учетом времени: Создавайте контент, который отвечает потребностям пользователей в разное время дня или недели. Это соответствует временным факторам (timing data), используемым при прогнозировании (например, контент про «утренний кофе» по сравнению с «вечерними мероприятиями»).
    • Комплексная оптимизация для Карт и Локальной выдачи (GBP): Поскольку результатом работы системы часто является контент, основанный на местоположении (например, branded pins на Картах, упомянутые в Claim 11), сильная оптимизация Google Business Profile (GBP) необходима для того, чтобы именно ваш контент был выбран для предварительной загрузки.

    Worst practices (это делать не надо)

    • Ориентация исключительно на оптимизацию «рядом со мной»: Недостаточно полагать, что видимость основана только на текущем GPS-местоположении пользователя. Google может отдать приоритет более удаленному месту, если история пользователя предполагает более высокую релевантность этого места для него (персонализация).
    • Изолированное Локальное SEO: Рассматривать Локальное SEO в отрыве от общей контент-стратегии. Игнорирование поведения пользователей на этапе исследования (информационные запросы) снижает количество сигналов для системы прогнозирования.
    • Создание контента без учета контекста пользователя: Публикация общего контента без учета того, как, когда и в какой последовательности пользователи могут искать ваши услуги, снижает вероятность попадания в релевантные Topic Clusters.

    Стратегическое значение

    Патент подтверждает глубокую интеграцию онлайн-поведения и релевантности физического местоположения. Стратегия локального SEO должна учитывать персонализацию, основанную на всем цифровом следе пользователя, а не только на его непосредственном местоположении или запросе. Это подчеркивает ценность того, чтобы быть узнаваемой сущностью (брендом), которую пользователи активно ищут и с которой взаимодействуют в интернете на разных этапах своего пути (Customer Journey).

    Практические примеры

    Сценарий: Прогнозирование места обеда на основе утренних поисков

    1. Действия пользователя (Утро): Пользователь ищет «лучшие веганские рецепты» и посещает несколько сайтов о здоровом питании. Эта активность фиксируется в его Search history и Web history.
    2. Обработка данных (Фон): Система Google анализирует эти данные. Parsing Engine извлекает атрибуты «веганский», «здоровое питание».
    3. Кластеризация и Прогноз: Атрибуты формируют Topic Cluster, связанный с веганской едой. Учитывая время (приближается полдень), Trained Model генерирует высокую вероятность того, что пользователь будет искать веганский ресторан на обед.
    4. Предварительная загрузка: Система определяет ближайшие релевантные веганские рестораны и предварительно загружает контент для них (меню, отзывы, пины на карте).
    5. Действия пользователя (Полдень): Пользователь открывает Google Maps и вводит общий запрос «рестораны рядом со мной».
    6. Результат: Благодаря предварительной загрузке и прогнозированию, веганские рестораны отображаются мгновенно и, вероятно, занимают более высокие позиции в его персонализированной выдаче, так как система считает их более релевантными для этого пользователя в данный момент.

    Вопросы и ответы

    Означает ли этот патент, что Google постоянно отслеживает мое местоположение по GPS?

    Не обязательно. Ключевая особенность этого патента заключается в использовании истории поиска и веб-активности (Search history и Web history) для прогнозирования местоположения, особенно когда данные GPS ограничены или недоступны. Система использует GPS, когда он включен, но может делать точные прогнозы и без него, основываясь на вашем онлайн-поведении.

    Как система определяет, какие темы связаны с какими локациями?

    Система использует машинное обучение. Атрибуты из истории пользователя группируются в Topic Clusters (например, «покупка кроссовок»). Затем Trained Model, обученная на огромном объеме данных, преобразует этот тематический интерес в вероятность посещения конкретных географических локаций (например, обувных магазинов поблизости).

    Что такое «матричная факторизация» (matrix factorization) и как она используется?

    Матричная факторизация (упомянутая в Claim 10) — это метод машинного обучения, используемый для обнаружения скрытых факторов и взаимосвязей в больших наборах данных. В данном контексте она помогает Parsing Engine понять сложные паттерны в истории пользователя, например, какие поисковые запросы часто происходят вместе или следуют за посещением определенных сайтов, и как это связано с последующими действиями.

    Как этот патент влияет на локальное SEO (Local SEO)?

    Влияние значительно. Он показывает, что для видимости в локальном поиске и на Картах важна не только физическая близость к пользователю, но и то, насколько ваш бизнес релевантен его прошлому поведению и прогнозируемым намерениям. Если пользователь часто ищет информацию по вашей тематике, ваш бизнес может быть показан ему с большим приоритетом.

    Может ли мой бизнес появиться в выдаче у пользователя, который никогда не искал мой бренд?

    Да. Если история поиска пользователя указывает на сильный интерес к вашей категории (например, он часто ищет «итальянская паста»), система может спрогнозировать, что ваш итальянский ресторан будет ему релевантен, и предварительно загрузить контент о вас, даже если он не искал ваш бренд напрямую.

    Какую роль играют временные данные (timing data)?

    Временные данные критичны (Claim 7). Система учитывает время суток и последовательность действий. Например, поиск «кофе» в 8 утра с большей вероятностью приведет к прогнозу посещения кофейни, чем тот же поиск в 8 вечера. SEO-специалистам следует учитывать временной контекст при создании контента.

    Что такое «ускорение» (acceleration) в контексте этого патента?

    Ускорение означает сокращение задержки между запросом пользователя и отображением контента. Достигается это за счет того, что система выполняет поиск, выбор и сборку контента заранее (pre-fetching и pre-assembling), основываясь на прогнозах, а не ждет фактического запроса пользователя.

    Влияет ли этот механизм на рекламу или только на органические результаты?

    Патент описывает доставку «цифрового контента», что включает в себя как данные приложений (например, пины на Картах), так и рекламу. В описании упоминается взаимодействие с Evaluation Engine (например, рекламным аукционом). Механизм универсален и направлен на ускорение доставки любого релевантного контента.

    Как SEO-специалисту повлиять на эти прогнозы?

    Необходимо усиливать ассоциацию вашего бизнеса с релевантными темами (работать над Topical Authority) и стимулировать взаимодействие пользователей с вашим сайтом и брендом в поиске. Чем больше данных у Google о том, что пользователи интересуются вами и вашей тематикой, тем выше вероятность того, что система спрогнозирует посещение вашей локации.

    Что означает доставка контента для использования в офлайн-режиме (Claim 3)?

    Это означает, что система может отправить предварительно собранный контент (например, данные о ресторане, маршруты) на устройство пользователя, пока у него есть интернет-соединение. Если позже пользователь потеряет соединение (например, в метро), он все равно сможет получить доступ к этому контенту, так как он уже сохранен в кэше устройства.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.