Как Google преобразует сырые GPS-данные в историю посещенных мест (Google Timeline) и использует ее для персонализации

Google использует сложную систему для преобразования необработанных координат (GPS, Wi-Fi) в семантическую историю посещений конкретных заведений. Система анализирует популярность места, историю поиска пользователя, чекины, транзакции и время работы, чтобы точно определить, где находился пользователь. Эта технология критически важна для персонализации поиска и Local SEO.

Описание

Какую задачу решает

Патент решает проблему интерпретации сырых данных о местоположении (raw location reports), таких как GPS-координаты или данные Wi-Fi, получаемых от устройств пользователя. Сами по себе эти данные не идентифицируют конкретные сущности реального мира (location entities) — рестораны, магазины, парки. Цель изобретения — преобразовать поток координат в семантически значимую User Location History (историю посещений конкретных мест), которая необходима для предоставления персонализированных сервисов и улучшения локального поиска.

Что запатентовано

Запатентована система для автоматического создания и редактирования истории местоположений. Система группирует сырые данные в пространственно-временные кластеры (segments) и определяет, какое место пользователь посетил. Для этого используется многофакторная модель оценки (scoring formula), которая учитывает различные признаки (features), включая расстояние, общую популярность места, часы работы и историю взаимодействий пользователя с этим местом (поиск, маршруты, транзакции). Также запатентован механизм пользовательского редактирования этой истории.

Как это работает

Система работает в несколько этапов:

Сбор данных: Получение Location Reports (время + координаты) от устройств пользователя.
Сегментация: Кластеризация отчетов в segments на основе близости во времени и пространстве.
Идентификация кандидатов: Для каждого сегмента определяются все близлежащие location entities.
Вычисление признаков: Для каждого кандидата рассчитываются значения признаков (Feature Values): расстояние, популярность (Popularity Features), персонализация (Personalization Features) и совпадение времени работы.
Скоринг и выбор: Применяется Scoring Formula (модель машинного обучения) для оценки вероятности посещения. Место с наивысшей оценкой включается в историю.
Интерфейс и обратная связь: История предоставляется пользователю (например, в Google Timeline), который может исправить записи. Эти исправления могут использоваться для дообучения модели.

Актуальность для SEO

Высокая. Описанная технология является основой функции Google Timeline в Google Maps. Точное понимание того, какие места посещает пользователь (связь онлайн-активности с офлайн-поведением), критически важно для локального поиска, персонализации результатов и оценки эффективности рекламы (Store Visits). Эти механизмы активно используются и развиваются.

Важность для SEO

Патент имеет высокое значение (8/10), особенно для Local SEO и персонализации. Он не описывает ранжирование веб-страниц, но раскрывает, какие сигналы Google использует для верификации физического посещения пользователем конкретного бизнеса. Это подтверждает критическую важность сигналов взаимодействия (чекины, запросы маршрутов, история поиска) и точности данных в Google Business Profile (часы работы, координаты) для повышения видимости локального бизнеса в экосистеме Google.

Детальный разбор

Термины и определения

Business Hour Overlap Feature (Признак совпадения часов работы): Признак, описывающий, пересекаются ли часы работы Location Entity со временем сегмента (segment time).
Distance Features (Признаки расстояния): Признаки, описывающие расстояние между Location Entity и местоположением сегмента (например, средним или медианным).
Feature Values (Значения признаков): Числовые значения, рассчитываемые для различных признаков (Features) для каждой Location Entity.
Location Entity (Сущность местоположения): Реальный объект (бизнес, ресторан, парк), имеющий семантическое название и географическое расположение.
Location Report (Отчет о местоположении): Сырые данные с устройства пользователя, включающие местоположение (GPS, Wi-Fi и т.д.) и время.
Personalization Features (Признаки персонализации): Признаки, описывающие предыдущие взаимодействия конкретного пользователя с Location Entity (поисковые запросы, запросы маршрутов, чекины, транзакции мобильных платежей, данные из email).
Popularity Features (Признаки популярности): Признаки, описывающие глобальную популярность Location Entity (количество чекинов, упоминаний в соцсетях, глобальный рейтинг).
Scoring Formula (Формула оценки): Алгоритм (модель ML) для расчета итоговой оценки (score). Сравнивает Feature Values кандидата со значениями других кандидатов в том же сегменте.
Segment (Сегмент): Кластер Location Reports, сгруппированных по времени и местоположению. Представляет период времени, проведенный в одной области.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает комплексный метод генерации и редактирования истории местоположений.

Получение множества location reports от устройств пользователя.
Кластеризация отчетов в segments.
Идентификация множества кандидатов (location entities) для каждого сегмента.
Выбор одной location entity для включения в историю на основе оценок (scores).
Предоставление истории для отображения в пользовательском интерфейсе.
Получение пользовательского ввода, запрашивающего редактирование.
Пересмотр истории на основе полученного ввода.

Claim 3 (Зависимый от 1): Детализирует процесс исправления ошибок пользователем.

Если пользователь указывает на неверную локацию, система предоставляет альтернативные сущности (которые ранее не были выбраны). Пользователь выбирает замену, и система обновляет историю. Это подразумевает, что система сохраняет альтернативные варианты и их оценки.

Claim 5 (Зависимый от 1): Описывает метод кластеризации (формирования сегментов).

Оценка кандидатов в сегменты основывается на расстоянии от каждого отчета до среднего местоположения (mean location) этого сегмента. Цель — найти наиболее плотные кластеры.

Claim 7 (Зависимый от 1): Раскрывает механизм оценки кандидатов.

Определение feature values для каждой location entity.
Определение score с использованием scoring formula. Формула рассчитывает оценку на основе сравнения feature values оцениваемой сущности со значениями всех других сущностей для данного сегмента.

Claims 8-11 (Зависимые от 7): Определяют типы признаков:

Claim 8: Distance Features.
Claim 9: Popularity Features.
Claim 10: Business Hour Overlap Feature.
Claim 11: Personalization Features.

Claim 12 (Зависимый от 1): Описывает использование истории в поиске.

Система получает запрос, ссылающийся на ранее посещенные места (например, «ресторан, где я был вчера»), идентифицирует сущности в истории и предоставляет их в качестве результатов поиска.

Где и как применяется

Изобретение охватывает сбор и обработку пользовательских данных для создания персонального индекса (истории местоположений), который затем используется в поисковой архитектуре.

CRAWLING – Сбор данных (Data Acquisition)
Система пассивно собирает raw location reports с мобильных устройств пользователя (при наличии разрешения), а также данные о взаимодействиях (поиск, карты, email, платежи).

INDEXING – Индексирование и извлечение признаков (Data Processing)
Основная работа алгоритма происходит здесь (в контексте обработки пользовательских данных). Система:

Кластеризует отчеты в segments.
Идентифицирует сущности (используя индекс Карт/Локальных сущностей).
Извлекает и рассчитывает признаки (Popularity, Personalization, Business Hours).
Генерирует семантическую User Location History.

QUNDERSTANDING – Понимание Запросов
Система распознает запросы, которые ссылаются на персональную историю (Claim 12).

RERANKING – Переранжирование (Персонализация)
Сгенерированная User Location History является мощным сигналом персонализации. Она используется для прямого ответа на запросы (Claim 12) и может использоваться для переранжирования локальных результатов (повышение знакомых мест).

Входные данные:

Сырые Location Reports (время, координаты).
Данные Карт (Map Data): расположение сущностей, часы работы.
Данные о взаимодействиях (Interaction Data): история поиска, клики на картах, чекины, данные email (бронирования), данные мобильных платежей.

Выходные данные:

Структурированная User Location History.
Данные обратной связи (правки пользователя), которые могут использоваться для обучения модели.

На что влияет

Конкретные типы контента: В первую очередь влияет на локальные сущности (Local Entities) — бизнес-профили (GBP), точки интереса на Картах.
Специфические запросы: Влияет на локальные запросы («рядом со мной») и персонализированные запросы, ссылающиеся на прошлые визиты.
Конкретные ниши или тематики: Критически важно для ритейла, ресторанов, туризма и любого бизнеса, зависящего от физического трафика (O2O).

Когда применяется

Условия работы: Требуется разрешение пользователя на сбор данных о местоположении (Location History settings).
Временные рамки: Обработка происходит непрерывно по мере поступления новых данных.
Пороговые значения: Упоминается возможность отбрасывания слишком коротких сегментов (например, менее 10 минут).

Пошаговый алгоритм

Процесс А: Генерация истории местоположений

Сбор данных: Получение множества location reports.
Кластеризация (Сегментация): Группировка отчетов в segments.
1. Оценка кандидатов в сегменты на основе плотности (расстояние отчетов до среднего местоположения сегмента — mean location).
2. Выбор наилучших сегментов.
3. Фильтрация слишком коротких сегментов.
Идентификация кандидатов: Для каждого сегмента поиск всех location entities в пределах порогового расстояния.
Вычисление признаков: Для каждого кандидата расчет Feature Values:
1. Distance Features: Расстояние до сегмента.
2. Popularity Features: Глобальная популярность (чекины, маршруты).
3. Personalization Features: История взаимодействий пользователя (поиск, клики, транзакции, email), с учетом давности (temporal correlation).
4. Business Hour Overlap Feature: Совпадение времени работы со временем сегмента.
Скоринг: Применение Scoring Formula. Формула сравнивает взвешенные признаки кандидата с признаками всех остальных кандидатов в сегменте. Веса определяются с помощью машинного обучения (computer learning).
Выбор: Выбор location entity с наивысшей оценкой.
Сохранение: Запись в User Location History.

Процесс Б: Взаимодействие и редактирование

Отображение: Предоставление истории пользователю (Timeline).
Получение ввода: Пользователь указывает на неверное место.
Предложение альтернатив: Система предлагает альтернативных кандидатов (следующие по оценке) для данного сегмента.
Обновление: Замена сущности. Данные редактирования могут использоваться для дообучения скоринговой модели.

Какие данные и как использует

Данные на входе

Система использует комбинацию технических, поведенческих и структурных данных.

Технические факторы: Сырые данные о местоположении (GPS, Wi-Fi, IP-адреса, триангуляция вышек).
Поведенческие факторы (Персонализация — Personalization Features):
- История веб-поиска, связанная с сущностью.
- Взаимодействия на Картах (клики (map click), запросы маршрутов (requested directions)).
- Чекины пользователя (check-ins).
- Данные транзакций через мобильные платежные системы (mobile payment system or virtual wallet).
- Данные из Email (бронирования отелей, ресторанов).
Поведенческие факторы (Популярность — Popularity Features): Агрегированные данные всех пользователей: количество чекинов, запросов маршрутов, упоминаний в социальных сетях (social media mentions), глобальный ранг популярности (global popularity rank).
Структурные факторы (Данные Карт): Точное расположение Location Entities, их границы.
Временные факторы: Часы работы заведений (Business Hours) для расчета Business Hour Overlap Feature. Давность взаимодействий пользователя (temporal correlation).

Какие метрики используются и как они считаются

Оценка Сегмента (Segment Score): Метрика качества кластеризации. Рассчитывается на основе расстояния каждого Location Report до mean location сегмента. Чем плотнее кластер, тем выше оценка.
Feature Values: Числовые значения для признаков (Distance, Popularity, Personalization, Overlap). Используются методы нормализации (например, масштабирование относительно максимального значения в сегменте).
Total Feature Value: Взвешенная сумма отдельных Feature Values. Весовые коэффициенты (weighting values) определяются с помощью машинного обучения (computer learning).
Scoring Formula (Итоговая оценка): Формула для расчета вероятности. В патенте описан пример реализации, напоминающий функцию Softmax: числитель равен экспоненциальной функции от Total Feature Value оцениваемой сущности, а знаменатель равен сумме экспоненциальных функций от Total Feature Value всех кандидатов в сегменте. Это обеспечивает сравнение вероятностей между кандидатами.

Выводы

Слияние онлайн и офлайн сигналов: Патент демонстрирует, как Google связывает онлайн-активность пользователя (поиски, клики, чекины, платежи, email) с его физическим местоположением для интерпретации офлайн-поведения. Онлайн-взаимодействия (Personalization Features) критичны для подтверждения визита.
Идентификация визита — вероятностный процесс: Система не просто фиксирует близость. Она использует сложную модель оценки, взвешивая множество факторов (дистанция, популярность, персонализация, время работы), чтобы определить наиболее вероятное место посещения среди множества кандидатов.
Критичность точности данных о бизнесе (GBP): Точные координаты и актуальные часы работы напрямую влияют на способность системы идентифицировать визит (Distance Features и Business Hour Overlap Feature). Ошибки могут привести к тому, что визит будет приписан конкуренту.
Важность популярности (Popularity Features): Общая популярность места является важным сигналом. При прочих равных (например, при отсутствии сигналов персонализации) система предпочтет более популярное место.
Обратная связь и машинное обучение: Система может использовать пользовательские исправления в Timeline. Эти данные могут служить обучающей выборкой (training data) для улучшения весов признаков в Scoring Formula.
Основа для гиперперсонализации: Созданная User Location History является фундаментальным источником данных для персонализации поисковой выдачи и ответов на запросы о прошлом опыте пользователя.

Практика

Best practices (это мы делаем)

Рекомендации направлены на максимизацию сигналов, которые помогают Google корректно идентифицировать визиты в рамках Local SEO.

Обеспечение абсолютной точности в GBP: Поддерживайте максимально точные данные о местоположении (пин на карте) и часах работы. Это фундамент для корректного расчета Distance Features и Business Hour Overlap Feature.
Стимулирование цифрового взаимодействия (Online-to-Offline): Поощряйте действия, которые формируют Personalization Features. Это включает мотивацию пользователей строить маршруты в Google Maps, делать чекины, искать ваш бренд перед визитом. Чем больше цифровых следов, тем выше уверенность системы в факте визита.
Использование Google-сервисов: Интеграция с Google Wallet/Pay или системами бронирования, которые Google может отслеживать (например, через Email), может служить сильным сигналом для Personalization Features, подтверждающим визит через транзакцию или бронь.
Повышение узнаваемости и популярности: Работайте над увеличением глобальных сигналов популярности (отзывы, упоминания в соцсетях). Это повышает Popularity Features и помогает системе выбрать ваш бизнес при прочих равных.

Worst practices (это делать не надо)

Манипуляции с местоположением: Указание неверного адреса или смещение пина в GBP. Это ухудшает расчет Distance Features и может привести к тому, что визиты будут ошибочно приписаны соседним бизнесам.
Игнорирование часов работы: Указание неактуальных часов работы. Если система решит, что вы были закрыты во время визита пользователя (низкий Business Hour Overlap Feature), визит может быть не засчитан.
Фокус только на традиционном SEO без учета взаимодействий: Недостаток цифровых сигналов взаимодействия (Personalization Features) снижает способность Google идентифицировать визит, особенно в сложных локациях (например, в ТЦ).

Стратегическое значение

Патент подтверждает стратегию Google на глубокое понимание поведения пользователей в реальном мире и конвергенцию цифрового взаимодействия и физических посещений. Для Local SEO это означает, что сигналы, подтверждающие реальную активность и вовлеченность (Engagement, O2O), становятся все более важными. Долгосрочная стратегия должна фокусироваться на оптимизации всего пути пользователя: от онлайн-обнаружения до физического визита и последующих действий.

Практические примеры

Сценарий: Разрешение неоднозначности в Торговом Центре (ТЦ)

Пользователь провел 2 часа в ТЦ. GPS-данные неточны. Система должна определить, какие магазины он посетил.

Сегментация и Кандидаты: Система формирует сегмент внутри ТЦ и идентифицирует 50 магазинов как кандидатов.
Вычисление признаков:
- Магазин А (Одежда): Средняя популярность. Пользователь искал «купить кроссовки» час назад.
- Магазин Б (Книги): Высокая популярность. Пользователь никогда не взаимодействовал с ним.
- Магазин В (Кофейня): Высокая популярность. Пользователь оплатил заказ через Google Pay.
Скоринг: Система анализирует признаки. Personalization Features (поиск кроссовок и транзакция Google Pay) значительно повышают оценки Магазина А и Магазина В.
Результат: Система с высокой уверенностью идентифицирует визит в Магазин В (благодаря транзакции) и с высокой вероятностью в Магазин А (благодаря релевантному поиску), игнорируя Магазин Б, несмотря на его популярность.

Вопросы и ответы

Как этот патент влияет на ранжирование в локальном поиске (Local SEO)?

Он напрямую не описывает алгоритмы ранжирования Local Pack. Однако он критически важен, так как описывает механизм создания User Location History. Эта история является мощным источником данных для персонализации выдачи. Если Google знает, что пользователь посещал ваш бизнес (благодаря этой системе), ваш бизнес с большей вероятностью будет ранжироваться выше в его персональной выдаче. Также агрегированные данные о посещениях могут влиять на общую популярность места.

Какие сигналы наиболее важны для того, чтобы Google «засчитал» визит в мою компанию?

Патент выделяет четыре ключевых типа сигналов. Критически важны Personalization Features: искал ли пользователь вас, строил ли маршрут, чекинился ли, платил ли через Google Pay. Также важны точность ваших координат (Distance Features), ваша глобальная популярность (Popularity Features) и корректные часы работы (Business Hour Overlap Feature).

Что делать, если мой бизнес находится в здании с множеством других арендаторов?

В таких условиях возрастает важность Personalization Features. Необходимо максимально стимулировать пользователей к цифровому взаимодействию именно с вашим бизнесом до, во время или после визита. Также критически важно максимально точно настроить ваше местоположение в Google Business Profile.

Насколько важны часы работы в Google Business Profile?

Очень важны. Патент описывает Business Hour Overlap Feature. Если согласно вашему профилю вы были закрыты в момент, когда пользователь находился рядом, система может исключить вашу компанию из списка кандидатов на посещение, даже если пользователь на самом деле был у вас.

Имеет ли значение, как давно пользователь взаимодействовал с моим бизнесом онлайн?

Да. Патент указывает, что при расчете Personalization Features может учитываться временная корреляция (temporal correlation). Недавние взаимодействия (например, построение маршрута за 15 минут до визита) будут иметь значительно больший вес, чем взаимодействия, произошедшие давно.

Использует ли Google данные из электронной почты или социальных сетей?

Да. Патент упоминает анализ Email data (например, бронирование отелей или ресторанов) и Social media data (чекины, отзывы) как источники данных для извлечения взаимодействий между пользователем и location entity. Эти данные влияют на Personalization Features.

Как работает формула скоринга (Scoring Formula)?

Она сравнивает взвешенные признаки одного кандидата с признаками всех остальных кандидатов в данном сегменте. Описанный в патенте вариант напоминает функцию Softmax: она вычисляет вероятность того, что пользователь посетил именно это место, относительно других мест поблизости. Веса признаков настраиваются с помощью машинного обучения.

Что происходит, когда пользователь редактирует свою историю местоположений (Timeline)?

Когда пользователь указывает на ошибку, система предлагает альтернативные варианты (кандидатов с высокими оценками). Выбор пользователя сохраняется. Эти исправления, согласно патенту, могут использоваться как обучающие данные (training data) для улучшения скоринговой модели машинного обучения.

Как система обрабатывает короткие остановки?

Патент упоминает возможность отбрасывания сегментов, если их продолжительность не превышает порогового значения (в примере указано 10 минут). Это помогает отфильтровать ситуации, когда пользователь просто проезжал мимо или остановился очень ненадолго.

Как система кластеризует данные в сегменты?

Кластеризация (clustering) происходит на основе местоположения и времени. Система ищет группы отчетов, близких друг к другу. Качество сегмента оценивается на основе расстояния каждого отчета до среднего местоположения сегмента (mean location), стремясь создать максимально плотные кластеры.