Google анализирует историю местоположений пользователей для точной идентификации посещаемых бизнесов, даже при неточных данных GPS. Система ранжирует ближайшие локации, учитывая расстояние, известность бизнеса (Prominence Score), его категорию и время суток. Патент также описывает, как Google использует модели Маркова для прогнозирования будущих посещений на основе прошлых поведенческих паттернов, что позволяет проактивно персонализировать выдачу информации.
Описание
Какую задачу решает
Патент решает две ключевые проблемы, связанные с интерпретацией физического поведения пользователей:
- Неточность определения местоположения: Сложность точного определения того, какой именно бизнес посетил пользователь, когда данные GPS/геолокации неточны (например, в торговых центрах, плотной городской застройке или зданиях с несколькими бизнесами), и стандартный подход, основанный только на близости, неэффективен.
- Прогнозирование поведения: Использование истории местоположений для предсказания того, куда пользователь отправится в будущем, чтобы проактивно предоставлять релевантную информацию (например, данные о трафике) без явного запроса.
Что запатентовано
Запатентована система, состоящая из двух основных компонентов. Первый компонент ранжирует ближайшие физические локации на основе Visit Likelihood (вероятности того, что пользователь посетил именно их). Для этого используется формула, комбинирующая расстояние, временные распределения вероятности посещения для категории бизнеса и оценку известности (Prominence Score). Второй компонент – это предиктивная модель (например, Цепь Маркова), которая анализирует исторические паттерны посещений (Visit Vectors) для прогнозирования будущих визитов в определенные временные слоты.
Как это работает
Система работает в двух режимах:
Режим 1: Ранжирование ближайших локаций (Интерпретация визита)
- Получение геолокации и времени визита пользователя из Location History.
- Выполнение локального поиска для нахождения ближайших бизнесов.
- Для каждого бизнеса рассчитывается Visit Likelihood Score. Формула учитывает: близость (чем ближе, тем лучше), Prominence Score (чем известнее, тем лучше), соответствие времени визита и категории бизнеса (используя Visit Likelihood Distribution Across Time), а также часы работы.
- Бизнесы сортируются по этому Score, определяя наиболее вероятное место посещения.
Режим 2: Прогнозирование будущих визитов
- Анализ истории посещений и создание Visit Vectors для конкретных временных слотов (например, «Вторник 16:00»).
- Использование статистической модели (например, Цепи Маркова) для поиска повторяющихся паттернов в векторах.
- Расчет вероятности будущего визита на основе исторических последовательностей.
- Если вероятность превышает порог, система проактивно отправляет пользователю информацию (например, пробки по маршруту) перед началом временного слота.
Актуальность для SEO
Высокая. Понимание физических посещений и персонализация на основе истории местоположений являются ядром функциональности Google Maps, Local Search и персонализированных сервисов (Google Assistant). Методы, описанные в патенте, напрямую связаны с интерпретацией поведенческих сигналов в локальном поиске и развитием проактивных технологий.
Важность для SEO
Патент имеет критическое значение для Local SEO (85/100). Он подтверждает, что Google активно отслеживает и анализирует физические посещения, и детально описывает механизм точной атрибуции этих визитов. Prominence (Известность/Авторитетность) прямо упоминается как ключевой фактор в этом процессе атрибуции, что подчеркивает ее важность в локальном ранжировании. Если Google не может точно атрибутировать визит к вашему бизнесу из-за низкой Prominence или неверных данных, вы теряете ценные поведенческие сигналы.
Детальный разбор
Термины и определения
- Location History (История местоположений)
- Набор данных о географическом положении пользователя с временными метками, обычно получаемый с мобильного устройства (с согласия пользователя).
- Visit Likelihood Distribution Across Time (Распределение вероятности посещения во времени)
- Матрица или модель, показывающая вероятность посещения определенной категории бизнеса (например, «еда», «жилье») в зависимости от времени суток и дня недели. Используется для оценки правдоподобности визита в конкретное время.
- Prominence Score (Оценка известности/значимости)
- Метрика, используемая для ранжирования более известных или значимых бизнесов выше менее известных. Факторы могут включать авторитетность веб-сайта бизнеса, количество упоминаний, обзоры, ссылки и т.д.
- Visit Likelihood Score (Оценка вероятности посещения)
- Итоговая метрика, рассчитываемая для конкретного бизнеса на основе расстояния, Prominence Score, часов работы и Visit Likelihood Distribution. Используется для ранжирования потенциальных мест визита.
- Clustering (Кластеризация)
- Обработка сырых данных о местоположении для группировки близлежащих точек в одно «посещенное место». Может быть основана на расстоянии или адресе.
- Visit Vector (Вектор посещений)
- Поток булевых значений (Да/Нет), представляющий историю посещений определенного места в течение прошлых экземпляров определенного временного слота (например, история посещений спортзала по понедельникам в 8 утра).
- Timeslot (Временной слот)
- Определенный интервал времени, используемый для анализа повторяющегося поведения (например, «Вторник 16:00» или «Выходные»).
- Markov Chain Model (Цепь Маркова)
- Статистическая модель, используемая для анализа Visit Vectors и прогнозирования будущих событий на основе исторических последовательностей.
- T(X,Y) Function
- Функция, используемая в предиктивной модели. Подсчитывает количество раз, когда в Visit Vector встречается паттерн (sub-stream) длины Y, содержащий X положительных элементов (визитов).
Ключевые утверждения (Анализ Claims)
Примечание: Патент US10332019B2 является разделением (divisional) и продолжением (continuation) более ранних заявок. Хотя его описание (Description) подробно охватывает обе части изобретения (Часть 1: Ранжирование локаций и Часть 2: Прогнозирование визитов), Формула изобретения (Claims 1-13) в этом конкретном документе фокусируется исключительно на механизме прогнозирования (Часть 2).
Claim 1 (Независимый пункт): Описывает процесс прогнозирования будущих посещений на основе истории местоположений.
- Система получает историю местоположений пользователя (список посещенных мест).
- Для каждого места определяется история посещений (visit history data) для определенного временного слота (timeslot).
- Это включает определение Visit Vector и выполнение функции T(X,Y): подсчет количества исторических паттернов определенной длины (Y) с определенным количеством посещений (X).
- Система определяет, превышает ли вероятность будущего визита (future visit probability) установленный порог.
- Если ДА (для конкретного места): Автоматически выводить информацию об этом месте (описание или текущие условия, например, погода/трафик) до начала временного слота.
- Если НЕТ (вероятность не превышена ни для одного места): Для каждого места уменьшить длину анализируемого паттерна (Y) на единицу и повторно выполнить функцию T(X,Y).
Ядром изобретения в данном документе является метод прогнозирования будущих посещений с использованием Visit Vectors, специфической функции подсчета паттернов T(X,Y) и итеративного процесса уменьшения длины паттерна (Y), если статистическая значимость не найдена для более длинных паттернов.
Claim 3 (Зависимый): Уточняет расчет вероятности.
Future Visit Probability рассчитывается как: (Количество раз, когда за паттерном (X,Y) следовал положительный элемент) / (Общее число, возвращенное функцией T(X,Y)).
Где и как применяется
Это изобретение затрагивает обработку данных о местоположении, персонализацию и локальное ранжирование.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных:
- Обработка истории местоположений: Сырые данные геолокации кластеризуются и геокодируются для идентификации посещенных мест.
- Индексация данных о бизнесе: Рассчитываются и индексируются Prominence Scores для локальных бизнесов. Индексируются категории и часы работы.
- Генерация моделей: Создаются и обновляются Visit Likelihood Distributions Across Time для различных категорий.
RANKING / RERANKING (Локальный поиск и Персонализация)
Основное применение патента.
Часть 1 (Ранжирование локаций):
- Когда система интерпретирует данные о местоположении (например, для предложения «чек-ина» в Google Maps или при локальном поиске), она использует индексированные данные (Prominence, временные распределения) для расчета Visit Likelihood Score. Это позволяет ранжировать ближайшие места более точно, чем просто по расстоянию.
Часть 2 (Прогнозирование):
- Система периодически анализирует обработанную историю местоположений (Visit Vectors) с использованием модели Маркова. При обнаружении высокой вероятности будущего визита информация проактивно отправляется пользователю (например, через Google Assistant).
Входные данные:
- История местоположений пользователя.
- База данных локальных бизнесов (местоположение, категория, Prominence Score, часы работы).
- Visit Likelihood Distributions Across Time.
Выходные данные:
- Отсортированный список мест, которые пользователь, вероятно, посетил.
- Проактивные информационные карточки/уведомления на основе прогнозов.
На что влияет
- Конкретные типы контента: В первую очередь влияет на локальные сущности (бизнесы, точки интереса — POI) в Google Maps и локальном поиске.
- Влияние на выдачу: Влияет на ранжирование в локальных сервисах и на персонализацию/проактивную доставку информации (Google Assistant). Точность атрибуции визитов влияет на сбор поведенческих сигналов, которые критичны для локального ранжирования.
Когда применяется
- Часть 1 (Ранжирование локаций): Применяется при интерпретации данных о местоположении, когда существует неоднозначность (несколько бизнесов расположены близко друг к другу или точность GPS низкая).
- Часть 2 (Прогнозирование): Применяется периодически для анализа истории. Активируется, когда обнаруживается статистически значимый паттерн поведения, и вероятность будущего визита превышает порог.
Пошаговый алгоритм
Процесс А: Ранжирование ближайших пунктов назначения (Интерпретация визита)
- Получение данных о визите: Система получает географические данные (широта, долгота) и время визита из истории местоположений пользователя.
- Локальный поиск: Проводится локальный поиск для получения списка бизнесов, находящихся в радиусе от местоположения пользователя.
- Сбор признаков: Для каждого бизнеса извлекаются: Расстояние до пользователя, Категория, Prominence Score, Часы работы.
- Оценка временной вероятности: Время визита сравнивается с Visit Likelihood Distribution Across Time для категории этого бизнеса.
- Расчет Visit Likelihood Score: Для каждого бизнеса рассчитывается оценка. Патент приводит пример формулы:
log(likelihood) = a*log(prominence score) — b*log(distance) + c*log(number of visits when the business was open) — d*log(number of visits when the business was closed) + e*log(average likelihood of this business category across visits).
(a, b, c, d, e – весовые коэффициенты). - Сортировка и выбор: Бизнесы сортируются в порядке убывания Visit Likelihood Score.
Процесс Б: Прогнозирование будущих визитов (Анализ паттернов)
- Создание Visit Vectors: Для посещенных мест создаются векторы для интересующих временных слотов (Timeslots).
- Инициализация анализа паттерна: Устанавливается максимальная длина паттерна (Y_MAX).
- Анализ текущего паттерна: Система анализирует последние Y элементов вектора (текущий паттерн) и подсчитывает количество посещений (X) в нем.
- Поиск исторических аналогов (T(X,Y)): Система подсчитывает, сколько раз точно такой же паттерн (X, Y) встречался ранее в истории.
- Проверка статистической значимости: Сравнивается результат T(X,Y) с порогом.
- Если НИЖЕ порога: Недостаточно данных. Длина паттерна (Y) уменьшается на 1, и процесс возвращается к шагу 4 (если Y>0).
- Если ВЫШЕ порога: Данные значимы. Переход к шагу 7.
- Расчет вероятности: Рассчитывается вероятность будущего визита = (Количество раз, когда за паттерном (X,Y) следовало посещение) / T(X,Y).
- Принятие решения о прогнозе: Если рассчитанная вероятность превышает порог прогнозирования, система генерирует прогноз и планирует вывод информации.
Какие данные и как использует
Данные на входе
- Поведенческие и Пользовательские факторы:
- Location History: Критически важные данные (широта, долгота, временные метки, радиус точности).
- Check-ins: Упоминаются как данные обратной связи для улучшения алгоритма ранжирования локаций.
- Географические факторы:
- Расстояние между пользователем и бизнесом (используется в формуле расчета Visit Likelihood Score с отрицательным весом).
- Временные факторы:
- Время суток и день недели (используются в Visit Likelihood Distributions и Visit Vectors).
- Часы работы бизнеса (статус открыто/закрыто используется в формуле расчета Visit Likelihood Score).
- Факторы Сущности (Entity Factors):
- Категория бизнеса (определяет, какое временное распределение использовать).
- Prominence Score: Оценка известности и авторитетности бизнеса. Патент указывает, что она может основываться на факторах SEO: авторитетность веб-страницы, количество и качество ссылающихся документов, отзывы, упоминания.
Какие метрики используются и как они считаются
- Visit Likelihood Score: Рассчитывается с использованием специфической взвешенной формулы (см. Алгоритм А), которая агрегирует логарифмы от Prominence Score, дистанции, статуса часов работы и временного распределения.
- T(X,Y): Функция, подсчитывающая количество вхождений определенного поведенческого паттерна в Visit Vector. Используется для определения статистической значимости паттерна.
- Future Visit Probability: Вероятность будущего посещения. Рассчитывается как отношение количества положительных исходов, следовавших за паттерном, к общему количеству вхождений паттерна (T(X,Y)).
- Алгоритмы машинного обучения: Явно упоминаются модели Markov Chain Model и Random Forest для прогнозирования визитов.
Выводы
- Точная атрибуция физических визитов: Google вкладывает значительные ресурсы в точное определение того, какой именно бизнес посетил пользователь, даже при наличии шумных геолокационных данных. Это подтверждает важность физических посещений как поведенческого сигнала.
- Атрибуция сложнее, чем просто близость: Определение места визита – это не просто поиск ближайшего бизнеса. Это сложный расчет, в котором близость является лишь одним из факторов. Время суток, категория бизнеса, часы работы и Prominence Score играют решающую роль.
- Критичность Prominence в локальном поиске: Prominence Score (Известность/Авторитетность) явно используется как фактор для разрешения неоднозначностей. Высокая Prominence помогает Google «привязать» визит пользователя именно к вашему бизнесу, а не к соседнему, что критично для Local SEO.
- Глубокий анализ поведенческих паттернов: Google использует сложные статистические методы (Цепи Маркова, Visit Vectors) для анализа истории местоположений и прогнозирования будущих действий пользователя на основе прошлых паттернов.
- Фокус на проактивную персонализацию: Механизм прогнозирования предназначен для проактивной доставки информации (персонализация контента в Assistant, Maps), улучшая пользовательский опыт за пределами стандартного поиска.
Практика
Best practices (это мы делаем)
- Максимизация Prominence (Авторитетности) в локальном поиске: Это ключевая стратегия. Необходимо работать над повышением известности бренда (цитаты, обзоры, ссылки, упоминания в авторитетных источниках). Согласно патенту, Prominence помогает Google корректно идентифицировать визиты в вашу локацию, особенно в зонах с высокой плотностью бизнесов (ТЦ, бизнес-центры).
- Обеспечение абсолютной точности базовых данных (NAP, Категории, Часы работы): Формула Visit Likelihood Score явно использует статус «открыто/закрыто» и временные распределения, зависящие от категории. Неверные данные в Google Business Profile снижают вероятность того, что Google атрибутирует визит к вам.
- Выбор максимально релевантной основной категории: Категория определяет, какое Visit Likelihood Distribution будет применено. Выбор категории должен соответствовать основному паттерну посещения вашего бизнеса.
- Стимулирование «Чек-инов» (Check-ins) и отзывов: Патент упоминает, что данные о чек-инах могут использоваться как обратная связь для улучшения алгоритма. Стимулирование пользователей подтверждать свой визит помогает обучать систему и улучшает атрибуцию.
Worst practices (это делать не надо)
- Игнорирование часов работы и праздников: Указание неточных часов работы будет негативно влиять на расчет Visit Likelihood Score, так как формула штрафует за визиты в нерабочее время (см. компонент — d*log(number of visits when the business was closed)).
- Манипуляции с категориями: Выбор неподходящей основной категории может привести к несоответствию бизнеса ожидаемому Visit Likelihood Distribution, что снизит точность атрибуции визитов.
- Игнорирование Prominence в конкурентных локациях: Полагаться только на физическую близость в Local SEO недостаточно. В плотной застройке бизнес с более высоким Prominence Score может «перетянуть» на себя атрибуцию визита, даже если он находится чуть дальше от пользователя.
Стратегическое значение
Патент подтверждает критическую важность Prominence в экосистеме локального поиска Google. Он демонстрирует, что поведенческие сигналы (физические визиты) активно отслеживаются, и для их корректной интерпретации Google использует сложные модели, учитывающие авторитетность сущности (Entity). Это подчеркивает стратегическую необходимость построения авторитетного локального бренда (Brand Authority). Также патент показывает глубокий уровень анализа поведения пользователей для персонализации и проактивного предоставления информации.
Практические примеры
Сценарий: Разрешение неоднозначности в Фуд-корте (Local SEO)
- Ситуация: Пользователь находится в центре фуд-корта торгового центра в 13:00 (обеденное время). Точность GPS низкая. В радиусе 20 метров находятся 5 ресторанов (A, B, C, D, E).
- Действие системы (Часть 1 патента): Google выполняет локальный поиск и рассчитывает Visit Likelihood Score для всех 5 ресторанов.
- Анализ факторов:
- Временной фактор: 13:00 – это пиковое время для категории «Еда». Все получают высокий балл по этому фактору.
- Фактор дистанции: Ресторан А физически чуть ближе к центру радиуса погрешности.
- Фактор Prominence: Ресторан E – это известный бренд с тысячами отзывов и высоким Prominence Score. Ресторан А – небольшая локальная точка с низким Prominence Score.
- Результат: Несмотря на то, что Ресторан А был чуть ближе, высокий Prominence Score Ресторана E значительно увеличивает его итоговый Visit Likelihood Score. Google атрибутирует визит к Ресторану E.
Вывод для SEO: Владельцу Ресторана А критически необходимо повышать Prominence (работать над отзывами, ссылками, узнаваемостью), чтобы конкурировать с крупными брендами за атрибуцию визитов и связанные с этим поведенческие сигналы.
Вопросы и ответы
Означает ли этот патент, что физические посещения являются фактором ранжирования в Local Pack?
Патент не утверждает это напрямую, но он детально показывает, насколько тщательно Google отслеживает, интерпретирует и атрибутирует физические посещения к конкретным бизнесам. Способность точно измерять реальную посещаемость является необходимым условием для использования этих данных в качестве сигнала ранжирования. Это сильно поддерживает гипотезу о том, что посещаемость является важным поведенческим сигналом в локальном поиске.
Что такое Prominence Score, упоминаемый в патенте, и как его улучшить?
Prominence Score — это оценка известности и авторитетности бизнеса. В патенте он используется как ключевой фактор для определения вероятности визита. Для его улучшения необходимо работать над классическими факторами Local SEO: авторитетность основного сайта компании, количество и качество внешних ссылок, упоминаний (citations) в авторитетных источниках и управление онлайн-репутацией (отзывы).
Как время суток влияет на мою локальную видимость согласно патенту?
Google использует Visit Likelihood Distribution Across Time – модель, которая знает, когда люди обычно посещают бизнесы разных категорий (например, рестораны в обед). Если время визита или поиска пользователя совпадает с пиковым временем для вашей категории, вероятность того, что Google посчитает ваш бизнес релевантным, повышается.
Почему точные часы работы критичны в контексте этого патента?
В патенте приведена конкретная формула для расчета Visit Likelihood Score, которая включает компоненты, учитывающие, был ли бизнес открыт или закрыт во время визита. Формула повышает вероятность, если визит был в рабочие часы, и понижает (штрафует), если бизнес был закрыт. Неверные часы работы напрямую вредят атрибуции визитов.
Что такое «Вектор посещений» (Visit Vector) и как он используется для прогнозирования?
Visit Vector – это история посещений конкретного места в определенный временной слот (например, каждую пятницу в 18:00), представленная в виде последовательности Да/Нет (T/F). Google использует статистические модели (Цепи Маркова) для анализа этих векторов, поиска повторяющихся паттернов и предсказания вероятности посещения в следующий раз в этот же временной слот.
Мой бизнес находится в здании с множеством других компаний (например, в ТЦ). Как мне убедиться, что Google атрибутирует визиты ко мне?
В условиях низкой точности GPS и высокой плотности бизнесов факторы, отличные от дистанции, становятся решающими. Согласно патенту, вам необходимо максимизировать ваш Prominence Score и обеспечить идеальную точность часов работы и категорий. Это поможет алгоритму выделить ваш бизнес среди соседей при расчете Visit Likelihood Score.
Используется ли механизм прогнозирования визитов для ранжирования в поиске?
Нет. Патент указывает, что цель прогнозирования – это проактивная доставка релевантной информации пользователю до того, как он ее запросит (например, показ карточек с пробками по маршруту на работу утром). Это механизм для улучшения пользовательского опыта в таких продуктах, как Google Assistant или Maps, а не для ранжирования в SERP.
Что происходит, если у пользователя нет четких паттернов поведения или мало истории?
Система использует итеративный подход. Если для длинного паттерна (например, 4 недели) недостаточно данных, она уменьшает длину анализируемого периода (например, до 3 недель), пока не найдет статистически значимый паттерн. Если данных совсем мало, патент упоминает возможность использования агрегированных данных других пользователей схожего профиля.
Как стимулирование «check-ins» влияет на работу алгоритма?
Патент явно упоминает, что «check-ins» могут использоваться для улучшения работы системы. Когда пользователь подтверждает визит через «check-in», это служит сигналом обратной связи, который валидирует или корректирует расчет Visit Likelihood. Это помогает обучать систему и может повысить точность атрибуции будущих визитов.
Что важнее для определения визита: расстояние или известность (Prominence)?
Оба фактора важны и используются в комбинации с временными факторами. Расстояние является ключевым ограничителем (система ищет только ближайшие места). Однако, когда несколько мест находятся близко, Prominence Score и время суток становятся решающими факторами для определения того, какое именно место было целью визита.