Google использует систему для аппроксимации текущего местоположения пользователя, когда точные данные (например, GPS) недоступны. Система анализирует исторические данные о локациях (из поиска, карт, IP) и текущий IP-адрес. Найденные локации оцениваются с помощью машинного обучения (регрессионный анализ), и если они формируют кластер, их достоверность повышается. Это позволяет предоставлять локализованные результаты поиска.
Описание
Какую задачу решает
Патент решает проблему предоставления Location-Enhanced Services (сервисов, зависящих от местоположения, таких как локальный поиск или карты), когда точное текущее местоположение устройства пользователя неизвестно или не может быть определено с достаточной точностью. Это особенно актуально для мобильных устройств, где GPS или Wi-Fi позиционирование могут быть недоступны, а геолокация по IP-адресу мобильного оператора часто неточна.
Что запатентовано
Запатентована система и метод для аппроксимации местоположения пользователя. Если точная локация недоступна, система анализирует Historical Location Data (исторические данные о местоположении, связанные с аккаунтом или cookie) и Current IP Address Data (данные текущего IP-адреса). Система генерирует локации-кандидаты и присваивает каждой Confidence Score (оценку уверенности), используя модели, обученные с помощью машинного обучения (regression analyses). Для повышения точности система идентифицирует Clusters (кластеры близко расположенных локаций) и увеличивает их оценки.
Как это работает
Система активируется, когда точное местоположение устройства определить не удается:
- Сбор данных: Извлекаются потенциальные локации из истории пользователя (прошлые GPS координаты, поиски, IP) и текущего IP-адреса.
- Оценка (Scoring): Каждой локации присваивается Confidence Score. Оценка учитывает свежесть данных (Age). Веса в формуле настраиваются с помощью regression analyses.
- Кластеризация (Clustering): Система ищет группы локаций, расположенных близко друг к другу.
- Корректировка оценок: Если локации формируют кластер (например, история указывает на «Стэнфорд», а текущий IP на «Пало-Альто»), их Confidence Scores повышаются.
- Выбор: Локация с наивысшей итоговой оценкой выбирается как аппроксимированное текущее местоположение пользователя.
Актуальность для SEO
Высокая. Локализация и персонализация являются фундаментальными аспектами современного поиска, особенно на мобильных устройствах. Поскольку доступ к точному местоположению (GPS) не всегда гарантирован, использование исторических данных и косвенных сигналов для аппроксимации локации является стандартной и необходимой практикой.
Важность для SEO
Патент имеет высокое значение (7/10) для Local SEO. Он не описывает алгоритм ранжирования контента, но критически важен для понимания того, как Google определяет географический контекст пользователя. Именно этот механизм решает, какую локальную выдачу (Map Pack, локализованные органические результаты) увидит пользователь, если его точное местоположение неизвестно. Это напрямую влияет на видимость локальных бизнесов.
Детальный разбор
Термины и определения
- Cluster (Кластер)
- Группа из двух или более локаций-кандидатов, которые расположены в пределах заранее определенного расстояния (predefined distance) друг от друга. В патенте приводятся примеры порогов: 25 км, 50 км, 75 км, 100 км.
- Confidence Score (Оценка уверенности)
- Метрика, присваиваемая каждой локации-кандидату. Выражает вероятность того, что данная локация совпадает с фактическим местоположением пользователя. Компоненты этой оценки обучаются с использованием машинного обучения.
- Current IP Address Data (Данные текущего IP-адреса)
- Информация о местоположении, полученная путем геолокации IP-адреса, с которого поступил текущий запрос.
- Historical Location Data (Исторические данные о местоположении)
- Данные о прошлых местоположениях пользователя, связанные с его аккаунтом или cookie (при наличии согласия). Могут включать историю IP-адресов, исторические данные GPS, историю поисковых запросов (historical query data), а также данные из истории браузера, истории карт, адресной книги, электронной почты, календаря.
- Location-Enhanced Service (Сервис, улучшенный с учетом местоположения)
- Любой сервис (поиск, карты, реклама, персональный ассистент), который использует знание о местоположении пользователя для адаптации предоставляемых результатов.
- Regression Analyses (Регрессионный анализ)
- Методы машинного обучения, используемые для обучения (тренировки) компонентов формулы Confidence Score на основе набора данных с известной точностью (ground truth).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод аппроксимации местоположения пользователя с акцентом на машинное обучение.
- Доступ к Historical Location Data и Current IP Address Data.
- Анализ данных для идентификации множества локаций.
- Определение Confidence Score для каждой локации. Ключевое уточнение: один или более компонентов Confidence Score обучаются (trained) путем выполнения одного или нескольких regression analyses на предоставленном наборе данных о местоположении с известной точностью или категоризацией.
- Выбор локации с наивысшим Confidence Score в качестве местоположения пользователя.
Ядром изобретения является применение машинного обучения (регрессионного анализа) для оптимизации того, как взвешиваются различные сигналы при расчете оценки уверенности, а не простое использование исторических данных.
Claim 3 (Зависимый от 1): Уточняет, что определение Confidence Score включает определение возраста (Age), связанного с каждой локацией из Historical Location Data. Свежесть данных является важным фактором.
Claim 6 (Зависимый от 1): Описывает механизм кластеризации для повышения уверенности.
- Идентификация двух или более локаций, которые формируют Cluster (расположены в пределах predefined distance друг от друга).
- Модификация (повышение) Confidence Scores для локаций в кластере путем корректировки каждой оценки с помощью веса (weight), связанного с кластером.
Если разные источники данных указывают на одну и ту же общую географическую область, это значительно повышает уверенность системы в этой аппроксимации.
Где и как применяется
Этот патент описывает механизм определения контекста пользователя, что является критически важным входным сигналом для поисковой системы.
INDEXING – Индексирование (Сбор данных)
Система предварительно собирает и хранит Historical Location Data, связывая ее с аккаунтами пользователей или идентификаторами (cookies). Это происходит постоянно при взаимодействии пользователя с сервисами (при наличии согласия).
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Перед началом поиска и ранжирования система должна понять контекст запроса, включая местоположение пользователя. Если точное местоположение (GPS/WiFi) недоступно в момент запроса, активируется описанный механизм аппроксимации для определения наиболее вероятной локации.
RANKING и RERANKING
Механизм напрямую не участвует в ранжировании, но предоставляет критически важный входной сигнал (аппроксимированную локацию), который используется алгоритмами ранжирования для локализации результатов (например, для Local Pack и локализованных органических результатов).
Входные данные:
- Текущий запрос на сервис.
- Current IP Address Data.
- Идентификатор пользователя (User Account ID или Cookie).
- Historical Location Data, связанная с идентификатором.
Выходные данные:
- Аппроксимированное местоположение пользователя (например, координаты или географическая область) с наивысшим Confidence Score.
На что влияет
- Специфические запросы: Запросы с явным или неявным локальным интентом (например, «ресторан», «автосервис», «купить [товар]»), где результаты сильно зависят от местоположения пользователя.
- Конкретные типы контента: Наибольшее влияние на локальный контент, страницы местных бизнесов, результаты в Картах (Map Packs).
- Ниши: Критично для всех ниш, связанных с локальным бизнесом (услуги, ритейл, рестораны).
Когда применяется
Алгоритм применяется при выполнении следующих условий:
- Триггер активации 1: Поступил запрос на Location-Enhanced Service.
- Триггер активации 2: Текущее местоположение клиентского устройства не может быть определено с достаточной точностью (например, GPS недоступен или данные устарели).
- Условие применения: Клиентское устройство связано с Historical Location Data (пользователь вошел в аккаунт или имеет соответствующий файл cookie).
Пошаговый алгоритм
- Получение запроса: Система получает запрос на сервис от клиентского устройства.
- Попытка точного определения локации: Система пытается определить текущее местоположение (например, через GPS, Wi-Fi).
- Проверка точности: Определяется, достаточно ли точны полученные данные.
- Если ДА: Использовать точную локацию. Процесс завершен.
- Если НЕТ: Перейти к шагу 4.
- Проверка исторических данных: Определяется, связано ли устройство с Historical Location Data.
- Если НЕТ: Предоставить сервис без локальных улучшений или только на основе IP. Процесс завершен.
- Если ДА: Перейти к шагу 5.
- Идентификация кандидатов: Система идентифицирует множество локаций на основе Historical Location Data и Current IP Address Data.
- Расчет Confidence Score: Для каждой локации рассчитывается Confidence Score. Расчет использует формулу, учитывающую свежесть данных (Age). Веса в формуле определяются с помощью обученных моделей (Regression Analyses).
- Идентификация кластеров: Система ищет Clusters — группы локаций, находящихся в пределах predefined distance друг от друга.
- Корректировка оценок: Confidence Scores для локаций, формирующих кластер, корректируются (повышаются) с помощью веса, связанного с кластером.
- Выбор локации: Выбирается локация с наивысшим итоговым Confidence Score.
- Предоставление сервиса: Запрошенный сервис предоставляется с использованием выбранной аппроксимированной локации.
Какие данные и как использует
Данные на входе
Система использует следующие типы данных (при наличии согласия пользователя):
- Поведенческие и Пользовательские факторы (составляющие Historical Location Data):
- История поисковых запросов (historical query data).
- История веб-браузинга.
- История использования карт (Maps history).
- Данные из адресной книги, архива электронной почты (email archive), календаря.
- Географические факторы:
- Current IP Address Data (геолокация текущего IP).
- Исторические данные IP-адресов.
- Исторические данные позиционирования (например, прошлые GPS-координаты).
- Технические факторы:
- Идентификаторы устройств (Device identifiers), например, серийный номер, MAC-адрес. Используются для связи активности на разных устройствах с одним аккаунтом.
- Идентификаторы сессии (Cookies).
- Временные факторы: Временные метки (timestamps) для всех исторических данных, используемые для расчета возраста (Age).
Какие метрики используются и как они считаются
- Confidence Score: Основная метрика для выбора локации. Рассчитывается по формуле, учитывающей различные параметры.
- Age (Возраст/Свежесть): Параметр для оценки исторических данных. Более свежие данные получают более высокий вес. В патенте упоминается, что данные старше пяти дней могут оцениваться очень низко.
- Location Consistency (Согласованность локаций): Оценивается через механизм кластеризации.
- Predefined distance (Порог кластеризации): Заранее определенное расстояние для формирования кластера (например, от 25 км до 100 км).
- Алгоритмы машинного обучения: В патенте явно указано использование Regression Analyses для обучения компонентов формулы Confidence Score. Модели обучаются на наборе данных, где точность определения локации известна (классифицирована как точная или неточная).
Выводы
- Агрессивная локализация контекста: Google прилагает значительные усилия для определения местоположения пользователя, чтобы обеспечить локализацию выдачи, даже если точные данные (GPS) недоступны.
- Широкий спектр исторических данных: Для аппроксимации локации используется не только история поиска или IP, но и данные из смежных сервисов (карты, почта, календарь, история браузера), что подчеркивает глубину профилирования пользователя (при наличии согласия).
- Машинное обучение в основе оценок: Расчет Confidence Score не является эвристическим. Он основан на моделях машинного обучения (Regression Analyses), обученных на реальных данных, что позволяет оптимизировать точность аппроксимации.
- Кластеризация как сигнал достоверности: Согласованность между различными источниками данных (например, текущий IP и недавняя история поиска указывают на одну область) значительно повышает уверенность системы в аппроксимированной локации.
- «Цифровая локация» может отличаться от физической: Для SEO важно понимать, что локальная выдача может быть привязана к аппроксимированной локации (например, домашний адрес), даже если пользователь физически находится в другом месте, если точные сигналы геолокации отсутствуют.
Практика
Best practices (это мы делаем)
- Консистентность NAP для Local SEO: Обеспечивайте максимальную согласованность данных о бизнесе (Name, Address, Phone) во всех источниках (сайт, Google Business Profile, каталоги). Это помогает Google четко ассоциировать ваш бизнес с конкретной географической областью. Когда система аппроксимирует локацию пользователя к этой области, ваш бизнес будет иметь больше шансов появиться в выдаче.
- Создание гео-таргетированного контента: Разрабатывайте контент, ориентированный на конкретные города или районы, где находится ваша целевая аудитория. Если пользователи часто ищут информацию, связанную с определенной локацией (что фиксируется в Historical Location Data), Google с большей вероятностью будет аппроксимировать их местоположение к этой локации.
- Учет поведенческой истории аудитории: При анализе трафика и планировании кампаний учитывайте, что локализация выдачи может базироваться на истории поведения пользователя (например, часто посещаемые места — дом/работа), а не только на его текущем физическом местоположении.
Worst practices (это делать не надо)
- Игнорирование разницы между физической и цифровой локацией: Ошибочно полагать, что пользователь, ищущий «рядом со мной», всегда увидит результаты, основанные на его физическом местоположении. Если GPS отключен, система использует аппроксимацию.
- Ненадежное тестирование локальной выдачи: Использование только VPN или режима инкогнито для тестирования локальной выдачи может давать искаженные результаты, если используется аккаунт с историей локаций. Historical Location Data может перевесить Current IP Address Data.
Стратегическое значение
Патент подтверждает стратегическую важность локализации как ключевого элемента понимания контекста пользователя. Он демонстрирует техническую сложность и многофакторность определения местоположения, включая использование ML и кросс-сервисных данных. Для SEO-стратегии это означает, что оптимизация под локальный поиск требует понимания того, как формируется «цифровой след» пользователя в экосистеме Google, который влияет на то, какую выдачу он увидит в условиях неопределенности.
Практические примеры
Сценарий 1: Тестирование локальной выдачи SEO-специалистом
- Ситуация: SEO-специалист в Москве хочет проверить позиции в Самаре. Он использует VPN (Самарский IP), но залогинен в свой рабочий аккаунт (с историей в Москве).
- Работа механизма: Google видит противоречие: Current IP (Самара) vs Historical Data (Москва). Кластер не формируется.
- Результат: Если Confidence Score для Москвы выше (из-за свежей и объемной истории), Google может аппроксимировать местоположение как Москва и показать московскую выдачу, игнорируя VPN.
- Действие: Использовать чистые профили или инструменты эмуляции (например, параметры uule) для надежного тестирования.
Сценарий 2: Поиск на мобильном устройстве с отключенным GPS.
- Ситуация: Пользователь ищет «доставка пиццы» с телефона, GPS отключен. Он находится на работе (Локация А), но живет в пригороде (Локация Б).
- Анализ данных: Current IP (мобильный оператор) неточен. Historical Data показывает недавнюю активность в Локации А (работа).
- Результат: Система выбирает Локацию А из-за высокой свежести (Age) и присваивает ей высокий Confidence Score. Пользователь видит доставку пиццы рядом с работой.
Вопросы и ответы
Как этот патент влияет на Local SEO?
Он имеет прямое влияние. Патент описывает механизм, который определяет, какую локальную выдачу увидит пользователь, если его точное местоположение неизвестно (например, выключен GPS). Это означает, что видимость вашего бизнеса может зависеть от того, насколько точно Google аппроксимирует местоположение пользователя, основываясь на его истории и IP.
Что такое Historical Location Data, и откуда Google ее берет?
Это данные о прошлых местоположениях пользователя. В патенте упоминается широкий спектр источников (при наличии согласия пользователя): история поисковых запросов, история IP-адресов, прошлые данные GPS, история веб-браузера, история карт, а также данные из адресной книги, электронной почты и календаря.
Может ли Google показывать мне результаты для дома, когда я на работе?
Да. Если GPS отключен и текущий IP-адрес неточен, система будет аппроксимировать ваше местоположение. Если ваша Historical Location Data сильно смещена в сторону домашнего адреса и эти данные формируют более сильный кластер или имеют более высокую свежесть, система может решить, что вы дома.
Что такое «кластеризация» локаций в контексте этого патента?
Это процесс группировки локаций-кандидатов, которые находятся близко друг к другу (например, в пределах 25-100 км). Если разные источники (например, текущий IP и история поиска) указывают на одну и ту же общую область, они формируют кластер. Наличие кластера повышает Confidence Score этих локаций.
Использует ли этот механизм машинное обучение?
Да, это ключевой аспект патента. В Claim 1 прямо указано, что компоненты формулы расчета Confidence Score обучаются с использованием Regression Analyses (регрессионного анализа) на данных с известной точностью. Это позволяет системе автоматически оптимизировать веса различных сигналов.
Насколько важна свежесть исторических данных?
Свежесть (Age) является важным фактором при расчете Confidence Score. Более недавние исторические данные обычно имеют больший вес, чем старые. В патенте упоминается, что данные старше пяти дней могут получать очень низкую оценку.
Как SEO-специалисту надежно тестировать локальную выдачу, учитывая этот патент?
Использование только VPN или режима Инкогнито недостаточно, так как история аккаунта или cookie могут влиять на результат. Для надежного тестирования рекомендуется использовать «чистые» аккаунты без истории локаций и специализированные инструменты, позволяющие задать точные координаты (например, через параметры uule в URL или эмуляцию GPS в инструментах разработчика).
Работает ли этот механизм, если пользователь не вошел в аккаунт Google?
Да. В патенте упоминается, что Historical Location Data может быть связана не только с аккаунтом пользователя, но и храниться в файлах cookie клиентского устройства. Система может использовать эти данные для аппроксимации.
Влияет ли этот патент на ранжирование контента?
Патент не описывает алгоритм ранжирования. Он описывает механизм определения входного сигнала — местоположения пользователя. Этот сигнал затем используется основными алгоритмами ранжирования для локализации выдачи. Таким образом, влияние на ранжирование косвенное, но критически важное.
Что важнее: текущий IP-адрес или история локаций?
Система рассчитывает Confidence Score для обоих источников, используя обученные модели. Если история свежая, обширная и формирует кластер, она может иметь больший вес, чем текущий IP-адрес с низкой точностью геолокации. Фиксированного приоритета нет, все зависит от рассчитанных оценок уверенности.