Google анализирует названия Wi-Fi сетей (SSID) и их предполагаемое местоположение, чтобы точно определить, какому бизнесу принадлежит точка доступа. Когда пользователь подключается к этой сети, система получает надежный сигнал о его физическом присутствии в данном заведении (семантическое местоположение). Этот механизм позволяет Google собирать точные данные о посещаемости, которые влияют на локальное ранжирование.
Описание
Какую задачу решает
Патент решает проблему неточности определения местоположения устройств, особенно в помещениях, где GPS работает плохо. Стандартные методы аппроксимации местоположения точек доступа Wi-Fi часто имеют низкое качество и не предоставляют семантической информации (т.е. неясно, какому заведению принадлежит сеть). Изобретение направлено на точную идентификацию реальной сущности (бизнеса, кафе, музея), связанной с конкретной точкой доступа, и использование этого для надежного определения Semantic Location (семантического местоположения) пользователя.
Что запатентовано
Запатентована система для связывания точек доступа беспроводной сети (Wi-Fi AP) с конкретными физическими сущностями (Entity). Система анализирует название сети (SSID) и сопоставляет его с базой данных сущностей, находящихся рядом с предполагаемым местоположением точки доступа. Для выбора наилучшего соответствия используется Confidence Score (оценка уверенности), учитывающая текстовое совпадение и физическое расстояние. Цель — точно знать, где находится пользователь, когда он подключается к сети.
Как это работает
Механизм работает следующим образом:
- Сбор данных: Система получает предполагаемое местоположение точки доступа Wi-Fi и ее SSID.
- Текстовый анализ: SSID анализируется (токенизируется) для извлечения Text Signals (текстовых сигналов) — значимых слов или фраз.
- Поиск кандидатов: Идентифицируются все сущности (бизнесы) в определенном радиусе от предполагаемого местоположения точки доступа.
- Оценка уверенности (Scoring): Для каждого кандидата рассчитывается Confidence Score. Оценка повышается, если Text Signals из SSID совпадают с названием сущности, ее адресом или текстом на ее веб-сайте. Оценка также учитывает расстояние между точкой доступа и сущностью.
- Идентификация: Сущность с наивысшей оценкой связывается с точкой доступа.
- Применение: Когда устройство пользователя подключается к этой сети, система получает высоконадежный сигнал о том, что пользователь физически находится в этом заведении.
Актуальность для SEO
Высокая. Точное определение местоположения пользователя и измерение физической посещаемости (foot traffic) являются критически важными для локального поиска, персонализации и рекламных платформ Google. Этот патент описывает конкретный механизм для улучшения качества данных о местоположении, что напрямую влияет на метрики популярности сущностей, используемые в локальном ранжировании.
Важность для SEO
Патент имеет высокое значение для Local SEO. Хотя он не описывает алгоритм ранжирования, он раскрывает ключевой механизм сбора и валидации данных о поведении пользователей в офлайне. Точное определение посещаемости (популярности) заведения является подтвержденным фактором ранжирования в локальном поиске (Prominence). Понимание того, как Google верифицирует присутствие пользователя через Wi-Fi, подчеркивает важность работы над привлечением и удержанием реальных посетителей.
Детальный разбор
Термины и определения
- Confidence Score (Оценка уверенности)
- Метрика, рассчитываемая для сущности-кандидата, указывающая на вероятность того, что данная точка доступа связана именно с этой сущностью. Рассчитывается на основе совпадения Text Signals с информацией о сущности и расстояния до нее.
- Database of Entity Information (База данных информации о сущностях)
- Хранилище данных (например, база данных географической информационной системы), которое связывает сущности с их географическими координатами.
- Entity (Сущность)
- Реальный объект физического мира, такой как локальный бизнес, ресторан, кафе, музей, заведение.
- Estimated Location (Предполагаемое местоположение)
- Аппроксимированное географическое местоположение точки доступа Wi-Fi, часто имеющее определенную степень неопределенности (uncertainty).
- Network Name / SSID (Название сети / Идентификатор набора услуг)
- Текстовая строка (имя), транслируемая точкой доступа Wi-Fi, которую видят пользователи при поиске сети.
- Scoring Function (Функция оценки)
- Алгоритм, используемый для расчета Confidence Score. Учитывает различные факторы, включая текстовые совпадения, популярность терминов и расстояние.
- Semantic Location (Семантическое местоположение)
- Идентификация конкретной сущности, в которой находится пользователь (например, «Пользователь находится в Café Intermezzo»), в отличие от просто географических координат.
- Text Signal (Текстовый сигнал)
- Токен (слово, фраза, символ), извлеченный из SSID с помощью методов текстового анализа (например, токенизации).
- User Presence Signal (Сигнал присутствия пользователя)
- Данные, указывающие на то, что пользователь находится в определенном месте (например, «check-in» в социальной сети). Может использоваться для повышения Confidence Score.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод идентификации сущности, связанной с точкой доступа.
- Система получает предполагаемое местоположение точки доступа Wi-Fi.
- Система получает SSID точки доступа.
- SSID анализируется для идентификации как минимум одного Text Signal.
- Система идентифицирует сущность, связанную с точкой доступа, на основе Text Signal и местоположения.
- Информация о сущности выводится (например, для отображения).
Пункт 1 также детализирует процесс идентификации (шаги 4 и 5 выше):
- Доступ к Database of Entity Information.
- Идентификация множества сущностей-кандидатов на основе предполагаемого местоположения точки доступа.
- Определение Confidence Score для каждого кандидата на основе Text Signal.
- Идентификация сущности на основе Confidence Score.
- Критически важно: Указано, что Confidence Score определяется на основе расстояния (distance) между предполагаемым местоположением точки доступа и местоположением сущности-кандидата.
Claim 3 и 4 (Зависимые): Детализируют применение изобретения для определения местоположения пользователя.
Определение Semantic Location пользовательского устройства на основе идентифицированной сущности. Это происходит путем получения сигнала о том, что устройство подключилось к данной точке доступа. Подключение используется как подтверждение физического присутствия пользователя в заведении.
Claim 6 и 7 (Зависимые): Описывают метод выбора кандидатов.
Идентификация кандидатов происходит путем выбора сущностей, расположенных в пределах определенного радиуса от предполагаемого местоположения точки доступа. Радиус определяется как функция одного или нескольких параметров: неопределенности местоположения точки доступа (uncertainty), неопределенности местоположения сущности в базе данных и предполагаемого радиуса действия (range) точки доступа.
Claim 8, 9, 10, 11 (Зависимые): Детализируют работу Scoring Function.
Confidence Score определяется с помощью Scoring Function, которая является функцией от Text Signal. Функция предоставляет оценку на основе совпадения (match) между Text Signal и информацией, связанной с сущностью (Claim 9). Функция также учитывает популярность (popularity) Text Signal (Claim 10) и может учитывать User Presence Signal (например, check-in) (Claim 11).
Где и как применяется
Изобретение относится к инфраструктуре сбора и обработки данных Google, которая обеспечивает работу систем ранжирования, особенно в локальном поиске.
CRAWLING – Сканирование и Сбор данных (Data Acquisition)
На этом этапе система собирает «сырые» данные с устройств пользователей (с их согласия). Сюда входят данные о видимых Wi-Fi сетях (SSID, сила сигнала) и данные позиционирования (GPS, триангуляция). Это основной источник входных данных для описанного механизма.
INDEXING – Индексирование и извлечение признаков (Feature Extraction)
Основная работа механизма происходит на этом этапе:
- Обработка данных о местоположении: Сырые данные обрабатываются для определения предполагаемых местоположений точек доступа.
- Связывание Wi-Fi и Сущностей: Описанный в патенте алгоритм (анализ SSID, расчет Confidence Score) выполняется для создания точного соответствия между точками доступа и физическими сущностями (Knowledge Graph).
- Извлечение признаков сущности (Entity Feature Extraction): Когда пользователь подключается к идентифицированной сети, это регистрируется как посещение. Эти данные агрегируются для вычисления метрик популярности сущности (foot traffic, dwell time, пиковые часы), которые сохраняются как признаки сущности и используются на этапе RANKING.
- Индексирование веб-контента: Система также индексирует веб-сайты сущностей, так как текст с сайта может использоваться в Scoring Function для сопоставления.
RANKING – Ранжирование (Local Ranking)
Сам алгоритм из патента не ранжирует результаты. Однако данные, которые он генерирует (точные данные о посещаемости и популярности), используются алгоритмами локального ранжирования как сильный сигнал авторитетности и релевантности бизнеса.
Входные данные:
- SSID точки доступа.
- Предполагаемое местоположение точки доступа.
- База данных сущностей с их географическим положением и связанной информацией (адрес, веб-сайт).
- Данные о подключении пользовательских устройств.
- Опционально: User Presence Signals (например, check-ins).
Выходные данные:
- Точное соответствие между точкой доступа и сущностью.
- Semantic Location подключенного пользователя.
- Агрегированные данные о посещаемости сущности (метрики популярности).
На что влияет
- Конкретные типы контента и ниши: Наибольшее влияние оказывается на локальные бизнесы (Local SEO) — рестораны, кафе, магазины, отели, музеи и любые другие заведения, предлагающие Wi-Fi своим посетителям.
- Метрики популярности: Алгоритм напрямую влияет на точность измерения офлайн-популярности (Prominence в терминах Google), что является ключевым фактором локального ранжирования.
Когда применяется
- Триггеры активации (Обработка данных): Алгоритм идентификации сущности активируется при обнаружении новой точки доступа Wi-Fi или при необходимости переоценки существующих соответствий (офлайн-обработка).
- Триггеры активации (Определение местоположения): Определение Semantic Location активируется, когда пользовательское устройство подключается к точке доступа, которая была успешно идентифицирована системой.
Пошаговый алгоритм
Процесс А: Идентификация сущности, связанной с точкой доступа
- Получение данных о точке доступа: Система получает предполагаемое местоположение и SSID точки доступа.
- Текстовый анализ SSID: SSID обрабатывается с использованием техник токенизации для извлечения одного или нескольких Text Signals. Общие или дефолтные названия (например, [NETGEAR], [default]) могут фильтроваться.
- Доступ к базе данных сущностей: Система обращается к географической базе данных (например, Google Maps/Knowledge Graph).
- Идентификация кандидатов: Выбираются сущности, находящиеся в определенном радиусе от предполагаемого местоположения точки доступа. Радиус (R) рассчитывается с учетом неопределенности локаций (X, Y) и радиуса действия Wi-Fi (Z). Например, R = X + Y + Z.
- Расчет Confidence Score: Для каждого кандидата применяется Scoring Function:
- Сопоставление (Matching): Проверяется совпадение Text Signals с названием сущности, адресом или текстом на ее веб-сайте (включая полные совпадения, префиксы, n-граммы, инициалы).
- Взвешивание (Weighting): Совпадения с общими словами ([cafe], [inc]), регионально популярными терминами или короткими токенами понижаются в весе (учитывается популярность термина).
- Учет расстояния: Оценка корректируется на основе расстояния между предполагаемым местоположением точки доступа и локацией сущности. Чем меньше расстояние, тем выше оценка.
- Учет других сигналов: Оценка может быть повышена при наличии User Presence Signal (например, check-in пользователя в этом месте).
- Выбор и связывание: Сущность с наивысшим Confidence Score (и/или превышающим порог) идентифицируется как владелец точки доступа. Соответствие сохраняется.
- Вывод информации: Информация о сущности (например, ее официальное название) может быть предоставлена для отображения в интерфейсе подключения Wi-Fi на устройстве пользователя.
Процесс Б: Определение местоположения пользователя
- Обнаружение подключения: Система получает сигнал о том, что пользовательское устройство подключилось к идентифицированной точке доступа.
- Определение Semantic Location: На основе надежного соответствия между точкой доступа и сущностью система определяет, что пользователь физически находится в данном заведении.
- Использование данных: Эта информация используется для предоставления локализованных сервисов пользователю и для обновления метрик посещаемости сущности.
Какие данные и как использует
Данные на входе
- Географические факторы: Критически важные данные. Используется предполагаемое местоположение точки доступа Wi-Fi и точное местоположение сущностей из базы данных. Учитываются расстояния и неопределенности локаций.
- Технические факторы: SSID (название сети), сила сигнала Wi-Fi (используется для оценки расстояния/предполагаемого местоположения), предполагаемый радиус действия точки доступа.
- Контентные факторы: Текст на веб-сайте сущности. Патент явно указывает, что термины с веб-сайта могут использоваться для сопоставления с Text Signals из SSID (например, если на сайте указано «Наш бесплатный Wi-Fi называется Fidolicous»). Также используются название и адрес сущности.
- Пользовательские факторы: Данные о местоположении устройства (для оценки локации точки доступа), статус подключения устройства к сети. Также используются User Presence Signals, такие как check-in в социальных сетях.
Какие метрики используются и как они считаются
- Text Signals: Извлекаются из SSID путем токенизации (на основе пробелов, пунктуации, границ классов символов, регистра символов или n-gram моделей).
- Радиус поиска кандидатов: Рассчитывается как функция неопределенностей и дальности действия. В патенте приводится пример: Radius = X + Y + Z (где X — неопределенность локации точки доступа, Y — неопределенность локации сущности, Z — максимальное расстояние обнаружения сигнала Wi-Fi).
- Confidence Score: Рассчитывается Scoring Function. Это взвешенная сумма совпадений между Text Signals и информацией о сущности, скорректированная на расстояние и другие факторы.
- Популярность Text Signal (Popularity): Метрика частотности термина в глобальном или региональном масштабе. Используется для понижения веса общих слов при расчете Confidence Score.
Выводы
- Верификация физического присутствия: Патент демонстрирует, как Google использует подключение к Wi-Fi как высоконадежный сигнал для подтверждения того, что пользователь действительно посетил конкретное заведение (Semantic Location). Это гораздо точнее, чем GPS или триангуляция в помещениях.
- Важность данных о посещаемости для Local SEO: Механизм позволяет Google собирать точные и верифицированные данные об офлайн-посещаемости (foot traffic). Эти данные лежат в основе метрик популярности (Prominence), которые являются одним из ключевых факторов ранжирования в локальном поиске.
- Связь онлайн и офлайн данных: Система активно связывает физические объекты (точки доступа) с цифровыми профилями (сущностями в Knowledge Graph), используя для этого как географические, так и контентные сигналы (включая SSID и контент сайта).
- Роль веб-сайта в физической идентификации: Текст на веб-сайте сущности может использоваться для подтверждения ее связи с точкой доступа Wi-Fi. Это подчеркивает важность размещения точной и полной информации о заведении на его сайте.
- Сложность оценки достоверности: Система использует комплексный подход к расчету Confidence Score, учитывая расстояние, неопределенности локаций и популярность терминов, чтобы минимизировать ошибки при связывании Wi-Fi и бизнеса.
Практика
Best practices (это мы делаем)
- Обеспечение точности данных о бизнесе (NAP): Убедитесь, что данные о местоположении вашего бизнеса в Google Business Profile (GBP) и других географических базах данных максимально точны. Это критично для того, чтобы система могла корректно идентифицировать ваш бизнес как кандидата и правильно рассчитать расстояние до точки доступа.
- Стратегия использования Wi-Fi: Для локальных бизнесов наличие гостевого Wi-Fi становится не только сервисом для клиентов, но и способом передачи Google верифицированных данных о посещаемости. Стимулируйте клиентов подключаться к вашей сети.
- Нейминг Wi-Fi (SSID): Используйте в SSID уникальные элементы названия вашего бренда (например, «Intermezzo_Guest», а не просто «Guest_Wifi»). Это увеличит Confidence Score при сопоставлении и поможет системе быстрее и точнее идентифицировать вашу точку доступа.
- Размещение информации о Wi-Fi на сайте: Патент явно упоминает использование текста с сайта для идентификации. Разместите информацию о вашей гостевой сети на сайте (например, в разделе FAQ или Контакты), указав ее SSID. Пример: «Подключайтесь к нашей бесплатной сети ‘Intermezzo_Guest'». Это поможет Scoring Function установить связь.
- Стимулирование Check-ins: Сигналы присутствия пользователя (User Presence Signals), такие как check-ins в социальных сетях, могут использоваться для повышения Confidence Score. Поощряйте клиентов отмечать посещение вашего заведения.
Worst practices (это делать не надо)
- Использование общих или дефолтных SSID: Использование названий типа «Free Wifi», «Guest», «NETGEAR» затрудняет идентификацию вашей точки доступа системой, так как такие термины понижаются в весе. Это снижает вероятность точного учета посещений.
- Игнорирование офлайн-сигналов: Стратегия Local SEO, сфокусированная только на онлайн-факторах (ссылки, отзывы, оптимизация GBP) без учета реальной посещаемости, будет неполной. Google активно измеряет офлайн-популярность.
- Предоставление неверных данных о локации: Попытки манипулировать физическим адресом в GBP или неточная установка пина на карте приведут к ошибкам в расчете расстояний и снизят Confidence Score, что может негативно сказаться на учете посещаемости.
Стратегическое значение
Этот патент подтверждает стратегическую важность офлайн-сигналов для локального ранжирования. Google инвестирует в технологии, позволяющие точно измерять реальное поведение пользователей в физическом мире. Для Local SEO это означает, что фундаментальные бизнес-показатели — популярность заведения, качество обслуживания, привлекающее посетителей, и удобство для них (включая Wi-Fi) — напрямую конвертируются в сигналы ранжирования. Стратегия должна объединять маркетинг, сервис и SEO для стимулирования реальных посещений.
Практические примеры
Сценарий: Оптимизация Wi-Fi для улучшения учета посещаемости
- Анализ текущей ситуации: Кафе «Brobdingnag Cafe» использует SSID «Guest-Wifi». В том же здании есть еще 3 бизнеса с похожими SSID. Google не может надежно связать точку доступа с кафе.
- Действие 1 (Изменение SSID): Владелец меняет SSID на «Brobdingnag_Cafe_Free».
- Действие 2 (Обновление сайта): На страницу контактов сайта добавляется фраза: «Для посетителей доступен бесплатный интернет, подключайтесь к сети ‘Brobdingnag_Cafe_Free'».
- Действие 3 (Стимулирование подключений): На столах размещаются таблички с названием сети и призывом подключиться.
- Результат:
- При следующем цикле обработки данных Google анализирует новый SSID. Text Signals [Brobdingnag], [Cafe], [Free] дают высокое совпадение с названием.
- Scoring Function также находит совпадение с текстом на сайте.
- Токен [Brobdingnag] имеет низкую популярность (высокий вес).
- Рассчитывается высокий Confidence Score, и точка доступа надежно связывается с кафе.
- Подключения посетителей теперь точно регистрируются как посещения «Brobdingnag Cafe», улучшая метрики популярности (Prominence) в Google.
Вопросы и ответы
Как этот патент влияет на локальное ранжирование (Local SEO)?
Патент не описывает алгоритм ранжирования напрямую, но он критически важен для него. Он описывает механизм сбора точных данных о посещаемости бизнеса (foot traffic). Популярность заведения в офлайне (Prominence) является одним из трех столпов локального ранжирования Google. Чем точнее Google знает, сколько людей посещает ваш бизнес (в том числе через Wi-Fi подключения), тем более объективно он может оценить его популярность и, соответственно, повлиять на его позиции в локальной выдаче.
Что такое «семантическое местоположение» (Semantic Location) и почему оно важно?
Semantic Location означает, что система знает не просто координаты пользователя (широту и долготу), а понимает, в каком конкретном заведении он находится (например, «в Starbucks на Мейн-стрит»). Это важно, потому что позволяет Google предоставлять более релевантные сервисы и, что критично для SEO, точно атрибутировать посещение конкретному бизнесу, а не просто фиксировать присутствие в здании.
Нужно ли локальному бизнесу обязательно иметь Wi-Fi для хорошего ранжирования?
Наличие Wi-Fi не является прямым фактором ранжирования. Однако, как показывает патент, наличие идентифицируемого Wi-Fi и подключение к нему клиентов является для Google одним из самых надежных способов верификации посещения. Если у вас нет Wi-Fi или клиенты к нему не подключаются, Google будет полагаться на менее точные методы (GPS, триангуляция), что может привести к недооценке реальной посещаемости вашего бизнеса.
Как правильно назвать Wi-Fi сеть (SSID), чтобы помочь Google ее идентифицировать?
Используйте уникальные элементы вашего бренда в названии. Избегайте общих слов вроде «Guest», «Free Wifi» или дефолтных названий роутеров. Например, если ваш бизнес называется «Walter’s Coffee», лучше использовать «WaltersCoffee_Guest», чем «Coffee_Wifi». Это повышает Confidence Score, так как Text Signal [WaltersCoffee] уникален (имеет низкую популярность) и хорошо совпадает с названием бизнеса.
Патент упоминает использование текста с веб-сайта для идентификации. Как это использовать?
Это важный инсайт. Google может сканировать ваш сайт в поисках упоминаний SSID. Рекомендуется явно указать название вашей гостевой сети на сайте, например, в разделе контактов или FAQ. Если ваш SSID — «WaltersCoffee_Guest», добавьте на сайт фразу: «Подключайтесь к нашей сети WaltersCoffee_Guest». Это поможет Scoring Function установить надежную связь.
Что делать, если мой бизнес находится в торговом центре, где много Wi-Fi сетей?
В таких условиях точность идентификации особенно важна. Необходимо использовать максимально уникальный SSID и убедиться, что местоположение вашего бизнеса в Google Business Profile указано предельно точно (включая этаж, если применимо). Это поможет системе корректно рассчитать расстояния и выделить вашу сеть среди других кандидатов.
Как Google рассчитывает радиус поиска кандидатов?
Патент описывает, что радиус учитывает три компонента неопределенности. В примере приводится формула R=X+Y+Z, где X — неопределенность предполагаемого местоположения самой точки доступа (Wi-Fi), Y — неопределенность местоположения бизнеса в базе данных Google, и Z — предполагаемый радиус действия сигнала Wi-Fi. Это делается для того, чтобы не пропустить релевантные бизнесы из-за неточности исходных данных.
Может ли система ошибиться и приписать мою точку доступа соседям?
Да, если SSID слишком общий или если расстояние между вашим бизнесом и соседями очень мало, а их название лучше совпадает с SSID. Именно для минимизации таких ошибок используется сложная Scoring Function, которая понижает вес общих слов и учитывает расстояние. Использование уникального брендированного SSID — лучшая защита от таких ошибок.
Что такое «User Presence Signal» и как он используется?
Это сигнал, указывающий на присутствие пользователя в заведении, например, «check-in» в социальной сети. Если система видит, что пользователь отметился в вашем заведении и одновременно подключен к сети, которую система пытается идентифицировать, это может значительно повысить Confidence Score для вашего бизнеса при связывании с этой точкой доступа (Claim 11).
Влияет ли этот механизм на конфиденциальность пользователей?
Патент указывает, что сбор и использование данных о местоположении и подключении происходит только с согласия пользователя, и пользователи должны иметь возможность контролировать сбор информации. Для SEO-специалистов важно понимать, что данные о посещаемости агрегируются и анонимизируются для расчета метрик популярности бизнеса, а не для отслеживания отдельных лиц.