Этот патент раскрывает, как Google анализирует анонимизированные данные о местоположении (пешеходный трафик) для понимания физических локаций. Сравнивая фактические посещения с вместимостью заведения и сегментируя визиты по времени и демографии пользователей, Google рассчитывает оценки качества и специфические характеристики (например, «подходит для детей» или «популярно у пожилых людей»). Эти сигналы затем используются для ранжирования и персонализации результатов локального поиска.
Описание
Какую задачу решает
Патент решает проблему оценки качества и характеристик физических локаций (ресторанов, магазинов и т.д.). Традиционные методы полагаются на анализ веб-документов (отзывы, веб-страницы), которые могут быть предвзятыми, манипулируемыми или устаревшими. Также устраняется проблема «чистых сигналов популярности» (pure popularity signals), которые могут отдавать предпочтение большим заведениям перед небольшими, но качественными. Изобретение предлагает использовать объективные данные о реальном пешеходном трафике (Visit Data) для более точной оценки.
Что запатентовано
Запатентована система, которая использует данные о посещениях (Visit Data) для определения характеристик физических местоположений. Система анализирует, сколько людей находится в локации в разное время, как долго они остаются и каковы их атрибуты. Ключевым механизмом является сравнение фактической занятости (Visit Measure) с предполагаемой вместимостью (Capacity) для вывода о качестве и популярности, а также анализ паттернов посещений для определения типа заведения (например, обеденное место или туристическая достопримечательность).
Как это работает
Система работает следующим образом:
- Сбор данных: Собираются анонимизированные Visit Data из различных источников (геолокация мобильных устройств, навигационные запросы, транзакции).
- Оценка вместимости: Система оценивает Capacity локации, часто на основе максимального наблюдаемого количества посетителей.
- Расчет показателей посещений: Определяются Visit Measures (количество людей), сегментированные по времени суток, дню недели и атрибутам пользователей (user attributes).
- Определение характеристик: Анализ паттернов посещений позволяет определить характеристики, такие как часы работы, пиковые часы, тип заведения (например, сравнение трафика в обед и ужин) и целевую аудиторию.
- Расчет качества: Сравнение занятости с вместимостью используется для определения Quality Measure. Локация, часто работающая на пределе вместимости, считается более качественной.
- Применение в поиске: Рассчитанные характеристики и оценки качества используются Search System для ранжирования результатов локального поиска, в том числе с учетом персонализации под атрибуты пользователя и контекст запроса (время/день).
Актуальность для SEO
Высокая. Google активно использует данные о реальном мире для оценки локального бизнеса (например, функция «Популярные часы» в Google Maps и Поиске). Понимание поведения пользователей в физическом мире является критически важным компонентом качества локального поиска и основой для продуктов Google Maps.
Важность для SEO
Патент имеет критическое значение для стратегий локального SEO (Local SEO). Он подтверждает, что Google использует реальное взаимодействие с бизнесом и его фактическую популярность в офлайне как сильные сигналы качества и релевантности. Это подчеркивает, что Local SEO не ограничивается оптимизацией профиля, ключевыми словами и ссылками, но напрямую зависит от того, насколько популярен и качественен бизнес в физическом мире. Системы, описанные в патенте, могут повышать или понижать ранжирование локации на основе объективных данных о пешеходном трафике.
Детальный разбор
Термины и определения
- Capacity (Вместимость)
- Максимальное количество людей, которое может вместить локация (например, количество посадочных мест). Может определяться на основе Visit Data (например, максимальное наблюдаемое количество посетителей за определенный период).
- Characteristic (Характеристика)
- Свойство локации, определенное на основе анализа Visit Data. Примеры: часы работы, пиковая популярность, тип услуги (завтрак/обед/ужин), целевая аудитория (например, «подходит для детей», «популярно у местных»), является ли место туристическим.
- First/Second Visit Measure (Первый/Второй показатель посещений)
- Показатель, отражающий количество людей в Population, присутствующих в локации в определенное время (First/Second Time). Может быть фактическим числом или экстраполяцией на основе выборки данных.
- Location (Местоположение)
- Физическая локация, такая как ресторан, спортзал, магазин, театр, больница.
- Population / Common Attribute (Популяция / Общий атрибут)
- Группа пользователей, объединенных общим признаком (например, возрастная группа, местные жители, туристы, спортивные фанаты). Характеристики локации могут рассчитываться отдельно для разных популяций.
- Quality Measure (Оценка качества)
- Характеристика локации, отражающая ее качество. Рассчитывается на основе сравнения фактической занятости (Visit Measure) и вместимости (Capacity).
- Residence Time Value (Значение времени пребывания)
- Показатель, отражающий продолжительность пребывания пользователей в локации. Используется для уточнения характеристик (например, короткое время может указывать на еду на вынос или на то, что пользователь ушел из-за долгого ожидания).
- Visit Data (Данные о посещениях)
- Данные, указывающие на физическое посещение локации пользователями. Источники включают геолокацию с мобильных устройств (GPS, Wi-Fi, сотовые вышки), навигационные запросы (navigational queries), финансовые транзакции, чекины пользователей.
Ключевые утверждения (Анализ Claims)
Патент содержит два основных независимых пункта (Claim 1 и Claim 27), описывающих разные аспекты использования данных о посещениях в ранжировании.
Claim 1 (Независимый пункт): Описывает процесс персонализированного ранжирования локаций на основе характеристик, специфичных для группы пользователей.
- Система идентифицирует локацию и связанные с ней Visit Data.
- Определяется First Visit Measure для этой локации, специфичный для First Attribute популяции (т.е. сколько людей с этим атрибутом посещают локацию в First Time).
- Определяется Second Measure, который в этом пункте определен как Capacity (вместимость) локации.
- Определяется Characteristic локации *для этого атрибута* путем сравнения First Visit Measure и Capacity.
- Система получает поисковый запрос от пользователя, который также ассоциирован с этим First Attribute.
- Определяются результаты поиска, включая данную локацию.
- Происходит ранжирование. Ранжирование результата, связанного с локацией, основывается на определенной Characteristic, причем именно потому, что характеристика релевантна атрибуту, и пользователь обладает этим атрибутом.
Этот пункт описывает механизм персонализации локального поиска. Если система определила, что локация популярна (высокая занятость относительно вместимости) среди определенной группы (например, пожилых людей), она будет повышать эту локацию в выдаче для пользователя из этой же группы.
Claim 15 (Зависимый от 1): Уточняет, что Characteristic является Quality Measure (оценкой качества).
Claim 27 (Независимый пункт): Описывает общий процесс ранжирования на основе качества, выведенного из соотношения занятости и вместимости.
- Идентифицируется локация и Visit Data.
- На основе Visit Data определяется First Measure, являющийся показателем Capacity (вместимости) локации.
- На основе Visit Data определяется Second Measure, являющийся показателем количества людей, присутствующих в локации в определенное время.
- Определяется Quality Measure локации путем сравнения First Measure (Вместимость) и Second Measure (Занятость).
- Получается поисковый запрос.
- Ранжирование результатов основывается на рассчитанном Quality Measure.
Этот пункт описывает использование соотношения занятости к вместимости как сигнала качества для ранжирования в локальном поиске. Чем выше процент занятости, тем выше предполагаемое качество.
Claim 28 (Зависимый от 27): Уточняет метод определения вместимости (Capacity): она определяется как максимальное количество людей, зафиксированное в локации согласно Visit Data.
Claims 29-32 (Зависимые от 27): Описывают контекстуальное ранжирование. Quality Measure может быть специфичным для определенных дней недели (Claim 29) или времени суток (Claim 31). Ранжирование на основе этой оценки применяется, если запрос сделан в соответствующий день или время.
Где и как применяется
Изобретение применяется в системах локального поиска (например, Google Maps и локальный блок в основном поиске) и затрагивает несколько этапов поисковой архитектуры.
CRAWLING & INDEXING – Сканирование, Индексирование и Извлечение признаков
На этом этапе происходит сбор и обработка сырых Visit Data. Система должна:
- Агрегировать анонимизированные данные о местоположении пользователей.
- Привязать эти данные к конкретным физическим локациям.
- Рассчитать Capacity для каждой локации (например, по максимальной наблюдаемой занятости).
- Рассчитать Visit Measures и Residence Time Values, сегментированные по времени и атрибутам пользователей.
- Вычислить Characteristics и Quality Measures и сохранить их в индексе как признаки локации.
RANKING & RERANKING – Ранжирование и Переранжирование
На этапе ранжирования Quality Measures используются как один из сигналов для сортировки локальных результатов.
На этапе переранжирования применяются более сложные механизмы, описанные в патенте:
- Персонализация (Claim 1): Если атрибуты пользователя известны, система может повышать локации, чьи Characteristics соответствуют этим атрибутам (например, повышать места, популярные у возрастной группы пользователя).
- Контекстуализация (Claims 29-32): Система может корректировать ранжирование в зависимости от времени и дня запроса, используя Quality Measures, рассчитанные именно для этого контекста.
Входные данные:
- Анонимизированные Visit Data (геолокация, время, продолжительность).
- База данных физических локаций.
- Атрибуты пользователей (анонимизированные/агрегированные).
- Поисковый запрос пользователя и его контекст (время, атрибуты пользователя).
Выходные данные:
- Рассчитанные Characteristics и Quality Measures для локаций (в индексе).
- Ранжированный список локальных результатов, отсортированный с учетом этих мер (в выдаче).
На что влияет
- Конкретные типы контента: Влияет на ранжирование страниц и профилей физических бизнесов (рестораны, розничные магазины, услуги, развлечения, медицинские учреждения).
- Специфические запросы: Наибольшее влияние на запросы с локальным интентом (например, «ресторан рядом», «спортзал»).
- Конкретные ниши или тематики: Влияет на все локальные ниши. В конкурентных нишах (например, рестораны в центре города) эти сигналы могут быть решающими для определения качества.
Когда применяется
- Условия работы: Алгоритм применяется при обработке запросов с локальным интентом.
- Триггеры активации:
- Персонализация: Активируется, если известны атрибуты пользователя и есть рассчитанные характеристики локаций для этих атрибутов.
- Контекст: Активируется на основе текущего времени и дня недели, используя специфичные для этого времени оценки качества.
Пошаговый алгоритм
Процесс А: Расчет характеристик и качества (Индексирование)
- Сбор и нормализация Visit Data: Сбор анонимизированных данных о посещениях из различных источников (геолокация, навигационные запросы).
- Определение вместимости (Capacity): Для каждой локации рассчитывается оценка вместимости. Метод: идентификация максимального количества людей, одновременно присутствовавших в локации.
- Сегментация данных: Данные о посещениях сегментируются по временным интервалам (время суток, день недели) и по атрибутам пользователей (Common Attributes).
- Расчет показателей посещений: Для каждого сегмента рассчитываются Visit Measures (занятость) и Residence Time Values (время пребывания).
- Расчет Quality Measure: Для локации (в целом или для конкретных сегментов) рассчитывается оценка качества путем сравнения занятости с вместимостью. Высокий процент занятости указывает на высокое качество.
- Определение Characteristics: Анализ распределения Visit Measures и Residence Time Values во времени и по группам пользователей для вывода характеристик.
- Пример 1: Если трафик высок только с 12:00 до 14:00, локация получает характеристику «Обеденное место».
- Пример 2: Если большинство посетителей преодолели большое расстояние, локация получает характеристику «Туристическое место».
- Пример 3: Если время пребывания короткое, локация может получить характеристику «Еда на вынос».
- Сохранение в индексе: Характеристики и оценки качества сохраняются как атрибуты локации.
Процесс Б: Применение в ранжировании (Обработка запроса)
- Получение запроса и контекста: Система получает запрос, определяет локальный интент, текущее время/день и атрибуты пользователя.
- Отбор кандидатов: Выбираются локации, релевантные запросу и местоположению пользователя.
- Ранжирование с учетом Quality Measure: Стандартное ранжирование корректируется с использованием общих Quality Measures локаций.
- Применение контекстуальных оценок: Если запрос сделан в specific time, используются Quality Measures, рассчитанные именно для этого времени/дня.
- Применение персонализации: Если пользователь принадлежит к определенной группе, ранжирование корректируется с использованием Characteristics и Quality Measures, рассчитанных для этой группы.
- Формирование выдачи: Предоставление финального ранжированного списка.
Какие данные и как использует
Данные на входе
Система полагается в первую очередь на данные о поведении пользователей в реальном мире.
- Географические и Технические факторы:
- Данные геолокации с мобильных устройств (GPS, Wi-Fi, данные сотовых вышек).
- Физический адрес локации, координаты (широта/долгота).
- Поведенческие факторы:
- Visit Data: Фактические посещения локаций.
- Навигационные запросы (navigational queries): Запросы маршрутов к локации (сигнал намерения посетить).
- Данные о финансовых транзакциях в локации (если доступны).
- Пользовательские чекины (user indications of visits).
- Пользовательские факторы:
- Анонимизированные атрибуты пользователей (user attributes), позволяющие группировать их в популяции (Population) по общим признакам (Common Attribute).
- Расстояние, пройденное пользователем до локации (используется для определения местных жителей и туристов).
Какие метрики используются и как они считаются
- Capacity (Вместимость): Оценка максимальной вместимости. Рассчитывается как максимальное количество людей, одновременно зафиксированных в локации (Claim 28).
- Visit Measure (Занятость): Количество людей, присутствующих в локации в определенный момент времени. Может рассчитываться для разных временных интервалов и групп пользователей.
- Occupancy Rate (Уровень занятости) (Неявная метрика): Соотношение Visit Measure / Capacity. Является основой для расчета Quality Measure.
- Residence Time Value (Время пребывания): Средняя продолжительность визита. Рассчитывается на основе времени входа и выхода пользователя из зоны локации.
- Repeat Visit Rate (Частота повторных визитов) (Неявная метрика): Соотношение новых и повторных посетителей. Используется для определения характеристики «редко посещается повторно».
- Local vs. Tourist Ratio (Соотношение местных и туристов) (Неявная метрика): Определяется путем анализа расстояния, пройденного пользователями до локации.
Выводы
- Реальное поведение как сигнал ранжирования: Патент подтверждает, что Google использует данные о поведении пользователей в физическом мире (Visit Data) как прямой сигнал для ранжирования в локальном поиске. Это снижает зависимость от традиционных сигналов, таких как отзывы или контент веб-сайта.
- Качество через популярность (Busy = Good): Ключевой механизм патента — вывод о качестве (Quality Measure) на основе популярности, нормализованной по вместимости (Capacity). Заведение, которое постоянно заполнено, считается более качественным, чем пустое, независимо от его размера.
- Вместимость определяется эмпирически: Google не полагается на заявленную вместимость. Capacity определяется на основе максимального наблюдаемого количества посетителей (Claim 28).
- Глубокая персонализация ранжирования: Claim 1 описывает конкретный механизм персонализации. Характеристики и качество рассчитываются для разных групп пользователей (Common Attribute), и эти оценки используются для повышения ранжирования, когда ищет пользователь из соответствующей группы.
- Контекстуальное ранжирование (Время и День): Ранжирование динамически адаптируется к контексту запроса. Оценка качества локации может меняться в зависимости от дня недели и времени суток, что влияет на ее позицию в выдаче в реальном времени (Claims 29-32).
- Интерпретация намерений через время пребывания: Анализ Residence Time Value позволяет системе различать разные типы взаимодействий с локацией (например, полноценный ужин, еда на вынос или отказ от посещения из-за очереди).
Практика
Best practices (это мы делаем)
- Стимулирование реального пешеходного трафика: Ключевая стратегия для Local SEO должна включать офлайн-маркетинг и работу над продуктом для привлечения реальных посетителей. Высокая фактическая занятость (Occupancy Rate) напрямую конвертируется в более высокий Quality Measure.
- Улучшение качества обслуживания и продукта: Обеспечение высокого качества физического опыта критично. Это влияет на Residence Time Value (пользователи остаются дольше, если им комфортно) и стимулирует повторные визиты (Repeat Visit Rate), что также является характеристикой качества, описанной в патенте.
- Работа с локальной аудиторией: Патент упоминает возможность определения местных жителей и туристов. Развитие базы лояльных местных клиентов обеспечивает стабильный трафик и положительные сигналы качества.
- Управление потоком посетителей: Для бизнесов с ограниченной вместимостью важно стимулировать посещения в непиковые часы. Это помогает сгладить кривую занятости и демонстрирует стабильный спрос, улучшая общие показатели Quality Measure в разные временные интервалы.
- Понимание целевой аудитории: Поскольку система сегментирует пользователей и персонализирует выдачу (Claim 1), важно понимать, какие группы посещают заведение, и работать над привлечением целевых сегментов.
Worst practices (это делать не надо)
- Игнорирование офлайн-опыта: Фокусироваться только на оптимизации онлайн-профиля (Google Business Profile) и накрутке отзывов, игнорируя реальную популярность и качество физической локации. Пустое заведение будет иметь низкий Quality Measure.
- Краткосрочные всплески трафика низкого качества: Привлечение нецелевого трафика, который быстро покидает заведение (низкий Residence Time) или не возвращается (низкий Repeat Visit Rate), может негативно сказаться на характеристиках локации.
Стратегическое значение
Патент имеет фундаментальное значение для Local SEO, перемещая фокус с онлайн-сигналов на офлайн-реальность. Он демонстрирует сложную систему оценки качества, основанную на объективных данных о посещениях, которая устойчива к традиционным SEO-манипуляциям. Стратегия Local SEO должна быть интегрирована с реальными бизнес-операциями и маркетингом. Цель — стать действительно популярным и релевантным местом в физическом мире, а не только в индексе Google.
Практические примеры
Сценарий 1: Оценка качества маленького ресторана
- Ситуация: Ресторан А имеет 30 мест и почти всегда полон (средняя занятость 28 человек). Ресторан Б имеет 200 мест и в среднем принимает 50 человек.
- Применение алгоритма:
- Система эмпирически определяет Capacity А=30 и Б=200 (или максимальное наблюдавшееся число, если оно меньше).
- Система рассчитывает уровень занятости: А = 28/30 (93%), Б = 50/200 (25%).
- Результат: Ресторан А получит значительно более высокий Quality Measure, чем Ресторан Б, и будет ранжироваться выше по релевантным запросам, несмотря на меньшее общее количество посетителей.
Сценарий 2: Персонализированное ранжирование спорт-бара
- Ситуация: Система проанализировала Visit Data и определила, что Спорт-бар В популярен среди пользователей с атрибутом «Спортивные фанаты» (Группа 1) во время матчей, но не популярен среди «Любителей тихих мест» (Группа 2).
- Применение алгоритма (Claim 1):
- Пользователь из Группы 1 ищет «бар рядом» во время матча. Система использует высокий Quality Measure бара В, рассчитанный для Группы 1, и повышает его в выдаче.
- Пользователь из Группы 2 ищет «бар рядом». Система использует низкий Quality Measure бара В для Группы 2, и он ранжируется ниже.
Вопросы и ответы
Как Google определяет вместимость (Capacity) заведения, если владелец ее не указал?
Патент (Claim 28) описывает метод определения вместимости на основе Visit Data. Система анализирует историю посещений и идентифицирует максимальное количество людей, которое когда-либо одновременно находилось в локации. Это значение используется как оценка Capacity. Таким образом, Google не полагается на данные владельца, а вычисляет вместимость эмпирически.
Что важнее для ранжирования согласно этому патенту: общее количество посетителей или процент занятости?
Процент занятости (соотношение Visit Measure к Capacity) является более важным показателем. Патент специально отмечает, что он направлен на устранение предвзятости «чистых сигналов популярности». Небольшое, но постоянно заполненное заведение получит более высокую оценку качества (Quality Measure), чем большое заведение с большим количеством посетителей, но низким процентом занятости.
Как данные о пешеходном трафике используются для персонализации выдачи?
Claim 1 описывает этот механизм. Система сегментирует посетителей по общим атрибутам (Common Attribute) и рассчитывает характеристики и качество для каждой группы отдельно. Если пользователь, выполняющий поиск, принадлежит к определенной группе, система будет использовать оценки качества, релевантные именно для этой группы, при ранжировании результатов. Например, место, популярное у студентов, будет ранжироваться выше для студента.
Влияет ли время суток на ранжирование локального бизнеса?
Да, напрямую. Claims 29-32 описывают контекстуальное ранжирование. Система рассчитывает Quality Measure отдельно для разных дней недели и времени суток. При ранжировании в реальном времени используются оценки качества, соответствующие текущему моменту. Заведение, популярное вечером, но не утром, будет ранжироваться выше вечером.
Что такое Residence Time Value и как оно влияет на SEO?
Residence Time Value — это время пребывания пользователя в локации. Оно используется для определения характеристик бизнеса. Например, очень короткое время пребывания может указывать на формат «на вынос» или на то, что пользователь ушел из-за очереди. Длительное пребывание может указывать на комфорт и высокое качество обслуживания (для ресторанов) или на то, что это гостиница (ночевка). Оптимальное время пребывания зависит от типа бизнеса.
Может ли этот алгоритм определить, является ли место туристической ловушкой или популярно у местных?
Да. Патент указывает, что система может анализировать расстояние, пройденное пользователями до локации. Если большинство посетителей приезжают издалека и посещают место только один раз (низкий Repeat Visit Rate), это может указывать на туристическую направленность. Если большинство посетителей живут рядом и часто возвращаются, это указывает на популярность у местных жителей.
Из каких источников Google получает Visit Data?
В патенте упоминаются несколько источников: геолокационные данные с мобильных устройств (GPS, Wi-Fi, сотовые вышки), навигационные запросы (navigational queries), финансовые транзакции и пользовательские чекины. Основным источником, вероятно, является агрегированная и анонимизированная история местоположений пользователей устройств на Android и пользователей приложений Google на iOS.
Как SEO-специалист может повлиять на сигналы, описанные в этом патенте?
Напрямую повлиять на эти сигналы сложно, так как они основаны на реальном поведении пользователей. Стратегия должна заключаться в улучшении реального бизнеса: повышении качества продукта и обслуживания для увеличения времени пребывания и повторных визитов, а также в использовании офлайн-маркетинга для привлечения стабильного потока посетителей и максимизации процента занятости.
Заменяет ли этот алгоритм традиционные факторы локального SEO (отзывы, ссылки, оптимизацию профиля)?
Он не заменяет их, но дополняет мощными сигналами из реального мира. Традиционные факторы по-прежнему важны для определения релевантности и заметности. Однако для определения качества и итогового ранжирования в конкурентных нишах сигналы, основанные на Visit Data, могут иметь решающее значение, так как они объективны и труднее поддаются манипуляциям.
Как обрабатываются ситуации, когда у бизнеса несколько локаций?
Патент фокусируется на анализе отдельных физических локаций. Каждая локация (филиал) будет оцениваться независимо на основе Visit Data, относящихся именно к ее физическому адресу. Качество и характеристики одного филиала не обязательно переносятся на другой, если паттерны посещений отличаются.