Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google агрегирует данные о взаимодействии пользователей и расстояние для ранжирования локальной мобильной рекламы

    DERIVING ADS RANKING OF LOCAL ADVERTISERS BASED ON DISTANCE AND AGGREGATE USER ACTIVITIES (Определение рейтинга рекламы местных рекламодателей на основе расстояния и совокупной активности пользователей)
    • US20130030913A1
    • Google LLC
    • 2013-01-31
    • 2011-07-29
    2011 Патенты Google Персонализация Поведенческие сигналы

    Google использует систему для ранжирования локальной рекламы на мобильных устройствах. Она собирает данные о взаимодействии пользователей (клики, звонки, отзывы, чекины) из множества источников (поиск, карты, соцсети, сторонние приложения, NFC). Эти агрегированные данные, вместе с расстоянием до пользователя, используются моделью машинного обучения для прогнозирования вероятности клика и определения рейтинга рекламы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу повышения релевантности и эффективности локальной рекламы, показываемой на мобильных устройствах. Цель — определить, какая реклама с наибольшей вероятностью приведет к взаимодействию, учитывая не только физическую близость пользователя к бизнесу (расстояние), но и общую популярность и востребованность этого бизнеса на основе исторических данных о поведении пользователей на различных платформах.

    Что запатентовано

    Запатентована система и метод ранжирования рекламы местных компаний (local businesses). Суть изобретения заключается в агрегации данных о взаимодействии пользователей (user interaction information) из множества структурированных источников (structured information sources). Эти агрегированные данные, в сочетании с расстоянием от пользователя до бизнеса, используются как признаки (feature vectors) для модели машинного обучения, которая рассчитывает рейтинг рекламы.

    Как это работает

    Система работает в двух ключевых режимах:

    • Агрегация данных (Офлайн/Фоновый): Компонент Business Data Extractor идентифицирует бизнес на разных платформах (поиск, карты, соцсети, сайты отзывов) и собирает данные о взаимодействиях (например, отзывы, чекины, звонки, просмотры страниц, время пребывания). Эти данные консолидируются в Indexed local business database.
    • Ранжирование рекламы (Реальное время): При получении запроса с мобильного устройства Ad Serving System определяет местоположение пользователя. Для ближайших бизнесов рассчитывается расстояние и извлекаются агрегированные данные. Эти признаки подаются в Machine Learning Model (например, логистическую регрессию), которая предсказывает вероятность взаимодействия (например, клика). Реклама ранжируется на основе этого прогноза.

    Актуальность для SEO

    Средняя. Фундаментальные принципы — использование расстояния, агрегированных сигналов вовлеченности и машинного обучения для локального ранжирования — остаются крайне актуальными в 2025 году. Однако конкретные реализации, упомянутые в патенте (подан в 2011), такие как акцент на NFC или базовые модели логистической регрессии, с тех пор значительно эволюционировали.

    Важность для SEO

    Влияние на органическое SEO умеренное (5/10). Патент описывает исключительно систему ранжирования рекламы (Google Ads). Однако он имеет высокое стратегическое значение для Local SEO, так как детально раскрывает инфраструктуру Google для сбора и интерпретации сигналов вовлеченности пользователей с локальными сущностями из множества источников. Это подтверждает важность работы над популярностью и репутацией бизнеса в экосистеме.

    Детальный разбор

    Термины и определения

    Aggregated Data (Агрегированные данные)
    Совокупность данных о взаимодействии пользователей с локальным бизнесом, собранных из различных источников и консолидированных в единый набор атрибутов.
    Business Data Extractor (Извлекатель бизнес-данных)
    Компонент, который идентифицирует локальный бизнес в разных источниках, извлекает данные о взаимодействиях (через краулинг, фиды или логи событий) и агрегирует их.
    Feature Vector (Вектор признаков)
    Набор числовых значений, подаваемый на вход модели машинного обучения. Включает расстояние до пользователя и значения агрегированных атрибутов (рейтинг, количество чекинов и т.д.).
    Indexed local business database (Индексированная база данных локальных бизнесов)
    Хранилище агрегированных данных и местоположений локальных бизнесов, оптимизированное для быстрого поиска по географическому признаку.
    Local Business (Местный бизнес)
    Компания, имеющая одну или несколько физических точек продаж (идентифицируемых по адресу).
    Logistic Regression (Логистическая регрессия)
    Статистическая модель машинного обучения, упомянутая в патенте для прогнозирования вероятности наступления события (например, клика по рекламе) на основе набора признаков.
    Machine Learning Model (Модель машинного обучения)
    Модель, обученная на исторических данных (например, с помощью logistic regression или boosting) для расчета оценки (score) на основе Feature Vector.
    Structured Information Sources (Структурированные источники информации)
    Внешние и внутренние источники данных о бизнесе. Примеры: локальные поисковые сайты, карты, социальные сети, сайты отзывов, мобильные приложения, NFC-взаимодействия, Click-to-call.

    Ключевые утверждения (Анализ Claims)

    Патент содержит два ключевых независимых пункта: Claim 1 (описывает систему) и Claim 14 (описывает метод).

    Claim 1 (Система): Описывает базовый процесс.

    1. Сбор информации о взаимодействии пользователей из структурированных источников.
    2. Агрегация этой информации в набор общих атрибутов.
    3. Хранение агрегированной информации в базе данных.
    4. Получение запроса на рекламу от мобильного устройства с указанием местоположения.
    5. Создание feature vector для локальных бизнесов в этом регионе на основе извлеченных атрибутов.
    6. Вычисление оценки (score) для векторов.
    7. Выбор рекламы на основе оценок.

    Claim 14 (Метод): Является более детальным и стратегически важным, так как явно включает идентификацию бизнеса и расстояние.

    1. Определение источников, в которых участвует бизнес, на основе общего набора признаков, идентифицирующих бизнес (например, NAP – Name, Address, Phone).
    2. Сбор, агрегация и хранение данных.
    3. Получение запроса с местоположением и определение географического региона.
    4. Извлечение бизнесов в этом регионе.
    5. Определение значений расстояния (distance values) между пользователем и бизнесами.
    6. Построение feature vectors, включающих значения расстояния и значения агрегированных атрибутов.
    7. Расчет оценок.
    8. Предоставление рекламы с наивысшей оценкой.

    Ядро изобретения — это метод ранжирования локальной рекламы, который использует комбинацию расстояния и агрегированных данных о пользовательской активности из множества источников в качестве входных признаков для скоринга.

    Claim 6 и 7 (Зависимые): Уточняют, что оценки вычисляются с помощью Machine Learning Model, обученной методом контролируемого обучения (supervised learning technique).

    Claim 9 (Зависимый): Перечисляет примеры информации о взаимодействии, собираемой из логов для обучения модели: клик по рекламе, звонок, развертывание карты, время просмотра карты, расстояние, время суток, демографические данные, качество целевой страницы.

    Где и как применяется

    Этот патент описывает процессы внутри системы показа рекламы (например, Google Ads), а не органического поиска. Он не вписывается напрямую в стандартную архитектуру веб-поиска, но использует схожие принципы сбора и обработки данных.

    CRAWLING и INDEXING (Аналогия в контексте Рекламы)
    Business Data Extractor выполняет функции сбора данных из Structured Information Sources (через краулинг, фиды, логи). Собранные данные агрегируются и сохраняются в Indexed local business database. Это формирует слой данных о популярности и атрибутах локальных бизнесов.

    RANKING (В контексте Рекламы)
    Процесс активируется в реальном времени Ad Serving System при получении запроса на рекламу.

    1. Отбор кандидатов: Система определяет регион пользователя и выбирает ближайшие бизнесы из базы данных.
    2. Извлечение признаков: Feature extractor вычисляет расстояние и извлекает агрегированные данные, формируя feature vectors.
    3. Скоринг: Machine Learning Model оценивает векторы для предсказания вероятности взаимодействия (например, клика).
    4. Аукцион и Фильтрация: Ad filtering and auction использует оценки (и, вероятно, ставки) для определения финального показа рекламы.

    Входные данные:

    • Запрос на рекламу (местоположение пользователя, время, тип устройства).
    • Данные из внешних источников (веб-сайты, приложения, логи).
    • Рекламные креативы, ключевые слова и настройки таргетинга от рекламодателей.

    Выходные данные:

    • Отранжированный список локальной рекламы для мобильного устройства.
    • Логи взаимодействий с рекламой (используются для обучения модели).

    На что влияет

    • Конкретные типы контента: Исключительно на показ локальных рекламных объявлений на мобильных устройствах. Не влияет на органическую выдачу.
    • Конкретные ниши или тематики: Все локальные бизнесы с физическими точками присутствия (ритейл, рестораны, услуги), которые используют локальную рекламу.

    Когда применяется

    • Триггеры активации: Получение запроса на показ рекламы от мобильного устройства с известным географическим местоположением (текущим или интересующим пользователя).

    Пошаговый алгоритм

    Процесс А: Агрегация данных (Офлайн/Фоновый режим)

    1. Идентификация бизнеса: Определение уникального локального бизнеса по общим признакам (NAP — Название, Адрес, Телефон, категория, часы работы).
    2. Определение источников: Поиск structured information sources, где присутствует бизнес.
    3. Извлечение данных: Сбор данных о взаимодействиях (рейтинги, чекины, просмотры страниц, звонки и т.д.) из каждого источника.
    4. Агрегация: Консолидация данных. Например, усреднение рейтингов по всем источникам, суммирование количества чекинов.
    5. Хранение: Сохранение агрегированных атрибутов в Indexed local business database с индексом по локации.
    6. Повторение: Процесс повторяется для всех локальных бизнесов.

    Процесс Б: Обработка запроса на рекламу (Реальное время)

    1. Получение запроса: Получение запроса от мобильного устройства с местоположением.
    2. Определение региона и Отбор кандидатов: Определение географического региона и выборка локальных бизнесов из базы данных, находящихся в этом регионе.
    3. Расчет расстояния: Определение расстояния от пользователя до каждого бизнеса-кандидата.
    4. Извлечение атрибутов: Получение значений агрегированных атрибутов для кандидатов из базы данных.
    5. Построение векторов признаков: Создание feature vectors, включающих расстояние и значения агрегированных атрибутов.
    6. Скоринг: Применение Machine Learning Model к векторам признаков для расчета оценок (вероятности взаимодействия).
    7. Ранжирование и Выбор: Ранжирование по оценкам, проведение аукциона и показ рекламы.

    Какие данные и как использует

    Данные на входе

    Система использует широкий спектр данных, агрегированных из множества источников.

    Контентные факторы (Структурированные данные о бизнесе):

    • Название бизнеса, адрес (географическое местоположение), номер телефона, часы работы, категория бизнеса. Используются для идентификации бизнеса (NAP) и расчета расстояния.

    Географические факторы:

    • Местоположение пользователя (из запроса мобильного устройства).
    • Местоположение локального бизнеса.

    Поведенческие факторы (Агрегированные взаимодействия):

    • Рейтинги и Отзывы: Средний рейтинг (например, 0-5), количество рекомендаций.
    • Вовлеченность на сайтах: Количество посещений страниц (page visits), время пребывания пользователя (user dwell time).
    • Социальная активность: Количество чекинов (check-ins) на веб-сайтах или в приложениях, количество шеров в социальных сетях.
    • Активность в поиске/картах: Количество уникальных пользователей, кликнувших для просмотра контента о бизнесе в локальном поиске или на картах.
    • Конверсии: Количество использованных электронных предложений (redeemed electronic offers), данные о звонках (Click-to-call).

    Физические сигналы (Офлайн):

    • Количество посещений, зарегистрированных через мобильные приложения с использованием NFC (Near Field Communication).

    Данные для обучения модели (из логов рекламы):

    • Был ли клик по рекламе.
    • Звонил ли пользователь по номеру из рекламы.
    • Разворачивал ли пользователь карту из рекламы.
    • Время, потраченное на просмотр карты.
    • Релевантность/качество целевой страницы рекламы.

    Временные и Пользовательские факторы:

    • Время суток запроса.
    • Демографические данные пользователя (используются для таргетинга и обучения).

    Какие метрики используются и как они считаются

    • Расстояние (Distance): Рассчитывается между пользователем и бизнесом. Является ключевым признаком в feature vector (Claim 14).
    • Score (Оценка / Вероятность взаимодействия): Основная метрика ранжирования. Рассчитывается Machine Learning Model. Представляет собой вероятность наступления события (клика, звонка).
    • Алгоритмы машинного обучения: Упоминается Logistic regression (логистическая регрессия) как метод контролируемого обучения (supervised learning).
      Формула логита: z = β0 + β1×1 + β2×2 + … + βnxn (где x — признаки из вектора, β — веса/коэффициенты, определенные при обучении).
      Вероятность рассчитывается как: P = 1 / (1 + e^-z).
      Также упоминается Boosting (Бустинг) для создания мета-модели.
    • Агрегация данных: Метрики консолидируются из разных источников (усреднение рейтингов, суммирование счетчиков). Патент также упоминает возможность анонимизации данных для защиты пользователей.

    Выводы

    1. Специфика для Рекламной Системы: Патент описывает исключительно ранжирование локальной мобильной рекламы (Google Ads). Выводы нельзя напрямую переносить на алгоритмы органического ранжирования.
    2. Агрегация Омниканальных Сигналов Вовлеченности: Ключевая концепция — способность Google идентифицировать локальный бизнес и агрегировать данные о взаимодействии с ним из самых разных источников (structured information sources), включая поиск, карты, социальные сети, сайты отзывов и даже офлайн-взаимодействия (NFC).
    3. Расстояние + Популярность = Ранжирование Рекламы: Ранжирование локальной рекламы базируется на двух основных компонентах, включенных в feature vector: физическом расстоянии до пользователя и агрегированных метриках популярности/вовлеченности бизнеса.
    4. Машинное Обучение для Прогнозирования Поведения: Система использует ML-модели (например, логистическую регрессию), обученные на исторических данных, для предсказания вероятности взаимодействия (клика, звонка). Система оптимизируется под вовлечение.
    5. Критичность Идентификации Бизнеса (NAP): Для корректной агрегации данных система должна точно идентифицировать бизнес на разных платформах (Claim 14), что подчеркивает важность консистентности NAP (Name, Address, Phone).
    6. Значение для Local SEO: Патент демонстрирует технические возможности Google по сбору и интерпретации локальных сигналов вовлеченности. Это подтверждает важность работы над реальной популярностью бизнеса и пользовательским опытом (E-E-A-T) для общей видимости в экосистеме Google.

    Практика

    Best practices (это мы делаем)

    Хотя патент посвящен рекламе, он дает важные инсайты о том, как Google оценивает локальные сущности, что критически важно для Local SEO и оптимизации Google Business Profile (GBP).

    • Стимулирование реального взаимодействия (Local E-E-A-T): Активно мотивируйте клиентов оставлять отзывы, взаимодействовать с вашим бизнесом онлайн (в Google Maps, социальных сетях, на сайтах отзывов) и использовать функционал Click-to-Call. Патент подтверждает, что эти сигналы агрегируются и используются для оценки популярности.
    • Обеспечение консистентности NAP (Name, Address, Phone): Убедитесь, что основная информация о бизнесе абсолютно идентична во всех источниках. Это критически важно для Business Data Extractor, чтобы корректно идентифицировать бизнес и агрегировать данные о нем (Claim 14).
    • Присутствие на ключевых платформах: Обеспечьте присутствие бизнеса в релевантных structured information sources (каталоги, карты, социальные сети, отраслевые сайты). Это увеличивает количество источников, из которых Google собирает данные.
    • Оптимизация поведенческих факторов на сайте: Работайте над улучшением пользовательского опыта на сайте, так как user dwell time (время пребывания пользователя) и page visits (посещения страниц) явно упоминаются как агрегируемые сигналы.

    Worst practices (это делать не надо)

    • Игнорирование внешних платформ: Фокусироваться только на собственном сайте или GBP и игнорировать активность на сайтах отзывов и в социальных сетях. Система ценит агрегированные данные из всей экосистемы.
    • Несогласованность данных (NAP): Наличие разных адресов, названий или телефонов в разных источниках может помешать системе корректно агрегировать данные о бизнесе, фрагментируя его профиль популярности.
    • Накрутка сигналов вовлеченности: Попытки симулировать взаимодействие (фейковые чекины, звонки, отзывы). Использование ML-моделей на основе агрегированных данных подразумевает способность выявлять аномалии и неестественную активность в user interaction information.

    Стратегическое значение

    Патент подтверждает, что Google при оценке локальных бизнесов использует холистический подход, анализируя сущность, а не только веб-сайт. Он демонстрирует важность реальных сигналов вовлеченности и популярности бизнеса в цифровой и физической (упоминание NFC) экосистеме. Для долгосрочной стратегии Local SEO необходимо фокусироваться на построении сильного локального бренда, который генерирует положительные сигналы на всех платформах.

    Практические примеры

    Сценарий: Улучшение агрегации данных для локальной кофейни

    1. Ситуация: Кофейня имеет активный профиль в Instagram и много отзывов на Yelp, но мало взаимодействий в Google Business Profile. Также обнаружены несоответствия в номере телефона в старых каталогах.
    2. Действия на основе патента:
      • Исправление NAP: Провести аудит и исправить номер телефона во всех каталогах для обеспечения корректной идентификации бизнеса системой Business Data Extractor (Claim 14).
      • Стимулирование кросс-платформенной активности: Запустить акцию, мотивирующую подписчиков Instagram оставлять отзывы в GBP и делиться фото (увеличение ratings и shares).
    3. Ожидаемый результат: Система Google сможет корректно связать активность на Yelp и в Instagram с сущностью кофейни благодаря исправленному NAP. Агрегированные данные (Aggregated data) улучшатся за счет учета активности со всех платформ. Это улучшит профиль кофейни в Indexed local business database, повышая эффективность локальной рекламы и общую видимость.

    Вопросы и ответы

    Описывает ли этот патент алгоритмы органического локального поиска (Local Pack)?

    Нет, патент сфокусирован исключительно на ранжировании локальной рекламы (Ads Ranking) в рамках Ad Serving System для мобильных устройств. Он не описывает, как ранжируются результаты в органическом поиске или на Google Maps, хотя базовые принципы оценки локальных сущностей (расстояние, популярность) могут быть схожими.

    Какова основная ценность этого патента для SEO-специалиста?

    Основная ценность заключается в детальном описании того, как Google собирает, агрегирует и использует сигналы взаимодействия пользователей с местным бизнесом из множества источников. Это дает понимание, какие метрики вовлеченности Google способен учитывать при оценке популярности локальной сущности, что критически важно для стратегии Local SEO и оптимизации GBP.

    Какие типы взаимодействий пользователей агрегируются согласно патенту?

    Перечислен широкий спектр: рейтинги, чекины (check-ins), посещения страниц, время пребывания (user dwell time), физические визиты (через NFC), рекомендации, использование купонов (redeemed electronic offers), шеры в соцсетях, просмотры в локальном поиске и на картах, а также звонки (Click-to-call).

    Как система определяет, что данные из разных источников относятся к одному бизнесу?

    Система идентифицирует бизнес на основе общего набора признаков (common set of features). В патенте упоминаются название, географическое местоположение (адрес), часы работы, категория и номер телефона. Это подчеркивает критическую важность согласованности NAP (Name, Address, Phone) в локальном SEO.

    Насколько важен фактор расстояния в этой системе?

    Расстояние является критически важным фактором. В Claim 14 прямо указано, что расстояние между пользователем и бизнесом включается в feature vector наряду с агрегированными данными о взаимодействиях. Это один из двух главных компонентов ранжирования локальной рекламы.

    Как работает модель машинного обучения, описанная в патенте?

    Это модель контролируемого обучения, в частности упоминается логистическая регрессия (logistic regression). Она обучается на исторических логах рекламы. Модель принимает на вход вектор признаков (расстояние + агрегированные взаимодействия) и предсказывает вероятность взаимодействия (например, клика или звонка). Эта вероятность используется как оценка для ранжирования.

    Учитывает ли система данные с моего собственного веб-сайта?

    Да, веб-сайты являются одним из Structured Information Sources. Патент явно указывает на сбор таких метрик, как количество посещений страниц (page visits) и время пребывания пользователя (user dwell time). Это говорит о важности оптимизации поведенческих факторов на сайте местного бизнеса.

    Говорит ли этот патент о том, что активность в социальных сетях является фактором ранжирования?

    Да, для ранжирования локальной рекламы. Патент явно упоминает «социальные сети и связанные мобильные приложения» как источники данных, а также «количество шеров в социальных сетях» как агрегируемый атрибут. Для органического SEO это не является прямым доказательством, но подтверждает интерес Google к этим данным.

    Может ли Google собирать данные с сайтов отзывов конкурентов (например, Yelp)?

    Да, патент явно упоминает «сайты отзывов пользователей и мобильные приложения» как источники данных, из которых Business Data Extractor может собирать информацию через краулинг или data feed. Система спроектирована для агрегации данных из любых доступных структурированных источников.

    Актуальны ли упомянутые источники данных, такие как NFC и чекины, в 2025 году?

    Некоторые технологии, такие как NFC для регистрации визитов или специализированные приложения для чекинов, могли устареть или эволюционировать. Однако принцип сбора данных о физическом посещении и социальном подтверждении остается актуальным, реализуясь сегодня через данные геолокации Google Maps, активность в Google Business Profile и интеграцию с современными социальными платформами.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.