Google использует двухэтапный метод доставки результатов поиска через API и виджеты (например, Google Maps) на сторонних сайтах. Сначала отображается только базовое описание результата и присваивается уникальный защищенный токен. Полный контент загружается только после клика пользователя и валидации токена. Это защищает данные Google от парсинга третьими сторонами и позволяет точно измерять CTR, который используется как сигнал ранжирования для географических запросов.
Описание
Какую задачу решает
Патент решает две критические проблемы, возникающие при предоставлении доступа к проприетарным данным (например, базе данных Google Places) через API или виджеты на сторонних веб-сайтах:
- Защита данных (Anti-Scraping): Предотвращение несанкционированного массового сбора (парсинга) ценных данных поисковой системы разработчиками сторонних сайтов.
- Надежный сбор метрик (Cross-Domain Analytics): Обеспечение точного и достоверного механизма для сбора данных о вовлеченности пользователей (Click-through rate, CTR) на сторонних доменах, где традиционные методы отслеживания ненадежны.
Дополнительно механизм повышает эффективность передачи данных, отправляя полный объем информации только по запросу (double fetch).
Что запатентовано
Запатентована система многоэтапного (двухэтапного) получения результатов поиска. Система разделяет данные на базовое описание (Descriptor) и основной контент (Substantive Content). При первоначальном запросе отправляется только описание и уникальный зашифрованный идентификатор (Opaque Token). Основной контент предоставляется только после того, как пользователь выберет результат, и система валидирует токен. Это стимулирует запрос деталей и позволяет системе точно зафиксировать клик.
Как это работает
Механизм функционирует как защищенный шлюз:
- Этап 1 (Список): Пользователь инициирует поиск (например, локальный) на стороннем сайте. Google генерирует результаты, но отправляет только минимальные Descriptors (например, название и район). Для каждого результата создается Opaque Token — зашифрованный, уникальный для сессии и имеющий короткий срок жизни (Time to Live, TTL).
- Этап 2 (Детали): Когда пользователь выбирает результат, виджет отправляет второй запрос, содержащий Opaque Token.
- Валидация и Доставка: Google проверяет подлинность и TTL токена. Если он действителен, система предоставляет Substantive Content (телефон, отзывы, фото) напрямую пользователю. Этот второй запрос позволяет точно измерить CTR.
Актуальность для SEO
Высокая. Использование Google Maps API, Google Places и встраиваемых виджетов повсеместно. Защита проприетарных данных и сбор поведенческих сигналов (CTR) для машинного обучения и улучшения ранжирования остаются критически важными задачами для Google.
Важность для SEO
Патент имеет высокое значение (70/100), особенно для Локального SEO (Local SEO). Хотя он описывает инфраструктуру, в тексте прямо указано его применение для ранжирования: «Click-through rates могут также использоваться как ranking signal для географических результатов поиска». Этот патент описывает, как именно Google надежно собирает эти сигналы CTR со сторонних сайтов, подтверждая, что вовлеченность пользователей с вашим листингом (например, в виджете Карты на чужом блоге) влияет на ваше локальное ранжирование.
Детальный разбор
Термины и определения
- API Module (Модуль API)
- Компонент на сервере Google (Backend Host Server), обрабатывающий запросы от сторонних сайтов. Определяет правила взаимодействия и обеспечивает безопасность данных.
- Descriptor / Human-readable description data (Дескриптор)
- Первый набор данных (first data elements). Минимальная информация о результате, достаточная для того, чтобы пользователь мог однозначно отличить (unambiguously differentiable) один результат от другого. Например, название компании и улица.
- Opaque Token (Непрозрачный токен)
- Уникальный идентификатор (unique identifier). Зашифрован, генерируется во время выполнения запроса (runtime), имеет короткий срок жизни (TTL) и не может быть расшифрован третьей стороной. Используется для валидации запроса на получение деталей.
- Substantive Content / Content Information (Основной контент)
- Второй набор данных (second data elements). Подробная информация о результате (контакты, отзывы, фото, часы работы и т.д.), предоставляемая только после валидации токена.
- Time to Live (TTL) (Время жизни)
- Максимальный срок действия Opaque Token (например, несколько минут). Ключевой элемент защиты от парсинга.
- Widget / Scripted Interface (Виджет / Скриптовый интерфейс)
- Приложение (часто на JavaScript), встроенное в стороннюю веб-страницу. Обеспечивает взаимодействие пользователя с сервисами Google напрямую.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод двухэтапного получения данных с защитой.
- Система получает поисковый запрос от интерфейса, предоставленного третьей стороной.
- Идентифицируются результаты поиска.
- Результаты обрабатываются для разделения на Descriptors (описательные данные) и Content Information (основной контент).
- С каждым результатом ассоциируется уникальный идентификатор (Opaque Token), который предотвращает несанкционированный доступ третьей стороны.
- Система отправляет инструкции для отображения дескрипторов и связанных с ними токенов.
- Система получает запрос на дополнительные данные (второй этап) для выбранного результата, включающий соответствующий токен.
- Проверяется наличие и валидность токена.
- Если токен валиден, система отправляет инструкции для отображения основного контента.
Claim 6 (Зависимый от 1): Детализирует характеристики Opaque Token.
Токен является шифруемым и дешифруемым (сервером), генерируется при каждом выполнении поиска (at each run time) и является уникальным даже для двух идентичных поисковых запросов, выполненных в разное время.
Claim 7 (Зависимый от 1): Указывает, что уникальный идентификатор имеет ассоциированный срок жизни (time to live).
Claim 9 и 10 (Зависимые от 1): Уточняют, что метод применяется к запросам на местоположение (request for one or more locations).
Где и как применяется
Патент описывает инфраструктурный механизм доставки контента и сбора данных, который поддерживает процессы ранжирования.
CRAWLING (Сбор данных)
Механизм позволяет собирать точные данные о поведении пользователей (Click-Through Rate) со сторонних доменов. Это является формой сбора данных о взаимодействии.
RANKING – Ранжирование
Основная система ранжирования генерирует список результатов. Критически важно, что данные, собранные с помощью этого механизма (CTR), используются для влияния на будущее ранжирование. В патенте указано: «Click-through rates may also be used as a ranking signal for geographic search results…»
METASEARCH / Доставка результатов
Основное применение патента. Он управляет тем, как результаты, полученные на этапе RANKING, безопасно доставляются пользователю через сторонний веб-сайт (API/Widgets).
Входные данные (Этап 1):
- Поисковый запрос от стороннего интерфейса (текст, координаты).
Выходные данные (Этап 1):
- Список дескрипторов (Descriptors).
- Opaque Tokens для каждого результата.
Входные данные (Этап 2):
- Индикация выбора пользователя (клик).
- Соответствующий Opaque Token.
Выходные данные (Этап 2):
- Основной контент (Substantive Content).
- Зарегистрированный клик (для аналитики и CTR).
На что влияет
- Конкретные типы контента и Ниши: Наибольшее влияние на Локальный поиск (Local Search) и данные, распространяемые через Google Maps/Places API. Касается агрегаторов, каталогов, сайтов бронирования и любых ресурсов, встраивающих локальные данные Google.
- Специфические запросы: Географические и локальные запросы, обрабатываемые через API.
Когда применяется
- Условия работы: Применяется, когда пользователь взаимодействует со сторонним веб-сайтом, использующим защищенный API или виджет поисковой системы.
- Триггеры активации: Активируется при первоначальном запросе (Этап 1) и при последующем выборе результата пользователем (Этап 2).
- Пороговые значения: Ключевым порогом является Time to Live (TTL) токена, упомянутый как «несколько минут».
Пошаговый алгоритм
Процесс многоэтапного получения результатов (Double Fetch)
Этап 1: Доставка списка
- Получение запроса: Система получает первый поисковый запрос от виджета на стороннем сайте.
- Идентификация результатов: Поисковая система идентифицирует релевантные результаты.
- Разделение данных: Для каждого результата система отделяет Substantive Content от Descriptor. Дескриптор формируется так, чтобы быть однозначно различимым.
- Генерация токенов: Для каждого результата генерируется уникальный Opaque Token (зашифрованный, с коротким TTL).
- Отправка списка: Список Дескрипторов и Токенов отправляется виджету для отображения пользователю.
Этап 2: Доставка контента
- Получение выбора: Пользователь выбирает результат. Виджет отправляет второй запрос, содержащий Opaque Token.
- Валидация токена: Система проверяет токен (подлинность, TTL).
- Регистрация клика: Если токен валиден, система регистрирует клик (для расчета CTR) и извлекает контент.
- Доставка контента: Substantive Content отправляется непосредственно в виджет пользователя.
- Мониторинг злоупотреблений: Система может отслеживать соотношение запросов Этапа 1 и Этапа 2 для выявления попыток парсинга (misuse indication).
Какие данные и как использует
Данные на входе
- Контентные/Индексированные данные: Проиндексированные данные (Web Index, Place Metadata). Они разделяются на Descriptors (название, базовый адрес) и Substantive Content (телефон, отзывы, фото и т.д.).
- Пользовательские/Географические факторы (Запрос): Исходный поисковый запрос пользователя, данные о местоположении, последующий выбор конкретного результата (клик).
- Системные данные (Безопасность): Криптографические данные для создания и шифрования Opaque Tokens.
Какие метрики используются и как они считаются
- Opaque Token Validation: Процесс, включающий дешифровку и проверку уникальности токена. В патенте упоминается использование случайных чисел и криптографии.
- Time to Live (TTL): Предопределенное временное окно (например, несколько минут) для валидности токена.
- Click-Through Rate (CTR): Ключевая метрика. Рассчитывается путем отслеживания соотношения успешных запросов Этапа 2 (валидированные клики) к запросам Этапа 1 (показы списка). Патент явно указывает, что CTR используется как ranking signal для географических результатов.
- Индикатор злоупотребления (Misuse indication): Отслеживание соотношения запросов Этапа 2 к Этапу 1. Если соотношение превышает 1:1, это может указывать на попытку скрапинга.
Выводы
- Подтверждение CTR как фактора ранжирования в Local SEO: Патент явно указывает, что одна из целей механизма — сбор надежных данных Click-Through Rate для использования в качестве сигнала ранжирования для географических результатов.
- Сбор поведенческих сигналов вне доменов Google (Off-Domain): Google активно собирает данные о взаимодействии с результатами на любом сайте, использующем их API (например, Google Maps). Поведение пользователей на сторонних сайтах влияет на ранжирование.
- Приоритет защиты данных (Anti-Scraping): Механизм Opaque Token с коротким TTL и двухэтапная загрузка демонстрируют, как Google защищает свои проприетарные данные от массового сбора третьими сторонами.
- Важность дескрипторов (Сниппетов): Поскольку пользователь принимает решение о клике на основе Descriptor, привлекательность и точность этой базовой информации (Название, Адрес) критически важна для максимизации CTR.
- Инфраструктурная основа экосистемы: Патент описывает техническую реализацию контроля Google над своими данными и сбора метрик в распределенной экосистеме API и виджетов.
Практика
Best practices (это мы делаем)
- Оптимизация привлекательности локальных листингов (Google Business Profile): Необходимо максимизировать привлекательность Descriptor (название, рейтинг, базовый адрес). Поскольку CTR, собранный через этот механизм, является сигналом ранжирования, увеличение вовлеченности на всех платформах (включая сторонние сайты с виджетами) напрямую влияет на локальные позиции.
- Обеспечение точности и уникальности данных (NAP): Убедитесь, что базовые данные о компании точны и помогают пользователю однозначно идентифицировать ваш бизнес среди других. Это повышает вероятность клика по нужному результату.
- Построение цитируемости и встраиваний (Citation Building): Поощряйте релевантные сторонние сайты (блоги, каталоги) встраивать виджеты Карт с вашим местоположением. Патент подтверждает, что Google учитывает вовлеченность пользователей с этими встраиваниями.
- Корректное использование API (для разработчиков): При использовании Google API на своем сайте следуйте документации. Правильная реализация гарантирует, что положительные взаимодействия пользователей будут корректно учтены Google.
Worst practices (это делать не надо)
- Попытки парсинга данных через API: Патент напрямую направлен на предотвращение этого. Использование Opaque Tokens с коротким TTL и мониторинг злоупотреблений делают массовый парсинг неэффективным и рискованным.
- Манипуляция кликами (Click Fraud): Попытки искусственно накрутить CTR через API усложняются. Токены уникальны для каждой сессии, генерируются в реальном времени и требуют сложной эмуляции поведения для обхода защиты.
- Игнорирование поведенческих факторов в Local SEO: Недооценка важности CTR и вовлеченности пользователей как сигнала ранжирования является ошибкой, учитывая инфраструктуру, описанную в патенте.
Стратегическое значение
Патент подтверждает стратегическую важность поведенческих сигналов (User Engagement) в экосистеме Google, особенно для локального поиска. Он демонстрирует, что Google разработал надежную инфраструктуру для сбора этих сигналов за пределами своих собственных доменов. Для SEO-специалистов это означает, что оптимизация под пользователя (SXO/CRO) и работа над привлекательностью листингов является необходимым условием для эффективного ранжирования, так как CTR напрямую используется как ranking signal.
Практические примеры
Сценарий: Использование CTR с сайта агрегатора для улучшения ранжирования ресторана
- Контекст: Популярный сайт-агрегатор ресторанов использует Google Maps API для отображения карты и списка заведений.
- Действие пользователя: Пользователь ищет «итальянская пицца рядом» на сайте агрегатора.
- Первый этап: Агрегатор получает от Google список из 10 ресторанов. Для каждого отправляется только Descriptor (название, примерное расположение) и Opaque Token.
- Выбор: Ресторан «Пицца Марио» имеет привлекательный дескриптор (высокий рейтинг). Пользователь кликает на него, чтобы увидеть телефон и точный адрес.
- Второй этап: Сайт агрегатора отправляет Opaque Token обратно в Google для получения деталей. Google валидирует токен и отдает контент.
- Влияние на SEO: Google регистрирует клик по «Пицца Марио». Из-за более высокого CTR по сравнению с конкурентами, Google может повысить ранжирование «Пицца Марио» по релевантным запросам в локальном поиске и на Картах.
Вопросы и ответы
Патент напрямую говорит о том, что Google использует CTR как фактор ранжирования?
Да. В патенте прямо указано одно из преимуществ системы: «Click-through rates may also be used as a ranking signal for geographic search results based on how often a search result… is chosen by a user». Этот патент описывает надежный механизм для сбора этих данных на сторонних сайтах.
Влияет ли поведение пользователей на сторонних сайтах на мое ранжирование в Google?
Да, если эти сайты используют API Google (например, Google Maps) для отображения информации о вашем бизнесе. Описанный механизм позволяет Google отслеживать, какие объекты пользователи выбирают на этих сайтах, и использовать эту вовлеченность (CTR) для корректировки локального ранжирования.
Что такое «Opaque Token» и зачем он нужен?
Opaque Token — это уникальный зашифрованный идентификатор, который присваивается каждому результату поиска в реальном времени. Он необходим для безопасности и валидации. Когда пользователь кликает на результат, токен отправляется обратно в Google. Это позволяет подтвердить, что запрос легитимен (а не попытка парсинга), и точно зафиксировать клик.
Что такое многоэтапное получение результатов (Double Fetch)?
Это технический подход, при котором данные не отправляются сразу. На первом этапе (Fetch 1) отправляется только список идентификаторов (Descriptors) и токены. На втором этапе (Fetch 2), только после выбора пользователя и валидации токена, отправляется основной контент (Substantive Content). Это защищает данные и позволяет отслеживать клики.
Какое значение имеет Time to Live (TTL) для токена?
TTL — это короткий срок жизни токена (например, несколько минут). Если пользователь не выберет результат в течение этого времени, токен станет недействительным. Это ключевой элемент защиты от автоматизированного сбора данных (парсинга), так как предотвращает сохранение и повторное использование токенов.
Как этот патент влияет на оптимизацию Google Business Profile (GBP)?
Он подчеркивает критическую важность оптимизации привлекательности листинга GBP. Поскольку CTR является сигналом ранжирования, необходимо работать над тем, чтобы ваш Descriptor (видимая часть листинга: название, рейтинг, адрес) выделялся и мотивировал пользователя кликнуть для получения дополнительной информации.
Защищает ли этот механизм данные Google от парсинга?
Да, это одна из основных целей. Поскольку основной контент передается только по запросу для одного результата и требует валидного, краткосрочного Opaque Token, массовый сбор данных значительно усложняется. Система также отслеживает аномальное количество запросов на детали (коэффициент > 1:1) как индикатор злоупотребления.
Может ли владелец стороннего сайта увидеть полные данные, которые Google отправляет пользователю?
Система разработана так, чтобы минимизировать этот риск. Взаимодействие часто происходит напрямую между виджетом (например, JavaScript в браузере клиента) и сервером Google. В патенте указано, что виджет может быть закодирован так, чтобы предотвратить доступ разработчика сайта к передаваемым данным.
Что такое «Descriptor» в контексте этого патента?
Descriptor — это базовое описание результата, которое показывается пользователю на первом этапе (аналог сниппета). Патент подчеркивает, что он должен содержать достаточно информации, чтобы пользователь мог отличить один результат от другого (например, название и улица, если названия одинаковые).
Применяется ли этот механизм только к локальному поиску?
Хотя патент акцентирует внимание на географических результатах (Place Metadata) и Google Maps, описанная технология многоэтапного получения результатов с использованием токенов может применяться к любым типам поиска, предоставляемым через API на сторонних платформах, где требуется защита данных и сбор метрик.