Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
Описание
Какую задачу решает
Патент решает проблему полисемии (многозначности) поисковых запросов и определения неявного намерения (implicit intent) пользователя. Одна и та же фраза может иметь разные значения в разных контекстах, зависящих от физического окружения. Например, запрос [golf] зимой может означать поиск мест для отпуска, а летом — поиск местных гольф-клубов. Изобретение направлено на улучшение таргетинга поисковых результатов и рекламы путем учета физической среды пользователя для устранения неоднозначности запроса.
Что запатентовано
Запатентована система и метод таргетирования информации, который использует данные о физической среде пользователя (physical environment) — такие как погода, время суток, местоположение и даже общественное настроение (public mood) — для адаптации поисковой выдачи. Система анализирует исторические данные поиска для выявления корреляций между физической средой и поведением пользователей (кликами на результаты и их длительностью). Эти корреляции используются для формирования модели, которая в реальном времени модифицирует ранжирование или переписывает запрос (query rewriting).
Как это работает
Система работает в двух режимах: офлайн-анализ (обучение) и онлайн-применение (runtime).
- Офлайн-анализ (Training): Система анализирует логи запросов (Query Logs), идентифицирует метаданные физической среды для прошлых запросов (например, определяя погоду по IP-адресу и времени) и анализирует реакции пользователей (клики, включая их длительность). На основе этого выявляются корреляции (например, пользователи в холодную погоду чаще кликают на определенный тип результатов) и формируется модель.
- Онлайн-применение (Runtime): При получении нового запроса система определяет текущую физическую среду пользователя. Модель применяется для продвижения тех результатов, которые соответствуют наиболее вероятному значению запроса в данном контексте. Это достигается путем переранжирования результатов или путем расширения/переписывания исходного запроса.
Актуальность для SEO
Высокая. Понимание контекста пользователя и его неявного намерения является фундаментальной задачей современных поисковых систем. Местоположение, время суток и сезонность активно используются в поиске для адаптации выдачи. Этот патент описывает базовые механизмы того, как данные об окружающей среде интегрируются в процессы понимания запросов и ранжирования.
Важность для SEO
Патент имеет высокое значение для SEO. Он демонстрирует, что ранжирование, особенно по многозначным запросам, сильно зависит от контекста пользователя (время, место, сезон). Это означает, что невозможно оптимизировать страницу под одно статичное намерение. SEO-специалисты должны понимать различные контекстуальные интенты (ситуативный интент), стоящие за ключевыми словами, и гарантировать, что контент удовлетворяет потребности пользователей в релевантных для бизнеса контекстах.
Детальный разбор
Термины и определения
- Physical Environment (Физическая среда)
- Условия вокруг пользователя в момент подачи запроса. Включает погоду (температура, влажность), время суток, географическое местоположение, а также вычисляемые факторы, такие как общественное настроение (public mood).
- Metadata (Метаданные)
- Данные, ассоциированные с поисковым запросом. В контексте патента включают данные о физической среде, а также демографические данные пользователя (возраст, пол) и язык.
- Query Log (Лог запросов)
- Хранилище информации о прошлых запросах, включающее сам запрос, IP-адрес, время и реакции пользователя (выбранные результаты).
- User Reactions / Selections (Реакции пользователя / Выборы)
- Действия пользователя в ответ на поисковую выдачу. Патент явно указывает, что эти данные основаны на кликах и на том, как долго пользователь оставался на результате после клика (how long a clicking user stayed) – т.е. учитывается Dwell Time (долгие long clicks и короткие short clicks).
- Query Rewriting / Query Expansion (Переписывание / Расширение запроса)
- Процесс изменения или дополнения исходного запроса на основе выявленных корреляций с физической средой для получения более релевантных результатов. Также называется Трансформацией (Transformation).
- Cosine Similarity (Косинусное сходство)
- Метрика, используемая для определения схожести между запросами. Запросы представляются как векторы (например, в пространстве кликов по URL), и косинус угла между ними определяет степень схожести.
- Query Cluster (Кластер запросов)
- Группа схожих запросов, выявленных на основе анализа, которые часто приводят к выбору одних и тех же результатов в схожих условиях физической среды.
- Model (Модель)
- Набор правил или трансформаций, созданный на основе выявленных корреляций. Используется для изменения будущих запросов или переранжирования результатов.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод таргетирования информации.
- Система получает поисковый запрос, который имеет как минимум два разных значения (неоднозначный запрос).
- Идентифицируются первые метаданные (first metadata), ассоциированные с запросом. Эти метаданные включают: географическое местоположение, дату, время суток, возраст пользователя, пол пользователя или язык.
- Эти метаданные используются для продвижения (promote) результатов, соответствующих первому значению запроса.
- Процесс продвижения включает:
- Анализ (a) предыдущих запросов, (b) вторых метаданных (second metadata), связанных с предыдущими запросами, и (c) выборов (selections) результатов предыдущих запросов.
- Ключевой момент: Выборы основаны на кликах И на том, как долго кликнувший пользователь оставался на результате (how long a clicking user stayed at each prior search result). Это прямая ссылка на Dwell Time.
- Выявление корреляции между вторыми метаданными и выборами результатов.
- Идентификация кандидатов в результаты для текущего запроса.
- Расчет оценки (score) для каждого кандидата на основе корреляции и первых метаданных.
- Продвижение результатов путем ранжирования на основе рассчитанных оценок.
- Предоставление продвинутых результатов пользователю.
Claim 2 и 3 (Зависимые от 1): Уточняют механизм продвижения.
Продвижение результатов включает повышение ранга (increasing the rank) результатов, имеющих положительную корреляцию с идентифицированными первыми метаданными (Claim 2), и понижение ранга (demoting the rank) результатов, имеющих отрицательную корреляцию (Claim 3).
Claim 4 (Зависимый от 1): Уточняет метод идентификации метаданных.
Идентификация метаданных включает определение сетевого адреса (например, IP) устройства и определение географического местоположения, связанного с этим сетевым адресом.
Где и как применяется
Изобретение применяется на ключевых этапах обработки запроса и формирования выдачи, используя данные, обработанные в офлайн-режиме.
QUNDERSTANDING – Понимание Запросов
Система проводит офлайн-анализ (Training phase) для построения модели, которая связывает физическую среду с намерением пользователя. В режиме реального времени (Runtime phase) система использует эту модель для интерпретации текущего запроса с учетом контекста (погоды, времени, места). Это может привести к активации механизма Query Rewriting или Query Expansion.
RANKING / RERANKING – Ранжирование и Переранжирование
Модель генерирует сигналы, которые используются для переоценки результатов. Если система определяет корреляцию между текущей физической средой и предпочтениями прошлых пользователей (измеренными через long clicks) в аналогичной среде, она может повышать (boost) или понижать (demote) определенные результаты в выдаче.
Входные данные (Runtime):
- Исходный запрос пользователя.
- Данные о текущей физической среде пользователя (местоположение, время).
- Внешние данные (текущая погода для местоположения).
- Демографические данные пользователя (если доступны).
Выходные данные (Runtime):
- Переписанный/расширенный запрос (если активирован Query Rewriting).
- ИЛИ: Набор сигналов ранжирования, корректирующих вес результатов на основе контекста.
- Финальная поисковая выдача (включая рекламу), адаптированная под физическую среду.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на многозначные (полисемичные) запросы, где значение слова меняется в зависимости от контекста (примеры из патента: [router], [skis]). Также сильно влияет на запросы с неявным интентом, зависящим от времени или погоды (например, [ресторан], [orange juice]).
- Локальный поиск: Местоположение является ключевым фактором физической среды, поэтому патент напрямую влияет на локальную выдачу и гео-зависимые запросы.
- Сезонные тематики: Влияет на тематики, связанные с погодой, отдыхом, спортом, одеждой, путешествиями, где интерес пользователя меняется в зависимости от сезона или текущей температуры.
Когда применяется
- Условия работы: Алгоритм применяется, когда у системы есть доступ к данным о физической среде пользователя (минимум — местоположение и время) и когда для данного запроса существует модель, связывающая среду с интентом.
- Триггеры активации: Активация происходит, когда система идентифицирует запрос как многозначный или имеющий контекстно-зависимое намерение (на основе офлайн-анализа логов).
Пошаговый алгоритм
Процесс разделен на две фазы: Анализ (Офлайн-обучение) и Применение (Runtime).
Фаза 1: Анализ и формирование модели (Офлайн / Training)
- Сбор данных: Сбор данных из Query Logs, включая запросы, IP-адреса, время и выбранные пользователями результаты (клики и их длительность – Dwell Time).
- Идентификация метаданных среды: Для каждого прошлого запроса определяются параметры физической среды. Например, определение местоположения по IP и запрос погоды для этого места и времени у внешнего источника (используя Lookup Module). Также могут вычисляться факторы, такие как public mood.
- Группировка и Сегментация: Запросы группируются по темам. Данные сегментируются (Slice Data) по признакам среды (например, по погоде или региону).
- Выявление схожести: Идентификация схожих пар запросов (similar query pairs). Для этого может использоваться Cosine Similarity, основанная на общих кликнутых URL. Формирование Query Clusters.
- Выявление корреляций: Анализ взаимосвязи между метаданными физической среды и реакциями пользователей (long clicks). Система ищет сильные корреляции в одной среде и отсутствие корреляции в других. Может использоваться логистическая регрессия.
- Оценка значимости (для Query Expansion): Определение, приводит ли расширение запроса к значительному улучшению пользовательского отклика и насколько это улучшение зависит от конкретного фактора среды (например, расширения сильно различаются для разных погодных условий).
- Формирование модели: Создание Model на основе выявленных корреляций. Модель может представлять собой правила для переранжирования или маппинг для Query Expansion.
Фаза 2: Применение модели (Runtime)
- Получение запроса: Система получает запрос от пользователя.
- Идентификация текущей среды: Определение текущего местоположения, времени и, возможно, погоды для пользователя.
- Применение модели: Система применяет Model, соответствующую текущему запросу и физической среде.
- Вариант A (Переранжирование): Результаты поиска оцениваются с учетом корреляций. Результаты с положительной корреляцией для данной среды повышаются в ранге, с отрицательной — понижаются.
- Вариант B (Переписывание запроса): Исходный запрос расширяется или заменяется на основе маппинга. Расширенный запрос отправляется в поисковую систему.
- Предоставление результатов: Пользователю предоставляется адаптированная поисковая выдача.
Какие данные и как использует
Данные на входе
Система использует широкий спектр данных для анализа и применения.
- Поведенческие факторы (Ключевые):
- Логи запросов (Query Logs).
- Выборы результатов (Selections).
- Длительность клика (how long a clicking user stayed). Патент явно указывает, что long clicks трактуются положительно, а short clicks — отрицательно.
- Технические факторы:
- IP-адрес (для определения местоположения).
- Временные факторы:
- Время суток, Дата (для определения временного контекста и сезонности).
- Географические факторы:
- Местоположение (Широта/долгота, Регион), полученное через GPS, Cell ID или IP.
- Пользовательские факторы (если доступны):
- Демография (Возраст, Пол) – явно упомянуты в Claims.
- Язык.
- Внешние данные (Physical Environment Data):
- Погода (Температура, Влажность).
- Новости региона или экономические индикаторы (используются для оценки public mood).
Какие метрики используются и как они считаются
- Correlation Score (Оценка корреляции): Метрика, определяющая силу связи между параметром физической среды и реакцией пользователя (long click). Может вычисляться с помощью статистических методов (например, логистическая регрессия упомянута в описании).
- Cosine Similarity (Косинусное сходство): Используется в офлайн-анализе для определения схожести запросов на основе того, на какие общие URL кликают пользователи.
- Query Norm (Норма запроса): Нормализация вектора запроса до единичной длины для использования в расчете Cosine Similarity.
- Significance of Query Cluster (Значимость кластера запросов): Метрика для оценки того, приводит ли расширение запроса к значительному улучшению пользовательского отклика (например, увеличению кликов) по сравнению с исходным запросом, и насколько это улучшение зависит от конкретного фактора среды (например, низкое пересечение расширений для разных регионов).
Выводы
- Физический контекст как ключевой сигнал интента: Патент подтверждает, что физическая среда пользователя (место, время, погода) является критически важным сигналом для понимания истинного намерения, особенно для многозначных запросов. Система активно использует этот контекст для адаптации выдачи.
- Интент определяется поведением масс: Намерение пользователя выводится из анализа того, как массы пользователей реагировали на результаты в аналогичных физических условиях в прошлом.
- Критичность поведенческих метрик (Dwell Time): В патенте (и конкретно в Claim 1) явно указано, что анализ основан на кликах и длительности пребывания на странице после клика (how long a clicking user stayed). Long clicks используются как сигнал удовлетворенности интента в конкретном контексте, short clicks — как негативный сигнал.
- Два механизма адаптации: Система может адаптировать выдачу двумя способами: (1) Переранжирование (повышение или понижение) результатов на основе корреляций с физической средой, и (2) Переписывание запроса (Query Rewriting/Expansion) для уточнения контекстуального интента.
- Комплексное использование данных о среде: Помимо очевидных факторов (погода, время), патент упоминает возможность использования вычисляемых факторов, таких как общественное настроение (public mood), основанное на новостях или экономических индикаторах региона.
Практика
Best practices (это мы делаем)
- Анализ контекстуальных интентов: Необходимо анализировать ключевые слова не изолированно, а в контексте различных физических сред. Определите, как меняется интент запроса в зависимости от сезона (зима/лето), времени суток (утро/вечер) и региона.
- Создание контента под специфические контексты: Если запрос имеет разные значения в разных контекстах, создавайте отдельные страницы или адаптируйте контент для удовлетворения этих специфических потребностей. Например, для запроса [golf] нужны страницы и про «зимний гольф-отпуск», и про «местные гольф-клубы».
- Оптимизация под сезонность: Активно работайте с сезонным контентом. Система будет отдавать предпочтение контенту, который коррелирует с текущей погодой и сезоном. Убедитесь, что ваш сезонный контент актуален и хорошо оптимизирован.
- Усиление локальных сигналов: Поскольку местоположение является ключевым фактором физической среды, комплексная работа над Local SEO критически важна. Это помогает системе точно определить контекст пользователя и предоставить релевантный локальный контент.
- Оптимизация удовлетворенности пользователя (Long Clicks): Так как модель обучается на long clicks, критически важно создавать контент, который полностью удовлетворяет интент пользователя и удерживает его на странице (высокий Dwell Time). Это повышает вероятность того, что ваш сайт будет повышен в выдаче при схожих контекстуальных условиях в будущем.
Worst practices (это делать не надо)
- Игнорирование многозначности запросов: Предполагать, что у многозначного ключевого слова есть только один интент. Это приведет к потере трафика в определенных контекстах (сезонах, регионах).
- Создание контента, генерирующего короткие клики (Clickbait): Использование кликбейтных заголовков или контента, который не соответствует обещанию в сниппете. Short clicks используются системой как негативный сигнал (Claim 1) и могут привести к понижению ранга в данном контексте.
- Пренебрежение региональными и временными различиями: Применение единой SEO-стратегии без учета того, что интерес к теме может радикально меняться в течение года, дня или в разных локациях.
Стратегическое значение
Патент подчеркивает стратегический сдвиг от статической оптимизации под ключевые слова к динамической, контекстно-зависимой стратегии контента. Понимание неявного намерения пользователя, основанное на его физическом окружении, становится определяющим фактором ранжирования для широкого класса запросов. Это требует от SEO-специалистов более глубокого понимания поведения пользователей в реальном мире и способности адаптировать контент под меняющиеся условия.
Практические примеры
Сценарий: Оптимизация магазина спортивного инвентаря под запрос [Skis] (Лыжи)
- Анализ интента: SEO-специалист определяет, что запрос [Skis] имеет два основных контекстуальных значения: «Snow Skis» (горные/беговые лыжи) и «Water Skis» (водные лыжи).
- Анализ среды: Интент зависит от погоды и сезона. В холодную погоду/зимой актуален первый интент, в теплую погоду/летом — второй.
- Стратегия контента: Создаются две отдельные категории/посадочные страницы, оптимизированные под каждый интент.
- Ожидаемый результат (Действие Google):
- Пользователь в Миннесоте зимой (холодный контекст) вводит [Skis]. Google определяет среду и применяет модель, которая коррелирует холод с интентом «Snow Skis». Страница про горные лыжи получает повышение (boost).
- Пользователь во Флориде летом (теплый контекст) вводит [Skis]. Google применяет модель, коррелирующую тепло с интентом «Water Skis». Страница про водные лыжи получает повышение.
- Результат для SEO: Магазин получает релевантный трафик круглый год, удовлетворяя контекстуальные потребности пользователей.
Вопросы и ответы
Как система определяет физическую среду пользователя (например, погоду)?
Система определяет местоположение пользователя (используя IP-адрес, как указано в Claim 4, данные GPS или Cell ID) и время запроса. Затем она может использовать эти данные для запроса информации о текущей погоде у внешних поставщиков данных через API (используя Lookup Module). Для офлайн-анализа используются исторические данные о погоде.
Какие именно поведенческие метрики используются для обучения модели?
Патент явно указывает в Claim 1, что используются клики и длительность пребывания пользователя на результате после клика (how long a clicking user stayed). В описании уточняется, что долгие клики (long clicks) интерпретируются как положительный сигнал (удовлетворенность результатом), а короткие клики (short clicks) — как отрицательный сигнал.
Этот патент описывает переранжирование или переписывание запросов?
Оба механизма. Патент описывает возможность повышения или понижения ранга существующих результатов на основе корреляций с физической средой (Claims 2 и 3). Также в описании детально рассматриваются процессы Query Rewriting и Query Expansion, где исходный запрос изменяется для лучшего соответствия контекстуальному интенту.
Как этот механизм влияет на многозначные (амбивалентные) запросы?
Это основная цель патента. Для запросов с несколькими значениями (полисемия) система использует физическую среду как ключевой сигнал для устранения неоднозначности. Например, для запроса [router] система может предпочесть результаты о сетевом оборудовании в технологическом регионе и о деревообрабатывающих инструментах в регионе с преобладанием ручного труда, основываясь на исторических данных.
Насколько это важно для Local SEO?
Критически важно. Местоположение является одним из основных компонентов «физической среды». Патент описывает, как система учится понимать, что пользователи в разных регионах или в разное время суток могут иметь разные намерения при вводе одного и того же запроса, и адаптирует выдачу соответственно.
Как оптимизировать сайт с учетом этого патента?
Необходимо провести глубокий анализ того, как меняется интент ваших ключевых запросов в зависимости от сезона, времени суток и региона. Создавайте специфический контент, который отвечает этим контекстуальным потребностям. Убедитесь, что ваш контент генерирует long clicks (высокий Dwell Time), подтверждая системе, что он соответствует интенту в данном контексте.
Что такое «Общественное настроение» (Public Mood) и как оно используется?
Патент упоминает Public Mood как один из факторов физической среды. Это вычисляемая метрика, отражающая общий уровень морального духа в регионе. Она может определяться на основе анализа местных новостей (например, стихийные бедствия), экономических индикаторов, движений фондового рынка или агрегированных трендов поисковых запросов в регионе.
Как система определяет схожие запросы (Query Clusters)?
В офлайн-режиме система анализирует логи и использует метрику косинусного сходства (Cosine Similarity). Схожесть определяется на основе того, насколько часто пользователи кликают на одни и те же URL в ответ на разные запросы. Если два запроса часто приводят к кликам на одинаковые результаты в схожем контексте, они считаются схожими.
Влияет ли этот механизм на показ рекламы?
Да, патент явно указывает, что описанные техники используются для улучшения таргетинга не только поисковых результатов, но и рекламных объявлений (targeted advertising или ads). Реклама также адаптируется с учетом физической среды пользователя для повышения ее релевантности и кликабельности.
Является ли это персонализацией поиска?
Это скорее контекстуализация, так как адаптация основана на текущей физической среде пользователя (погода, время, место), а не на его личной истории поиска. Однако в Claims также упоминается возможность использования демографических данных (возраст, пол), если они доступны, что добавляет элемент персонализации.