SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи

TARGETING TO PHYSICAL ENVIRONMENT (Таргетинг с учетом физического окружения)
  • US8898148B1
  • Google LLC
  • 2012-04-10
  • 2014-11-25
  • Семантика и интент
  • Поведенческие сигналы
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.

Описание

Какую проблему решает

Патент решает проблему полисемии (многозначности) поисковых запросов и определения неявного намерения (implicit intent) пользователя. Одна и та же фраза может иметь разные значения в разных контекстах, зависящих от физического окружения. Например, запрос [golf] зимой может означать поиск мест для отпуска, а летом — поиск местных гольф-клубов. Изобретение направлено на улучшение таргетинга поисковых результатов и рекламы путем учета физической среды пользователя для устранения неоднозначности запроса.

Что запатентовано

Запатентована система и метод таргетирования информации, который использует данные о физической среде пользователя (physical environment) — такие как погода, время суток, местоположение и даже общественное настроение (public mood) — для адаптации поисковой выдачи. Система анализирует исторические данные поиска для выявления корреляций между физической средой и поведением пользователей (кликами на результаты и их длительностью). Эти корреляции используются для формирования модели, которая в реальном времени модифицирует ранжирование или переписывает запрос (query rewriting).

Как это работает

Система работает в двух режимах: офлайн-анализ (обучение) и онлайн-применение (runtime).

  • Офлайн-анализ (Training): Система анализирует логи запросов (Query Logs), идентифицирует метаданные физической среды для прошлых запросов (например, определяя погоду по IP-адресу и времени) и анализирует реакции пользователей (клики, включая их длительность). На основе этого выявляются корреляции (например, пользователи в холодную погоду чаще кликают на определенный тип результатов) и формируется модель.
  • Онлайн-применение (Runtime): При получении нового запроса система определяет текущую физическую среду пользователя. Модель применяется для продвижения тех результатов, которые соответствуют наиболее вероятному значению запроса в данном контексте. Это достигается путем переранжирования результатов или путем расширения/переписывания исходного запроса.

Актуальность для SEO

Высокая. Понимание контекста пользователя и его неявного намерения является фундаментальной задачей современных поисковых систем. Местоположение, время суток и сезонность активно используются в поиске для адаптации выдачи. Этот патент описывает базовые механизмы того, как данные об окружающей среде интегрируются в процессы понимания запросов и ранжирования.

Важность для SEO

Патент имеет высокое значение для SEO. Он демонстрирует, что ранжирование, особенно по многозначным запросам, сильно зависит от контекста пользователя (время, место, сезон). Это означает, что невозможно оптимизировать страницу под одно статичное намерение. SEO-специалисты должны понимать различные контекстуальные интенты (ситуативный интент), стоящие за ключевыми словами, и гарантировать, что контент удовлетворяет потребности пользователей в релевантных для бизнеса контекстах.

Детальный разбор

Термины и определения

Physical Environment (Физическая среда)
Условия вокруг пользователя в момент подачи запроса. Включает погоду (температура, влажность), время суток, географическое местоположение, а также вычисляемые факторы, такие как общественное настроение (public mood).
Metadata (Метаданные)
Данные, ассоциированные с поисковым запросом. В контексте патента включают данные о физической среде, а также демографические данные пользователя (возраст, пол) и язык.
Query Log (Лог запросов)
Хранилище информации о прошлых запросах, включающее сам запрос, IP-адрес, время и реакции пользователя (выбранные результаты).
User Reactions / Selections (Реакции пользователя / Выборы)
Действия пользователя в ответ на поисковую выдачу. Патент явно указывает, что эти данные основаны на кликах и на том, как долго пользователь оставался на результате после клика (how long a clicking user stayed) – т.е. учитывается Dwell Time (долгие long clicks и короткие short clicks).
Query Rewriting / Query Expansion (Переписывание / Расширение запроса)
Процесс изменения или дополнения исходного запроса на основе выявленных корреляций с физической средой для получения более релевантных результатов. Также называется Трансформацией (Transformation).
Cosine Similarity (Косинусное сходство)
Метрика, используемая для определения схожести между запросами. Запросы представляются как векторы (например, в пространстве кликов по URL), и косинус угла между ними определяет степень схожести.
Query Cluster (Кластер запросов)
Группа схожих запросов, выявленных на основе анализа, которые часто приводят к выбору одних и тех же результатов в схожих условиях физической среды.
Model (Модель)
Набор правил или трансформаций, созданный на основе выявленных корреляций. Используется для изменения будущих запросов или переранжирования результатов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод таргетирования информации.

  1. Система получает поисковый запрос, который имеет как минимум два разных значения (неоднозначный запрос).
  2. Идентифицируются первые метаданные (first metadata), ассоциированные с запросом. Эти метаданные включают: географическое местоположение, дату, время суток, возраст пользователя, пол пользователя или язык.
  3. Эти метаданные используются для продвижения (promote) результатов, соответствующих первому значению запроса.
  4. Процесс продвижения включает:
    • Анализ (a) предыдущих запросов, (b) вторых метаданных (second metadata), связанных с предыдущими запросами, и (c) выборов (selections) результатов предыдущих запросов.
    • Ключевой момент: Выборы основаны на кликах И на том, как долго кликнувший пользователь оставался на результате (how long a clicking user stayed at each prior search result). Это прямая ссылка на Dwell Time.
    • Выявление корреляции между вторыми метаданными и выборами результатов.
    • Идентификация кандидатов в результаты для текущего запроса.
    • Расчет оценки (score) для каждого кандидата на основе корреляции и первых метаданных.
    • Продвижение результатов путем ранжирования на основе рассчитанных оценок.
  5. Предоставление продвинутых результатов пользователю.

Claim 2 и 3 (Зависимые от 1): Уточняют механизм продвижения.

Продвижение результатов включает повышение ранга (increasing the rank) результатов, имеющих положительную корреляцию с идентифицированными первыми метаданными (Claim 2), и понижение ранга (demoting the rank) результатов, имеющих отрицательную корреляцию (Claim 3).

Claim 4 (Зависимый от 1): Уточняет метод идентификации метаданных.

Идентификация метаданных включает определение сетевого адреса (например, IP) устройства и определение географического местоположения, связанного с этим сетевым адресом.

Где и как применяется

Изобретение применяется на ключевых этапах обработки запроса и формирования выдачи, используя данные, обработанные в офлайн-режиме.

QUNDERSTANDING – Понимание Запросов
Система проводит офлайн-анализ (Training phase) для построения модели, которая связывает физическую среду с намерением пользователя. В режиме реального времени (Runtime phase) система использует эту модель для интерпретации текущего запроса с учетом контекста (погоды, времени, места). Это может привести к активации механизма Query Rewriting или Query Expansion.

RANKING / RERANKING – Ранжирование и Переранжирование
Модель генерирует сигналы, которые используются для переоценки результатов. Если система определяет корреляцию между текущей физической средой и предпочтениями прошлых пользователей (измеренными через long clicks) в аналогичной среде, она может повышать (boost) или понижать (demote) определенные результаты в выдаче.

Входные данные (Runtime):

  • Исходный запрос пользователя.
  • Данные о текущей физической среде пользователя (местоположение, время).
  • Внешние данные (текущая погода для местоположения).
  • Демографические данные пользователя (если доступны).

Выходные данные (Runtime):

  • Переписанный/расширенный запрос (если активирован Query Rewriting).
  • ИЛИ: Набор сигналов ранжирования, корректирующих вес результатов на основе контекста.
  • Финальная поисковая выдача (включая рекламу), адаптированная под физическую среду.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на многозначные (полисемичные) запросы, где значение слова меняется в зависимости от контекста (примеры из патента: [router], [skis]). Также сильно влияет на запросы с неявным интентом, зависящим от времени или погоды (например, [ресторан], [orange juice]).
  • Локальный поиск: Местоположение является ключевым фактором физической среды, поэтому патент напрямую влияет на локальную выдачу и гео-зависимые запросы.
  • Сезонные тематики: Влияет на тематики, связанные с погодой, отдыхом, спортом, одеждой, путешествиями, где интерес пользователя меняется в зависимости от сезона или текущей температуры.

Когда применяется

  • Условия работы: Алгоритм применяется, когда у системы есть доступ к данным о физической среде пользователя (минимум — местоположение и время) и когда для данного запроса существует модель, связывающая среду с интентом.
  • Триггеры активации: Активация происходит, когда система идентифицирует запрос как многозначный или имеющий контекстно-зависимое намерение (на основе офлайн-анализа логов).

Пошаговый алгоритм

Процесс разделен на две фазы: Анализ (Офлайн-обучение) и Применение (Runtime).

Фаза 1: Анализ и формирование модели (Офлайн / Training)

  1. Сбор данных: Сбор данных из Query Logs, включая запросы, IP-адреса, время и выбранные пользователями результаты (клики и их длительность – Dwell Time).
  2. Идентификация метаданных среды: Для каждого прошлого запроса определяются параметры физической среды. Например, определение местоположения по IP и запрос погоды для этого места и времени у внешнего источника (используя Lookup Module). Также могут вычисляться факторы, такие как public mood.
  3. Группировка и Сегментация: Запросы группируются по темам. Данные сегментируются (Slice Data) по признакам среды (например, по погоде или региону).
  4. Выявление схожести: Идентификация схожих пар запросов (similar query pairs). Для этого может использоваться Cosine Similarity, основанная на общих кликнутых URL. Формирование Query Clusters.
  5. Выявление корреляций: Анализ взаимосвязи между метаданными физической среды и реакциями пользователей (long clicks). Система ищет сильные корреляции в одной среде и отсутствие корреляции в других. Может использоваться логистическая регрессия.
  6. Оценка значимости (для Query Expansion): Определение, приводит ли расширение запроса к значительному улучшению пользовательского отклика и насколько это улучшение зависит от конкретного фактора среды (например, расширения сильно различаются для разных погодных условий).
  7. Формирование модели: Создание Model на основе выявленных корреляций. Модель может представлять собой правила для переранжирования или маппинг для Query Expansion.

Фаза 2: Применение модели (Runtime)

  1. Получение запроса: Система получает запрос от пользователя.
  2. Идентификация текущей среды: Определение текущего местоположения, времени и, возможно, погоды для пользователя.
  3. Применение модели: Система применяет Model, соответствующую текущему запросу и физической среде.
    • Вариант A (Переранжирование): Результаты поиска оцениваются с учетом корреляций. Результаты с положительной корреляцией для данной среды повышаются в ранге, с отрицательной — понижаются.
    • Вариант B (Переписывание запроса): Исходный запрос расширяется или заменяется на основе маппинга. Расширенный запрос отправляется в поисковую систему.
  4. Предоставление результатов: Пользователю предоставляется адаптированная поисковая выдача.

Какие данные и как использует

Данные на входе

Система использует широкий спектр данных для анализа и применения.

  • Поведенческие факторы (Ключевые):
    • Логи запросов (Query Logs).
    • Выборы результатов (Selections).
    • Длительность клика (how long a clicking user stayed). Патент явно указывает, что long clicks трактуются положительно, а short clicks — отрицательно.
  • Технические факторы:
    • IP-адрес (для определения местоположения).
  • Временные факторы:
    • Время суток, Дата (для определения временного контекста и сезонности).
  • Географические факторы:
    • Местоположение (Широта/долгота, Регион), полученное через GPS, Cell ID или IP.
  • Пользовательские факторы (если доступны):
    • Демография (Возраст, Пол) – явно упомянуты в Claims.
    • Язык.
  • Внешние данные (Physical Environment Data):
    • Погода (Температура, Влажность).
    • Новости региона или экономические индикаторы (используются для оценки public mood).

Какие метрики используются и как они считаются

  • Correlation Score (Оценка корреляции): Метрика, определяющая силу связи между параметром физической среды и реакцией пользователя (long click). Может вычисляться с помощью статистических методов (например, логистическая регрессия упомянута в описании).
  • Cosine Similarity (Косинусное сходство): Используется в офлайн-анализе для определения схожести запросов на основе того, на какие общие URL кликают пользователи.
  • Query Norm (Норма запроса): Нормализация вектора запроса до единичной длины для использования в расчете Cosine Similarity.
  • Significance of Query Cluster (Значимость кластера запросов): Метрика для оценки того, приводит ли расширение запроса к значительному улучшению пользовательского отклика (например, увеличению кликов) по сравнению с исходным запросом, и насколько это улучшение зависит от конкретного фактора среды (например, низкое пересечение расширений для разных регионов).

Выводы

  1. Физический контекст как ключевой сигнал интента: Патент подтверждает, что физическая среда пользователя (место, время, погода) является критически важным сигналом для понимания истинного намерения, особенно для многозначных запросов. Система активно использует этот контекст для адаптации выдачи.
  2. Интент определяется поведением масс: Намерение пользователя выводится из анализа того, как массы пользователей реагировали на результаты в аналогичных физических условиях в прошлом.
  3. Критичность поведенческих метрик (Dwell Time): В патенте (и конкретно в Claim 1) явно указано, что анализ основан на кликах и длительности пребывания на странице после клика (how long a clicking user stayed). Long clicks используются как сигнал удовлетворенности интента в конкретном контексте, short clicks — как негативный сигнал.
  4. Два механизма адаптации: Система может адаптировать выдачу двумя способами: (1) Переранжирование (повышение или понижение) результатов на основе корреляций с физической средой, и (2) Переписывание запроса (Query Rewriting/Expansion) для уточнения контекстуального интента.
  5. Комплексное использование данных о среде: Помимо очевидных факторов (погода, время), патент упоминает возможность использования вычисляемых факторов, таких как общественное настроение (public mood), основанное на новостях или экономических индикаторах региона.

Практика

Best practices (это мы делаем)

  • Анализ контекстуальных интентов: Необходимо анализировать ключевые слова не изолированно, а в контексте различных физических сред. Определите, как меняется интент запроса в зависимости от сезона (зима/лето), времени суток (утро/вечер) и региона.
  • Создание контента под специфические контексты: Если запрос имеет разные значения в разных контекстах, создавайте отдельные страницы или адаптируйте контент для удовлетворения этих специфических потребностей. Например, для запроса [golf] нужны страницы и про "зимний гольф-отпуск", и про "местные гольф-клубы".
  • Оптимизация под сезонность: Активно работайте с сезонным контентом. Система будет отдавать предпочтение контенту, который коррелирует с текущей погодой и сезоном. Убедитесь, что ваш сезонный контент актуален и хорошо оптимизирован.
  • Усиление локальных сигналов: Поскольку местоположение является ключевым фактором физической среды, комплексная работа над Local SEO критически важна. Это помогает системе точно определить контекст пользователя и предоставить релевантный локальный контент.
  • Оптимизация удовлетворенности пользователя (Long Clicks): Так как модель обучается на long clicks, критически важно создавать контент, который полностью удовлетворяет интент пользователя и удерживает его на странице (высокий Dwell Time). Это повышает вероятность того, что ваш сайт будет повышен в выдаче при схожих контекстуальных условиях в будущем.

Worst practices (это делать не надо)

  • Игнорирование многозначности запросов: Предполагать, что у многозначного ключевого слова есть только один интент. Это приведет к потере трафика в определенных контекстах (сезонах, регионах).
  • Создание контента, генерирующего короткие клики (Clickbait): Использование кликбейтных заголовков или контента, который не соответствует обещанию в сниппете. Short clicks используются системой как негативный сигнал (Claim 1) и могут привести к понижению ранга в данном контексте.
  • Пренебрежение региональными и временными различиями: Применение единой SEO-стратегии без учета того, что интерес к теме может радикально меняться в течение года, дня или в разных локациях.

Стратегическое значение

Патент подчеркивает стратегический сдвиг от статической оптимизации под ключевые слова к динамической, контекстно-зависимой стратегии контента. Понимание неявного намерения пользователя, основанное на его физическом окружении, становится определяющим фактором ранжирования для широкого класса запросов. Это требует от SEO-специалистов более глубокого понимания поведения пользователей в реальном мире и способности адаптировать контент под меняющиеся условия.

Практические примеры

Сценарий: Оптимизация магазина спортивного инвентаря под запрос [Skis] (Лыжи)

  1. Анализ интента: SEO-специалист определяет, что запрос [Skis] имеет два основных контекстуальных значения: "Snow Skis" (горные/беговые лыжи) и "Water Skis" (водные лыжи).
  2. Анализ среды: Интент зависит от погоды и сезона. В холодную погоду/зимой актуален первый интент, в теплую погоду/летом — второй.
  3. Стратегия контента: Создаются две отдельные категории/посадочные страницы, оптимизированные под каждый интент.
  4. Ожидаемый результат (Действие Google):
    • Пользователь в Миннесоте зимой (холодный контекст) вводит [Skis]. Google определяет среду и применяет модель, которая коррелирует холод с интентом "Snow Skis". Страница про горные лыжи получает повышение (boost).
    • Пользователь во Флориде летом (теплый контекст) вводит [Skis]. Google применяет модель, коррелирующую тепло с интентом "Water Skis". Страница про водные лыжи получает повышение.
  5. Результат для SEO: Магазин получает релевантный трафик круглый год, удовлетворяя контекстуальные потребности пользователей.

Вопросы и ответы

Как система определяет физическую среду пользователя (например, погоду)?

Система определяет местоположение пользователя (используя IP-адрес, как указано в Claim 4, данные GPS или Cell ID) и время запроса. Затем она может использовать эти данные для запроса информации о текущей погоде у внешних поставщиков данных через API (используя Lookup Module). Для офлайн-анализа используются исторические данные о погоде.

Какие именно поведенческие метрики используются для обучения модели?

Патент явно указывает в Claim 1, что используются клики и длительность пребывания пользователя на результате после клика (how long a clicking user stayed). В описании уточняется, что долгие клики (long clicks) интерпретируются как положительный сигнал (удовлетворенность результатом), а короткие клики (short clicks) — как отрицательный сигнал.

Этот патент описывает переранжирование или переписывание запросов?

Оба механизма. Патент описывает возможность повышения или понижения ранга существующих результатов на основе корреляций с физической средой (Claims 2 и 3). Также в описании детально рассматриваются процессы Query Rewriting и Query Expansion, где исходный запрос изменяется для лучшего соответствия контекстуальному интенту.

Как этот механизм влияет на многозначные (амбивалентные) запросы?

Это основная цель патента. Для запросов с несколькими значениями (полисемия) система использует физическую среду как ключевой сигнал для устранения неоднозначности. Например, для запроса [router] система может предпочесть результаты о сетевом оборудовании в технологическом регионе и о деревообрабатывающих инструментах в регионе с преобладанием ручного труда, основываясь на исторических данных.

Насколько это важно для Local SEO?

Критически важно. Местоположение является одним из основных компонентов "физической среды". Патент описывает, как система учится понимать, что пользователи в разных регионах или в разное время суток могут иметь разные намерения при вводе одного и того же запроса, и адаптирует выдачу соответственно.

Как оптимизировать сайт с учетом этого патента?

Необходимо провести глубокий анализ того, как меняется интент ваших ключевых запросов в зависимости от сезона, времени суток и региона. Создавайте специфический контент, который отвечает этим контекстуальным потребностям. Убедитесь, что ваш контент генерирует long clicks (высокий Dwell Time), подтверждая системе, что он соответствует интенту в данном контексте.

Что такое "Общественное настроение" (Public Mood) и как оно используется?

Патент упоминает Public Mood как один из факторов физической среды. Это вычисляемая метрика, отражающая общий уровень морального духа в регионе. Она может определяться на основе анализа местных новостей (например, стихийные бедствия), экономических индикаторов, движений фондового рынка или агрегированных трендов поисковых запросов в регионе.

Как система определяет схожие запросы (Query Clusters)?

В офлайн-режиме система анализирует логи и использует метрику косинусного сходства (Cosine Similarity). Схожесть определяется на основе того, насколько часто пользователи кликают на одни и те же URL в ответ на разные запросы. Если два запроса часто приводят к кликам на одинаковые результаты в схожем контексте, они считаются схожими.

Влияет ли этот механизм на показ рекламы?

Да, патент явно указывает, что описанные техники используются для улучшения таргетинга не только поисковых результатов, но и рекламных объявлений (targeted advertising или ads). Реклама также адаптируется с учетом физической среды пользователя для повышения её релевантности и кликабельности.

Является ли это персонализацией поиска?

Это скорее контекстуализация, так как адаптация основана на текущей физической среде пользователя (погода, время, место), а не на его личной истории поиска. Однако в Claims также упоминается возможность использования демографических данных (возраст, пол), если они доступны, что добавляет элемент персонализации.

Похожие патенты

Как Google использует погоду, время, текущие события и социальные сигналы для персонализации поисковых подсказок (Autocomplete)
Google динамически изменяет поисковые подсказки (Autocomplete и переписанные запросы), основываясь на текущем контексте пользователя. Система учитывает такие факторы, как погода, время суток, актуальные новости, рекомендации друзей в социальных сетях и их местоположение. Стандартные подсказки переоцениваются и переранжируются в реальном времени, чтобы предложить пользователю наиболее релевантный запрос в данный момент и в данном месте.
  • US20160041991A1
  • 2016-02-11
  • Персонализация

  • Свежесть контента

  • SERP

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google определяет локальный интент и предлагает уточнить запрос до его отправки в поиск
Google использует вероятностную модель, основанную на поведении пользователей, чтобы определить, имеет ли вводимый запрос локальный интент. Если вероятность высока, система предлагает пользователю добавить уточняющую информацию (например, местоположение) ещё до того, как запрос будет отправлен в поисковую систему. Это позволяет сразу формировать более точную и локализованную выдачу.
  • US8484190B1
  • 2013-07-09
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует сезонные и локальные события (Recurrent Queries) для определения местоположения пользователя
Google улучшает геолокацию пользователей, анализируя «повторяющиеся запросы» (Recurrent Queries) — запросы, популярность которых резко возрастает в конкретных регионах в определенное время (например, локальные праздники или события). Когда пользователь вводит такой запрос в соответствующий период, система с высокой уверенностью определяет его местоположение, даже если другие сигналы (IP, GPS) неоднозначны.
  • US20150169596A1
  • 2015-06-18
  • Local SEO

  • Поведенческие сигналы

  • Персонализация

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Популярные патенты

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео
Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.
  • US8903812B1
  • 2014-12-02
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя
Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.
  • US9235626B2
  • 2016-01-12
  • Персонализация

  • SERP

  • Семантика и интент

seohardcore