SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу

DETERMINING USER INTENT FROM QUERY PATTERNS (Определение намерения пользователя по паттернам запросов)
  • US8868548B2
  • Google LLC
  • 2010-07-22
  • 2014-10-21
  • Семантика и интент
  • Поведенческие сигналы
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.

Описание

Какую проблему решает

Патент решает проблему определения специфического намерения (интента) пользователя в рамках поисковой сессии, особенно когда запросы неоднозначны или не полностью отражают потребность пользователя. Стандартное ранжирование, основанное на поведении общей массы пользователей, может не уловить нюансы текущего контекста. Изобретение улучшает релевантность, идентифицируя сигналы интента на основе того, как пользователь уточняет свои запросы в рамках сессии.

Что запатентовано

Запатентована система для определения и использования интента пользователя на основе Query Patterns. Система идентифицирует Intent Refining Query Terms — универсальные термины, которые пользователи часто добавляют к широкому спектру уникальных запросов для их уточнения (например, «фото», «отзывы»). Когда такой термин используется в сессии, система ассоциирует соответствующий интент с этой сессией и модифицирует ранжирование, основываясь на исторических поведенческих данных, сегментированных по этому конкретному интенту.

Как это работает

Система работает в двух режимах:

  • Офлайн-анализ: Анализируются логи поисковых сессий для выявления уточнений запросов. Если термин используется для уточнения большого количества разных уникальных запросов (превышая статистический порог), он помечается как Intent Refining Query Term.
  • Онлайн-обработка: Когда пользователь вводит запрос, система проверяет наличие Intent Refining Query Terms в текущем запросе или предыдущих запросах сессии. Если они найдены, с сессией ассоциируется интент(ы). Система сравнивает историческое поведение пользователей с этим интентом и поведение General Population (общей массы пользователей). Если частота выбора документа (frequency of selection) для группы с этим интентом отличается, оценка документа модифицируется с учетом Confidence Value.

Актуальность для SEO

Высокая. Понимание контекста сессии (Search Journeys) и намерений пользователя является центральным направлением развития поиска Google. Этот патент описывает конкретный механизм для идентификации интента на основе анализа переформулировок запросов и использования сегментированных поведенческих данных для контекстуального ранжирования.

Важность для SEO

Патент имеет высокое значение (85/100). Он демонстрирует, что ранжирование зависит не только от темы запроса, но и от предполагаемого интента сессии, определяемого специфическими уточняющими терминами. Это означает, что контент должен удовлетворять не просто запросу, а запросу в контексте определенного интента (например, «товар + отзывы» требует иного контента, чем «товар + фото»). Понимание этих Intent Refining Query Terms и поведенческих ожиданий, связанных с ними, критично для SEO.

Детальный разбор

Термины и определения

Confidence Value (Мера уверенности)
Метрика, определяющая степень уверенности системы в применимости интента и надежности данных. Основана на объеме исторических данных (количестве Prior Sessions), связанных с этим интентом. Используется для взвешивания влияния Intent Boost.
Document Boost Factor (Фактор бустинга документа)
Итоговая корректировка оценки документа. Рассчитывается на основе агрегации Intent Boost и Confidence Value для всех интентов, ассоциированных с сессией.
General Population (Общая популяция)
Все предыдущие сессии, включающие текущий запрос, независимо от ассоциированного с ними интента. Используется как базовая линия (baseline) для сравнения поведения.
Intent (Намерение, Интент)
Скрытая цель или потребность пользователя в рамках сессии, определяемая наличием Intent Refining Query Terms.
Intent Boost (Бустинг по интенту)
Корректировка оценки документа (повышение или понижение), основанная на одном конкретном интенте, ассоциированном с сессией.
Intent Refining Query Term (Уточняющий термин, определяющий интент)
Термин, который пользователи часто используют для уточнения большого количества разных уникальных запросов (например, «фото», «отзывы», «pdf»). Наличие такого термина позволяет ассоциировать интент с сессией.
Prior Sessions (Предыдущие сессии)
Исторические поисковые сессии, используемые для анализа поведения. Они сегментируются на сессии с определенным интентом и General Population.
Query Refinement (Уточнение запроса)
Изменение запроса пользователем для получения более точных результатов (например, запрос «Париж» уточняется до «Париж фото»).
Session (Сессия)
Последовательность запросов и взаимодействий пользователя в течение определенного периода времени.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения интента и его применения для ранжирования, включая обработку нескольких интентов.

  1. Система получает запрос в рамках сессии и начальные результаты с оценками релевантности.
  2. С сессией ассоциируется множество интентов (plurality of intents), если запрос содержит intent refining query term. Условие для термина: он должен был ранее использоваться с количеством разных запросов, превышающим порог.
  3. Идентифицируются документы, которые выбирались пользователями в предыдущих сессиях, связанных хотя бы с одним из этих интентов, с частотой (выше или ниже), отличающейся от частоты выбора в сессиях, не связанных с этим интентом (General Population).
  4. Для каждого идентифицированного документа и для каждого из интентов определяется Intent Boost (корректировка оценки) и Confidence Value (основанная на количестве предыдущих сессий с этим интентом).
  5. Оценка документа модифицируется на основе Document Boost Factor, который является функцией от Intent Boost и Confidence Value для всех интентов.
  6. Результаты ранжируются на основе модифицированных оценок.

Claim 4 (Зависимый): Уточняет механизм модификации оценки.

Оценка увеличивается, если документ выбирался чаще в сессиях с данным интентом по сравнению с General Population. Оценка уменьшается, если документ выбирался реже.

Claim 5 и 7 (Зависимые): Уточняют, как определяется порог для идентификации Intent Refining Query Term.

Порог может основываться на статистическом распределении (distribution) частоты использования терминов в качестве уточнений. Например, может использоваться стандартное отклонение (standard deviation) от среднего значения для выявления статистически значимых терминов.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска, используя офлайн-анализ для влияния на онлайн-ранжирование.

INDEXING / Анализ Логов (Офлайн-процессы)
Система собирает и анализирует логи поисковых сессий (Result Selection Logs). На этом этапе происходит идентификация Query Refinements и определение списка Intent Refining Query Terms путем анализа частоты их использования с уникальными запросами.

QUNDERSTANDING – Понимание Запросов (Онлайн)
При получении запроса компонент Intent Identifier анализирует текущий запрос и историю сессии на наличие Intent Refining Query Terms. Если они найдены, система ассоциирует соответствующий интент(ы) с сессией.

RANKING / RERANKING – Ранжирование и Переранжирование (Онлайн)
Основное применение патента. Компоненты Rank Modifier Engine и Ranking Engine используют информацию об интенте сессии для модификации оценок документов.

  1. Система сегментирует исторические данные о кликах по текущему запросу на основе выявленного интента.
  2. Сравнивается поведение пользователей с этим интентом и General Population.
  3. Рассчитываются Intent Boost и Confidence Value.
  4. Применяется Document Boost Factor для корректировки финального ранжирования.

Входные данные:

  • Текущий запрос и история запросов в сессии.
  • База идентифицированных Intent Refining Query Terms.
  • Исторические логи сессий (запросы, клики, уточнения, время на документе).
  • Начальные оценки релевантности документов.

Выходные данные:

  • Модифицированные оценки документов (с учетом Document Boost Factor).
  • Финальный ранжированный список результатов, адаптированный под интент сессии.

На что влияет

  • Специфические запросы: Наибольшее влияние на неоднозначные запросы (например, «Ягуар», «Cougar»), где контекст сессии может радикально изменить ранжирование. Также сильно влияет на запросы с явными модификаторами интента («рецепт пиццы с фото»).
  • Типы контента: Влияет на предпочтение определенных форматов контента в зависимости от интента (например, предпочтение изображений при интенте «фото»; предпочтение подробных статей при интенте «обзор» или «инструкция»).

Когда применяется

  • Триггер активации: Алгоритм активируется, когда в текущем запросе или в рамках текущей поисковой сессии обнаруживается Intent Refining Query Term.
  • Условия применения: Применяется, если существует достаточный объем исторических данных (Prior Sessions) по данному запросу и данному интенту для расчета достоверного Confidence Value.

Пошаговый алгоритм

Процесс А: Офлайн-идентификация терминов интента (Intent Refining Query Terms)

  1. Сбор данных сессий: Система получает данные исторических поисковых сессий.
  2. Идентификация уточнений: Выявляются случаи, когда пользователь изменяет запрос (например, добавляет термин). Добавленный термин помечается как Refining Term.
  3. Агрегация и подсчет: Для каждого Refining Term подсчитывается количество уникальных запросов, к которым он был применен.
  4. Применение порога: Определяется порог на основе статистического распределения (например, стандартное отклонение).
  5. Классификация: Термины, чей счетчик уникальных запросов превышает порог, классифицируются как Intent Refining Query Terms и сохраняются.

Процесс Б: Онлайн-обработка запроса и переранжирование

  1. Получение запроса и результатов: Система идентифицирует текущий запрос и генерирует первичный набор результатов с базовыми оценками.
  2. Ассоциация интента: Система проверяет наличие Intent Refining Query Terms в сессии. Если найдены, с сессией ассоциируются соответствующие интенты (один или несколько).
  3. Анализ исторических сессий: Идентифицируются Prior Sessions, включавшие текущий запрос.
  4. Сегментация поведения: Анализируется частота выбора документов в двух группах: (1) сессии с ассоциированным интентом и (2) General Population.
  5. Идентификация отклонений: Выявляются документы, для которых частота выбора в группе (1) значимо отличается от группы (2).
  6. Расчет модификаторов: Для каждого интента рассчитывается Intent Boost (величина корректировки, положительная или отрицательная) и Confidence Value (основанная на объеме данных).
  7. Расчет Document Boost Factor: Агрегируются модификаторы всех интентов сессии по формуле взвешенного среднего, упомянутой в описании патента: DocumentBoost=∑(IntentBoosti⋅Confidencei)∑Confidencei\text{DocumentBoost} = \frac{\sum (\text{IntentBoost}_i \cdot \text{Confidence}_i)}{\sum \text{Confidence}_i}DocumentBoost=∑Confidencei∑(IntentBoosti⋅Confidencei)​
  8. Модификация оценок и Ранжирование: Базовые оценки документов корректируются с использованием Document Boost Factor, и результаты сортируются.

Какие данные и как использует

Данные на входе

Система полагается преимущественно на поведенческие данные, собранные из логов.

  • Поведенческие факторы:
    • Логи выбора результатов (Result Selection Logs): Записи, включающие запрос (Q), выбранный документ (D).
    • Последовательности запросов (Query Sequences): Используются для идентификации Query Refinements в рамках сессий (офлайн) и определения контекста текущей сессии (онлайн).
    • Данные о кликах (Click Data): Частота выбора документов (frequency of selection). Патент также упоминает сбор дополнительной информации: время на документе (T), позиция клика, IR-оценки кликнутых и пропущенных результатов, показанные сниппеты.
  • Пользовательские факторы:
    • Язык (L) и Страна (C) пользователя.
    • Идентификаторы сессии (Cookie, IP-адрес, User Agent).

Какие метрики используются и как они считаются

  • Количество уникальных запросов (Count of unique queries): Метрика для офлайн-анализа. Подсчитывает, к скольким разным запросам применялся данный уточняющий термин.
  • Порог (Threshold) для идентификации интента: Значение, которое должно превысить количество уникальных запросов. Может быть динамическим (например, на основе стандартного отклонения).
  • Частота выбора (Frequency of selection): Метрика поведения. Рассчитывается отдельно для сессий с определенным интентом и для General Population.
  • Intent Boost: Величина корректировки оценки на основе разницы в частоте выбора.
  • Confidence Value: Вес, присваиваемый Intent Boost. Основан на количестве Prior Sessions, использованных для расчета.
  • Document Boost Factor: Итоговый модификатор оценки, агрегирующий все интенты сессии (см. формулу выше).

Выводы

  1. Интент определяется универсальными шаблонами уточнений: Google идентифицирует интент не только через семантику запроса, но и через анализ того, как пользователи массово уточняют разные запросы. Термины, используемые универсально (например, «фото», «отзывы»), становятся сигналами глобального интента.
  2. Сегментация поведенческих факторов по интенту: Ключевой механизм — сегментация исторических данных о кликах. Система анализирует не общее поведение, а поведение пользователей с конкретным, идентифицированным интентом.
  3. Контекст сессии имеет приоритет: Интент ассоциируется с сессией. Если интент был определен в начале сессии, он может влиять на ранжирование последующих запросов, даже если они неоднозначны или не содержат явного уточняющего термина.
  4. Обработка множественных интентов и взвешивание: Система обрабатывает несколько интентов в одной сессии (например, «еда» и «фото» в запросе «фото еды») и взвешивает их влияние на ранжирование с помощью Confidence Value, основанной на объеме исторических данных.
  5. Интент может переопределить общие тренды: Если поведение пользователей с определенным интентом сильно отличается от поведения General Population, система предпочтет данные сегментированной группы для ранжирования, что может привести как к повышению, так и к понижению результатов.

Практика

Best practices (это мы делаем)

  • Анализ Intent Refining Query Terms в нише: Изучайте, какие общие уточняющие термины используют ваши пользователи (например, «цена», «отзывы», «сравнение», «pdf», «видео», «примеры», «пошагово»). Убедитесь, что ваш контент оптимизирован для удовлетворения этих специфических интентов.
  • Оптимизация под удовлетворенность конкретного интента (Click Satisfaction): Сосредоточьтесь на том, чтобы контент максимально удовлетворял пользователя с определенным интентом. Если интент — «фото», предоставьте лучшие изображения. Если интент — «отзывы», предоставьте аутентичные обзоры. Высокая частота выбора вашего сайта пользователями с этим интентом приведет к повышению ранжирования по механизму Intent Boost.
  • Использование мультиформатного и структурированного контента: Поскольку многие Intent Refining Query Terms связаны с форматом или структурой (фото, видео, инструкции HowTo), создание разнообразного и хорошо размеченного контента повышает шансы удовлетворить различные интенты и получить буст.
  • Анализ SERP с учетом модификаторов интента: При анализе выдачи смотрите не только на head terms, но и на запросы с уточняющими терминами. Это покажет, какой контент Google считает релевантным для конкретных интентов, основываясь на поведенческих данных.

Worst practices (это делать не надо)

  • Игнорирование уточняющих терминов и контекста сессии: Фокусироваться только на высокочастотных запросах без учета модификаторов интента и пути пользователя. Это может привести к созданию контента, который не удовлетворяет специфические потребности.
  • Создание универсального контента для всех интентов: Попытка удовлетворить все возможные интенты на одной странице часто приводит к плохому пользовательскому опыту для всех сегментов. Это снижает вероятность получения Intent Boost.
  • Несоответствие контента интенту модификатора: Оптимизация страницы под запрос с модификатором (например, «[тема] фото»), но предоставление только текста. Пользователи с этим интентом будут кликать реже, что приведет к понижению страницы (отрицательный Intent Boost) при активации этого интента.

Стратегическое значение

Патент подтверждает стратегическую важность глубокого понимания пользовательских интентов и контекста поиска (in-the-moment context). Он демонстрирует механизм, с помощью которого Google переходит от анализа «среднего пользователя» к анализу поведения сегментированных групп, объединенных общим намерением. Для SEO это означает необходимость более гранулярного подхода к созданию контента и оптимизации под конкретные сценарии использования и поведенческие шаблоны, а не просто под ключевые слова.

Практические примеры

Сценарий 1: Разрешение неоднозначности в рамках сессии

  1. Запрос 1: Пользователь ищет «Jaguar». Выдача смешанная (автомобили, животные).
  2. Запрос 2 (Уточнение): Пользователь ищет «Jaguar cat». Google идентифицирует «cat» как Intent Refining Query Term (так как он используется широко). Интент «Животное/Кошка» ассоциируется с сессией.
  3. Запрос 3: Пользователь ищет «Cougar» (неоднозначный запрос: животное, автомобиль, ПО).
  4. Действие системы: Система применяет активный интент «Животное/Кошка». Исторические данные показывают, что пользователи с этим интентом предпочитают результаты о пуме (животном).
  5. Результат: Результаты о животном получают Document Boost Factor и ранжируются выше, чем результаты об автомобиле Mercury Cougar.

Сценарий 2: Интент поиска изображений

  1. Запрос 1: Пользователь ищет «рецепт пиццы с фото». «Фото» идентифицируется как Intent Refining Query Term. Интент «Фото» активируется.
  2. Запрос 2: Пользователь ищет «рецепт лазаньи».
  3. Действие системы: Система применяет активный интент «Фото».
  4. Результат: Рецепты лазаньи с пошаговыми фотографиями повышаются в выдаче, так как исторические данные показывают, что пользователи с интентом «Фото» предпочитают именно такой формат контента.

Вопросы и ответы

В чем ключевое отличие между обычным уточнением и «Intent Refining Query Term»?

Обычное уточнение сужает тему (например, «машина» -> «красная машина»). Intent Refining Query Term — это универсальный модификатор, который сигнализирует о способе поиска и применяется к огромному количеству разных уникальных запросов (например, «фото» добавляют к машинам, рецептам, местам). Система считает термин сигналом интента, только если он используется очень широко.

Как Google определяет, какие слова являются сигналами интента?

Это происходит во время офлайн-анализа исторических логов. Система подсчитывает, сколько различных уникальных запросов было уточнено с помощью данного термина. Если это число превышает определенный статистический порог (например, основанный на стандартном отклонении), термин классифицируется как Intent Refining Query Term.

Применяется ли выявленный интент только к текущему запросу?

Нет, интент ассоциируется со всей поисковой сессией. Если пользователь использовал Intent Refining Query Term в предыдущем запросе в рамках этой же сессии, интент остается активным и влияет на ранжирование последующих запросов, даже если они сами не содержат этого термина. Это помогает разрешать неоднозначность.

Как именно меняется ранжирование, когда система определяет интент?

Система анализирует агрегированные исторические данные (Prior Sessions). Она сравнивает, как часто на документ кликали пользователи с этим конкретным интентом по сравнению с General Population. Если пользователи с этим интентом кликают значительно чаще, документ получает повышение (Intent Boost); если реже — понижение.

Что такое Confidence Value и как оно влияет на ранжирование?

Confidence Value (Мера уверенности) отражает объем исторических данных, доступных для комбинации «Запрос + Интент». Если данных много (например, 3000 сессий), уверенность высока, и влияние на ранжирование будет значительным. Если данных мало (например, 20 сессий), уверенность низкая, и влияние будет минимальным. Это обеспечивает статистическую значимость корректировок.

Может ли система определить несколько интентов одновременно?

Да, патент явно описывает обработку множества интентов (plurality of intents). Например, в запросе «отзывы о еде для кошек» могут быть интенты «отзывы», «еда» и «кошки». Система рассчитывает Intent Boost и Confidence Value для каждого из них и комбинирует их с помощью формулы взвешенного среднего для финальной корректировки ранжирования.

Как этот патент связан с поведенческими факторами (CTR)?

Патент описывает механизм использования CTR, но не общего, а сегментированного по интентам. Важен не просто CTR вашего сайта по запросу, а CTR среди пользователей, у которых был идентифицирован специфический интент. Это более точное и контекстуализированное использование поведенческих данных для оценки релевантности.

Что делать SEO-специалисту, чтобы оптимизировать сайт под этот алгоритм?

Необходимо кластеризовать запросы по универсальным модификаторам (интентам) и убедиться, что целевая страница идеально соответствует ожиданиям этого интента (формат, содержание). Удовлетворение интента приведет к лучшему CTR в этом сегменте (Click Satisfaction), что исторически приведет к повышению позиций для будущих пользователей с аналогичным интентом.

Может ли этот алгоритм понизить мой сайт, даже если он релевантен теме?

Да. Если ваш сайт тематически релевантен, но не соответствует способу поиска пользователя (интенту). Например, если пользователь ищет «рецепт с фото» (интент «фото»), а ваш сайт предлагает только текст, система может определить, что пользователи с этим интентом реже выбирают ваш результат, и применит отрицательный буст.

Как узнать, какие модификаторы Google считает сигналами интента в моей нише?

Патент не дает списка, так как он генерируется автоматически. SEO-специалистам следует анализировать подсказки поиска, данные GSC и семантическое ядро на предмет часто встречающихся универсальных модификаторов, таких как «лучший», «сравнение», «фото», «видео», «купить», «скачать», «pdf», «пошагово».

Похожие патенты

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов
Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.
  • US7617205B2
  • 2009-11-10
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google персонализирует Sitelinks и сниппеты, используя интересы пользователя и тренды для прямого перехода на нужные страницы
Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. При совпадении Google отображает персонализированные прямые ссылки (например, динамические Sitelinks) на эти конкретные разделы или товары прямо в выдаче.
  • US20140188927A1
  • 2014-07-03
  • Персонализация

  • SERP

  • Ссылки

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи
Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.
  • US8825639B2
  • 2014-09-02
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

seohardcore