SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"

GENERATING SIBLING QUERY REFINEMENTS (Генерирование уточнений на основе родственных запросов)
  • US8244749B1
  • Google LLC
  • 2009-09-10
  • 2012-08-14
  • Семантика и интент
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.

Описание

Какую проблему решает

Патент решает задачу помощи пользователям в исследовании темы или уточнении их поискового намерения, когда исходный запрос слишком широк или не дает удовлетворительных результатов. Цель — предложить пользователю набор связанных запросов (query refinements), которые являются релевантными исходной теме, но при этом достаточно разнообразными (diverse), чтобы вести к новым наборам результатов, а не повторять уже увиденное.

Что запатентовано

Запатентована система генерации уточнений запроса (например, блок "Связанные запросы" или "Related Searches") на основе анализа данных пользовательских сессий. Система идентифицирует "родственные" запросы (sibling queries) — это запросы, которые часто следуют за одним и тем же "родительским" запросом (parent query). Ключевым элементом является механизм фильтрации кандидатов, который гарантирует разнообразие (diversity) результатов поиска, связанных с предложенными уточнениями.

Как это работает

Система работает в несколько этапов:

  • Анализ сессий: Система анализирует логи сессий (Session Data), чтобы определить последовательности запросов. Запрос, следующий за другим (часто сразу), определяется как "дочерний" (child query) по отношению к "родительскому" (parent query).
  • Идентификация родственных запросов: Определяются запросы, которые имеют общих родителей. Они становятся кандидатами в sibling queries.
  • Фильтрация и Ранжирование: Кандидаты фильтруются по различным метрикам (например, Fan-in, Fan-out, сила связи) и ранжируются с использованием данных о предпочтениях пользователей (User Preference Data).
  • Обеспечение разнообразия: Система итеративно выбирает финальные предложения, проверяя "разнообразие внутри предложений" (intra-suggestion diversity). Предложение принимается, только если его топовые результаты существенно отличаются от результатов исходного запроса и уже выбранных предложений.

Актуальность для SEO

Высокая. Понимание пути пользователя (user journey) и взаимосвязей между запросами является фундаментальной задачей для современных поисковых систем. Хотя методы анализа сессий могли эволюционировать (например, с использованием нейронных сетей и векторизации), базовые принципы идентификации связанных интентов и необходимость обеспечения разнообразия выдачи остаются крайне актуальными.

Важность для SEO

Патент имеет значительное влияние на SEO-стратегию (7/10). Он демонстрирует, что Google определяет взаимосвязь между запросами на основе реального поведения пользователей (последовательности запросов в сессии), а не только на основе семантической схожести контента. Это подчеркивает важность создания контент-стратегии, которая охватывает различные, но связанные субтопики (sibling intents), которые пользователи естественным образом исследуют последовательно.

Детальный разбор

Термины и определения

Parent Query (Родительский запрос)
Запрос, введенный пользователем в рамках сессии, за которым последовал другой запрос.
Child Query (Дочерний запрос)
Запрос, введенный пользователем после родительского запроса в той же сессии. Часто требуется, чтобы он следовал сразу, без промежуточных запросов.
Sibling Queries (Родственные запросы)
Два дочерних запроса, которые имеют одного или нескольких общих родительских запросов. Используются как кандидаты для уточнений (query refinements).
Session Data (Данные сессии)
Анонимизированные и очищенные данные о последовательности запросов и действиях пользователя (кликах) в течение ограниченного периода времени.
Fan-out (Ветвление)
Метрика для родительского запроса, равная количеству уникальных дочерних запросов, связанных с ним. Высокий Fan-out может указывать на слишком общий родительский запрос, и такие запросы могут фильтроваться.
Fan-in (Схождение)
Метрика для дочернего запроса, равная количеству уникальных родительских запросов, связанных с ним. Высокий Fan-in может указывать на слабость связи с конкретным родителем, и такие запросы могут фильтроваться.
Strength of Relationship (Сила связи)
Метрика, определяющая связь между родственными запросами. Рассчитывается на основе частоты, с которой оба запроса следовали за их общими родителями.
Intra-suggestion diversity / Intra-sibling diversity (Разнообразие внутри предложений)
Метрика, оценивающая разнообразие между топовыми документами, релевантными кандидату в родственные запросы, и документами, уже "увиденными" (seen documents) по исходному запросу и другим принятым предложениям.
Seen Documents (Увиденные документы)
Набор топовых документов, связанных с исходным запросом и уже выбранными финальными родственными запросами. Используется для обеспечения разнообразия следующих предложений.
User Preference Data (Данные о предпочтениях пользователя)
Данные о кликах (click data), включающие click-through-rate (CTR), взвешенные клики (weighted clicks), показы и другие метрики, используемые для оценки качества результатов и ранжирования родственных запросов.
Inverse Document Frequency (IDF, Обратная частота документа)
Метрика, используемая для фильтрации родительских запросов. Низкий IDF может указывать на слишком популярные концепции, которые не несут много информации для их дочерних запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной процесс идентификации родственных запросов с акцентом на фильтрацию родителей.

  1. Ассоциация родительских запросов с группами дочерних запросов (на основе сессий).
  2. Идентификация кандидатов в родственные запросы (candidate sibling queries) для конкретного дочернего запроса. Условия идентификации:
    • Родители обоих запросов (как исходного дочернего, так и кандидата) должны иметь показатель Fan-out, удовлетворяющий пороговому значению (т.е. не иметь слишком много детей).
    • Запросы должны иметь группу общих родителей (shared parent queries), размер которой удовлетворяет порогу общих запросов (common-query threshold).
  3. Выбор финальных родственных запросов (final sibling queries) из кандидатов и их ассоциация в качестве уточнений.

Claim 3 (Зависимый от 1): Уточняет механизм выбора финальных запросов. Группа финальных родственных запросов выбирается на основе разнообразия (diversity) между документами, релевантными этим финальным запросам.

Claim 13 (Независимый пункт): Описывает процесс с акцентом на разнообразие и строгое определение дочернего запроса (без промежуточных запросов).

  1. Ассоциация родительских и дочерних запросов, при условии, что дочерний запрос следовал за родительским без каких-либо промежуточных запросов в сессии.
  2. Идентификация кандидатов в родственные запросы (с условием достаточности общих родителей).
  3. Выбор финальных родственных запросов из кандидатов на основе разнообразия (diversity) между документами, релевантными этим финальным запросам.

Claim 19 (Зависимый от 13): Детализирует итеративный алгоритм выбора на основе разнообразия.

  1. Кандидаты упорядочиваются (ранжируются).
  2. Система обрабатывает кандидатов по порядку.
  3. Для кандидата определяется, удовлетворяет ли его оценка разнообразия (intra-sibling diversity score) пороговому значению. Оценка измеряет разнообразие между топовыми документами кандидата и группой увиденных документов (seen documents).
  4. Если ДА, кандидат добавляется в финальную группу.
  5. Топовые документы принятого кандидата добавляются в группу seen documents.

Где и как применяется

Изобретение в основном применяется на этапах понимания запросов и формирования финальной выдачи, используя данные о поведении пользователей.

QUNDERSTANDING – Понимание Запросов
Основная работа происходит на этом этапе в офлайн-режиме. Sibling Refinements Engine анализирует Session Data и User Preference Data для построения карты взаимосвязей между запросами (родитель-ребенок-родственник). Здесь генерируется база данных уточнений (Refinement Database).

INDEXING – Индексирование
Данные из индекса используются для расчета Inverse Document Frequency (IDF) для фильтрации родительских запросов, а также для определения топовых документов (top_docs), используемых при расчете разнообразия.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
На этапе формирования SERP система обращается к базе данных уточнений, чтобы получить предварительно рассчитанные родственные запросы. Процесс фильтрации разнообразия (описанный в FIG. 8 и Claim 19) может применяться здесь (или быть предварительно рассчитанным) для выбора финального набора предложений, гарантируя, что они разнообразны по отношению друг к другу и к основному запросу.

Входные данные:

  • Session Data (последовательности запросов).
  • User Preference Data (данные о кликах, CTR, показы).
  • Индекс документов (для расчета IDF и получения результатов).

Выходные данные:

  • Ассоциации Дочерний Запрос — Финальные Родственные Запросы (Child-Final Sibling Associations), сохраненные в базе данных уточнений.

На что влияет

  • Специфические запросы: Наибольшее влияние на информационные и широкие запросы, где пользователи часто занимаются исследованием темы и переходят от одного связанного концепта к другому (например, от [Jupiter] к [Mars] или [Jupiter Moons]).
  • Типы контента: Влияет на все типы контента, так как механизм основан на анализе запросов и разнообразии результатов, независимо от формата контента.

Когда применяется

  • Временные рамки: Основной анализ (идентификация родителей/детей/родственников) происходит офлайн в рамках пакетной обработки логов сессий. Выбор финального набора с учетом разнообразия происходит при генерации SERP или также рассчитывается офлайн.
  • Триггеры активации (для идентификации связи): Активируется, когда два запроса имеют достаточное количество общих родителей (common-query threshold), и эти родители удовлетворяют требованиям качества (например, пороги Fan-out и IDF).
  • Триггеры активации (для выбора предложения): Активируется, когда кандидат в родственные запросы демонстрирует достаточный уровень разнообразия результатов (intra-sibling diversity score выше порога) по сравнению с уже увиденными результатами.

Пошаговый алгоритм

Процесс состоит из двух основных частей: идентификация кандидатов и фильтрация для обеспечения разнообразия.

Часть А: Идентификация кандидатов в родственные запросы (Офлайн)

  1. Сбор и очистка данных сессий: Получение Session Data, удаление подозрительного трафика (боты, спам), анонимизация.
  2. Ассоциация Родитель-Ребенок: Идентификация пар запросов, где один следует за другим в сессии (часто без промежуточных запросов). Применение базовых фильтров (например, время между запросами, наличие клика после дочернего запроса).
  3. Фильтрация дочерних запросов (Child Filter): Удаление дочерних запросов, у которых показатель Fan-in (количество родителей) превышает порог.
  4. Фильтрация родительских запросов (Parent Filter): Удаление родительских запросов, у которых показатель Fan-out (количество детей) превышает порог. Также могут удаляться родители с низким IDF или являющиеся суперстрокой (superstring) ребенка.
  5. Идентификация родственных связей (Sibling Associator): Для каждого дочернего запроса поиск других запросов, имеющих общих родителей. Проверка, что количество общих родителей удовлетворяет порогу (common-query threshold).
  6. Расчет силы связи: Вычисление Strength of Relationship между родственными запросами на основе частоты их совместного появления после общих родителей. Фильтрация слабых связей.
  7. Ранжирование кандидатов (Sibling Ranking Engine): Ранжирование оставшихся кандидатов для каждого дочернего запроса с использованием User Preference Data (например, CTR, взвешенные клики) или количества общих родителей.

Часть Б: Фильтрация для обеспечения разнообразия (Sibling Filtering Engine)

Этот процесс выполняется для каждого дочернего запроса и его списка ранжированных кандидатов.

  1. Инициализация: Создается пустой список финальных предложений (final_sibs). Инициализируется набор увиденных документов (seen_docs), который включает топовые документы исходного (дочернего) запроса.
  2. Итерация по кандидатам: Система обрабатывает ранжированных кандидатов по одному.
  3. Расчет разнообразия: Для текущего кандидата (additional_sib) вычисляется intra-suggestion diversity. Это оценка того, насколько топовые результаты кандидата отличаются от документов в seen_docs.
  4. Проверка порога разнообразия: Сравнение оценки разнообразия с порогом.
    • Если НЕТ (результаты слишком похожи): Кандидат отклоняется, переход к следующему.
    • Если ДА (результаты разнообразны): Кандидат принимается и добавляется в final_sibs.
  5. Обновление увиденных документов: Если кандидат принят, его топовые документы добавляются в seen_docs. Это гарантирует, что следующий кандидат будет сравниваться и с ним тоже.
  6. Завершение: Процесс продолжается до тех пор, пока не будет достигнуто желаемое количество финальных предложений (desired_sibs) или пока не закончатся кандидаты.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Являются основными данными для этого патента.
    • Session Data: Последовательность запросов пользователей в рамках одной сессии. Используется для определения связей родитель-ребенок.
    • User Preference Data (Click Data): Данные о кликах, взвешенных кликах (weighted clicks), CTR, показах (impressions). Используются для: (i) валидации связи родитель-ребенок (требование клика после ребенка); (ii) ранжирования кандидатов в родственные запросы; (iii) расчета оценки разнообразия (intra-sibling diversity score).
  • Контентные/Системные факторы:
    • Индекс документов: Используется для получения топовых результатов по запросам (для расчета разнообразия) и для расчета IDF.

Какие метрики используются и как они считаются

  • Fan-out: Количество уникальных дочерних запросов для данного родителя. Используется для фильтрации слишком общих родителей.
  • Fan-in: Количество уникальных родительских запросов для данного ребенка. Используется для фильтрации детей со слабыми связями.
  • Common-query threshold: Минимальное количество общих родителей, необходимое для признания двух запросов родственными.
  • Strength of Relationship: Агрегированное значение частот, с которыми родственные запросы следовали за общими родителями. Может взвешиваться обратно пропорционально Fan-in и Fan-out.
  • Intra-sibling diversity score: Оценка разнообразия результатов. Рассчитывается на основе User Preference Data (например, суммы оценок качества или tuple score) для документов, которые присутствуют в топе кандидата, но отсутствуют в наборе seen_docs.
  • Inverse Document Frequency (IDF): Стандартная метрика IR, используемая для оценки важности/специфичности родительского запроса.

Выводы

  1. Поведение пользователей определяет связь запросов: Патент демонстрирует, что Google использует реальные последовательности запросов пользователей (Session Data) для определения того, какие темы связаны между собой. Это поведенческое определение связи может отличаться от связей, установленных только на основе семантического анализа текста запросов или контента страниц.
  2. Разнообразие является приоритетом для уточнений: Ключевая часть изобретения — механизм intra-suggestion diversity. Google активно избегает предложений ("Связанные запросы"), которые ведут к тем же результатам, что и исходный запрос или другие предложения в блоке. Цель — помочь пользователю исследовать новые направления.
  3. Фильтрация шума через Fan-in/Fan-out: Использование метрик Fan-in и Fan-out позволяет системе игнорировать связи, основанные на слишком общих запросах (высокий Fan-out) или случайных переходах (высокий Fan-in), фокусируясь на значимых паттернах поведения.
  4. Качество и Сила связи: Система не просто находит связи, но и количественно оценивает их через Strength of Relationship и ранжирует кандидатов, используя данные о кликах (User Preference Data), чтобы предложить наиболее полезные уточнения.

Практика

Best practices (это мы делаем)

  • Построение тематического авторитета через покрытие смежных интентов: Создавайте контент, который охватывает не только основной запрос, но и родственные запросы (sibling queries), которые пользователи естественным образом исследуют в рамках одной сессии. Это укрепляет релевантность сайта теме в целом.
  • Анализ блока "Связанные запросы" (Related Searches): Регулярно анализируйте, какие запросы Google показывает в этом блоке для ваших ключевых слов. Это прямой индикатор того, какие sibling queries система идентифицировала на основе поведения пользователей. Эти запросы должны быть интегрированы в вашу контент-стратегию.
  • Создание отдельных страниц для различных интентов: Поскольку система активно ищет разнообразие результатов (diversity), важно, чтобы разные родственные запросы вели на разные страницы вашего сайта (или на страницы с существенно разным контентом). Если несколько связанных запросов ведут к очень похожим результатам, Google не посчитает их достаточно разнообразными для показа в качестве уточнений.
  • Оптимизация под путь пользователя (User Journey): Проектируйте структуру сайта и перелинковку так, чтобы она соответствовала естественному пути исследования темы, который описан в патенте (от родителя к различным детям/родственникам).

Worst practices (это делать не надо)

  • Создание почти дублирующихся страниц (Keyword Cannibalization): Попытка ранжироваться по множеству очень похожих ключевых слов с помощью отдельных страниц с минимальными отличиями неэффективна в контексте этого патента. Система ищет разнообразие результатов, и такие страницы не будут считаться разнообразными (diverse).
  • Игнорирование пути пользователя: Фокусировка только на отдельных высокочастотных запросах без учета того, как пользователи переходят от них к связанным темам в рамках сессии.
  • Попытки манипулировать данными сессий: Использование ботов для генерации искусственных последовательностей запросов. Патент упоминает очистку Session Data от подозрительного трафика (suspect traffic).

Стратегическое значение

Этот патент подтверждает стратегическую важность понимания не отдельных запросов, а всего процесса исследования темы пользователем. SEO-стратегия должна быть направлена на отображение контента на разнообразные пути (diverse paths), которые пользователи выбирают в рамках одной темы. Понимание того, какие запросы Google считает "родственными" (на основе поведения) и "разнообразными" (на основе результатов), критично для построения эффективной архитектуры сайта и достижения полного тематического охвата.

Практические примеры

Сценарий: Оптимизация сайта о планетах (на основе примера из FIG. 1)

  1. Анализ поведения: Пользователь ищет [Jupiter]. Google знает из Session Data, что многие пользователи, искавшие [Solar System] (Parent Query), затем искали [Jupiter] (Child 1), а также [Mars] и [Venus] (Child 2, 3).
  2. Идентификация родственников: [Mars] и [Venus] идентифицируются как sibling queries для [Jupiter], так как имеют общего родителя [Solar System].
  3. Проверка разнообразия: Google проверяет результаты для [Jupiter], [Mars] и [Venus]. Поскольку результаты для [Mars] сильно отличаются от результатов для [Jupiter] (разные документы в топе), оценка intra-suggestion diversity высока. [Mars] принимается как уточнение.
  4. SEO-действие: Владелец сайта о космосе должен убедиться, что у него есть высококачественная, уникальная страница для "Jupiter" и отдельные, столь же качественные страницы для "Mars" и "Venus".
  5. Ожидаемый результат: Сайт хорошо ранжируется по всем трем запросам и соответствует паттернам поведения пользователей, которые исследуют эту тему последовательно. Структура сайта помогает пользователям легко переходить между этими связанными темами.

Вопросы и ответы

Что такое "родственный запрос" (Sibling Query) согласно патенту?

Родственный запрос — это запрос, который имеет одного или нескольких общих "родительских" запросов с исходным запросом. Родительским считается запрос, который часто предшествует исходному и родственному запросам в рамках одной пользовательской сессии. Например, если пользователи часто ищут [Лучшие смартфоны], а затем [iPhone 15] или [Samsung S25], то [iPhone 15] и [Samsung S25] являются родственными запросами.

Как Google обеспечивает разнообразие в блоке "Связанные запросы"?

Google использует метрику intra-suggestion diversity. При выборе предложений система проверяет, насколько топовые результаты кандидата отличаются от результатов исходного запроса и уже выбранных предложений (seen_docs). Если результаты слишком похожи (разнообразие ниже порога), кандидат отклоняется. Это гарантирует, что каждое предложение ведет к новому набору информации.

Как этот патент влияет на мою стратегию ключевых слов?

Он подчеркивает необходимость перехода от изолированных ключевых слов к пониманию пути пользователя (user journey) и тематических кластеров. Необходимо анализировать, какие темы пользователи исследуют последовательно, и создавать контент для этих родственных, но различных интентов. Важно обеспечить, чтобы разные интенты вели на разные страницы вашего сайта, чтобы удовлетворить требованию разнообразия.

Что такое Fan-in и Fan-out и почему они важны?

Fan-out — это количество уникальных запросов, следующих за родительским запросом. Fan-in — это количество уникальных запросов, предшествующих дочернему запросу. Google фильтрует запросы с слишком высокими значениями этих метрик, чтобы исключить слишком общие (высокий Fan-out) или случайные (высокий Fan-in) связи и сфокусироваться на наиболее значимых паттернах поведения.

Основывается ли связь между запросами только на семантической близости текста?

Нет. Связь определяется в первую очередь на основе анализа поведения пользователей в Session Data. Два запроса считаются связанными, если пользователи часто вводят их последовательно. Хотя часто это коррелирует с семантической близостью, основой является именно поведенческий паттерн.

Использует ли Google данные о кликах (CTR) в этом алгоритме?

Да, User Preference Data (включая CTR, взвешенные клики) активно используются. Они могут применяться для валидации связи родитель-ребенок (требуя клика после дочернего запроса), для ранжирования кандидатов в родственные запросы и при расчете оценки разнообразия результатов.

Что такое "Сила связи" (Strength of Relationship) между запросами?

Это количественная мера того, насколько тесно связаны два родственных запроса. Она рассчитывается путем агрегации частот, с которыми оба запроса следовали за их общими родительскими запросами. Чем чаще они оба появляются после одних и тех же родителей, тем сильнее связь.

Может ли связь между родственными запросами быть односторонней?

Да, патент описывает такую возможность (FIG. 6 и соответствующее описание). Например, если Запрос А гораздо популярнее Запроса Б как уточнение для их общих родителей, то Запрос А может быть предложен как уточнение для Запроса Б, но Запрос Б не будет предложен для Запроса А, так как он менее полезен для пользователей, ищущих А.

Что произойдет, если я создам много страниц под близкие ключевые слова?

Если эти страницы имеют очень похожий контент и удовлетворяют одному и тому же интенту, Google не будет считать их разнообразными (diverse). В контексте этого патента, это не поможет занять больше мест в блоке "Связанные запросы", так как система отфильтрует предложения, ведущие к похожим результатам.

Как использовать информацию из этого патента для улучшения структуры сайта?

Необходимо спроектировать архитектуру сайта так, чтобы она отражала естественные пути исследования темы. Определите основные темы (потенциальные родительские запросы) и создайте кластеры контента для связанных субтопик (родственных запросов), убедившись, что каждый кластер отвечает на уникальный интент и предлагает разнообразную информацию.

Похожие патенты

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов
Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.
  • US7565345B2
  • 2009-07-21
  • Поведенческие сигналы

  • SERP

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google анализирует поведение пользователей для выбора разнообразных связанных запросов и диверсификации контента на выдаче
Google использует механизм для диверсификации предложений на странице результатов (например, связанных запросов или рекламных блоков), основанный на анализе сессий пользователей. Система отбирает подсказки, которые часто следуют за исходным запросом (высокая «Utility»), но при этом редко следуют друг за другом (высокая «Diversity»). Это позволяет покрыть разные намерения пользователя, исходящие из одного неоднозначного запроса.
  • US8631030B1
  • 2014-01-14
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google определяет географическую зону релевантности бизнеса на основе реального поведения пользователей (Catchment Areas)
Google определяет уникальную "зону охвата" (Catchment Area) для локального бизнеса, анализируя, из каких географических точек пользователи кликали на его результаты в поиске. Эта динамическая зона заменяет фиксированный радиус и используется для фильтрации кандидатов при локальном поиске, учитывая известность бренда, категорию бизнеса и физические препятствия.
  • US8775434B1
  • 2014-07-08
  • Local SEO

  • Поведенческие сигналы

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
  • US20130144836A1
  • 2013-06-06
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

seohardcore