Как Google использует анализ сессий и CTR для переписывания низкоэффективных запросов в высокоэффективные

CONTENT SELECTION DATA EXPANSION (Расширение данных для выбора контента)

US8234265B1
Google LLC
2009-11-18
2012-07-31

Google анализирует поведение пользователей внутри поисковых сессий. Если пользователь быстро переходит от запроса с низким CTR (низкоэффективный) к запросу с высоким CTR (высокоэффективный), система связывает их как относящиеся к одному интенту. В дальнейшем, при получении низкоэффективного запроса, Google использует связанный высокоэффективный запрос для поиска и подмешивания более релевантного контента.

Какую проблему решает

Патент решает проблему неоптимального подбора контента (включая органические результаты и рекламу), когда формулировка запроса пользователя плохо соответствует критериям отбора релевантного контента. Это приводит к низкой вовлеченности (например, низкому CTR), и пользователи вынуждены итеративно уточнять свои запросы. Изобретение направлено на автоматическое улучшение выдачи по этим исходным, неоптимальным запросам.

Что запатентовано

Запатентована система, которая генерирует Query Rules (Правила запросов) на основе анализа данных пользовательских сессий. Система выявляет статистически значимые паттерны, когда пользователи в течение короткого промежутка времени (User Sub-session) переходят от Low-Performing Query (LPQ, запрос с низкой эффективностью) к High-Performing Query (HPQ, запрос с высокой эффективностью). Создается правило: при получении LPQ система должна также искать контент, релевантный HPQ.

Как это работает

Система работает путем анализа логов поисковых сессий:

Сегментация: Сессии делятся на короткие подсессии (Session Subsets) на основе временной близости запросов (Session Delineator), предполагая, что они направлены на одну информационную потребность.
Классификация: Каждый запрос оценивается по метрике эффективности контента (Content Performance Measure, например, CTR) и классифицируется как HPQ или LPQ.
Выявление пар: Внутри каждой подсессии ищутся пары (LPQ, HPQ).
Валидация частотности: Пары, которые встречаются в значительном количестве разных подсессий, становятся Reference Query Pairs.
Генерация правил: На основе этих пар создаются Query Rules (LPQ → HPQ).
Применение: Когда система получает LPQ, она использует соответствующее правило для расширения поиска контентом, релевантным HPQ.

Актуальность для SEO

Высокая. Понимание запросов на основе поведения пользователей и анализа контекста сессии является фундаментальным аспектом современного поиска. Механизмы переписывания и расширения запросов, основанные на данных о вовлеченности (CTR) и паттернах реформулировки, активно используются для улучшения релевантности, хотя современные реализации могут использовать более сложные ML-модели для этой задачи.

Важность для SEO

Патент имеет высокое стратегическое значение для SEO (8.5/10). Он описывает конкретный механизм, как данные о поведении пользователей (сессии и CTR) напрямую влияют на понимание и переписывание запросов. Это подчеркивает критическую важность оптимизации под удовлетворенность пользователя и достижение высокого CTR. Если ваш контент хорошо отвечает на HPQ (запрос, который удовлетворяет пользователя), вы можете получать трафик даже от тех, кто изначально вводил связанный LPQ.

Термины и определения

Content Performance Measure (CPM) (Метрика эффективности контента): Показатель, определяющий, насколько хорошо контент (включая рекламу), предоставленный в ответ на запрос, удовлетворяет потребность пользователя. Основной пример — Selection Rate (показатель кликабельности, CTR). Может быть нормализован.
High-Performing Query (HPQ) (Высокоэффективный запрос): Запрос, для которого Content Performance Measure соответствует или превышает определенный порог. Запрос, приводящий к высокому уровню вовлеченности.
Low-Performing Query (LPQ) (Низкоэффективный запрос): Запрос, для которого Content Performance Measure ниже определенного порога. Запрос, приводящий к низкому уровню вовлеченности.
Session Subset / User Sub-session (Подмножество сессии / Подсессия): Сегмент пользовательской сессии, включающий запросы, которые были получены в пределах пороговой близости друг от друга. Предполагается, что запросы в подсессии связаны одной информационной потребностью.
Session Delineator (Разделитель сессии): Пороговое значение (например, максимальное время между запросами), используемое для определения границ Session Subset. Может быть специфичным для пользователя (Session specific delineator).
Initial Query Pair (Начальная пара запросов): Пара, состоящая из HPQ и LPQ, которые были обнаружены в одной и той же Session Subset.
Reference Query Pair (Эталонная пара запросов): Initial Query Pair, которая была обнаружена в пороговом количестве различных Session Subsets. Указывает на распространенный паттерн реформулировки запроса.
Query Rules (Правила запросов): Правила, сгенерированные на основе Reference Query Pairs. Правило указывает, что контент, релевантный HPQ, должен быть идентифицирован в ответ на получение соответствующего LPQ.
Normalization Factor (Нормализационный фактор): Коэффициент, применяемый для корректировки CPM с учетом внешних факторов, таких как позиция контента на странице (presentation positions).

Ключевые утверждения (Анализ Claims)

Claim 1 и Claim 18 (Независимые пункты): Описывают основной метод генерации и применения правил. Claim 1 фокусируется на метриках рекламы, Claim 18 использует более общие метрики контента.

Система получает данные пользовательских сессий (запросы и данные об эффективности контента).
Данные сегментируются на подсессии (Session Subsets) на основе близости запросов (например, по времени).
Каждый запрос классифицируется на основе показателя эффективности (Content/Advertisement Performance Measure). Запросы выше порога становятся HPQ, ниже порога — LPQ.
Выбираются эталонные пары (Reference Query Pairs): пары HPQ+LPQ из одной подсессии, которые встречаются достаточно часто (превышают порог частотности).
Генерируются правила (Query Rules): при получении LPQ идентифицировать контент, релевантный связанному HPQ.
Система предоставляет контент, релевантный HPQ, в ответ на получение LPQ.

Claims 2-5 (Зависимые): Детализируют расчет метрики эффективности (CPM).

CPM основан на количестве выборов/кликов (Claim 2) и рассчитывается как Selection Rate (CTR) (Claim 3).
CTR нормализуется (Normalized Selection Rate) на основе характеристик представления (Claim 4), в частности, позиции показа (presentation positions), с использованием соответствующих коэффициентов нормализации (Claim 5).

Claim 6 (Зависимый): Детализирует процесс выбора эталонных пар.

Начальные пары (Initial Query Pairs) из подсессий становятся эталонными, только если они встречаются в пороговом количестве (threshold number) различных подсессий.

Claims 7-9 (Зависимые): Детализируют адаптивную сегментацию сессий.

Session Delineator может быть специфичным для пользователя (Claim 7, 8). Он может рассчитываться как среднее время между запросами (average elapsed time) для данного пользователя (Claim 9). Это позволяет адаптировать определение "близости" запросов под индивидуальный темп работы пользователя.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поисковой архитектуры, используя поведенческие данные для улучшения понимания запросов и ранжирования.

QUNDERSTANDING – Понимание Запросов
Основное применение. Analysis Subsystem работает в офлайн-режиме, анализируя исторические данные сессий для выявления связей между LPQ и HPQ на основе их временной близости и показателей CTR. Результатом является генерация базы данных Query Rules. Это механизм расширения и переписывания запросов.

RANKING – Ранжирование / METASEARCH – Метапоиск и Смешивание
На этих этапах происходит онлайн-применение правил. Когда система получает запрос, идентифицированный как LPQ, она активирует правило и инициирует поиск контента, релевантного связанному HPQ. Этот дополнительный контент затем используется при ранжировании и смешивании финальной выдачи.

Входные данные (Офлайн):

Логи пользовательских сессий (User Session Data): запросы, временные метки, анонимизированные идентификаторы.
Данные об эффективности контента (Content Performance Data): клики, показы, CTR, позиции показа.

Выходные данные (Офлайн):

База данных Query Rules (маппинг LPQ → HPQ).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, которые пользователи часто реформулируют: неоднозначные, слишком общие или неудачно сформулированные запросы, которые изначально дают плохие результаты (LPQ).
Контент с измеряемой эффективностью: Применимо к любому контенту, для которого измеряется Selection Rate (CTR), включая органические результаты и рекламу.

Когда применяется

Генерация правил (Офлайн): Происходит периодически при анализе накопленных логов сессий. Требует статистической значимости паттерна (достижения порога частотности).
Применение правил (Онлайн): Активируется в реальном времени, когда входящий поисковый запрос совпадает с LPQ, для которого существует запись в базе Query Rules.

Пошаговый алгоритм

Процесс А: Офлайн-генерация правил запросов

Сбор данных: Получение данных пользовательских сессий (запросы, время, клики, показы).
Сегментация сессий: Разделение сессий на подмножества (Session Subsets) с использованием Session Delineator. Запросы, близкие по времени, группируются. (Опционально: расчет индивидуальных разделителей для пользователей).
Расчет эффективности: Для каждого запроса вычисляется Content Performance Measure (например, CTR). Применяется нормализация по позиции показа (Normalized Selection Rate).
Классификация запросов: Запросы классифицируются как High-Performing (HPQ) или Low-Performing (LPQ) на основе порога эффективности.
Определение начальных пар: Внутри каждого Session Subset формируются Initial Query Pairs (LPQ, HPQ).
Подсчет частотности: Подсчитывается количество различных Session Subsets, в которых встречается каждая уникальная пара.
Выбор эталонных пар: Пары, частотность которых превышает установленный порог, выбираются как Reference Query Pairs.
Генерация правил: На основе эталонных пар генерируются Query Rules (LPQ → HPQ) и сохраняются в базе данных.

Процесс Б: Онлайн-применение правил

Получение запроса: Система получает запрос от пользователя (потенциальный LPQ).
Проверка правил: Система проверяет базу Query Rules.
Расширение выбора контента: Если правило найдено, система идентифицирует соответствующий HPQ.
Выбор контента: Система ищет контент, релевантный как исходному LPQ, так и найденному HPQ.
Предоставление результатов: Расширенный набор контента предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент полностью полагается на поведенческие данные, собранные во время поисковых сессий.

Поведенческие факторы:
- Данные сессий (User Session Data): Последовательность запросов, сгруппированных по анонимизированным идентификаторам.
- Временные данные (Timing Information): Точное время получения каждого запроса для определения близости и расчета скорости ввода.
- Данные о взаимодействии: Клики (selections), показы (impressions) контента, предоставленного в ответ на каждый запрос.
Технические факторы (Контекст показа):
- Характеристики представления (Presentation Characteristics): Позиции показа контента (presentation positions), используемые для нормализации показателей эффективности.

Какие метрики используются и как они считаются

Content Performance Measure (CPM): Метрика эффективности запроса.
Selection Rate (CTR): Основной компонент CPM. Рассчитывается как отношение кликов к показам.
Normalized Selection Rate: CTR, скорректированный с учетом внешних факторов, таких как позиция показа. К кликам на разных позициях применяются разные Normalization Factors (веса) для нивелирования позиционного биаса.
Session Delineator: Временной порог для группировки запросов в подсессии. Может рассчитываться индивидуально как среднее время между запросами (average elapsed time) для конкретного пользователя.
Пороги (Thresholds):
- Порог эффективности: Значение CPM для разделения запросов на HPQ и LPQ.
- Порог частотности: Минимальное количество подсессий, в которых должна появиться пара запросов, чтобы стать правилом.

Поведенческие данные как основа для понимания интента: Патент демонстрирует, как анализ поведения пользователей (паттерны реформулировки запросов и CTR) напрямую используется для определения истинного намерения и переписывания запросов.
CTR как мера качества формулировки запроса: Эффективность запроса определяется через Content Performance Measure (CTR). Запросы, которые приводят к кликам (HPQ), считаются более качественными формулировками интента, чем те, которые игнорируются (LPQ).
Связывание разных запросов через временную близость: Ключевым элементом является концепция Session Subset. Если два разных запроса вводятся близко по времени, система предполагает, что они служат одной и той же информационной потребности.
Нормализация поведенческих данных: Система учитывает позиционный биас, используя нормализацию CTR для более точной оценки эффективности запроса, независимо от того, где были показаны результаты.
Персонализация анализа сессий: Патент предлагает рассчитывать Session Delineator индивидуально для пользователя на основе его средней скорости ввода запросов, что делает анализ контекста сессии более точным.
Автоматическое обучение и расширение запросов: Система автоматически учится на статистически значимых паттернах, какие запросы (HPQ) лучше всего удовлетворяют потребность, начатую с менее удачного запроса (LPQ), и использует это знание для расширения будущих поисков.

Best practices (это мы делаем)

Оптимизация под "конечные" запросы (Destination Queries/HPQ): Выявляйте запросы, которые фактически приводят к удовлетворению потребности пользователя и высокому CTR (HPQ). Стратегия должна фокусироваться на доминировании по этим запросам. Это позволит получать трафик не только напрямую по HPQ, но и по всем связанным LPQ, которые Google переписывает в этот HPQ.
Максимизация CTR и вовлеченности: Поскольку эффективность запроса определяется через CTR, критически важно работать над привлекательностью сниппетов (Title, Description) и обеспечивать высокое качество контента. Это повышает вероятность того, что ваши запросы будут классифицированы как HPQ.
Анализ путей пользователя и реформулировок: Изучайте, как пользователи уточняют запросы в вашей нише (переходы от LPQ к HPQ). Создавайте контент, который покрывает весь спектр связанных запросов, но убедитесь, что он максимально релевантен именно конечной, высокоэффективной формулировке.
Построение Topical Authority: Обеспечивая широкий охват темы, вы повышаете вероятность того, что ваш сайт будет релевантен как для LPQ, так и для HPQ, что улучшит общие поведенческие сигналы для ваших страниц по всей группе связанных запросов.

Worst practices (это делать не надо)

Фокус на объеме ключевых слов без учета CTR: Оптимизация под запросы с низкой вовлеченностью (LPQ) рискованна. Даже если вы достигнете топа по LPQ, Google может предпочесть показать пользователям контент, найденный по связанному HPQ, если исторические данные показывают низкий CTR для LPQ.
Игнорирование качества сниппетов: Плохие Title и Description приводят к низкому CTR, что может привести к классификации целевых запросов как LPQ, уменьшая общую видимость сайта.
Создание контента для промежуточных интентов без решения финальной задачи: Если контент отвечает только на начальный (LPQ), но не на конечный (HPQ) запрос пользователя, это приведет к возврату в поиск и реформулировке (Pogo-sticking), что является негативным сигналом и подтверждает низкую эффективность исходного запроса.

Стратегическое значение

Этот патент подтверждает стратегию Google по интеграции поведенческих факторов в ядро системы понимания запросов. Он показывает, что релевантность определяется не только семантическим соответствием, но и наблюдаемым поведением пользователей. Для SEO это означает, что анализ CTR и удовлетворенности пользователя (User Satisfaction) является центральным элементом стратегии. Система предпочитает те формулировки запросов и тот контент, которые исторически приводили к успешному завершению поиска.

Практические примеры

Сценарий 1: Переписывание неоднозначного запроса

Ситуация: Пользователь ищет информацию о животном ягуар.
Исходный запрос (LPQ): Пользователь вводит "Ягуар". Выдача смешанная (животные и автомобили), пользователь не кликает (низкий CTR).
Реформулировка (HPQ): В течение короткого времени (внутри Session Subset) пользователь вводит "Ягуар животное скорость". Результаты удовлетворяют потребность, пользователь кликает (высокий CTR).
Анализ Google: Система фиксирует этот паттерн у многих пользователей. Пара достигает порога частотности.
Генерация правила: Создается правило: LPQ="Ягуар" → HPQ="Ягуар животное скорость".
Применение: В следующий раз при запросе "Ягуар", Google может использовать правило и расширить выборку контента, включая результаты, высоко релевантные HPQ.

Сценарий 2: Оптимизация для SEO в E-commerce

Задача: Продвинуть сайт магазина кроссовок.
Анализ: SEO-специалист обнаруживает, что общий запрос "купить кроссовки Nike" (LPQ) имеет низкий CTR, а пользователи часто уточняют его до "Nike Air Max 270 черные мужские" (HPQ) с высоким CTR.
Действия: Специалист фокусирует усилия на оптимизации листингов и сниппетов под HPQ.
Результат: Сайт занимает высокие позиции по HPQ. Благодаря механизму из патента, сайт также начинает получать трафик от пользователей, которые изначально вводили LPQ, так как Google использует HPQ для улучшения выдачи по общему запросу.

Что такое High-Performing Query (HPQ) и Low-Performing Query (LPQ)?

HPQ (высокоэффективный запрос) — это запрос, который приводит к высокой вовлеченности пользователей, то есть контент, показанный в ответ на него, имеет высокий Content Performance Measure (например, CTR). LPQ (низкоэффективный запрос) — это запрос, который приводит к низкой вовлеченности и низкому CTR. Разделение происходит на основе сравнения CTR с определенным порогом.

Как Google определяет, что два разных запроса связаны одним интентом?

Ключевым механизмом является анализ временной близости внутри пользовательской сессии. Если пользователь вводит LPQ, а затем быстро вводит HPQ (в пределах короткого временного окна, называемого Session Subset), система предполагает, что оба запроса направлены на удовлетворение одной и той же информационной потребности. Связь подтверждается, если такой паттерн повторяется у достаточного количества пользователей.

Что такое Session Subset и как определяется его длительность?

Session Subset (подсессия) — это короткий сегмент сессии, объединяющий близкие по времени запросы. Его длительность определяется Session Delineator. Патент предлагает делать этот разделитель адаптивным: он может рассчитываться индивидуально для каждого пользователя на основе его средней скорости ввода запросов (average elapsed time).

Используется ли этот механизм только для рекламы или для органического поиска тоже?

Механизм применим к обоим типам контента. Хотя некоторые пункты формулы изобретения (например, Claim 1) фокусируются на метриках эффективности рекламы (advertisement performance measure), другие (например, Claim 18) используют общий термин content performance measure. Логика анализа сессий и CTR для переписывания запросов универсальна для улучшения релевантности любой выдачи.

Как система учитывает позицию клика при расчете эффективности запроса?

Система использует нормализацию (Normalized Selection Rate). К кликам на разных позициях применяются разные весовые коэффициенты (Normalization Factors). Это позволяет скорректировать CTR с учетом того, что верхние позиции обычно получают больше кликов (позиционный биас), и более точно оценить истинную эффективность запроса независимо от расположения результатов.

Что произойдет, если я оптимизирую страницу под LPQ?

Если запрос классифицирован как LPQ, и для него существует правило, связывающее его с HPQ, Google будет активно подмешивать в выдачу контент, релевантный HPQ. Это может снизить видимость вашего контента, если он оптимизирован только под LPQ и не релевантен HPQ. Стратегически выгоднее оптимизировать контент под конечный, высокоэффективный запрос (HPQ).

Как этот патент влияет на важность CTR для SEO?

Он значительно повышает важность CTR. Патент описывает механизм, где CTR напрямую используется для классификации качества запросов и принятия решений о переписывании запросов. Высокий CTR подтверждает, что запрос является HPQ, что увеличивает вероятность его использования системой для расширения поиска по связанным LPQ.

Все ли пары LPQ-HPQ становятся правилами?

Нет. Пара должна пройти проверку частотности. Она должна встречаться в значительном количестве различных подсессий (превысить Threshold Number of Session Subsets), чтобы стать Reference Query Pair и быть преобразованной в правило. Это отсеивает случайные или слишком редкие паттерны реформулировки.

Как я могу определить, какие запросы в моей нише являются HPQ?

Анализируйте данные Google Search Console и систем аналитики. Ищите запросы, которые имеют высокий нормализованный CTR, низкий показатель отказов и приводят к удовлетворению пользователя (например, достижению конверсии). Это запросы, которые наиболее точно формулируют потребность целевой аудитории.

Может ли этот механизм объяснить, почему я вижу в выдаче результаты, не содержащие слов из моего запроса?

Да, это один из возможных механизмов. Если вы ввели запрос, который система классифицировала как LPQ, она может использовать связанный HPQ для поиска контента. Контент, релевантный HPQ, может не содержать терминов из исходного LPQ, но он будет соответствовать общему интенту, который система вывела на основе анализа исторических данных сессий.

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов

Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.

US7617205B2
2009-11-10

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету

Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.

US8930351B1
2015-01-06

Персонализация
Поведенческие сигналы
SERP

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность

Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.

US7870147B2
2011-01-11

Семантика и интент
Поведенческие сигналы
SERP

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу

Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.

US8868548B2
2014-10-21

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске

Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.

US8965875B1
2015-02-24

Поведенческие сигналы
Семантика и интент
EEAT и качество

Как Google обучается на поведении пользователя для персонализации весов источников в поисковой выдаче

Google использует сигналы интереса пользователя (клики, время просмотра) для динамической корректировки весов различных источников данных (например, ключевых слов, тем, типов контента). Система определяет, какие источники наиболее полезны для конкретного пользователя, и повышает их значимость при ранжировании последующих результатов поиска, тем самым персонализируя выдачу.

US8631001B2
2014-01-14

Персонализация
Поведенческие сигналы
SERP

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя

Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.

US9235626B2
2016-01-12

Персонализация
SERP
Семантика и интент

Как Google использует историю чтения новостных сайтов для определения географических интересов пользователя и персонализации выдачи

Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, даже если пользователь физически находится в другом месте.

US20130246381A1
2013-09-19

Персонализация
Поведенческие сигналы
SERP

Как Google интегрирует поиск в инструменты создания контента и использует распространение ссылок для расчета репутации автора

Google разработал систему (UDS), интегрирующую поиск в инструменты создания контента (Email, блоги, форумы). Система автоматически уточняет запросы на основе контекста и профилей пользователей. Если автор вставляет ссылку, а читатель кликает по ней, Google использует это взаимодействие для расчета «оценки репутации» автора и как поведенческий сигнал качества контента.

US7844603B2
2010-11-30

Ссылки
Поведенческие сигналы
EEAT и качество

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов

Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).

US6754873B1
2004-06-22

Ссылки
SERP
Техническое SEO

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска

Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.

US8612411B1
2013-12-17

Ссылки
SERP

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей

Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.

US11379527B2
2022-07-05

Семантика и интент
Поведенческие сигналы

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей

Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.

US10110701B2
2018-10-23

Knowledge Graph
Поведенческие сигналы
Персонализация

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов

Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.

US9436709B1
2016-09-06

EEAT и качество
Поведенческие сигналы

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

US8868592B1
2014-10-21

Персонализация
Поведенческие сигналы
Local SEO