SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google переносит вес поведенческих сигналов (кликов) между связанными запросами для улучшения ранжирования

METHODS AND SYSTEMS FOR IMPROVING A SEARCH RANKING USING RELATED QUERIES (Методы и системы для улучшения поискового ранжирования с использованием связанных запросов)
  • US7505964B2
  • Google LLC
  • 2003-09-12
  • 2009-03-17
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google улучшает ранжирование по редким или новым запросам, для которых недостаточно собственных данных, используя поведенческие сигналы (Clickthrough Data) из связанных запросов. Если пользователи часто вводят запросы последовательно, система идентифицирует связь и переносит данные о кликах с одного запроса на другой, позволяя документам с высоким engagement ранжироваться выше по всему кластеру.

Описание

Какую проблему решает

Патент решает проблему ненадежности поисковой выдачи (unreliable search results) для редких, новых или нечетких запросов (obscure or infrequently used search queries). Для таких запросов у поисковой системы часто недостаточно данных, в частности поведенческих сигналов, для надежного ранжирования. Изобретение направлено на улучшение качества поиска в условиях разреженности данных (проблема «холодного старта»).

Что запатентовано

Запатентована система и метод улучшения ранжирования для исходного запроса путем использования данных, ассоциированных со связанными запросами (related queries). Суть изобретения заключается в переносе поведенческих сигналов (selection data или clickthrough data) с одного запроса на другой. Если документ популярен по запросу Б, и запрос Б связан с запросом А, эта популярность может повысить ранжирование документа по запросу А.

Как это работает

Система работает следующим образом:

  • Идентификация связей: Система анализирует поведение пользователей для определения связанных запросов, например, если пользователи часто вводят их последовательно (back-to-back) или в рамках одной сессии.
  • Измерение силы связи: Для каждой пары запросов определяется вес связи (Weight of Relationship, W).
  • Агрегация данных: Система агрегирует данные о кликах, которые документ получил по исходному запросу и по всем связанным запросам.
  • Взвешивание и Нормализация: Данные из связанных запросов взвешиваются (W) и нормализуются (Normalization Factor), чтобы учесть разницу в популярности запросов.
  • Смешивание (Blending): Финальная оценка рассчитывается путем смешивания данных исходного запроса и агрегированных данных связанных запросов с использованием Blending Factor (A/λ), который определяет степень доверия к каждому источнику.

Актуальность для SEO

Высокая. Несмотря на возраст патента (подача 2003 г.), описанные в нем концепции являются фундаментальными. Понимание взаимосвязей между запросами и использование агрегированных поведенческих данных для преодоления дефицита информации остаются ключевыми задачами в Information Retrieval. Принципы этого патента лежат в основе современных систем, направленных на понимание контекста пользователя и использование вовлеченности в ранжировании.

Важность для SEO

Патент имеет высокое значение для SEO (8/10). Он прямо подтверждает использование Clickthrough Data как сигнала ранжирования и демонстрирует механизм переноса этого сигнала между связанными запросами. Это подчеркивает стратегическую важность оптимизации под удовлетворенность пользователя (и высокий CTR) в рамках всей темы (кластера), а не только под отдельное ключевое слово.

Детальный разбор

Термины и определения

Blending Factor (A, λ) (Коэффициент смешивания)
Параметр, определяющий баланс между данными исходного запроса и данными связанных запросов. Отражает степень доверия (trust) к качеству и релевантности данных из разных источников.
Clickthrough Data / Selection Data (Данные о кликах / Данные о выборе)
Поведенческие данные, фиксирующие выбор пользователя (клик) на определенном результате в поисковой выдаче для конкретного запроса. Индикатор качества результата.
Normalization Factor (Norm_q') (Коэффициент нормализации)
Параметр для корректировки данных связанных запросов. Обычно отражает частотность связанного запроса (how often a particular related query is asked), чтобы сбалансировать влияние очень популярных запросов.
Related Query (q') (Связанный запрос)
Запрос, связанный с исходным запросом (q) на основе определенных критериев, таких как последовательный ввод пользователями (consecutive search queries / back-to-back), близость по времени ввода, синонимия и т.д.
Related Query Signal (Сигнал связанного запроса)
Сигнал ранжирования, рассчитанный для документа на основе данных (например, кликов), полученных этим документом по связанным запросам.
Ranking Score (Оценка ранжирования)
Числовое значение для определения позиции документа. В патенте используются метрики #Initial (исходные клики/оценка) и #Total (итоговая оценка после смешивания).
Weight of Relationship (W) (Вес связи)
Метрика, определяющая силу связи между исходным и связанным запросом. Чем выше вес, тем большее влияние оказывают данные связанного запроса.
Score(q,d)
Предварительно рассчитанная оценка ранжирования документа 'd' для запроса 'q', которая может быть основана на других факторах (например, текстовых). Упоминается в альтернативных формулах (Формула 6).

Ключевые утверждения (Анализ Claims)

Claim 15 и Claim 20 (Независимые пункты): Описывают основной механизм изобретения.

  1. Система получает первый (Q1, связанный) и второй (Q2, исходный) запросы и идентифицирует связь между ними.
  2. Определяется документ (article), ассоциированный с обоими запросами (Claim 15).
  3. Определяется selection score (Claim 15) или конкретно number of clickthroughs (Claim 20) для этого документа, когда он был показан в результатах по Q1.
  4. Рассчитывается ranking score для документа по Q2, основываясь, по крайней мере частично, на этих данных (кликах) из Q1.

Ядро изобретения — ранжирование документа по исходному запросу напрямую зависит от количества кликов, которое этот документ получает в выдаче по связанному запросу.

Claim 17, 18, 19 (Зависимые от 15): Детализируют процесс расчета.

Система определяет начальную оценку ранжирования (initial ranking score) для исходного запроса и вычисляет математическую функцию, которая комбинирует эту оценку с selection score из связанного запроса (Claim 17). Этот процесс может включать взвешивание (weighting factor) (Claim 18) и нормализацию (normalization factor) (Claim 19).

Claim 21 (Независимый пункт): Описывает асинхронную реализацию.

Система заранее (в течение периода T1) анализирует логи, идентифицирует связи между запросами (Q1 и Q2) и агрегирует пользовательские данные (user data) по Q2. После T1, при получении запроса Q1, система использует сохраненную связь для доступа к агрегированным данным от Q2 и ранжирует результаты Q1 на их основе.

Где и как применяется

Изобретение затрагивает несколько этапов поисковой архитектуры, используя предварительно рассчитанные данные для влияния на ранжирование.

QUNDERSTANDING (Офлайн-процессы)
На этом этапе система анализирует логи запросов для идентификации связей между ними. Определяются пары связанных запросов на основе поведения пользователей (например, последовательные запросы в сессии) и рассчитывается Weight of Relationship (W). Эти данные сохраняются в Related Query Database.

INDEXING / Обработка логов (Офлайн-процессы)
Поведенческие данные (Clickthrough Data) собираются, обрабатываются и сохраняются в Click Through DB, индексированные по запросам и документам.

RANKING – Ранжирование (Реальное время)
Это основной этап применения патента. При получении исходного запроса (q):

  1. Система идентифицирует связанные запросы (q') и их вес (W).
  2. Для каждого релевантного документа рассчитывается Related Query Signal путем агрегации, взвешивания (W) и нормализации (Norm) кликов, полученных этим документом по всем связанным запросам (q').
  3. Ranking Processor рассчитывает финальную оценку (например, #Total) путем смешивания (используя Blending Factor) данных исходного запроса (#Initial) и Related Query Signal.

Входные данные:

  • Исходный запрос (q).
  • Начальный набор релевантных документов.
  • Related Query Database (связи и веса W).
  • Click Through Database (данные о кликах и показах).

Выходные данные:

  • Скорректированная оценка ранжирования (#Total) для каждого документа.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на редкие, новые, длиннохвостые (long-tail) или нечеткие запросы, для которых у системы недостаточно собственных данных для надежного ранжирования. Для высокочастотных запросов влияние этого механизма менее значительно.
  • Типы контента: Влияет на любые типы контента, для которых фиксируются данные о кликах.

Когда применяется

  • Условия применения: Механизм применяется, когда система определяет наличие связанных запросов с накопленными данными.
  • Триггеры активации и регулировка: Степень влияния регулируется Blending Factor (A/λ). Если система имеет низкую уверенность в данных исходного запроса (например, их мало), она будет больше полагаться на данные связанных запросов. В некоторых реализациях (Формула 2 и 6) вес связанных данных увеличивается, если общий CTR выдачи по исходному запросу низкий.

Пошаговый алгоритм

Процесс А: Офлайн-подготовка

  1. Анализ логов: Анализ сессий пользователей для выявления последовательных или близких по времени запросов.
  2. Идентификация связей: Определение пар связанных запросов (q, q').
  3. Расчет веса связи (W): Определение силы связи на основе частоты совместного появления.
  4. Сохранение: Запись данных в Related Query Database.
  5. Сбор кликов: Агрегация данных о кликах и показах в Click Through Database.

Процесс Б: Ранжирование (На примере Формулы 1)

  1. Получение запроса (q) и документов (D1...N).
  2. Получение связанных запросов (q'1...M) и весов (W1...M).
  3. Цикл по документам: Для каждого документа (Di):
    1. Получение исходных кликов (#Initial_i).
    2. Расчет агрегированных связанных кликов:
      1. Для каждого связанного запроса (q'm):
        • Определение нормализации (Norm_q'm).
        • Получение кликов по Di для q'm (#q'm).
        • Расчет взвешенных кликов: (Wm∗#qm′)/Norm_qm′(W_m * \#q'_m) / Norm\_q'_m.
      2. Суммирование взвешенных кликов по всем M запросам.
    3. Определение коэффициента смешивания (A).
    4. Расчет финальной оценки (#Total_i): Смешивание исходных и связанных данных: A∗#Initiali+(1−A)∗SUM[...]A * \#Initial_i + (1-A) * SUM[ ... ].
  4. Ранжирование: Сортировка документов на основе #Total.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Критически важные):
    • Clickthrough Data (Клики): Количество кликов на конкретные документы для исходного и связанных запросов (Selection Score).
    • Данные о показах (Impressions): В некоторых формулах (2, 6) используется количество показов запроса (S(q)) или документа (S(d,q)) для расчета CTR или нормализации.
    • Логи запросов (Query Logs): Используются офлайн для определения связей между запросами (анализ сессий, последовательные запросы).
  • Системные данные: В альтернативных реализациях (например, Формула 6) используется Score(q,d) – предварительно рассчитанная оценка ранжирования (например, на основе текстовых или ссылочных факторов).

Какие метрики используются и как они считаются

Патент предлагает несколько формул. Основная (Формула 1) детально описана выше. Рассмотрим также ключевые метрики и альтернативный подход (Формула 6).

Ключевые метрики:

  • Weight of Relationship (W): Рассчитывается офлайн на основе анализа логов (частота совместного появления запросов).
  • Blending Factor (A, λ): Определяет баланс. Может устанавливаться эвристически или динамически (как в Формуле 6).
  • Normalization Factor (Norm): Рассчитывается как частотность связанного запроса или общее количество кликов по нему.

Альтернативный подход (Формула 6):

#Total=#qS(q)×[...]+(1−#qS(q))×∑(...)\#Total = \frac{\#q}{S(q)} \times [...] + (1-\frac{\#q}{S(q)}) \times \sum (...)

В этой реализации система использует общий CTR выдачи по исходному запросу (#q/S(q) – отношение кликов к показам) в качестве динамического Blending Factor. Если общий CTR низкий (системе не хватает уверенности), вес данных из связанных запросов (1−#q/S(q))(1 - \#q/S(q)) увеличивается. Также Формула 6 интегрирует предварительные оценки ранжирования Score(q,d).

Выводы

  1. Подтверждение использования Clickthrough Data в ранжировании: Патент явно описывает использование данных о кликах (selection data, clickthrough data) в качестве ключевого сигнала для расчета оценки ранжирования.
  2. Перенос поведенческих сигналов между запросами: Ключевой вывод — поведенческие сигналы не изолированы. Клики, полученные документом по одному запросу, напрямую влияют на его ранжирование по другим, связанным запросам.
  3. Измерение связей через поведение пользователей: Google активно анализирует поисковые сессии (например, последовательные запросы), чтобы определить связи между запросами и измерить их силу (Weight of Relationship).
  4. Решение проблемы «холодного старта»: Описан конкретный механизм для улучшения ранжирования по новым или редким запросам за счет использования данных из более популярных связанных запросов.
  5. Адаптивная балансировка данных: Использование Blending Factor показывает, что система гибко регулирует зависимость от связанных данных. При наличии достаточного количества надежных данных по исходному запросу система предпочитает их; при их отсутствии — полагается на связанные данные.

Практика

Best practices (это мы делаем)

  • Оптимизация удовлетворенности пользователя (CTR и Вовлеченность): Это критически важно. Поскольку поведенческие сигналы переносятся между связанными запросами, высокий CTR по одному запросу в кластере может улучшить ранжирование страницы по другим запросам этого же кластера. Работайте над сниппетами и качеством контента.
  • Построение тематического авторитета (Topical Authority) и кластеризация: Создавайте контент, который полностью покрывает тему и отвечает на связанные запросы. Это увеличивает вероятность того, что страница будет релевантна как исходному, так и связанным запросам (условие Claim 15), позволяя ей аккумулировать поведенческие сигналы из разных источников.
  • Анализ пути пользователя и последовательных запросов: Изучайте, как пользователи ищут информацию в вашей нише (что ищут до и после). Понимание этих связей помогает понять, как Google может связывать эти запросы (Related Queries). Оптимизируйте контент так, чтобы он отвечал на эти последовательные интенты.
  • Стратегия Long-Tail через Head/Mid-Tail: Для продвижения по сложным long-tail запросам (где мало данных) полезно иметь сильные позиции по связанным с ними более частотным запросам. Успех по частотным запросам позволит аккумулировать клики, которые затем могут быть перенесены на связанные long-tail запросы.

Worst practices (это делать не надо)

  • Изолированная оптимизация под ключевые слова: Работа с ключевыми словами в отрыве от тематического кластера и пути пользователя неэффективна. Система оценивает поведение в контексте связанных запросов.
  • Игнорирование поведенческих факторов: Стратегии, приводящие к низкому CTR или неудовлетворенности пользователя, будут проигрывать. Негативные поведенческие сигналы (или их отсутствие) также учитываются при агрегации.
  • Манипуляции с CTR (Кликбейт): Хотя патент описывает использование сырых кликов, сложные механизмы взвешивания и нормализации направлены на выявление естественного поведения. Современные системы Google также учитывают качество кликов (например, pogo-sticking).

Стратегическое значение

Патент подтверждает стратегическую важность поведенческих факторов и семантической связности. Он демонстрирует, что Google рассматривает поисковое поведение не как набор изолированных событий, а как непрерывный процесс (сессию). Для долгосрочной SEO-стратегии критически важно фокусироваться на построении тематической релевантности и обеспечении положительного пользовательского опыта на всех этапах взаимодействия с контентом в рамках топика.

Практические примеры

Сценарий: Улучшение ранжирования низкочастотного (НЧ) запроса за счет среднечастотного (СЧ).

  1. Исходный запрос (НЧ): "как починить код ошибки E01 на принтере Canon" (Данных мало).
  2. Связанный запрос (СЧ): "устранение неполадок принтера Canon" (Данных много).
  3. Связь: Пользователи часто переходят от СЧ запроса к НЧ или наоборот. Google устанавливает высокую Weight of Relationship (W).
  4. Контент: У вас есть подробное руководство, релевантное обоим запросам.
  5. Поведение: Страница получает много кликов (высокий Selection Score) по СЧ запросу.
  6. Применение алгоритма: При ранжировании по НЧ запросу система видит, что собственных данных мало (Blending Factor смещается в сторону связанных данных).
  7. Результат: Система импортирует высокий Selection Score из СЧ запроса и использует его для расчета ranking score по НЧ запросу, значительно повышая позицию страницы.

Вопросы и ответы

Как система определяет, что два запроса связаны (Related Queries)?

Патент указывает несколько методов, основанных преимущественно на поведении пользователей. Основной метод — это анализ близости (proximity) ввода запросов. Если пользователи часто вводят запрос Б сразу после запроса А (back-to-back или consecutive queries) или в течение короткого промежутка времени (в рамках одной сессии), система идентифицирует связь. Также упоминаются другие типы связей, такие как исправление опечаток, синонимы или акронимы.

Означает ли этот патент, что CTR является фактором ранжирования?

Да, этот патент является одним из прямых подтверждений того, что Clickthrough Data (данные о кликах) используются в процессе ранжирования. Патент детально описывает, как именно эти данные агрегируются, взвешиваются, нормализуются и смешиваются для расчета финальной оценки документа (Ranking Score).

Что такое «Вес связи» (Weight of Relationship, W) и как он влияет на ранжирование?

Вес связи (W) — это метрика, определяющая силу связи между двумя запросами. Чем сильнее связь (например, чем чаще запросы задаются последовательно), тем выше вес W. При расчете финальной оценки клики, полученные от связанного запроса, умножаются на этот вес. Клики от тесно связанных запросов оказывают большее влияние на ранжирование.

Что такое «Коэффициент смешивания» (Blending Factor, A/λ) и почему он важен?

Blending Factor определяет баланс между кликами по исходному запросу и кликами по связанным запросам. Он позволяет системе адаптироваться. Если по исходному запросу много данных, система полагается на них. Если же данных мало (запрос новый или редкий), коэффициент смещается, и система больше полагается на данные из связанных запросов, решая проблему «холодного старта».

Как используется нормализация (Normalization Factor, Norm)?

Нормализация необходима, чтобы избежать искажений из-за разной популярности запросов. Если связанный запрос очень популярен, документы по нему получат много кликов. Нормализация (например, деление на частотность запроса или общее количество показов) позволяет справедливо сравнивать данные от разных запросов, уравнивая их влияние вне зависимости от абсолютной популярности.

Влияет ли этот механизм на высокочастотные (Head) запросы?

Влияние на высокочастотные запросы минимально. Для таких запросов у системы достаточно собственных данных. Blending Factor будет настроен так, чтобы полагаться преимущественно на эти прямые данные. Механизм в первую очередь предназначен для улучшения ранжирования по редким и новым запросам.

Как этот патент связан с концепцией Тематического Авторитета (Topical Authority)?

Патент обеспечивает механизм, который поддерживает сайты с сильным тематическим авторитетом. Авторитетный сайт, покрывающий тему широко, будет релевантен множеству связанных запросов. Он сможет аккумулировать поведенческие сигналы (клики) со всех этих запросов. Благодаря механизму переноса сигналов, успех сайта в рамках всей темы будет улучшать его ранжирование по отдельным запросам внутри этой темы.

Могут ли негативные поведенческие сигналы также переноситься между запросами?

Хотя патент фокусируется на использовании количества кликов, логика механизма подразумевает, что отсутствие кликов (низкий CTR) также будет учтено. Если документ плохо перформит (получает мало кликов) по множеству связанных запросов, его агрегированная оценка будет низкой, что затруднит его ранжирование по любому запросу в этом кластере.

Учитывает ли патент качество кликов (например, pogo-sticking)?

Нет. В описанных механизмах и формулах используются сырые данные о кликах (Selection Score). Патент не описывает механизмов фильтрации кликов по качеству или времени пребывания на сайте. Однако следует учитывать, что современные системы Google используют более сложные метрики оценки качества взаимодействия.

Как SEO-специалист может использовать знание этого патента на практике?

Необходимо сместить фокус с оптимизации изолированных страниц на оптимизацию кластеров контента под группы связанных запросов и пользовательские сессии. Анализируйте путь пользователя, понимайте связи запросов в вашей нише и обеспечивайте максимальную удовлетворенность пользователя (высокий CTR) по всему кластеру, чтобы максимизировать перенос положительных поведенческих сигналов.

Похожие патенты

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google переносит данные о поведении пользователей из основного веб-поиска для улучшения ранжирования в вертикальных поисках (Книги, Товары)
Google использует механизм для решения проблемы «холодного старта» в специализированных или новых поисковых вертикалях. Система идентифицирует один и тот же объект (например, товар или книгу по уникальному идентификатору) в разных корпусах. Затем она заимствует данные о релевантности (клики, время просмотра) из высокопосещаемого общего веб-поиска для корректировки ранжирования в вертикальном поиске, пока не накопит достаточно собственных данных.
  • US8396865B1
  • 2013-03-12
  • Поведенческие сигналы

  • Google Shopping

  • SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.
  • US9128993B2
  • 2015-09-08
  • Ссылки

  • SERP

  • Индексация

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google использует машинное обучение и поведение пользователей для понимания скрытого намерения в коммерческих запросах
Google использует систему машинного обучения для анализа того, какие товары пользователи выбирают после ввода широких или неоднозначных запросов. Изучая скрытые атрибуты (метаданные) этих выбранных товаров, система определяет «скрытое намерение» запроса. Это позволяет автоматически переписывать будущие неоднозначные запросы в структурированный формат, ориентированный на атрибуты товара, а не только на ключевые слова.
  • US20180113919A1
  • 2018-04-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

seohardcore