SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов

RANK-ADJUSTED CONTENT ITEMS (Контент с корректировкой ранжирования)
  • US7610282B1
  • Google LLC
  • 2007-03-30
  • 2009-10-27
  • Поведенческие сигналы
  • SERP
  • Семантика и интент
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.

Описание

Какую проблему решает

Патент решает проблему стандартных поисковых систем, которые часто обрабатывают каждый запрос изолированно, игнорируя контекст предыдущих запросов в рамках одной сессии. Это может замедлить поиск релевантного контента при выполнении сложных задач, требующих нескольких шагов. Система улучшает качество поиска, предсказывая конечное намерение пользователя путем сравнения его текущей сессии с историческими паттернами поведения других пользователей.

Что запатентовано

Запатентована система и метод корректировки ранжирования контента на основе контекста текущей поисковой сессии. Система анализирует Click Logs и Query Logs для выявления статистически значимых Query Paths (Путей Запросов) и связанных с ними Content Terminuses (Конечных Точек Контента – URL, которые завершают путь). Если текущая сессия пользователя совпадает с историческим путем, система корректирует ранжирование, отдавая предпочтение тем результатам, которые были популярны в аналогичных исторических сессиях.

Как это работает

Система работает в два этапа: офлайн-анализ и онлайн-корректировка.

  • Офлайн-анализ (Mining): Mining Engine обрабатывает исторические логи. Он идентифицирует статистически значимые последовательности запросов (Query Paths), которые приводят к клику на определенный контент (Content Terminus). Также рассчитывается вероятность выбора этого контента (Selection Distribution).
  • Онлайн-корректировка (Adjustment): Во время текущей сессии Adjusting Engine определяет Context (контекст) на основе запросов пользователя. Этот контекст сравнивается с базой Query Paths. Если обнаруживается совпадение (требуется минимум два общих запроса, согласно Claims), система идентифицирует связанные Content Terminuses и повышает их ранжирование для текущего запроса пропорционально Selection Distribution.

Актуальность для SEO

Критически высокая. Понимание контекста сессии, предсказание поведения пользователя и анализ пути пользователя (User Journey) являются фундаментальными аспектами современных поисковых систем. Хотя методы машинного обучения для анализа паттернов значительно продвинулись с момента подачи патента (например, использование трансформеров и векторных представлений), запатентованный принцип использования исторических данных о сессиях для переранжирования текущей сессии остается крайне актуальным.

Важность для SEO

Патент имеет критическое значение (90/100) для SEO. Он описывает механизм, который напрямую использует поведенческие данные (последовательности запросов и клики) для переранжирования выдачи. Это подчеркивает важность не только ранжирования по отдельным запросам, но и становления Content Terminus — конечным ответом, который удовлетворяет информационную потребность пользователя после серии уточняющих запросов. Сайты, которые успешно решают задачу пользователя (Task Completion), получают значительное преимущество.

Детальный разбор

Термины и определения

Adjusting Engine (Механизм корректировки)
Онлайн-компонент системы, который сравнивает текущую поисковую сессию с историческими паттернами и корректирует ранжирование результатов. Также называется Contextual Search Engine.
Click Logs (Логи кликов)
Данные, фиксирующие, какие элементы контента были выбраны (кликнуты) пользователями в ответ на запросы.
Content Item (Элемент контента)
Результат поиска (например, веб-страница, документ, медиафайл).
Content Terminus (Конечная точка контента)
Элемент контента (например, URL), который пользователи статистически значимо выбирают в конце определенного Query Path. Это точка завершения поисковой задачи.
Context (Контекст)
Информация, определяемая текущей поисковой сессией, состоящая из последовательности или набора запросов, введенных пользователем на данный момент.
Mining Engine (Механизм анализа данных)
Офлайн-компонент системы, который обрабатывает Query Logs и Click Logs для выявления Query Paths и Content Terminuses.
Noise Path (Шумовой путь)
Последовательность запросов, которая не является статистически значимой и игнорируется системой.
Query Logs (Логи запросов)
Данные, фиксирующие запросы, отправленные пользователями поисковой системе.
Query Path (Путь запросов)
Статистически значимая серия запросов (в определенном порядке или как набор), которую пользователи вводят во время поисковой сессии и которая завершается выбором Content Terminus.
Selection Distribution (Распределение выбора)
Вероятность выбора конкретного Content Item в контексте определенного Query Path. Используется для пропорционального масштабирования корректировки ранжирования.
Statistical Search Patterns (Статистические поисковые паттерны)
Обобщенный термин для выявленных закономерностей в логах, включающий Query Paths и Content Terminuses.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы.

  1. Выбор Query Paths (последовательность запросов из прошлых сессий).
  2. Идентификация Content Terminuses (кликнутый контент в конце пути).
  3. Идентификация Context текущей сессии.
  4. Критическое условие: Определение связи между текущим Context и выбранным Query Path ТОЛЬКО если два или более запросов из Query Path похожи на два или более запросов текущей сессии.
  5. Идентификация двух или более Content Items, связанных с Content Terminus.
  6. Определение вероятности выбора (likelihood или Selection Distribution) для каждого Content Item.
  7. Корректировка ранжирования каждого Content Item пропорционально этой вероятности.

Ядро изобретения — это использование исторических последовательностей запросов (требующих минимум два совпадения с текущей сессией) для предсказания желаемого результата и пропорциональная корректировка ранжирования на основе исторических данных о кликах.

Claim 5 (Независимый пункт): Альтернативное описание метода, фокусирующееся на Statistical Search Patterns.

  1. Анализ Click Logs и Query Logs.
  2. Выбор Statistical Search Patterns.
  3. Сравнение запросов текущей сессии с паттернами.
  4. Критическое условие: Определение связи текущей сессии с паттерном ТОЛЬКО если два или более запросов паттерна похожи на два или более запросов текущей сессии.
  5. Идентификация двух или более Content Items, связанных с паттерном.
  6. Определение вероятности выбора и пропорциональная корректировка ранжирования.

Claims 9-12 (Зависимые от 5): Вводят концепцию категоризации. Система может идентифицировать категории для Query Paths, текущей сессии и Content Terminuses, и использовать совпадение этих категорий как дополнительный фактор для корректировки ранжирования.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, рассчитанные офлайн, для влияния на ранжирование в реальном времени.

INDEXING / QUNDERSTANDING (Офлайн-обработка)
На этих этапах происходит предварительная обработка данных. Mining Engine анализирует Query Logs и Click Logs. Система выявляет Statistical Search Patterns, определяет Query Paths, идентифицирует Content Terminuses и рассчитывает Selection Distribution. Эти данные сохраняются для быстрого доступа.

QUNDERSTANDING (Онлайн-обработка)
Во время сессии пользователя система отслеживает последовательность запросов для определения текущего Context. Происходит сравнение этого контекста с предварительно рассчитанными Query Paths.

RANKING / RERANKING
Основное применение патента. После генерации начального набора результатов Adjusting Engine вмешивается. Если текущий Context совпадает с историческим Query Path (условие: 2+ общих запроса), система идентифицирует связанные Content Terminuses и корректирует их Ranking Scores. Корректировка масштабируется пропорционально Selection Distribution. Затем результаты пересортировываются.

Входные данные:

  • Офлайн: Исторические Query Logs и Click Logs.
  • Онлайн: Текущая поисковая сессия (Context), текущий запрос, база данных Query Paths и Content Terminuses.

Выходные данные:

  • Набор результатов поиска с скорректированными рангами для текущего запроса.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на информационные, исследовательские (exploratory) и уточняющие (refinement) запросы, где пользователи выполняют многошаговый поиск. Меньше влияет на навигационные запросы.
  • Конкретные ниши: Тематики, требующие глубокого изучения или сравнения (например, путешествия, финансы, e-commerce, технологии), где пользователи часто переформулируют запросы в рамках одной сессии.

Когда применяется

Алгоритм применяется при выполнении строгих условий, определенных в Claims:

  • Условие сессии: Пользователь должен ввести несколько запросов в рамках текущей сессии, чтобы сформировался Context.
  • Триггер активации (Порог совпадения): Система активируется ТОЛЬКО тогда, когда два или более запросов из текущей сессии похожи на два или более запросов из идентифицированного исторического Query Path. Система не активируется на основе одного запроса.
  • Наличие данных: Должны существовать предварительно рассчитанные статистически значимые Query Paths. Если путь признан Noise Path, механизм не применяется.

Пошаговый алгоритм

Процесс А: Офлайн-анализ данных (Mining)

  1. Сбор данных: Агрегация Query Logs и Click Logs из прошлых поисковых сессий.
  2. Идентификация серий запросов: Выявление последовательностей запросов, которые завершились выбором определенного Content Item.
  3. Оценка статистической значимости: Определение, является ли серия запросов статистически значимой.
    • Если НЕТ: Серия определяется как Noise Path (шум).
    • Если ДА: Серия определяется как Query Path.
  4. Определение Content Terminus: Идентификация Content Item(s), связанных с Query Path.
  5. Расчет распределения выбора: Если с Query Path связано несколько Content Items, рассчитывается Selection Distribution (например, URL 1 выбран в 60% случаев, URL 2 в 40%).
  6. Сохранение: Query Paths, Content Terminuses и Selection Distribution сохраняются в базе данных.

Процесс Б: Онлайн-обработка запроса и корректировка ранжирования

  1. Отслеживание сессии и определение контекста: Идентификация запросов текущей сессии пользователя (Context).
  2. Сравнение с Query Paths: Сравнение текущего Context с базой исторических Query Paths.
  3. Проверка триггера: Определение, связан ли Context с каким-либо Query Path. Условие: минимум два запроса из сессии должны совпадать с минимум двумя запросами из Query Path.
    • Если НЕТ: Использовать стандартное ранжирование.
    • Если ДА: Перейти к шагу 4.
  4. Идентификация Content Terminuses: Получение Content Terminuses и их Selection Distribution, связанных с совпавшим Query Path.
  5. Получение результатов: Идентификация Content Items, релевантных текущему запросу.
  6. Корректировка ранжирования: Корректировка рангов идентифицированных Content Terminuses. Масштаб корректировки пропорционален их Selection Distribution. (Опционально: понижение ранга контента, который редко выбирается в этом контексте).
  7. Выдача результатов: Предоставление пользователю переранжированного списка результатов.

Какие данные и как использует

Данные на входе

Система полагается исключительно на поведенческие данные для работы этого механизма корректировки:

  • Поведенческие факторы:
    • Query Logs: Последовательности запросов, введенных пользователями в рамках сессий. Это основной источник для определения Query Paths и текущего Context.
    • Click Logs: Данные о выборе контента пользователями. Это основной источник для определения Content Terminuses и расчета Selection Distribution.

Патент не упоминает использование контентных или ссылочных факторов для этой корректировки, хотя они используются для базового ранжирования.

Какие метрики используются и как они считаются

  • Статистическая значимость (Statistical Significance): Метрика для определения, является ли серия запросов действительным Query Path или шумом (Noise Path). Рассчитывается на основе частоты встречаемости серии в логах.
  • Selection Distribution (Распределение выбора): Вероятность того, что конкретный Content Item будет выбран в контексте определенного Query Path. Рассчитывается на основе исторических данных о кликах для данного пути.
  • Степень сходства (Degree of Similarity) / Связь контекста (Context Relation): Метрика для сравнения запросов текущей сессии с запросами в Query Path. Может использовать точное совпадение, семантическую близость или варианты объединения (Union, Exclusive Union).
  • Порог совпадения контекста: Жестко заданное условие в Claims: минимум 2 совпадающих запроса между текущей сессией и историческим Query Path.
  • Масштаб корректировки (Adjustment Scale): Величина, на которую изменяется ранг Content Item. Она прямо пропорциональна Selection Distribution.

Выводы

  1. Контекст сессии как фактор ранжирования: История запросов пользователя в рамках текущей сессии напрямую влияет на ранжирование результатов следующего запроса. Система пытается предсказать конечную цель пользователя, а не просто ответить на последний запрос.
  2. Важность поведенческих паттернов: Система полностью основана на анализе исторических поведенческих данных (Query Logs и Click Logs). Статистически значимые пути пользователей (Query Paths) становятся основой для корректировки ранжирования.
  3. Ориентация на User Journey и Task Completion: Механизм отдает предпочтение контенту, который исторически завершал поисковую задачу (Content Terminus). Это подчеркивает важность удовлетворенности пользователя и решения его проблемы.
  4. Пропорциональное усиление (Proportional Boosting): Корректировка ранжирования не бинарна. Чем чаще URL выбирался в конце определенного пути в прошлом (выше Selection Distribution), тем сильнее он будет повышен в ранжировании при обнаружении этого пути в текущей сессии.
  5. Порог активации в два запроса: Механизм не активируется на основе одного запроса. Для его запуска необходимо совпадение как минимум двух запросов между текущей сессией и историческим путем, что обеспечивает надежность контекста.
  6. Возможность понижения: Хотя основной фокус на повышении Content Terminuses, патент также упоминает возможность понижения контента, который имеет высокий базовый ранг, но редко выбирается в определенном контексте.

Практика

Best practices (это мы делаем)

  • Оптимизация под User Journey и Task Completion: Фокусируйтесь на том, чтобы ваш контент был лучшим конечным ответом (Content Terminus). Анализируйте, какие серии запросов (Query Paths) используют пользователи в вашей нише, и убедитесь, что контент полностью удовлетворяет интент, стоящий за всем путем, а не только за последним запросом.
  • Создание контента для сложных задач: Разрабатывайте подробный, авторитетный контент (например, Pillar Pages, Hubs), который может служить конечной точкой для многошаговых поисковых сессий. Это повышает вероятность того, что ваш сайт будет идентифицирован как статистически значимый Content Terminus.
  • Анализ поведения и повышение удовлетворенности: Используйте аналитику для минимизации возврата в поиск (pogo-sticking). Высокая удовлетворенность контентом способствует тому, что ваш сайт будет чаще фиксироваться в Click Logs как успешное завершение сессии, увеличивая ваш Selection Distribution.
  • Семантическое покрытие темы: Обеспечьте широкий охват темы, чтобы ваш контент был релевантен различным запросам в рамках одного Query Path. Это увеличивает вероятность того, что система повысит ваш контент на разных этапах поисковой сессии пользователя.

Worst practices (это делать не надо)

  • Оптимизация только под изолированные ключевые слова: Игнорирование контекста сессии. Если ваш контент отвечает только на один узкий запрос, но не удовлетворяет более широкую потребность, он вряд ли станет Content Terminus и может быть вытеснен другими результатами, как только контекст будет определен.
  • Использование кликбейта и неудовлетворение интента: Привлечение трафика, который быстро покидает сайт и возвращается к поиску для уточнения запроса. Это генерирует негативные поведенческие сигналы, уменьшая вероятность идентификации вашего сайта как Content Terminus.
  • Создание поверхностного контента: Контент, который заставляет пользователя искать дополнительную информацию по той же теме в рамках той же сессии, проигрывает ресурсам, которые сразу дают исчерпывающий ответ и становятся конечной точкой сессии.

Стратегическое значение

Этот патент подтверждает стратегическую важность поведенческих факторов и анализа удовлетворенности пользователей (User Satisfaction). Для Google важно не просто найти релевантные документы, а помочь пользователю выполнить задачу. Долгосрочная SEO-стратегия должна быть сосредоточена на анализе и оптимизации всего пути пользователя (User Journey). Это смещает фокус с традиционного ранжирования по ключевым словам на ранжирование по сценариям использования и эффективности решения задач.

Практические примеры

Сценарий: Планирование путешествия (Исследовательская сессия)

  1. Исторический паттерн (Query Path): Google идентифицировал путь: Q1: "погода на Бали в октябре" -> Q2: "лучшие пляжи Бали" -> Q3: "отели на Бали Семиньяк". Content Terminus: Агрегатор отелей (URL_A) и сайт отзывов (URL_R). Selection Distribution: URL_A (60%), URL_R (40%).
  2. Текущая сессия пользователя (Шаг 1): Пользователь вводит Q1: "Бали октябрь погода". Ранжирование стандартное.
  3. Текущая сессия пользователя (Шаг 2): Пользователь вводит Q2: "популярные пляжи Бали".
  4. Активация механизма: Система обнаруживает совпадение 2 запросов с историческим Query Path. Текущий Context совпадает с паттерном планирования поездки.
  5. Корректировка ранжирования: Для текущего запроса Q2 система агрессивно повышает ранжирование URL_A и URL_R, даже если они не идеально оптимизированы под этот конкретный запрос. URL_A получает больший буст, чем URL_R, согласно Selection Distribution.
  6. Результат: Пользователь видит в топе выдачи сайты, которые исторически помогали другим пользователям планировать поездку.

Вопросы и ответы

Что такое «Query Path» (Путь запросов) и почему он важен?

Query Path — это статистически значимая последовательность запросов, которую пользователи вводят в ходе одной поисковой сессии, завершающейся кликом. Это важно, потому что Google использует эти исторические пути для понимания контекста текущей сессии пользователя. Если текущая сессия совпадает с историческим путем, Google предполагает, что пользователь имеет схожее намерение, и корректирует ранжирование.

Что такое «Content Terminus» (Конечная точка контента) и как им стать?

Content Terminus — это URL или контент, который пользователи статистически часто выбирают в конце Query Path. Он представляет собой успешное завершение поисковой задачи. Чтобы стать Content Terminus, ваш контент должен полностью удовлетворять информационную потребность, стоящую за серией запросов, и предотвращать необходимость дальнейшего поиска по этой теме (минимизировать возврат в поиск).

Как система определяет, что текущая сессия похожа на исторический путь запросов?

Патент устанавливает четкий порог, зафиксированный в Claims (Формуле изобретения): система определяет связь ТОЛЬКО в том случае, если как минимум два запроса из текущей сессии похожи на как минимум два запроса из исторического Query Path. Это предотвращает ложные срабатывания на основе одного случайного запроса и обеспечивает надежность контекста.

Насколько сильно повышается ранжирование контента, если он идентифицирован как Content Terminus?

Корректировка ранжирования пропорциональна Selection Distribution (распределению выбора). Если исторически 80% пользователей, следовавших определенному пути, выбирали ваш URL, вы получите значительно большее усиление, чем URL, который выбирали только 20% пользователей в том же контексте.

Влияет ли этот механизм на ранжирование по первому запросу в сессии?

Нет. Согласно патенту, для определения контекста и активации механизма требуется несколько запросов в сессии (минимум два совпадающих запроса). Первый запрос в сессии обрабатывается стандартными алгоритмами ранжирования, так как контекст еще не сформирован.

Может ли этот алгоритм понизить мой сайт в ранжировании?

Да. Хотя основной фокус патента на повышении релевантных Content Terminuses, в описании упоминается возможность понижения ранга контента. Если ваш сайт высоко ранжируется по запросу в базовом алгоритме, но исторически редко выбирается пользователями в определенном контексте сессии, система может уменьшить его ранг для этого контекста.

Как этот патент связан с E-E-A-T и качеством контента?

Прямой связи с сигналами E-E-A-T в патенте нет, он фокусируется исключительно на поведенческих данных (кликах и запросах). Однако высококачественный и авторитетный контент с большей вероятностью полностью удовлетворит потребность пользователя и станет Content Terminus. Таким образом, работа над E-E-A-T косвенно увеличивает шансы на получение выгоды от этого механизма.

Как оптимизировать сайт с учетом этого патента?

Необходимо сместить фокус с оптимизации под отдельные ключевые слова на оптимизацию под весь путь пользователя (User Journey). Анализируйте сценарии поиска, создавайте контент, который исчерпывающе отвечает на сложные информационные потребности и способствует успешному выполнению задачи пользователя (Task Completion).

Использует ли Google точное совпадение запросов для определения Query Paths?

Патент описывает возможность использования как точного совпадения, так и определения «степени сходства» (degree of similarity) между запросами. В Claims используется термин "похожи" (similar). Это предполагает, что система может использовать не только точное совпадение терминов, но и семантическую близость при сравнении текущей сессии с историческими путями.

Что такое категоризация контекста, упомянутая в патенте?

В одном из вариантов реализации (описанном в зависимых Claims 9-12) система может присваивать категории Query Paths (например, «Фрукты»). Если текущая сессия попадает в ту же категорию, система может повысить контент, связанный с этой категорией, даже если конкретные запросы не полностью пересекаются. Это позволяет системе понимать контекст на более высоком уровне абстракции.

Похожие патенты

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет скрытый интент сессии, используя универсальные уточняющие слова, и переранжирует выдачу
Google идентифицирует универсальные слова-модификаторы (например, «фото», «отзывы», «pdf»), которые пользователи часто добавляют к разным запросам. Если такое слово появляется в сессии, система определяет скрытый интент пользователя. Затем Google переранжирует выдачу, основываясь на том, какие документы исторически предпочитали пользователи с таким же интентом, адаптируя результаты под контекст сессии.
  • US8868548B2
  • 2014-10-21
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует историю запросов в текущей сессии для понимания контекста и переписывания неоднозначных запросов
Google анализирует предыдущие запросы пользователя в рамках текущей сессии, чтобы понять контекст нового запроса. Если новый запрос неоднозначен или содержит отсылки (например, местоимения типа «он», «это»), система пытается объединить его с сущностями из предыдущих запросов. Это позволяет переписать запрос более точно (например, заменить «он» на имя человека), чтобы предоставить результаты, соответствующие истинному намерению пользователя.
  • US9547690B2
  • 2017-01-17
  • Семантика и интент

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Популярные патенты

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google автоматически определяет связанные домены (например, международные версии сайта) и переранжирует их для повышения локальной релевантности и разнообразия выдачи
Google использует автоматическую систему для идентификации доменов, принадлежащих одной организации (аффилированных доменов), анализируя ссылки между ними и сходство их имен (SLD). Когда в результатах поиска появляется несколько таких доменов, система может понизить или поменять местами их позиции. Это делается для того, чтобы показать пользователю наиболее локально релевантную версию сайта и увеличить разнообразие организаций в топе выдачи.
  • US9178848B1
  • 2015-11-03
  • Local SEO

  • SERP

  • Ссылки

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google использует данные о реальных повторных посещениях (Quality Visit Measure) и социальных взаимодействиях для ранжирования локального бизнеса
Google использует данные о физических посещениях пользователей для оценки качества локального бизнеса. Система рассчитывает «Quality Visit Measure», придавая значительно больший вес местам, куда люди возвращаются повторно, приводят друзей или посещают по рекомендации. Этот показатель используется как сильный сигнал качества для ранжирования в локальном поиске и Google Maps, снижая зависимость от онлайн-отзывов.
  • US10366422B2
  • 2019-07-30
  • Поведенческие сигналы

  • Local SEO

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует анализ аномалий в показах и кликах для выявления фейковых локальных бизнес-листингов (Map Spam)
Google анализирует статистику взаимодействий (кликов) для групп связанных бизнес-листингов (Common Business). Система вычисляет статистически нормальный уровень активности и устанавливает порог (Anomaly Detection Threshold). Резкий всплеск активности выше этого порога (например, на два стандартных отклонения) сигнализирует о наличии фейковых или спамных листингов, созданных для манипуляции локальной выдачей.
  • US20150154610A1
  • 2015-06-04
  • Local SEO

  • Антиспам

  • Поведенческие сигналы

seohardcore