SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко

SYSTEMS AND METHODS FOR IMPROVED SEARCHING (Системы и методы для улучшенного поиска)
  • US8521725B1
  • Google LLC
  • 2003-12-03
  • 2013-08-27
  • Поведенческие сигналы
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.

Описание

Какую проблему решает

Патент решает проблему, когда релевантные документы оказываются глубоко в результатах поиска и не видны пользователю. Это может происходить из-за ограничений алгоритмов ранжирования или из-за того, что пользователь ввел неточный, неоднозначный запрос или запрос с ошибкой. Система стремится выявить эту «скрытую релевантность» и создать механизм обратной связи (Exploration/Exploitation) для обучения и улучшения системы ранжирования.

Что запатентовано

Запатентована система модификации поисковой выдачи, которая идентифицирует документ, высоко ранжирующийся по связанному запросу (Q2), но низко по исходному запросу (Q1). Если такой документ найден, система перемещает (boosts) его на более высокую, видимую позицию в результатах исходного запроса Q1. Цель — протестировать результат и собрать данные о взаимодействии с ним (click-through data).

Как это работает

Система работает в несколько этапов:

  • Генерация исходной выдачи: Система получает исходный запрос (Q1) и ранжирует результаты.
  • Идентификация связанного запроса (Q2): Это может быть переформулировка Q1 (синоним, добавление термина) или запрос, часто вводимый вскоре после Q1 (темпоральная связь, например, исправление опечатки).
  • Сравнение: Система ищет документ (D), который высоко ранжируется в Q2, но низко (на невидимой позиции) в Q1.
  • Перемещение (Boosting): Если условия выполнены, D перемещается на высокую позицию в результатах Q1.
  • Обратная связь (Feedback Loop): Система отслеживает клики на перемещенный документ. Если CTR высок, эти данные обновляют Popularity Database, что улучшает ранжирование этого документа по запросу Q1 в будущем.

Также в патенте упоминается возможность случайного выбора документов из «хвоста» выдачи для перемещения вверх с целью сбора данных.

Актуальность для SEO

Средняя/Высокая. Патент подан в 2003 году, и конкретные методы идентификации связанных запросов (например, простое добавление синонимов) устарели по сравнению с современными нейросетевыми подходами. Однако базовые концепции — использование связанных запросов для обнаружения релевантности и механизм Exploration/Exploitation (тестирование результатов и сбор обратной связи от пользователей) — остаются фундаментальными для работы современных поисковых систем.

Важность для SEO

Значительное влияние (7/10). Этот патент подчеркивает стратегическую важность ранжирования по всему кластеру связанных запросов (Topical Authority). Он демонстрирует, как успех по одному запросу может быть использован для улучшения позиций по связанному запросу. Кроме того, он подтверждает критическую роль вовлеченности пользователей (CTR) как механизма валидации релевантности, когда система тестирует страницу в топе.

Детальный разбор

Термины и определения

Candidate Result Set (Набор результатов-кандидатов)
Пул документов, из которого система выбирает результаты для перемещения. Может включать результаты связанного запроса (Q2) или «хвост» исходной выдачи (Q1).
Click-through data (Данные о кликах)
Поведенческие данные (частота кликов, CTR), используемые как индикатор качества и релевантности для обновления Popularity Database.
Popularity Database (База данных популярности)
Хранилище метрик популярности документов (показы, клики). Эти данные используются для ранжирования.
Query Reformulation (Переформулировка запроса)
Процесс изменения исходного запроса для создания связанного запроса (например, добавление синонимов или терминов).
Related Query (Связанный запрос)
Запрос (Q2), связанный с исходным запросом (Q1). Связь может быть семантической (переформулировка) или темпоральной (temporally related — запросы, введенные последовательно).
Tiers (Уровни выдачи)
Способ разделения результатов поиска. Higher tier — результаты, которые пользователь, скорее всего, увидит (например, Топ-20). Lower tier — результаты, которые пользователь, скорее всего, не увидит.

Ключевые утверждения (Анализ Claims)

Ядро изобретения сосредоточено на модификации ранжирования на основе анализа результатов связанных запросов.

Claim 1 (Независимый пункт): Описывает процесс, где связанный запрос генерируется с использованием синонима.

  1. Система получает результаты для первого запроса (Q1).
  2. Генерируется второй запрос (Q2), включающий Q1 и синоним термина из Q1.
  3. Получаются результаты для Q2.
  4. Определяется, что конкретный результат (D) входит в число самых высокоранжированных результатов в Q2 (threshold number of highest-ranked second search results).
  5. Определяется, что этот же результат D не входит в число самых высокоранжированных результатов в Q1.
  6. При выполнении обоих условий порядок результатов Q1 модифицируется: D перемещается с исходной позиции на более высокую позицию.
  7. Модифицированные результаты предоставляются пользователю.

Claim 4 (Независимый пункт): Описывает аналогичный процесс, но связанный запрос генерируется путем добавления термина (уточнение).

  1. Система получает результаты для Q1.
  2. Генерируется второй запрос (Q2) путем добавления термина к Q1.
  3. Получаются результаты для Q2.
  4. Далее процесс повторяет шаги 4-7 из Claim 1: идентификация документа D (высоко в Q2, низко в Q1) и его перемещение на более высокую позицию в Q1.

Claims 3, 7, 22 (Зависимые пункты): Уточняют, что второй запрос может быть связан с первым темпорально (related temporally). Это означает анализ логов поиска для выявления запросов, которые пользователи часто вводят последовательно (например, исправление опечаток).

Claims 11-14 (Зависимые пункты): Детализируют механизм обратной связи и валидации. После показа модифицированных результатов система определяет, имеет ли перемещенный результат более высокую релевантность, чем указывала его исходная позиция. Это определение основывается на информации, полученной после показа (т.е. на данных о кликах). Это подтверждает, что целью перемещения является сбор данных для валидации и обучения системы ранжирования.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска, функционируя как механизм обнаружения релевантности и обратной связи.

QUNDERSTANDING – Понимание Запросов
На этом этапе система идентифицирует или генерирует связанные запросы (Q2). Это включает анализ логов запросов для выявления темпоральных связей и применение методов переформулировки (Query Reformulation), таких как использование синонимов.

RANKING – Ранжирование
Система генерирует первичные наборы ранжированных результатов как для исходного запроса (Q1), так и для связанного запроса (Q2).

RERANKING – Переранжирование
Основное применение патента. Система сравнивает ранжирование документов в Q1 и Q2. Если обнаруживается расхождение (документ высоко в Q2, но низко в Q1), система модифицирует порядок результатов Q1, перемещая выбранный документ в higher tier. Также на этом этапе может происходить случайное перемещение документов из «хвоста» выдачи вверх (как описано в Description патента).

Сбор данных (Data Acquisition)
После показа модифицированной выдачи система собирает Click-through data по повышенным результатам и сохраняет их в Popularity Database для использования в будущем ранжировании.

Входные данные:

  • Исходный запрос (Q1) и его результаты.
  • Связанные запросы (Q2) и их результаты.
  • Логи запросов (для темпорального анализа).
  • Данные о синонимах.

Выходные данные:

  • Модифицированный набор результатов для Q1.
  • Обновленные данные в Popularity Database.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, широкие запросы или запросы с потенциальными орфографическими ошибками (в патенте приведен пример "infinity" вместо "infiniti"). Также влияет на запросы, где пользователи часто прибегают к переформулировкам.
  • Типы контента: Влияет на документы, которые очень релевантны теме в целом, но могут быть плохо оптимизированы под конкретную формулировку запроса (Q1), при этом хорошо отвечая на связанный запрос (Q2).

Когда применяется

Алгоритм активируется при выполнении специфических условий или в рамках тестирования:

  • Условие связанных запросов (Claims): Когда существует связанный запрос Q2, и есть документ D, который удовлетворяет пороговым значениям ранжирования: высоко в Q2 и низко в Q1.
  • Условие тестирования/Разведки (Description): Система может периодически или случайно активировать перемещение документов из «хвоста» выдачи (Lower tier) на видимые позиции (Higher tier) для сбора данных об их релевантности.

Пошаговый алгоритм

Рассмотрим основной сценарий, описанный в Claims (Формуле изобретения).

Алгоритм перемещения на основе связанных запросов

  1. Получение запроса: Система получает исходный запрос (Q1).
  2. Первичное ранжирование: Выполняется Q1 и генерируется первичный набор результатов.
  3. Генерация связанного запроса: Система идентифицирует или генерирует связанный запрос (Q2). Методы включают:
    • Переформулировку (добавление синонима, добавление термина).
    • Анализ темпорально близких запросов из логов.
  4. Ранжирование кандидатов: Выполняется Q2 и генерируется набор результатов-кандидатов.
  5. Идентификация документа для перемещения: Система ищет документ (D), который высоко ранжируется в результатах Q2 (входит в Higher tier).
  6. Проверка условий: Система проверяет позицию документа D в результатах Q1.
    • Если D ранжируется высоко в Q1: Перемещение не требуется.
    • Если D ранжируется низко в Q1 (входит в Lower tier): Перейти к шагу 7.
  7. Модификация выдачи: Порядок результатов Q1 изменяется. Документ D перемещается на высокую (видимую пользователю) позицию.
  8. Предоставление результатов: Модифицированный набор результатов Q1 отправляется пользователю.
  9. Сбор обратной связи (Feedback Loop): Система отслеживает взаимодействие пользователя с документом D (клики) и обновляет Popularity Database.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о ранжировании и поведенческих факторах.

  • Поведенческие факторы: Критически важны. Используются логи запросов (log files) для идентификации темпорально связанных запросов (Q1 и Q2, введенные последовательно). Также используются click-through data, собираемые после показа модифицированной выдачи, для валидации релевантности.
  • Системные данные: Оценки ранжирования, используемые для определения позиций документов в Q1 и Q2.
  • Контентные/Лингвистические данные: Базы данных синонимов или вариаций терминов для переформулировки запросов.
  • Пользовательские факторы: Идентификаторы пользователя (Cookie/IP) могут использоваться для анализа сессий и поддержания консистентности выдачи при повторных запросах в течение короткого времени.

Какие метрики используются и как они считаются

  • Пороги ранжирования (Ranking Thresholds): Определяют, что такое «высокий ранг» (Higher tier) и «низкий ранг» (Lower tier). Например, Топ-20 для высокого ранга; позиции после 30 для низкого ранга. Используются для проверки условий перемещения.
  • Темпоральная близость (Temporal Proximity): Метрика для анализа логов, определяющая, были ли Q1 и Q2 введены одним пользователем в течение короткого промежутка времени (например, 5 минут). Может требоваться определенное количество повторений (например, 5 раз), чтобы связь была установлена.
  • Click-Through Rate (CTR): Отношение кликов к показам. Используется для валидации релевантности перемещенного документа. Если он высок, метрики в Popularity Database обновляются.

Выводы

  1. Активное тестирование релевантности (Exploration): Google не просто пассивно ранжирует контент, но и активно тестирует гипотезы о релевантности. Система перемещает потенциально недооцененные документы на видимые позиции, чтобы проверить их эффективность на пользователях.
  2. Связанные запросы как источник релевантности: Производительность документа по связанным запросам (синонимы, уточнения, исправления ошибок) используется как сильный сигнал потенциальной релевантности для исходного запроса. Успех по одному запросу может привести к бустингу по другому.
  3. Критическая роль цикла обратной связи (Feedback Loop): Механизм перемещения является временным тестированием. Устойчивое улучшение ранжирования требует валидации со стороны пользователей. Click-through data сигнализирует о релевантности и используется для обучения системы ранжирования.
  4. Использование темпоральных данных сессий: Система анализирует последовательности запросов пользователей (темпоральные связи), чтобы выявить скрытые связи между разными формулировками, особенно при исправлении ошибок или уточнении намерений.
  5. Случайность для разведки: В патенте также упоминается использование случайной выборки документов из «хвоста» выдачи и их перемещение вверх. Это механизм «разведки» (Exploration), позволяющий обнаружить релевантные документы, упущенные стандартными алгоритмами.

Практика

Best practices (это мы делаем)

  • Тематическая кластеризация и Topical Authority: Необходимо оптимизировать контент под всю тему целиком, включая синонимы, LSI-фразы и подтемы. Это увеличивает вероятность того, что страница будет высоко ранжироваться по связанному запросу (Q2), что делает ее кандидатом на бустинг в основном запросе (Q1).
  • Максимизация CTR и вовлеченности: Поскольку система использует бустинг для тестирования реакции пользователей, критически важно иметь привлекательные сниппеты (Title, Description). Если Google тестирует вашу страницу, перемещая ее в топ, высокий CTR поможет подтвердить релевантность и закрепить позиции.
  • Анализ вариаций запросов и интентов: Изучайте, как пользователи переформулируют запросы в вашей нише (используя данные GSC). Убедитесь, что ваш контент релевантен для этих вариаций, включая распространенные опечатки или альтернативные термины.
  • Создание контента, отвечающего на последующие запросы: Если анализ показывает, что пользователи часто вводят Q1, а затем Q2, создайте контент, который исчерпывающе отвечает на оба интента. Это укрепит связь между запросами в глазах системы.

Worst practices (это делать не надо)

  • Гипероптимизация под одно ключевое слово: Фокусировка на точном вхождении одного ключевого слова при игнорировании синонимов и связанных концепций снижает шансы на то, что страница будет найдена через механизм связанных запросов.
  • Игнорирование поведенческих факторов: Нельзя полагаться только на статические факторы. Если страница не привлекает клики или не удовлетворяет интент пользователя, она не задержится в топе, даже если будет туда временно перемещена системой тестирования.
  • Использование кликбейта без релевантности: Попытка обмануть механизм обратной связи с помощью кликбейтных заголовков. Если страница получит бустинг, но пользователи будут быстро уходить, это подтвердит низкую релевантность страницы.

Стратегическое значение

Этот патент, несмотря на его возраст, описывает фундаментальный механизм обратной связи (Exploration & Exploitation) в поисковых системах. Он подтверждает, что ранжирование не статично и постоянно корректируется на основе как семантического анализа (связанные запросы), так и реального поведения пользователей. Стратегически это означает, что SEO должно фокусироваться на построении тематического авторитета и обеспечении положительного пользовательского опыта, который валидирует релевантность контента.

Практические примеры

Сценарий 1: Орфографическая ошибка и темпоральная связь (Пример из патента)

  1. Исходный запрос (Q1): "infinity car" (с ошибкой).
  2. Анализ логов: Система видит, что многие пользователи сразу после этого вводят "infiniti car" (Q2). Устанавливается темпоральная связь.
  3. Документ (D): Официальный сайт Infiniti (www.infiniti.com).
  4. Анализ ранжирования: D высоко ранжируется в Q2, но низко в Q1.
  5. Действие: Система перемещает D на первую позицию в выдаче по Q1 ("infinity car").
  6. Обратная связь: Пользователи кликают на сайт. Система фиксирует высокий CTR и улучшает будущее ранжирование www.infiniti.com по запросу с ошибкой.

Сценарий 2: Использование синонимов (Claim 1)

  1. Исходный запрос (Q1): "дешевый отель москва".
  2. Переформулирование (Q2): Система использует синоним: "недорогой отель москва".
  3. Документ (D): Страница агрегатора отелей.
  4. Анализ ранжирования: D ранжируется №1 по Q2, но №25 по Q1.
  5. Действие: Система идентифицирует D как недооцененный результат для Q1 и перемещает его на позицию №3.
  6. Результат: Система собирает CTR по этому результату для валидации.

Вопросы и ответы

Как этот патент связан с концепцией Topical Authority (Тематический Авторитет)?

Патент напрямую поддерживает стратегию построения Topical Authority. Он описывает механизм, при котором высокое ранжирование по одному запросу (Q2) может привести к улучшению ранжирования по связанному запросу (Q1). Если сайт авторитетно покрывает всю тему, он с большей вероятностью будет высоко ранжироваться по множеству вариаций запросов (различные Q2), что увеличивает его шансы на получение бустинга по тем запросам, где он изначально ранжировался низко (Q1).

Что произойдет, если перемещенный (boosted) документ не получит кликов?

Если документ был перемещен на высокую позицию, но пользователи его игнорируют (низкий CTR), это сигнализирует системе о том, что гипотеза о его релевантности не подтвердилась. Popularity Database не получит положительных сигналов, и бустинг прекратится. В патенте упоминается, что если документ показан определенное количество раз и не является популярным, его перестают вставлять.

Как Google определяет, какие запросы являются связанными (Related Queries)?

Патент описывает несколько методов. Во-первых, это переформулировка (Query Reformulation): добавление синонимов (Claim 1), добавление или удаление терминов (Claim 4). Во-вторых, это темпоральная связь (Claims 3, 7, 22): анализ логов запросов для выявления запросов, которые пользователи часто вводят последовательно в течение короткого времени (например, исправление опечаток).

Является ли этот бустинг постоянным?

Нет, описанный механизм перемещения является временным тестированием (Exploration). Цель — собрать данные о взаимодействии пользователя с документом (Claims 11-14). Для того чтобы улучшение ранжирования стало постоянным (Exploitation), необходимо, чтобы пользователи положительно взаимодействовали с перемещенным документом (высокий CTR), подтверждая его релевантность.

Может ли система случайно выбрать низкоранжированный результат и переместить его?

Да, в описании патента (Description) явно упоминается возможность случайного выбора (randomly selecting) документа из lower tier (с низких позиций, например 50-100) и его перемещения в higher tier (на высокие позиции). Это также служит цели тестирования релевантности и сбора данных о популярности для документов, которые иначе не получили бы показов.

Насколько важен CTR в контексте этого патента?

CTR критически важен. Он выступает основным механизмом валидации в цикле обратной связи. Перемещение документа дает ему показы, но именно клики (click-through data) сообщают поисковой системе, что этот документ действительно релевантен запросу Q1. Без положительного CTR улучшение ранжирования не будет устойчивым.

Стоит ли мне оптимизировать страницы специально под синонимы, чтобы воспользоваться этим механизмом?

Да, но это следует делать естественно в рамках comprehensive content. Ваша страница должна быть релевантна как для основного термина, так и для его синонимов и вариаций. Это улучшает шансы страницы высоко ранжироваться по связанным запросам (Q2), что является необходимым условием для активации этого механизма бустинга в исходном запросе (Q1).

Насколько актуальны эти методы, учитывая, что патент подан в 2003 году?

Методы переформулировки, описанные в патенте (простая замена синонимов), безусловно, устарели по сравнению с современными моделями (BERT, MUM). Однако сама идея использования связанных запросов для обнаружения релевантности и механизм обратной связи через бустинг и анализ кликов остаются фундаментальными принципами работы поисковых систем.

Как я могу определить, получил ли мой сайт бустинг благодаря этому механизму?

Это сложно определить напрямую. Однако косвенными признаками могут быть резкие скачки позиций по определенному запросу, за которыми следует либо закрепление на новой позиции (если CTR хороший), либо возврат к исходной (если CTR плохой). Это объясняет волатильность SERP, связанную с тестированием гипотез.

Как обеспечить консистентность выдачи, если Google постоянно перемещает результаты?

Патент предполагает, что консистентность поддерживается в течение короткого периода времени. Система может использовать идентификатор пользователя (например, cookie), чтобы запомнить, какой результат и на какую позицию был перемещен, и показывать ту же выдачу при повторных запросах в рамках одной сессии или короткого временного окна.

Похожие патенты

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует графы уточнений запросов для бустинга документов и переписывания широких запросов
Google анализирует, как пользователи уточняют свои запросы, и строит «Граф Запросов». Этот граф используется двумя способами: 1) Для повышения ранжирования документов (особенно по заголовкам), которые точно соответствуют популярным кластерам запросов, даже если у них мало ссылок. 2) Для автоматического переписывания широкого запроса пользователя в его наиболее популярные конкретные уточнения и объединения результатов.
  • US20150169589A1
  • 2015-06-18
  • Семантика и интент

  • Свежесть контента

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Популярные патенты

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google определяет связанность документов с использованием Co-citation, анализа текста вокруг ссылок и паттернов пользовательского доступа
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
  • US7305380B1
  • 2007-12-04
  • Ссылки

  • SERP

  • Поведенческие сигналы

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования
Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.
  • US7454417B2
  • 2008-11-18
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

seohardcore