SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google делает поиск «сессионным» (stateful), объединяя параметры из последовательных запросов пользователя

COMBINING PARAMETERS OF MULTIPLE SEARCH QUERIES THAT SHARE A LINE OF INQUIRY (Объединение параметров нескольких поисковых запросов, относящихся к одной линии исследования)
  • US11468052B2
  • Google LLC
  • 2020-06-25
  • 2022-10-11
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google может определять, когда несколько последовательных запросов пользователя являются частью одного исследования («линии запроса»). Система объединяет параметры из этих запросов, создавая «комбинированный запрос». Это позволяет пользователю постепенно уточнять поиск (особенно голосом), не повторяя предыдущие условия, делая процесс более естественным и контекстуальным.

Описание

Какую проблему решает

Патент решает проблему «поиска без сохранения состояния» (stateless search). В традиционном поиске каждый запрос обрабатывается изолированно, что вынуждает пользователей вручную повторять параметры из предыдущих запросов при постепенном уточнении поиска. Это неэффективно и особенно сложно при использовании голосовых интерфейсов и виртуальных ассистентов, где ручное управление фильтрами затруднено.

Что запатентовано

Запатентована система для создания «поиска с сохранением состояния» (stateful search). Система определяет, когда текущий и предыдущие запросы пользователя относятся к общей «линии исследования» (shared line of inquiry). Если связь обнаружена, система автоматически формулирует «комбинированный поисковый запрос» (combined search query), который агрегирует параметры из всех связанных запросов, тем самым сохраняя контекст сессии.

Как это работает

Система сравнивает текущий запрос с одним или несколькими предыдущими запросами. Связь определяется двумя основными способами:

  • Семантическая схожесть: Запросы преобразуются в векторные представления (embeddings). Если расстояние между ними в латентном пространстве (latent space) меньше порогового значения, запросы считаются семантически связанными.
  • Лингвистические сигналы: Система использует «связующие грамматики» (linking grammars) для обнаружения фраз (link back phrase), которые явно указывают на уточнение (например, «На самом деле, я имел в виду...»).

Близость запросов по времени усиливает сигнал о наличии связи. После объединения параметров система может предоставить пользователю интерактивные элементы (tokens) для управления активными условиями поиска.

Актуальность для SEO

Высокая. Понимание контекста сессии, обработка итеративных уточнений и развитие диалогового поиска (Conversational Search) являются приоритетными направлениями для Google. Этот механизм напрямую связан с тем, как современные поисковые системы интерпретируют эволюционирующий интент пользователя, особенно в голосовом поиске.

Важность для SEO

Патент имеет высокое стратегическое значение (7.5/10) для Понимания Запросов (Query Understanding). Он демонстрирует, что Google стремится интерпретировать не изолированные запросы, а целые поисковые сессии. Для SEO это подчеркивает необходимость оптимизации под «путь пользователя» (User Journey) и прогрессивное уточнение интента. Контент должен удовлетворять комбинированным, более сложным запросам, которые система генерирует автоматически в ходе сессии.

Детальный разбор

Термины и определения

Combined Search Query (Комбинированный поисковый запрос)
Запрос, автоматически сформулированный системой, который включает поисковые параметры из двух или более связанных запросов пользователя (текущего и предыдущих).
Embeddings (Векторные представления, Эмбеддинги)
Числовые векторные представления запросов, используемые для оценки их семантической схожести.
Latent Space (Латентное пространство)
Многомерное пространство, в котором размещаются embeddings. Расстояние между векторами в этом пространстве используется как прокси для семантической схожести.
Linking Grammar / Link Back Phrase (Связующая грамматика / Фраза обратной связи)
Лингвистические конструкции или конкретные фразы (например, «Actually, I meant...»), которые сигнализируют о том, что текущий запрос является уточнением или модификацией предыдущего.
Search Parameter (Поисковый параметр)
Термины и/или модификаторы (например, NOT), извлеченные из запросов. В комбинированном запросе они могут быть обязательными, опциональными или взвешенными.
Shared Line of Inquiry (Общая линия исследования)
Последовательность из двух или более поисковых запросов, которые система идентифицирует как часть одной исследовательской задачи или сессии.
Similarity Learning (Обучение схожести)
Процесс обучения функции схожести (например, модели машинного обучения, генерирующей embeddings) на основе обратной связи пользователя о качестве комбинированных запросов.
Stateful Search (Поиск с сохранением состояния)
Режим поиска, при котором система поддерживает контекст («состояние») между несколькими запросами в рамках одной сессии.
Tokens (Токены)
Интерактивные элементы пользовательского интерфейса, представляющие активные Search Parameters или элементы результатов поиска, с которыми пользователь может взаимодействовать (например, вычеркивать) для уточнения запроса.

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов (Claims 1, 6, 7, 8, 9), описывающих разные аспекты и методы реализации системы.

Claim 1 (Независимый пункт): Метод семантической схожести.

  1. Получение данных голосового ввода, содержащих текущий запрос.
  2. Сравнение текущего запроса с предыдущим. Сравнение включает определение расстояния в latent space между первым embedding (текущий запрос) и вторым embedding (предыдущий запрос).
  3. На основе сравнения определяется наличие общей shared line of inquiry.
  4. Формулируется combined search query с параметрами из обоих запросов.
  5. Выполняется поиск.

Claim 6 (Независимый пункт): Метод связующих грамматик.

  1. Получение данных голосового ввода (текущий запрос).
  2. Сравнение с предыдущим запросом. Сравнение включает применение одной или нескольких grammars к текущему запросу для идентификации фразы, указывающей на связь (relate-back) с предыдущим запросом.
  3. Определение наличия общей shared line of inquiry.
  4. Формулируется и выполняется combined search query.

Claim 7 (Независимый пункт): Режим Stateful Search с подтверждением.

  1. Определение наличия общей shared line of inquiry.
  2. В ответ на это пользователю предоставляется запрос (prompt) на вход в поисковую сессию, в которой запросы будут модифицироваться на основе отслеживаемого состояния (tracked state).
  3. Получение ответа пользователя.
  4. Формулирование combined search query происходит только после определения связи И получения положительного ответа пользователя.

Claim 8 (Независимый пункт): Отображение параметров.

  1. После определения связи и формулирования combined search query.
  2. Система предоставляет пользователю список активных search parameters, включающий параметры как из текущего, так и из предыдущего запроса.

Claims 9 и 10 (Независимый/Зависимый): Интерактивное уточнение через результаты.

  1. Предоставление результатов поиска по combined search query.
  2. Получение индикации взаимодействия пользователя с одним или несколькими tokens одного из результатов поиска.
  3. Формулирование обновленного combined search query на основе этого взаимодействия.
  4. (Claim 10) Уточняется, что взаимодействие может быть «вычеркиванием» (striking through) токенов, и обновленный запрос формулируется так, чтобы исключить результаты, соответствующие этим токенам.

Где и как применяется

Изобретение является ключевым компонентом этапа понимания запросов и управления сессией.

QUNDERSTANDING – Понимание Запросов
Это основная область применения. Query Processing Engine анализирует текущий запрос в контексте истории сессии.

  1. Анализ контекста: Сравнение текущего запроса с предыдущими (полученными из Historical Query Database) с использованием семантических и грамматических моделей.
  2. Переписывание запроса (Query Reformulation): Если обнаружена shared line of inquiry, система извлекает параметры и генерирует Combined Search Query. Это происходит до этапа ранжирования.

RANKING – Ранжирование
Системы ранжирования (Search Engine, Ranking Engine) получают на вход уже переписанный Combined Search Query. Веса параметров (обязательные/опциональные), установленные на этапе QUNDERSTANDING, используются при определении релевантности.

Интерфейс (Presentation Engine):
Presentation Engine отвечает за отображение результатов и интерактивных элементов (tokens). Взаимодействие пользователя с этими элементами обрабатывается и возвращается в Query Processing Engine для дальнейшего уточнения запроса.

Входные данные:

  • Текущий поисковый запрос (текст или аудио).
  • История недавних запросов пользователя/сессии.
  • Временные метки запросов.
  • Данные о взаимодействии пользователя с интерфейсом (например, вычеркивание токенов).

Выходные данные:

  • Combined Search Query, отправляемый в систему ранжирования.
  • Интерактивные элементы UI (tokens), отображающие активные параметры поиска.

На что влияет

  • Специфические запросы: Наибольшее влияние на исследовательские (informational) и сложные коммерческие (transactional) запросы, где пользователь итеративно сужает область поиска или добавляет критерии (поиск товаров, планирование, решение проблем).
  • Конкретные ниши: E-commerce, путешествия, недвижимость и любые ниши, требующие многофакторного выбора.
  • Интерфейсы: Критически важно для голосового поиска и виртуальных ассистентов, где ожидается диалоговый контекст.

Когда применяется

Алгоритм активируется при выполнении условий, указывающих на продолжение поисковой сессии:

  • Триггер 1 (Семантический): Когда рассчитанная семантическая схожесть между текущим и предыдущим запросом превышает порог. Это измеряется расстоянием между их embeddings в latent space.
  • Триггер 2 (Лингвистический): Когда система обнаруживает linking grammar или link back phrase в текущем запросе (например, пользователь говорит «А как насчет красных?» после поиска «кроссовки Nike»).
  • Вспомогательное условие (Временная близость): Если запросы поданы последовательно или в течение короткого интервала времени, это усиливает сигнал о наличии связи, даже если семантическая схожесть умеренная.

Пошаговый алгоритм

Процесс обработки запроса и поддержания состояния

  1. Получение текущего запроса: Система получает новый запрос от пользователя (например, голосовой ввод).
  2. Извлечение предыдущих запросов: Система извлекает один или несколько самых последних запросов из истории сессии.
  3. Сравнение и анализ схожести:
    • Метод А (Семантический): Генерация embeddings для запросов. Расчет расстояния в latent space.
    • Метод Б (Грамматический): Применение linking grammars для поиска фраз обратной связи.
    • Учет времени: Корректировка порогов схожести на основе временной близости.
  4. Определение Shared Line of Inquiry: Принятие решения о связи запросов (превышение порога схожести или наличие грамматической связи).
  5. (Опционально) Запрос подтверждения: Система может спросить пользователя о входе в режим stateful search.
  6. Извлечение и взвешивание параметров: Идентификация ключевых терминов и ограничений из всех связанных запросов. Система может назначать веса (обязательный, опциональный, высокая/низкая важность).
  7. Формулирование Combined Search Query: Объединение параметров в единый запрос.
  8. Выполнение поиска: Отправка комбинированного запроса в поисковую систему.
  9. Отображение результатов и интерфейса: Предоставление результатов и (опционально) интерактивных tokens, представляющих активные параметры.
  10. Обработка взаимодействия и Обучение (Уточнение): Мониторинг действий пользователя с tokens (например, вычеркивание). Эта обратная связь используется для формулирования обновленного запроса и для обучения функции схожести (Similarity Learning).

Какие данные и как использует

Данные на входе

  • Лингвистические данные: Текст текущего и предыдущих запросов. Анализируется семантика терминов и грамматические структуры (linking grammars).
  • Поведенческие факторы (Сессия и Взаимодействие): История поисковых запросов в рамках текущей сессии. Взаимодействие пользователя с интерфейсом (манипуляции с tokens — добавление, удаление/вычеркивание). Эта обратная связь используется для немедленного уточнения запроса и для машинного обучения.
  • Временные факторы: Время, прошедшее между последовательными запросами. Временная близость используется как сигнал для определения связи.

Какие метрики используются и как они считаются

  • Measure of Semantic Similarity (Мера семантической схожести): Ключевая метрика для определения связи между запросами.
  • Distance in Latent Space (Расстояние в латентном пространстве): Основной способ расчета семантической схожести. Запросы преобразуются в embeddings с помощью моделей (например, энкодера). Вычисляется расстояние между ними; меньшее расстояние соответствует большей схожести.
  • Parameter Weights (Веса параметров): Система может назначать веса параметрам (Mandatory, Optional High/Low Importance). Веса могут определяться на основе семантической схожести терминов, частоты запросов или связей в графе знаний.
  • Алгоритмы машинного обучения (Similarity Function): Используются модели для генерации embeddings и функции схожести. Патент упоминает Similarity Learning: эти функции обучаются на основе взаимодействия пользователя. Если пользователь отвергает комбинированный запрос, модель учится размещать похожие запросы дальше друг от друга в latent space.

Выводы

  1. Поиск становится сессионным (Stateful Search): Google активно развивает механизмы для поддержания контекста в рамках поисковой сессии. Поиск рассматривается не как набор изолированных событий, а как непрерывная «линия исследования» (shared line of inquiry).
  2. Два пути определения связи: Система использует два дополняющих друг друга метода: (1) неявный семантический анализ через embeddings и расстояние в latent space, и (2) явные лингвистические сигналы (linking grammars), такие как фразы уточнения.
  3. Автоматическое уточнение запроса: Система может автоматически усложнять запрос пользователя, добавляя параметры из предыдущих шагов сессии. Это критически важно для развития голосового поиска и диалоговых интерфейсов.
  4. Временной контекст важен: Близость запросов по времени является усиливающим сигналом для их объединения, даже при умеренной семантической схожести.
  5. Прозрачность и контроль пользователя: Патент предусматривает механизмы контроля. Пользователю могут показываться активные параметры (tokens), и он может ими управлять (например, использовать вычеркивание для исключения).
  6. Обучение на обратной связи (Similarity Learning): Взаимодействие пользователя с результатами и параметрами используется как обучающий сигнал для улучшения моделей машинного обучения, ответственных за генерацию embeddings и оценку схожести.

Практика

Best practices (это мы делаем)

  • Оптимизация под поисковые сессии (User Journey Optimization): Необходимо сместить фокус с отдельных ключевых слов на покрытие целых тем (Topical Authority) и сценариев поиска. Контент должен быть структурирован так, чтобы отвечать на естественное развитие запроса пользователя — от общего к частному.
  • Проработка глубины и детализации контента: Создавайте контент, который покрывает не только базовый интент, но и последующие уточняющие вопросы (follow-up questions) и атрибуты. Это позволит сайту оставаться релевантным по мере того, как Google автоматически усложняет запрос пользователя (Combined Search Query).
  • Улучшение информационной архитектуры и перелинковки: Четкая связь между обзорными и детальными страницами помогает соответствовать прогрессивному уточнению запросов.
  • Использование структурированных данных (для E-commerce): Полная разметка атрибутов товара (цвет, функции, совместимость) критична, так как именно эти атрибуты становятся параметрами в комбинированном запросе во время покупательской сессии.

Worst practices (это делать не надо)

  • Фокус только на высокочастотных общих запросах: Стратегия, направленная только на широкие запросы без проработки деталей, приведет к потере трафика на следующих этапах сессии пользователя, когда Google применит уточняющие параметры.
  • Создание поверхностного контента (Thin Content): Контент, который не предоставляет достаточной детализации или не покрывает смежные аспекты темы, будет неэффективен в рамках stateful search, так как не сможет ответить на сложные комбинированные запросы.
  • Игнорирование диалоговых форматов и естественного языка: Поскольку механизм активно используется в голосовом поиске, игнорирование оптимизации под естественные формулировки и диалоговые интенты является упущенной возможностью.

Стратегическое значение

Патент подтверждает стратегический курс Google на контекстно-зависимый и сессионный поиск. Он подчеркивает важность понимания того, как Google использует embeddings для оценки семантических связей не только между контентом, но и между запросами пользователя в динамике. Долгосрочная SEO-стратегия должна быть направлена на понимание полного цикла исследования пользователя в нише (Task Completion) и обеспечение присутствия на всех его этапах.

Практические примеры

Сценарий: Исследование продукта в E-commerce (Наушники)

  1. Начало сессии (Q1): Пользователь вводит «Bluetooth наушники».
  2. Уточнение типа (Q2): Пользователь говорит: «Вообще-то, мне нужны полностью беспроводные (true wireless)».
  3. Действие Google (Анализ Q2): Система распознает linking grammar («Вообще-то, мне нужны...»). Она определяет, что Q1 и Q2 связаны (shared line of inquiry).
  4. Комбинированный запрос 1: Google выполняет поиск по «True wireless Bluetooth наушники».
  5. Уточнение функции (Q3): Пользователь спрашивает: «Какие из них с шумоподавлением?».
  6. Действие Google (Анализ Q3): Система определяет высокую семантическую схожесть (через embeddings) между Q3 и контекстом предыдущих запросов.
  7. Комбинированный запрос 2: Google выполняет поиск по «True wireless Bluetooth наушники с шумоподавлением».
  8. SEO-применение: Чтобы выиграть в этой сессии, сайт должен иметь контент (например, детальную страницу категории или обзор), который точно соответствует всем трем параметрам. Если сайт оптимизирован только под «Bluetooth наушники», он исчезнет из выдачи на шаге 4 или 7.

Вопросы и ответы

Как именно система определяет, что два запроса связаны? Описано ли это детально?

В патенте описаны два основных механизма. Первый — семантическая схожесть: запросы преобразуются в embeddings, и измеряется расстояние между ними в latent space. Если расстояние меньше порога, запросы связаны. Второй — linking grammars: система ищет явные лингвистические конструкции (например, «а какие из них...», «вообще-то, я имел в виду...»), которые указывают на уточнение предыдущего запроса.

Что такое «расстояние в латентном пространстве» (Distance in Latent Space) и как оно используется?

Это математическая мера различия между двумя векторными представлениями (embeddings) запросов. Google использует модели машинного обучения для преобразования текста запроса в вектор. Расстояние между этими векторами используется как прокси для семантической схожести: чем ближе векторы, тем более схожими по смыслу считаются запросы, что позволяет системе связать их в одну shared line of inquiry.

Влияет ли время между запросами на их объединение?

Да, патент указывает, что временная близость является важным сигналом. Запросы, поданные последовательно или в течение короткого интервала, с большей вероятностью будут считаться связанными. Это может снизить порог требуемой семантической схожести для их объединения.

Как этот патент влияет на стратегию построения Topical Authority?

Он значительно повышает важность Topical Authority. Поскольку система стремится поддерживать пользователя на протяжении всей исследовательской сессии, сайт должен быть способен отвечать на весь спектр связанных запросов — от общих до очень специфических. Если сайт покрывает тему неглубоко, он потеряет пользователя, как только система начнет применять уточняющие комбинированные запросы.

Применяется ли этот механизм только в голосовом поиске?

Хотя патент часто упоминает голосовой ввод и виртуальных ассистентов как основную мотивацию (так как там сложно вручную управлять фильтрами), описанные механизмы применимы и к традиционному текстовому поиску в браузере. Система может использоваться в любом интерфейсе для поддержания контекста сессии.

Пользователь видит, что Google объединил его запросы?

Патент предусматривает такую возможность. В Claim 8 описано предоставление пользователю списка активных поисковых параметров (tokens). Эти токены могут быть интерактивными, позволяя пользователю видеть текущее состояние комбинированного запроса и модифицировать его (например, удалять параметры).

Что означает «вычеркивание токенов» (striking through tokens), упомянутое в патенте?

Это пример взаимодействия пользователя с интерфейсом для управления комбинированным запросом. Если пользователь «вычеркивает» (например, свайпом) отображаемый параметр (токен) или элемент результата поиска, система интерпретирует это как команду исключения. Параметр либо удаляется из запроса, либо к нему добавляется оператор NOT, создавая негативное ограничение для следующего поиска.

Все ли параметры из предыдущих запросов имеют одинаковый вес в комбинированном запросе?

Нет. Патент описывает возможность классификации параметров как обязательных (Mandatory) или опциональных (Optional), а также присвоения им разной степени важности (High/Low Importance). Веса могут определяться на основе семантического анализа, частоты использования или других факторов.

Использует ли Google обратную связь от пользователя для обучения этой системы?

Да, это важный аспект. Патент упоминает Similarity Learning. Если пользователь негативно реагирует на результаты комбинированного запроса (например, быстро покидает выдачу) или вручную корректирует параметры, эта обратная связь используется для обучения модели (например, энкодера), генерирующей embeddings. Это позволяет системе точнее определять семантическую схожесть в будущем.

Что делать SEO-специалисту, чтобы оптимизировать сайт под Stateful Search?

Необходимо анализировать не только отдельные запросы, но и типичные пути пользователя (User Journeys) в вашей нише. Убедитесь, что ваш контент покрывает все этапы исследования — от осознания проблемы до сравнения решений. Структурируйте контент так, чтобы он естественно отвечал на прогрессивно усложняющиеся запросы, которые Google будет генерировать автоматически.

Похожие патенты

Как Google концептуализирует поиск в виде диалоговых тредов для итеративного уточнения запросов
Патент Google описывает интерфейс, который организует поисковые сессии в виде диалоговых тредов (Search Threads). Система интерпретирует последовательные сообщения пользователя как единое, эволюционирующее намерение, позволяя итеративно уточнять критерии. Интерфейс предназначен для управления сложной историей поиска, совместной работы и отслеживания обновлений.
  • US9069825B1
  • 2015-06-30
  • Семантика и интент

Как Google использует архитектуру «Generative Companion» для ведения диалогового поиска с сохранением контекста и выбора специализированных LLM (SGE)
Google патентует архитектуру диалогового поиска («Generative Companion»), которая поддерживает состояние пользователя (контекст, историю запросов и взаимодействий) на протяжении всей сессии. Система использует начальную LLM для генерации «синтетических запросов», классифицирует намерение пользователя на основе текущего состояния и динамически выбирает специализированные «Downstream LLM» (для суммаризации, креатива или уточнения) для формирования финального генеративного ответа.
  • US20240289407A1
  • 2024-08-29
  • Персонализация

  • Семантика и интент

Как Google использует контекст поисковой сессии для исправления ошибок и уточнения запросов пользователя
Google использует механизм для интеллектуального исправления ошибок в запросах (опечаток или неверно употребленных слов), опираясь на контекст текущей поисковой сессии. Вместо стандартного исправления по словарю, система анализирует предыдущие запросы пользователя, чтобы понять его намерение, и предлагает вариант исправления, который соответствует теме поиска.
  • US7953746B1
  • 2011-05-31
  • Семантика и интент

  • Персонализация

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса
Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.
  • US8392443B1
  • 2013-03-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Популярные патенты

Как Google рассчитывает «VisualRank» для изображений и медиафайлов, используя виртуальные ссылки на основе схожести и поведения пользователей
Google использует алгоритм (концептуально называемый VisualRank) для ранжирования изображений и других медиафайлов путем создания «виртуальных ссылок» между ними. Эти ссылки основаны на визуальной схожести контента, данных о кликах пользователей и контексте размещения (URL analysis). Это позволяет оценить качество и авторитетность медиафайлов даже без явных гиперссылок, при этом система активно избегает показа слишком похожих (дублирующихся) результатов.
  • US8732187B1
  • 2014-05-20
  • Ссылки

  • Мультимедиа

  • Поведенческие сигналы

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

seohardcore