Как Google использует нейронные сети (Pairwise Learning-to-Rank) для предсказания, какой документ пользователь откроет следующим в Google Drive или Workspace

RECOMMENDING A DOCUMENT FOR A USER TO ACCESS (Рекомендация документа для доступа пользователя)

US10832130B2
Google LLC
2017-04-05
2020-11-10

Google использует специализированную нейронную сеть для предсказания, какие документы пользователь захочет открыть следующими в сервисах типа Google Drive. Система анализирует историю взаимодействий (редактирование, просмотры, комментарии) и временные паттерны. Результаты ранжируются с помощью модели парного обучения (Pairwise Learning-to-Rank), и для каждого документа предлагается «мотив» (причина рекомендации).

Какую проблему решает

Патент решает проблему быстрого доступа к нужным документам в рамках закрытой системы хранения файлов (например, Google Drive или Workspace), особенно на устройствах с маленьким экраном. Цель — предсказать, какой документ пользователь захочет открыть следующим, и предложить его, избавляя пользователя от ручного поиска. Также решается проблема задержки (latency) при получении рекомендаций от сервера за счет показа локально сгенерированного предложения.

Патент не устраняет уязвимости веб-поиска или SEO-манипуляции, так как описывает систему рекомендаций внутренних документов, а не ранжирование веб-страниц.

Что запатентовано

Запатентован метод обучения нейронной сети для ранжирования документов на основе вероятности их открытия пользователем. Ключевым элементом является использование архитектуры Pairwise Learning-to-Rank (парное обучение ранжированию). Сеть обучается на парах векторов: один представляет документ, который был открыт в определенном контексте, а другой — документ, который не был открыт в том же контексте. Также система предоставляет рекомендации вместе с «мотивами» (motives) — причинами, почему документ был предложен.

Как это работает

Система работает в двух режимах: обучение и предсказание.

Обучение (Офлайн): Система анализирует исторические данные о взаимодействии пользователя с документами. Создаются пары документов (открытый vs. не открытый) в одинаковом контексте. Для каждого генерируется вектор признаков (Feature Vector), включающий данные о времени доступа, типе взаимодействия и т.д. Эти пары подаются в нейронную сеть (архитектура типа Siamese Network), которая учится предсказывать, какой из двух документов более вероятно будет открыт, минимизируя ошибку ранжирования.
Предсказание (Онлайн): Когда пользователь открывает приложение, клиент запрашивает у сервера список рекомендаций. Сервер применяет обученную модель к текущему контексту и генерирует оценки (scores) вероятности открытия для документов пользователя. Топ-N документов выбираются, для них определяются «мотивы», и этот набор отправляется клиенту.

Актуальность для SEO

Высокая для продуктов Google Workspace и Google Drive. Технологии предсказания следующего действия пользователя и персонализированные рекомендации активно развиваются. Описанный механизм, вероятно, лежит в основе функции «Быстрый доступ» (Quick Access) в Google Drive. Актуальность для веб-поиска (SEO) низкая.

Важность для SEO

1/10 (Минимальное/Инфраструктура). Патент имеет минимальное значение для традиционного SEO. Он НЕ описывает алгоритмы ранжирования веб-страниц в Google Поиске. Он строго сфокусирован на предсказании поведения пользователя в закрытых системах управления документами.

Ценность для Senior SEO-специалистов заключается только в концептуальном понимании того, как Google использует сложные архитектуры машинного обучения (Pairwise LTR, Siamese Networks) для задач ранжирования и какие типы поведенческих и временных признаков используются для предсказания намерений пользователя.

Термины и определения

Client-suggested document (Документ, предложенный клиентом): Документ, выбранный локально на устройстве пользователя (например, самый последний открытый файл) для немедленного отображения в интерфейсе, пока ожидается ответ от сервера. Используется для снижения видимой задержки (latency).
Feature Vector (Вектор признаков): Численное представление документа и его контекста. Включает множество признаков, описывающих историю взаимодействия пользователя (и других лиц) с этим документом, временные метки, частоту доступа и т.д.
Motive / Potential Motive (Мотив / Потенциальный мотив): Объяснение, предоставляемое пользователю, почему система рекомендует данный документ (например, «Редактировали вчера» или «Открывали на прошлой неделе в это время»).
Pairwise Learning-to-Rank (Парное обучение ранжированию): Подход в машинном обучении, где модель обучается определять, какой из двух документов более релевантен (или, как в данном патенте, более вероятно будет открыт).
Siamese Network (Сиамская нейронная сеть): Архитектура нейронной сети (подразумевается в патенте, см. FIG. 7), состоящая из двух или более идентичных подсетей с общими весами. Используется для сравнения двух разных входных векторов.
Specific Context (Специфический контекст): Состояние системы и пользователя в момент совершения действия (открытия документа). Включает время, день недели, недавно открытые документы и другие ситуативные факторы.

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе обучения нейронной сети для задачи рекомендации документов.

Claim 1 (Независимый пункт): Описывает метод обучения нейронной сети для определения оценок документов.

Определение первой оценки (Score 1) для первого вектора (Vector 1), представляющего документ, который БЫЛ выбран пользователем в специфическом контексте. Вектор включает индикацию того, редактировал ли пользователь документ.
Процесс включает подачу Vector 1 через специфическую архитектуру NN: Входной эндпоинт (n измерений) -> Скрытый слой (m измерений) -> Агрегирующий слой (1 измерение).
Определение второй оценки (Score 2) для второго вектора (Vector 2), представляющего документ, который НЕ был выбран в том же контексте.
Процесс использует ту же архитектуру для Vector 2.
Определение значения ошибки (Error Value) на основе функции, включающей обе оценки (Score 1 и Score 2).
Модификация нейронной сети на основе значения ошибки.

Claim 6 (Зависимый от 1): Определяет функцию ошибки как $\delta=1/(1+exp(S_{W}-S_{L}))$ , где $S_{W}$ — оценка «победителя» (открытого документа), а $S_{L}$ — оценка «проигравшего» (не открытого документа). Это вариант функции логистических потерь, используемый для оптимизации ранжирования (похож на RankNet).

Claim 17 (Независимый пункт): Аналогичен Claim 1, но добавляет ключевую деталь к шагу определения ошибки: функция сравнивает векторы дважды, меняя их порядок во втором сравнении. Это технический прием для устранения «сбоев комплементарности» (complementarity failures), когда результат сравнения A>B не гарантирует, что при обратном сравнении будет B

Где и как применяется

Изобретение применяется в системах рекомендации документов (например, Google Drive, Workspace) и не относится к архитектуре веб-поиска Google. Однако, если адаптировать этапы поиска к системе рекомендаций:

INDEXING (Индексирование и извлечение признаков)
На этом этапе происходит сбор и обработка данных о взаимодействии пользователей с документами. Система логирует все события (открытия, редактирования, комментарии, шеринг) и контекст этих событий (время). Из этих логов офлайн генерируются Feature Vectors для каждого документа в различных контекстах.

RANKING (Ранжирование)
Это основной этап применения патента в режиме реального времени. Когда поступает запрос на рекомендацию, система использует обученную нейронную сеть для оценки (скоринга) документов пользователя. Нейронная сеть выступает в роли функции ранжирования, определяя вероятность открытия каждого документа в текущем контексте.

RERANKING / Presentation (Переранжирование и Представление)
На этом этапе происходит несколько действий:

Сортировка: Документы сортируются по полученным оценкам.
Выбор мотивов: Система выбирает Motive для каждого из Топ-N документов. Выбор мотива может быть основан на эвристиках или оптимизирован для максимизации вовлеченности.
Смешивание (Blending): Результаты от сервера объединяются с Client-suggested document (если он был сгенерирован локально для снижения задержки).

Входные данные:

Запрос от клиентского устройства.
Текущий контекст пользователя (время, день недели).
Feature Vectors документов, связанных с аккаунтом пользователя.

Выходные данные:

Отсортированный список рекомендуемых документов.
Motive для каждого рекомендованного документа.

На что влияет

Типы контента и ниши: Влияет на все типы документов, хранящихся в системе (текстовые файлы, таблицы, презентации, изображения).
Специфические запросы: Применяется не к поисковым запросам, а к ситуации доступа к хранилищу (например, открытие главной страницы Google Drive).

Когда применяется

Триггеры активации: Запуск пользователем приложения для доступа к документам или переход на главную страницу сервиса.
Условия работы: Наличие достаточного количества синхронизированных документов и истории взаимодействия для генерации надежных предсказаний.

Пошаговый алгоритм

Процесс А: Обучение модели (Офлайн)

Сбор данных: Агрегация исторических данных о доступе к документам (Historical input data).
Генерация примеров: Извлечение событий и определение контекста. Генерация Feature Vectors для документов.
Маркировка: Присвоение меток документам: 1 (открыт в данном контексте) или 0 (не открыт).
Формирование пар: Создание пар векторов (Vector 1, Vector 2) в одном контексте, где один документ был открыт (Winner, W), а другой нет (Loser, L).
Итеративное обучение (Training Loop):
1. Подача Vector W на первую башню нейронной сети (Input 1 -> Hidden 1 -> Aggregation 1) для получения оценки $S_{W}$ .
2. Подача Vector L на вторую башню нейронной сети (Input 2 -> Hidden 2 -> Aggregation 2) для получения оценки $S_{L}$ . (Веса между башнями общие).
3. Вычисление ошибки: $\delta=1/(1+exp(S_{W}-S_{L}))$ .
4. Модификация сети: Обратное распространение ошибки (Backpropagation). Ошибка +δ идет через башню W, ошибка -δ идет через башню L.
Валидация: Проверка модели на тестовых данных (Test Examples).

Процесс Б: Генерация рекомендаций (Онлайн)

Запрос: Клиент отправляет запрос на сервер.
Локальное предложение (Опционально): Клиент немедленно определяет Client-suggested document (например, самый последний файл) и показывает его.
Генерация признаков: Сервер генерирует Feature Vectors для документов пользователя с учетом текущего контекста.
Скоринг: Сервер использует обученную модель (только одну башню сети) для расчета оценки вероятности открытия для каждого вектора.
Ранжирование: Документы сортируются по оценкам.
Выбор мотивов: Для Топ-N документов выбирается наилучший Motive из списка приоритетов.
Ответ: Сервер отправляет список документов и мотивов клиенту.
Отображение: Клиент обновляет интерфейс, показывая полученные рекомендации и мотивы.

Какие данные и как использует

Данные на входе

Система использует детальные данные о взаимодействии пользователя с его документами для формирования Feature Vectors. Патент не использует традиционные SEO-факторы (ссылки, контент веб-страниц).

Поведенческие факторы (User Interaction):
- Открытие/доступ к документу.
- Редактирование документа пользователем (явно указано в Claim 1).
- Комментирование документа пользователем.
- Создание или загрузка (upload) документа пользователем.
- Частота доступа к документу.
Временные факторы (Temporal Context):
- Время последнего доступа/редактирования (Recency).
- Временные паттерны: доступ в определенное время дня, день недели, день месяца.
- Периодичность доступа (например, каждую неделю в одно и то же время).
Контекстуальные факторы (Context/Social):
- Действия других пользователей: шеринг документа с пользователем, упоминания, редактирование или комментирование другими.
- Наличие неразрешенных (outstanding) комментариев.
- Связь документа с предстоящими событиями в календаре пользователя.
- Связь документа с другими недавно использованными документами.
Общая активность пользователя:
- Количество созданных документов/папок за период.
- Количество соавторов (collaborators).

Какие метрики используются и как они считаются

Labels (Метки): Бинарные значения (1 или 0), указывающие, был ли документ открыт пользователем в Specific Context. Используются для обучения.
Ranking Score (Оценка ранжирования): Числовое значение (например, от 0 до 1), генерируемое нейронной сетью, указывающее на вероятность того, что пользователь откроет документ следующим.
Error Value (Значение ошибки $\delta$ ): Рассчитывается во время обучения на основе разницы оценок между «победителем» и «проигравшим» в паре. Формула (Claim 6): $\delta=1/(1+exp(S_{W}-S_{L}))$ .
Алгоритмы машинного обучения: Используется нейронная сеть с архитектурой, напоминающей Siamese Network, обученная с помощью Pairwise Learning-to-Rank. Упоминаются слои ReLU (Rectified Linear Unit) и линейные слои.

Патент не относится к веб-поиску: Описанные механизмы предназначены для систем управления документами (Google Drive/Workspace) и не применимы к ранжированию сайтов в интернете. Практических выводов для SEO, направленных на улучшение позиций сайта в поиске, из этого патента сделать нельзя.
Продвинутые методы ML для ранжирования: Патент демонстрирует использование сложных архитектур машинного обучения (Siamese Networks) и методологии Pairwise Learning-to-Rank для задач ранжирования. Это подтверждает, что Google применяет LTR для определения порядка элементов, основываясь на предсказании поведения пользователя.
Детальное профилирование поведения: Для предсказания намерений Google использует очень гранулярные данные о поведении пользователя. Feature Vectors включают не только факт взаимодействия, но и его тип (редактирование, комментарий), точное время, частоту и социальный контекст (действия соавторов).
Важность временных паттернов: Система активно использует временные сигналы (время дня, день недели, периодичность) для предсказания релевантности документа в конкретный момент.
«Мотивы» как фактор вовлечения: Google не просто ранжирует контент, но и предоставляет объяснения (Motives) своим рекомендациям. Это важно для повышения доверия к системе и увеличения вероятности клика (engagement).

Best practices (это мы делаем)

Патент описывает внутренние процессы системы рекомендаций документов и не дает прямых рекомендаций для SEO-специалистов, работающих с веб-поиском. Практических действий для улучшения ранжирования сайтов на основе этого патента нет.

Worst practices (это делать не надо)

Не применимо. Патент не описывает механизмы борьбы со спамом или манипуляциями в веб-поиске.

Стратегическое значение

Стратегическое значение патента для SEO минимально. Он важен для понимания того, как работают рекомендательные системы внутри экосистемы Google (Drive, Workspace), и дает представление об уровне сложности моделей машинного обучения, которые Google использует для задач ранжирования и предсказания поведения. Он подтверждает общий тренд на персонализацию и использование AI для интерпретации сложных поведенческих сигналов.

Практические примеры

Практических примеров для SEO нет, так как патент не относится к веб-поиску. Ниже приведен пример работы системы в контексте Google Drive.

Сценарий: Рекомендация отчета в Google Drive

Контекст: Пользователь открывает Google Drive в понедельник в 9:00 утра.
Анализ (Сервер): Нейронная сеть анализирует Feature Vectors документов пользователя. Вектор документа «Еженедельный отчет» имеет высокие значения в признаках, связанных с понедельником утром, недавним редактированием соавторами и наличием новых комментариев.
Скоринг: Модель присваивает «Еженедельному отчету» наивысшую оценку вероятности открытия.
Выбор мотива: Система проверяет список мотивов. Условие «Новые комментарии» выполняется и имеет высокий приоритет.
Результат: Пользователь видит «Еженедельный отчет» на первом месте в блоке рекомендаций с подписью (Motive) «Новые комментарии».

Описывает ли этот патент алгоритмы ранжирования Google Поиска?

Нет. Патент строго сфокусирован на системе рекомендации документов, которые пользователь уже имеет в своем хранилище (например, Google Drive или Workspace). Он предсказывает, какой из существующих документов пользователь захочет открыть следующим. Механизмы ранжирования веб-сайтов в Google Поиске здесь не рассматриваются.

Что такое Pairwise Learning-to-Rank, описанный в патенте?

Это подход к обучению ранжированию, где модель учится на парах объектов. В данном случае система берет два документа в одном и том же контексте: тот, который пользователь открыл («победитель»), и тот, который не открыл («проигравший»). Модель оптимизируется так, чтобы предсказывать более высокую оценку для «победителя», чем для «проигравшего». Это позволяет эффективно обучать модель ранжированию.

Что такое Siamese Network и как она используется здесь?

Хотя термин явно не используется, архитектура на FIG. 7 является классической сиамской сетью. Она состоит из двух идентичных подсетей (башен) с общими весами. Каждая башня обрабатывает один из документов в паре, генерируя его оценку. Затем эти оценки сравниваются для вычисления ошибки. Это позволяет эффективно сравнивать два объекта, используя одну и ту же функцию оценки.

Что такое «Мотивы» (Motives) и зачем они нужны?

Мотивы — это короткие текстовые объяснения, почему система рекомендует тот или иной документ (например, «Вы редактировали это вчера»). Они служат для повышения прозрачности работы системы и увеличения вовлеченности пользователя. Патент предполагает, что показ правильного мотива может увеличить вероятность того, что пользователь воспользуется рекомендацией.

Как система определяет, какой мотив показать?

Патент описывает несколько подходов. Один из них — использование упорядоченного списка мотивов. Система проверяет критерии для каждого мотива по порядку и выбирает первый подходящий. Также упоминается возможность выбора мотива, который максимизирует вероятность открытия документа, основываясь на исторических данных о том, какие мотивы лучше работали для данного пользователя.

Какие данные использует система для предсказания?

Система использует очень подробные векторы признаков (Feature Vectors). Они включают типы взаимодействий (редактирование, просмотр, комментирование, загрузка), временные паттерны (время дня, день недели, периодичность), социальные сигналы (действия соавторов, шеринг) и связь с другими событиями (например, календарем).

Что такое Client-suggested document?

Это механизм для борьбы с задержкой сети. Пока устройство ждет ответа от сервера с ML-рекомендациями, оно может быстро сгенерировать локальное предложение (например, показать самый последний открытый файл). Это гарантирует, что пользователь сразу увидит хоть какую-то рекомендацию.

Какова формула функции ошибки, используемая при обучении?

Патент указывает формулу (Claim 6): $\delta=1/(1+exp(S_{W}-S_{L}))$ . Это вариант функции логистических потерь, где SW — оценка для открытого документа, а SL — для не открытого. Модель стремится максимизировать разницу между SW и SL.

Что такое «сбои комплементарности» и как система с ними борется?

Это ситуация, когда модель предсказывает, что Документ А лучше Документа Б, но если поменять их местами на входе, она также предсказывает, что Документ Б лучше Документа А. Для решения этой проблемы патент (Claim 17) предлагает проводить сравнение дважды, меняя порядок векторов при втором сравнении, чтобы обеспечить согласованность результатов.

Какую пользу этот патент несет Senior SEO-специалисту?

Прямой пользы для ранжирования сайтов нет. Однако патент полезен для расширения кругозора в области Information Retrieval и Machine Learning. Он детально описывает архитектуру и процесс обучения сложной системы ранжирования на основе поведенческих данных, что дает представление о технических возможностях Google в этой области.

Как Google создает семантические векторы (эмбеддинги) для понимания смысла целых документов (Doc2Vec)

Патент описывает нейросетевой метод (известный как Doc2Vec) для преобразования документов любой длины в числовые векторы (эмбеддинги). Эти векторы фиксируют семантику и контекст всего документа, позволяя системе понимать смысл контента, классифицировать его и находить похожие документы, даже если в них используются разные слова.

US20150220833A1
2015-08-06

Семантика и интент

Как Google использует архитектуру нейронных сетей «Two-Tower» для семантического поиска и оценки контента

Google использует модель с двумя отдельными нейронными сетями (Two-Tower Model) для понимания семантической релевантности между запросами и контентом. Одна сеть обрабатывает запрос, другая — контент, преобразуя их в векторы (embeddings). Релевантность определяется близостью этих векторов, а не совпадением ключевых слов. Эта архитектура позволяет Google предварительно вычислять векторы для всего контента во время индексации, обеспечивая быстрый семантический поиск в реальном времени.

US11188824B2
2021-11-30

Семантика и интент
Индексация

Как Google обучает модели ранжирования, сравнивая результаты из разных, но похожих запросов (Cross-List Learning to Rank)

Google использует метод обучения моделей ранжирования, который выходит за рамки одного поискового запроса. Система сравнивает релевантность документа для Запроса А с релевантностью другого документа для Запроса Б, если эти запросы семантически похожи. Это позволяет моделям лучше обобщать сигналы релевантности внутри тематических кластеров и эффективнее определять порядок результатов.

US12314275B2
2025-05-27

Семантика и интент

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы

Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.

US11782998B2
2023-10-10

Семантика и интент
Индексация
Мультимедиа

Как Google обучает модели машинного обучения для персонализации поиска при недостатке данных о пользователе

Этот патент описывает продвинутую технику машинного обучения, используемую Google для комбинирования различных типов сигналов (запрос, история пользователя, контекст) при ранжировании. Он использует метод иерархического взвешивания (тензорные произведения и слои), который гарантирует точность системы, даже если часть информации (например, история пользователя) отсутствует, отдавая приоритет фундаментальной релевантности над сложными взаимодействиями.

US9122986B2
2015-09-01

Персонализация
Поведенческие сигналы

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста

Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.

US7260573B1
2007-08-21

Персонализация
Ссылки

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования

Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.

US8832083B1
2014-09-09

Поведенческие сигналы
SERP

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче

Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.

US8392429B1
2013-03-05

Ссылки
SERP
EEAT и качество

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче

Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.

US9002832B1
2015-04-07

Ссылки
Антиспам
SERP

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента

Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.

US8412699B1
2013-04-02

Свежесть контента
Поведенческие сигналы
SERP

Как Google использует околоссылочный текст и заголовки (Web Quotes) для индексирования страниц и генерации сниппетов

Google анализирует текст на страницах, ссылающихся на целевой документ, извлекая «Web Quotes». Это не только текст абзаца, окружающего ссылку, но и текст из ближайших заголовков. Эти цитаты ранжируются по качеству ссылающегося источника (например, PageRank) и используются для индексирования целевой страницы (даже если этих слов на ней нет) и для формирования сниппета в результатах поиска.

US8495483B1
2013-07-23

Индексация
Ссылки
SERP

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска

Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.

US8959083B1
2015-02-17

Персонализация
Поведенческие сигналы
SERP

Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя

Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.

US9116952B1
2015-08-25

Семантика и интент
Поведенческие сигналы

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных

Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.

US9128945B1
2015-09-08

SERP
Поведенческие сигналы
EEAT и качество

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи

Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.

US8458171B2
2013-06-04

Семантика и интент
SERP
Поведенческие сигналы