Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи

USING MODELS TO ANNOTATE SEARCH QUERIES (Использование моделей для аннотирования поисковых запросов)

US20150012558A1
Google LLC
2013-07-02
2015-01-08

Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.

Какую проблему решает

Патент решает задачу понимания неявного намерения пользователя (Implicit Intent), особенно когда он ищет личную информацию без явного указания (например, вводит [airline] вместо [my flights on airline]). Система улучшает точность интерпретации запроса путем устранения неоднозначности на основе личного контекста пользователя (например, понимая, что [Max] — это контакт пользователя, а не математическая функция). Это также позволяет экономить вычислительные ресурсы за счет определения намерения до выполнения дорогостоящих поисковых операций по личным данным.

Что запатентовано

Запатентована система для генерации персонализированной модели пользователя (User Model) и её использования для аннотирования поисковых запросов. User Model создается на основе контента, сгенерированного пользователем (user-generated content) в различных сервисах (почта, контакты, соцсети). Модель содержит извлеченные термины (n-grams), аннотированные контекстом их использования. Эта модель применяется для определения намерения пользователя (личное или общее) и уточнения запроса для предоставления персонализированных результатов.

Как это работает

Система работает в двух режимах:

Офлайн (Создание модели): Система извлекает n-grams из личного контента пользователя, фильтрует стоп-слова, аннотирует термины контекстом (например, «имя», «дата», «местоположение») и сохраняет их в User Model с метками свежести.
Онлайн (Обработка запроса): При получении запроса компонент Implicit Intent Trigger обращается к User Model. На основе совпадения терминов, их свежести (Freshness Score) и временного контекста (Interest Window) определяется намерение пользователя. Если обнаружено личное намерение (Personal Intent), компонент Query Annotator уточняет запрос, используя аннотации из модели. Затем система выполняет поиск по аннотированному запросу.

Актуальность для SEO

Высокая. Понимание личного контекста и предоставление проактивных, персонализированных ответов является ядром стратегии Google (например, Google Assistant, интеграция данных Gmail/Workspace в Поиск). Описанные механизмы интерпретации запросов на основе личных данных крайне актуальны для понимания того, как Google обрабатывает запросы аутентифицированных пользователей.

Важность для SEO

Патент имеет значительное влияние на SEO-стратегию (7.5/10). Хотя он фокусируется на личных данных, он критически важен для понимания того, как Google интерпретирует запросы залогиненных пользователей. Система определяет, являются ли органические веб-результаты основным ответом или приоритет отдается личной информации (например, деталям бронирования из почты). Это напрямую влияет на видимость и кликабельность органических результатов в персонализированной выдаче.

Термины и определения

Annotations (Аннотации): Метки, присваиваемые терминам (n-grams) в User Model, указывающие на контекст использования термина. Примеры: имя, фамилия, адрес, человек (Person), объект, тема, дата, время, местоположение (Location). Структурируют данные в модели.
Freshness Score (Оценка свежести): Метрика, связанная с n-gram в User Model, основанная на возрасте исходного контента (например, давности электронного письма). Используется при определении намерения.
General Intent (Общее намерение) / Web-based Intent: Намерение пользователя получить общие результаты поиска (из интернета), не специфичные для его личных данных.
Implicit Intent (Неявное намерение): Истинное намерение пользователя при отправке запроса, определяемое системой без явных указаний со стороны пользователя.
Implicit Intent Trigger (Триггер неявного намерения): Компонент системы, который анализирует запрос и User Model для определения, ищет ли пользователь личные или общие результаты. Рассчитывает Intent Score.
Interest Window (Окно интереса): Период времени между событием в User Model (например, бронированием рейса) и моментом запроса. Используется для определения актуальности личного намерения (например, рейс в ближайшие 24 часа).
N-grams: Последовательности из одного или нескольких терминов, извлеченные из user-generated content и сохраненные в User Model.
Personal Intent (Личное намерение): Намерение пользователя получить персонализированные результаты поиска (personal search results), основанные на его личном контенте.
Query Annotator (Аннотатор запросов): Компонент, который модифицирует входящий запрос, добавляя к его терминам аннотации, взятые из User Model, создавая annotated search query (персональный запрос).
User-Generated Content (Контент, сгенерированный пользователем): Личные данные пользователя из различных сервисов: электронные письма, чаты, контакты, посты в социальных сетях, блоги, документы.
User Model (Модель пользователя): Персонализированная модель данных, специфичная для конкретного пользователя. Содержит n-grams, извлеченные из его личного контента, вместе с аннотациями контекста и оценками свежести.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод использования модели пользователя для аннотирования запроса.

Система получает поисковый запрос от пользователя.
Система обращается к User Model, специфичной для этого пользователя. Модель содержит n-grams, причем термины в них аннотированы контекстом их использования.
Система аннотирует один или несколько терминов в поисковом запросе, используя аннотации из User Model, создавая annotated search query.
Система получает результаты поиска, релевантные аннотированному поисковому запросу.

Ядро изобретения — использование персональной контекстуальной модели (User Model) для модификации (аннотирования) запроса перед поиском.

Claim 2 (Зависимый от 1): Уточняет процесс аннотирования.

Определяется, что термины в запросе соответствуют терминам в n-grams модели пользователя.
Аннотирование происходит с использованием аннотаций, связанных с этими соответствующими терминами в модели.

Это механизм сопоставления запроса с моделью для переноса личного контекста.

Claim 4 (Зависимый от 1): Определяет источник данных для User Model.

N-grams в модели получены из множества документов, связанных с пользователем и сгенерированных с использованием множества компьютерных сервисов (почта, контакты и т.д.).

Claim 6 (Зависимый от 1): Добавляет этап определения намерения.

Система сначала определяет user intent, связанное с запросом. Аннотирование запроса выполняется в ответ на это определенное намерение. Это указывает на то, что аннотирование может быть выборочным и активируется при обнаружении определенного интента (например, Personal Intent, как указано в Claim 7).

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поисковой архитектуры, в основном связанных с обработкой запроса и персонализацией.

INDEXING – Индексирование (Личных данных)
На этом этапе (обычно офлайн или в фоновом режиме) происходит обработка User-Generated Content (почта, контакты и т.д.). Система User Model Generator извлекает n-grams, аннотирует их контекстом и создает User Model. Эти данные сохраняются в хранилище User Models и индексируются в User Content Index.

QUNDERSTANDING – Понимание Запросов
Основной этап применения патента. Когда аутентифицированный пользователь вводит запрос:

Определение намерения: Система (Intent System), в частности Implicit Intent Trigger, анализирует запрос в контексте User Model для определения Implicit Intent (Personal vs General).
Аннотирование запроса: Если обнаружено личное намерение, Query Annotator использует контекстуальные аннотации из User Model для уточнения и обогащения запроса (устранение неоднозначности).

METASEARCH / RERANKING – Метапоиск и Переранжирование
На этом этапе принимается решение о том, как представить результаты пользователю. Если Intent Score для личного намерения высок, персонализированные результаты (из User Content Index) отображаются на более заметных позициях, чем общие веб-результаты (из Search Index), и наоборот.

Входные данные:

Исходный запрос пользователя.
Идентификатор аутентифицированного пользователя.
User Model пользователя (n-grams, аннотации, Freshness Scores).
Текущее время (для расчета Interest Window).
Исторические данные о кликах пользователя (Historical Data).

Выходные данные:

Определенное намерение пользователя (Intent Score).
Аннотированный поисковый запрос (Annotated Search Query).
Набор результатов поиска (персонализированных и/или общих), отсортированных с учетом намерения.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, где личный контекст может радикально изменить интерпретацию (например, [Jaguar] как машина, животное или название кафе, где у пользователя назначена встреча). Также влияет на запросы, связанные с сущностями, известными пользователю лично (имена контактов, названия проектов).
Конкретные типы контента: Влияет на отображение личного контента (письма, документы, события календаря) в результатах поиска.
Временные запросы: Запросы, связанные с предстоящими событиями (путешествия, бронирования, встречи), где срабатывает Interest Window.

Когда применяется

Условия работы: Алгоритм применяется только для аутентифицированных (залогиненных) пользователей, для которых существует User Model и которые дали разрешение на использование их данных для персонализации (как указано в разделе о приватности патента).
Триггеры активации: Активируется, когда термины запроса совпадают с n-grams в User Model.
Пороговые значения: Активация личного поиска зависит от Intent Score, который должен превысить определенный порог. Этот балл рассчитывается на основе качества совпадения, Freshness Score, исторических данных о кликах и того, попадает ли запрос в Interest Window.

Пошаговый алгоритм

Процесс А: Генерация модели пользователя (Офлайн / Фоновый режим)

Сбор данных: Получение доступа к User-Generated Content из различных сервисов (почта, контакты, соцсети, документы).
Извлечение информации: Идентификация потенциально интересных терминов и концепций (например, имен собственных) и генерация n-grams. Фильтрация стоп-слов.
Аннотирование: Анализ контекста использования терминов в исходных документах (например, поле "От кого" в письме, запись в контактах). Присвоение аннотаций (например, 'Person', 'Location', 'Date', 'Sender').
Оценка свежести: Присвоение Freshness Score на основе возраста исходного контента.
Сохранение модели: Сохранение аннотированных n-grams в User Model, специфичной для пользователя.
Обновление: Периодическое обновление модели, удаление устаревших n-grams (чья свежесть ниже порога) или удаление данных при удалении исходного контента пользователем.

Процесс Б: Обработка запроса (Онлайн)

Получение запроса: Получение запроса от аутентифицированного пользователя.
Доступ к модели: Извлечение соответствующей User Model.
Определение намерения (Implicit Intent Trigger):
- Сравнение терминов запроса с n-grams в модели (включая синонимы).
- Расчет оценок совпадения (Closeness of Match). Точное совпадение оценивается выше синонима.
- Учет Freshness Score совпадающих n-grams.
- Анализ Interest Window (близость к событиям).
- Учет исторических данных о кликах пользователя по личным/общим результатам для похожих запросов.
- Расчет итогового Intent Score.
Принятие решения: Сравнение Intent Score с порогами для определения типа интента (Личный, Общий или Смешанный).
Аннотирование запроса (Query Annotator): Если определен Личный или Смешанный интент:
- Идентификация терминов запроса, которые есть в модели.
- Применение аннотаций из модели к терминам запроса (например, запрос [Max] аннотируется как 'Person').
Выполнение поиска: Отправка аннотированного запроса в поисковую систему для получения результатов (из User Content Index и/или Search Index). Может включать сопоставление с грамматическими шаблонами (например, [emails from /Sender/]).
Формирование выдачи: Объединение и ранжирование результатов с учетом определенного намерения (например, показ личных результатов выше при высоком Intent Score).

Какие данные и как использует

Данные на входе

Контентные факторы (Личные / User-Generated Content): Текст, темы и метаданные (отправитель, получатель) электронных писем; данные контактной книги; посты и взаимодействия в социальных сетях; события календаря; личные документы.
Поведенческие факторы: Исторические данные о кликах пользователя (Selection data). Учитывается, выбирал ли пользователь ранее личные или общие результаты в ответ на похожие запросы.
Временные факторы: Возраст личного контента (используется для Freshness Score). Текущее время относительно времени события, упомянутого в личном контенте (используется для Interest Window).
Пользовательские факторы: Идентификатор пользователя для доступа к его персональной User Model.

Какие метрики используются и как они считаются

Intent Score (Оценка намерения): Агрегированная метрика для определения типа интента. Рассчитывается как взвешенная комбинация различных оценок (свежесть, качество совпадения, исторические данные, окно интереса).
Freshness Score (Оценка свежести): Метрика, уменьшающаяся со временем с момента создания исходного контента. Недавний контент имеет более высокий балл и сильнее влияет на интент.
Interest Window (Окно интереса): Временная метрика, основанная на близости времени запроса к времени события. Попадание в окно значительно увеличивает вероятность Personal Intent.
Closeness of Match (Близость совпадения): Оценка того, насколько точно термины запроса совпадают с n-grams в модели (точное совпадение vs синоним).

Персонализация через приватные данные: Google активно создает детализированные профили (User Models) на основе частных данных пользователя (почта, контакты, документы), формируя персональный граф знаний для глубокого понимания его индивидуального контекста.
Контекст и аннотации как ключ к пониманию: Система полагается на аннотации (понимание типа сущности и контекста её использования в личных данных), чтобы устранять неоднозначность запросов в реальном времени. Это подтверждает важность сущностного подхода к поиску.
Динамическое определение интента: Намерение пользователя (Личное vs Общее) определяется динамически. Временные факторы — Freshness (недавняя активность) и Interest Window (предстоящие события) — являются сильными сигналами для активации персонального поиска.
Личные результаты конкурируют с органикой: Если система определяет сильное Personal Intent, персонализированные результаты (например, информация о рейсе из Gmail) могут занять приоритетные позиции, значительно понижая или вытесняя стандартные органические веб-результаты для данного пользователя.
Интерпретация запроса индивидуальна: Один и тот же запрос будет интерпретирован по-разному для разных пользователей (или даже для одного пользователя в разное время) в зависимости от содержания их User Model и текущего временного контекста.

Best practices (это мы делаем)

Использование Email-маркетинга для попадания в User Model: Это ключевая практическая рекомендация. Поощряйте взаимодействие пользователей с вашим брендом через электронную почту (подтверждения заказов, бронирования, информационные рассылки). Это позволяет сущностям вашего бренда (название компании, номера рейсов, названия продуктов) попасть в User Model пользователя. Это увеличивает вероятность того, что при последующих запросах система правильно идентифицирует Personal Intent, связанный с вашим брендом.
Внедрение разметки для писем (Gmail Markup): Для транзакционных писем (бронирования, покупки, события) используйте разметку (например, JSON-LD в письмах). Это помогает Google корректно извлекать и аннотировать данные из писем, что повышает качество User Model и вероятность показа персонализированных блоков (например, статус рейса) в поиске пользователя.
Оптимизация под сущности (Entity Optimization): Хотя патент использует личные данные, описанный механизм аннотирования и контекстуализации подтверждает фокус Google на сущностях. Необходимо продолжать работу над четким определением сущностей на сайте и их взаимосвязей (использование Schema.org), чтобы облегчить системам (как общим, так и персональным) правильную интерпретацию контента.
Анализ неоднозначности запросов: При исследовании семантики учитывайте, что интерпретация неоднозначных запросов может сильно варьироваться для залогиненных пользователей в зависимости от их недавней активности и личных данных.

Worst practices (это делать не надо)

Игнорирование персонализации при анализе позиций и трафика: Оценка эффективности SEO только по «чистой» выдаче (в режиме инкогнито) может привести к неверным выводам, так как значительная часть пользователей видит персонализированную выдачу, сформированную под влиянием их User Model.
Фокус только на ключевых словах без учета интента и контекста: Стратегии, основанные на объеме ключевых слов без понимания того, как личный контекст может полностью изменить интент пользователя (с Общего на Личный), будут неэффективны.
Игнорирование Email как канала влияния на поиск: Рассмотрение email-маркетинга в отрыве от поисковой стратегии является ошибкой, так как email является ключевым источником данных для формирования User Model и влияния на персонализированный поиск.

Стратегическое значение

Патент подтверждает стратегический курс Google на гиперперсонализацию и проактивное предоставление информации. Для SEO это означает, что конкуренция происходит не только между веб-сайтами, но и между органической выдачей и личными данными пользователя. Личный контекст пользователя может радикально изменить SERP, отдавая приоритет прямой информации (из Gmail, Календаря) перед органическими ссылками. Долгосрочная стратегия должна включать укрепление присутствия бренда в личном информационном пространстве пользователя (например, через email).

Практические примеры

Сценарий 1: Влияние Interest Window на выдачу в Travel/E-commerce

Действие пользователя: Пользователь бронирует рейс авиакомпании "Airline X" на 15 октября и получает подтверждение по почте.
Создание User Model: Google обрабатывает письмо, извлекает n-grams ("Airline X", "15 октября") и аннотирует их как 'Organization', 'Date', 'Flight'.
Запрос (5 октября): Пользователь вводит запрос [Airline X].
Анализ интента: Система проверяет User Model. Совпадение есть, но до рейса 10 дней. Interest Window (например, 72 часа до рейса) не активирован. Intent Score низкий.
Результат: Система определяет General Intent. Пользователь видит стандартную выдачу с официальным сайтом Airline X на первом месте.
Запрос (14 октября): Пользователь вводит тот же запрос [Airline X].
Анализ интента: Совпадение есть, и Interest Window активирован (до рейса менее 24 часов). Intent Score высокий.
Результат: Система определяет Personal Intent. Пользователь видит блок с деталями своего рейса (время вылета, терминал) над всеми органическими результатами.

Сценарий 2: Дисамбигуация запроса на основе User Model

Контекст пользователя А: В его контактах есть "Max Ivanov". Он часто получает от него письма. В User Model "Max" аннотирован как 'Person', 'Sender'.
Контекст пользователя Б: Он студент-математик и часто ищет информацию о функции "max". У него нет контактов с именем Max.
Запрос: Оба пользователя вводят запрос [Max].
Результат для А: Система определяет Personal Intent и аннотирует запрос как [Person: Max]. В выдаче могут быть показаны последние письма от Max Ivanov или его контактная информация.
Результат для Б: Система определяет General Intent. В выдаче будут результаты о математической функции или другие общие значения слова "max".

Что такое User Model и откуда Google берет для неё данные?

User Model — это персональный профиль пользователя, содержащий ключевые термины (n-grams) из его личного контента и контекст их использования (аннотации). Данные берутся из User-Generated Content: электронных писем (Gmail), контактов, чатов, документов и событий календаря. Это приватные данные пользователя, используемые для персонализации его поиска.

Как этот патент влияет на традиционное SEO, если он работает с личными данными?

Влияние значительно и заключается в двух аспектах. Во-первых, это конкуренция за место на SERP: если система определяет Personal Intent, то личные результаты (например, детали рейса из Gmail) могут занять топовые позиции, смещая органическую выдачу вниз. Во-вторых, это интерпретация запроса: User Model помогает Google устранять неоднозначность запросов для залогиненных пользователей, что напрямую влияет на то, какие сайты будут признаны релевантными.

Что такое «Interest Window» (Окно интереса) и как он работает?

Это механизм учета времени для определения намерения. Если у пользователя есть предстоящее событие (например, бронь столика или рейс), и он вводит связанный запрос незадолго до этого события (например, за 24 часа до рейса), система с большей вероятностью определит личное намерение. Если же до события еще много времени, интент скорее всего будет признан общим.

Что такое аннотирование запроса в контексте этого патента?

Это процесс обогащения запроса контекстом из User Model. Например, если пользователь вводит [встреча с Max], а в его модели "Max" аннотирован как 'Person' (потому что он есть в контактах), система будет интерпретировать "Max" именно как человека, а не как математическую функцию или название бренда. Это позволяет выполнить более точный поиск.

Как SEO-специалист может повлиять на User Model пользователя?

Напрямую повлиять нельзя, так как это личные данные. Однако можно действовать стратегически через Email-маркетинг. Отправляя пользователям полезные, хорошо структурированные письма (подтверждения заказов, бронирования), вы увеличиваете вероятность попадания сущностей вашего бренда в их User Model. Использование разметки Gmail Markup особенно полезно для этого.

Что означает «Freshness Score» (Оценка свежести) для User Model?

Freshness Score указывает, насколько недавно пользователь взаимодействовал с определенным контентом. Если n-gram был извлечен из вчерашнего письма, его оценка свежести будет высокой, и он будет сильнее влиять на определение текущего намерения. Старые данные постепенно теряют вес и могут быть удалены из модели.

Применяется ли этот алгоритм ко всем пользователям?

Нет, он применяется только к аутентифицированным (залогиненным) пользователям, которые используют сервисы Google (такие как Gmail, Календарь) и для которых система смогла сгенерировать User Model. Пользователи в режиме инкогнито или те, кто не пользуется этими сервисами, увидят стандартную, не персонализированную таким образом выдачу.

Учитывает ли система историческое поведение пользователя при определении интента?

Да, патент упоминает использование исторических данных о кликах (Selection data). Если пользователь ранее выбирал личные результаты в ответ на определенные запросы, система с большей вероятностью классифицирует будущие похожие запросы как Personal Intent.

Значит ли это, что анализ позиций в режиме инкогнито больше не актуален?

Он остается актуальным для понимания базового ранжирования и общей конкуренции в нише. Однако для оценки реальной видимости сайта необходимо учитывать, что значительная доля пользователей видит сильно персонализированную выдачу, на которую влияют механизмы, описанные в этом патенте. Полная картина требует анализа обоих сценариев.

Как система определяет, какой интент важнее, если запрос смешанный?

Система рассчитывает Intent Score на основе множества факторов (свежесть данных, точность совпадения с моделью, окно интереса, исторические клики). Этот балл сравнивается с пороговыми значениями. Если балл высок, приоритет отдается личному интенту. Если средний — выдача может быть смешанной с равной заметностью личных и общих результатов. Если низкий — приоритет отдается общему интенту.

Как Google определяет, когда показывать пользователю его личные данные (Gmail, Контакты) вместо результатов веб-поиска

Google создает детальную модель пользователя (User Model) на основе его личного контента (письма, контакты, события). При получении запроса система анализирует эту модель, чтобы определить намерение пользователя (Intent Score): ищет ли он свои личные данные или общую информацию в интернете. Это позволяет автоматически активировать персональный поиск только тогда, когда это релевантно контексту и времени.

US20150012524A1
2015-01-08

Персонализация
Семантика и интент

Как Google анализирует личные данные (Email, Календарь, Контакты) для определения скрытого интента и персонализации выдачи

Google создает персонализированную «Модель пользователя» на основе его личного контента (письма, события, контакты). Эта модель хранит ключевые термины и их контекст. Система использует ее, чтобы понять «неявное намерение» запроса — ищет ли пользователь общую информацию в вебе или свои личные данные (например, свой рейс) — и соответствующим образом адаптирует выдачу, даже если запрос выглядит общим.

US20150012532A1
2015-01-08

Персонализация
Семантика и интент
Свежесть контента

Как Google использует ваши личные данные (Gmail, Календарь, Фото) для генерации персонализированных подсказок в Autocomplete

Google анализирует активность пользователя и его контент в различных сервисах (таких как email, календарь, фотохостинг). На основе этих данных система генерирует персонализированные поисковые подсказки (Autocomplete), когда пользователь начинает вводить запрос. Это позволяет предлагать запросы типа «мои рейсы» или «мои фото», основываясь на реальных бронированиях или загруженных изображениях пользователя.

US9317585B2
2016-04-19

Персонализация
Индексация
Поведенческие сигналы

Как Google использует личные данные (Gmail, историю местоположений) для ответов на запросы о посещенных местах

Google анализирует личные данные пользователя (электронные письма, данные о местоположении, календари) для ответа на запросы типа «рестораны, которые я посетил в Атланте». Система определяет, является ли запрос «персональным локационным», извлекает релевантные взаимодействия из приватного индекса пользователя и обогащает их публичными данными о сущности (адрес, телефон), отображая эти персональные результаты над стандартной органической выдачей.

US10089394B2
2018-10-02

Персонализация
Local SEO
Индексация

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска

Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.

US7580929B2
2009-08-25

Персонализация
Семантика и интент
Поведенческие сигналы

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату

Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.

US9305102B2
2016-04-05

Персонализация
Поведенческие сигналы

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи

Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.

US8538970B1
2013-09-17

Персонализация
Поведенческие сигналы
SERP

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей

Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.

US20210232659A1
2021-07-29

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента

Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.

US8799107B1
2014-08-05

EEAT и качество
SERP
Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных

Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.

US9594851B1
2017-03-14

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам

Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).

US11609949B2
2023-03-21

Антиспам
SERP
Поведенческие сигналы

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

US9235653B2
2016-01-12

Knowledge Graph
Свежесть контента
Семантика и интент

Как Google корректирует позиционную предвзятость (Position Bias) при обучении моделей ранжирования на кликах пользователей

Google использует механизм для устранения позиционной предвзятости (Position Bias) при обучении моделей ранжирования (Learning to Rank). Система анализирует, на какой позиции находился кликнутый результат, и присваивает этому клику вес важности. Клики по нижним позициям получают больший вес, чем клики по ТОП-1. Это позволяет модели учиться определять истинную релевантность, а не просто копировать существующий порядок выдачи.

US20210125108A1
2021-04-29

Поведенческие сигналы
SERP

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности

Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.

US7657520B2
2010-02-02

SERP
EEAT и качество
Поведенческие сигналы

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)

Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.

US8856124B2
2014-10-07

Безопасный поиск
Поведенческие сигналы
Семантика и интент